Нажмите "Enter" для пропуска содержимого

Глубина изображения: глубина изображения — это… Что такое глубина изображения?

Содержание

глубина изображения — это… Что такое глубина изображения?

глубина изображения
definition in depth

Большой англо-русский и русско-английский словарь. 2001.

  • глубина изображаемого пространства
  • глубина исследования

Смотреть что такое «глубина изображения» в других словарях:

  • Глубина резко изображаемого пространства — Глубина резкости В фотографии глубина резко изображаемого пространства (ГРИП)  это одна из характеристик объектива. Глубина резко изображаемого пространства на фотографическом изображении  это расстояние между передней и задней… …   Википедия

  • Глубина цвета — битовое изображение 8 битная шкала серого 8 битный цвет 15/16 bit: Highcolor 24 bit: Truecolor 30/36/48 bit: Deep Color См. также Цветовая модель RGB Цветовая модель CMYK Цветовая палитра Видимое излучение Цвета в Web (Цвета HTML) Глубина цвета… …   Википедия

  • глубина резкости светового микроскопа — Расстояние вдоль оптической оси светового микроскопа, в пределах которого обеспечивается возможность наблюдения резкого изображения объемного объекта. Примечание Глубина резкого изображения светового микроскопа определяется по формуле где Т… …   Справочник технического переводчика

  • глубина — сущ., ж., употр. часто Морфология: (нет) чего? глубины, чему? глубине, (вижу) что? глубину, чем? глубиной, о чём? о глубине; мн. что? глубины, (нет) чего? глубин, чему? глубинам, (вижу) что? глубины, чем? глубинами, о чём? о глубинах 1. Глубина… …   Толковый словарь Дмитриева

  • глубина цвета — Число двоичных разрядов, используемых для одновременного представления определенного количества цветов на экране или печатающем устройстве. При этом количество отображаемых цветов определяется как 2N, где N — глубина цвета. Количество бит,… …   Справочник технического переводчика

  • глубина резкости (в физической оптике) — глубина резкости Измеренное вдоль оптической оси расстояние между точками пространства изображений, определяющими границы резкого изображения оптической системы плоскости, заданной в пространстве предметов. [Сборник рекомендуемых терминов. Выпуск …   Справочник технического переводчика

  • Глубина цвета — максимальное число оттенков цвета или градаций серого, которое может считывать сканирующее устройство для каждого вводимого пиксела. С ростом Г. ц. увеличивается количество деталей цветного изображения, которые может вводить сканер. Для… …   Реклама и полиграфия

  • глубина резкости — 02.04.31 глубина резкости (сканер) [depth of field] (2): Диапазон расстояний, в пределах которого возможно надежное считывание сканером символа с заданными параметрами, равный разности дальности действия сканера и его оптической дальности.

    … …   Словарь-справочник терминов нормативно-технической документации

  • Глубина (Лукьяненко) — У этого термина существуют и другие значения, см. Глубина (значения). Глубина  название виртуальной реальности в фантастическом цикле Сергея Лукьяненко «Лабиринт отражений»  «Фальшивые зеркала»  «Прозрачные витражи». Первая книга… …   Википедия

  • Глубина резкости светового микроскопа — 47. Глубина резкости светового микроскопа D. Schärfentiefe des Mikroskops E. Depth of microscope field F. Profondeur de champs du microscope Расстояние вдоль оптической оси светового микроскопа, в пределах которого обеспечивается возможность… …   Словарь-справочник терминов нормативно-технической документации

  • Матричный КМОП фотоприемник цветного изображения компании SensorIS — Физические принципы работы матрицы такие же, как и у матрицы Foveon X3. Однако, здесь использован альтернативный способ разделения фототока на три цветовые компоненты. До 18 августа 2008 г. разработка велась компанией ЮникАйСиз (Unique ICs). На… …   Википедия


Что такое глубина цвета (Color Depth)?

Color Depth (Глубина цвета) – количество бит, которые вмещаются в один пиксель (256, 65536 и 16 млн. цветов). От этого количества зависит размер изображения: чем больше глубина цвета, тем больше размер. Другими словами, это количество оттенков, соответствующих каждому пикселю изображения.

Понятие «глубина цвета» актуально и является важнейшим для цифровой фотографии. Специалисты часто заменяют его термином «глубина пикселя» или «битовое разрешение».

При любом количестве бит белый и черный цвета будут присутствовать в изображении всегда. Когда глубина цвета увеличивается на единицу, число оттенков возрастает вдвое. Что касается качества фотоаппарата, то все просто: чем большую глубину цвета поддерживает устройство, тем больше оттенков доступно для каждого пикселя изображения, а значит и выше качество изображения. Лучше всего выбирать технику с высокой битовой глубиной.

Разновидности глубины цвета

Глубина пикселя — величина точная и может варьироваться от 1 до 48 битов. Как мы уже отметили в примере, с битовой глубиной пикселя равной 1 можно получить только 2 цвета и те лишь белый и черный. А вот с глубиной пикселя в 8 бит количество оттенков составит 256.

Профессиональные фотокамеры с большей глубиной цвета в 36 или в 48 бит позволяют снимать в формате RAW. Но наиболее популярным показателем глубины цвета остается 24 бита, благодаря которым получаются стандартные фотоснимки с обычных фотоаппаратов в формате JPG. В них есть все, что необходимо любительским снимкам: детальная передача картинки, четкие нюансы изображения. Все 24-битные изображения называют «TruColor» или «настоящий цвет».

16 битные фотографии называют «HighColor», поскольку они передают оттенки наиболее восприимчивые глазу человека.

Влияние глубины цвета

  1. Глубина цвета влияет на качество цветопередачи и качество самой фотографии. Наиболее оптимальное решение — показатель глубины цвета в 24 бита.
  2. Объем файла с изображением во многом зависит от размеров картинки и от глубины цвета. Чем больше показатель битового разрешения, тем тяжелее будет файл. Этот момент стоит продумать заранее, чтобы обеспечить фотоаппарат картой памяти для достаточного объема.

Не профессионалу сложно отличить 8-битные изображения от 16-битных. Это и понятно. Ведь все дело в плавности редактирования, но переходы будут плавней в 16 бит. Поэтому первоначальное отсутствие разницы позже может стать серьезной проблемой, когда потребуется редактирование изображения.

Что такое глубина цвета в фотографии

Для цифровой фотографии одним из важнейших параметров является глубина цвета. Ее часто называют и глубиной пикселя, или битовым разрешением. Под этим термином подразумевается величина, которая характеризует количество бит информации, содержащейся в пикселе картинки. Т.е. это количество оттенков, соответствующих каждому пикселю изображения.

Возьмем изображение с глубиной цвета 1 бит, в нем будут только два цвета, белый и черный. В изображении в 2 бита будет четыре оттенка: черный, белый, два оттенка серого. Белый и черный цвета всегда присутствуют в изображении, независимо от глубины цвета. Если глубина цвета увеличивается на единицу, число оттенков удваивается. Чем большую глубину цвета поддерживает фотоаппарат, тем больше оттенков доступно для каждого пикселя изображения. Другими словами, чем больше битовая глубина, тем точнее и детальнее само изображение.

Какая бывает глубина цвета изображений?

Глубина пикселя может варьироваться от 1 до 48 битов. С битовой глубиной пикселя = 1 возможно лишь 2 цвета (белый и черный) и 21 допустимое состояние. Если глубина пикселя будет равна 8, то возможных состояний будет уже больше на 7, а количество оттенков – 256.

С большей глубиной цвета (36 или 48 битов) позволяют снимать в формате RAW профессиональные фотокамеры. Иногда именно поэтому многие фотографы предпочитают делать снимки именно а RAW.

Но наиболее распространенным показателем глубины цвета является все же 24 бита – это стандартные фотоснимки обычных фотоаппаратов в формате JPG, они вполне передают все детали и нюансы изображения. Недаром 24-битные изображения имеют название «TruColor», т.е. «настоящий цвет».

Существуют также 16 битные фотографии. Их еще называют «HighColor». Они передают оттенки, к которым наиболее восприимчив глаз человека.

На что влияет глубина цвета?

Во-первых, как понятно из вышесказанного, от глубины цвета зависит качество цветопередачи и, соответственно, качество самой фотографии. Оптимальным показателем глубины цвета является 24 бита, которого и придерживается большинство обычных фотографов.

Во-вторых, нужно помнить, что объем файла с изображением во многом зависит как от размеров картинки, так и от глубины цвета. Чем больше битовое разрешение изображения, тем больше будет объем его файла и его вес. Следовательно, нужно заранее подумать об обеспечении фотоаппарата картой памяти достаточного объема.

Почему 8-битные изображения выглядят так же, как 16-битные?

При преобразовании 16-битного изображения в 8-битное вы не увидите разницы. Тогда зачем использовать 16-бит? Всё дело в плавности редактирования. При работе с кривыми или другими инструментами вы получите больше шагов коррекции тонов и цветов. Переходы будут плавней в 16 бит. Поэтому, даже если разница не может быть изначально заметна, переход к меньшей битовой глубине цвета может стать серьезной проблемой позже, при редактировании изображения.

Иллюстрированный самоучитель по Adobe Photoshop CS2 › Цвет › Режим Indexed Color и глубина цвета [страница — 121] | Самоучители по графическим программам

Режим Indexed Color и глубина цвета

Глубина цвета – это еще один важнейший параметр растровых изображений. Сразу оговорим, что он тесно связан с архитектурой существующих компьютеров и исторически сложившимися стандартами. Глубина цвета выражается в битах и показывает, сколько бит памяти требуется для хранения одного пикселя изображения.

Компьютер имеет дело с цифровой информацией в двоичной системе счисления. Двоичный разряд может иметь два значения: единица или ноль (как вы знаете, десятичный разряд может принимать десять значений от нуля до девяти). Этот наименьшая элементарная информации называется битом. Восемь двоичных разрядов, восемь бит, образуют байт. Байт может принимать 28 = 256 значений (восемь десятичных разрядов могут принимать 108 = 100 000 000 значений). Почему байт составляют именно восемь бит? Да просто потому, что восемь разрядов имели первые микропроцессоры. Разрядность современных микропроцессоров для совместимости с их предшественниками тоже кратна восьми. Для больших значений используются «псевдодесятичные» приставки: 1024 байт =1 Кбайт, 1024 Кбайт=1Мбайт.

В памяти компьютера информация о цвете пикселей изображения тоже хранится в двоичном представлении. Поэтому для быстрой ее обработки пиксел кодируется одним или несколькими байтами. Единственное исключение составляют монохромные изображения. Для хранения информации о цвете пикселя такого изображения вполне достаточно одного бита, ведь пиксель может иметь всего два цвета. Таким образом, глубина цвета монохромных изображений составляет 1 бит. Зная, сколько памяти требуется для хранения одного пикселя изображения (то есть глубину цвета), легко рассчитать, сколько памяти займет все изображение. Например, изображение размером 100х100 пикселей займет 100 пикселей x 100 пикселов х 1 бит = 10 000 бит приблизительно 1.2 Кбайт. Объем памяти, занимаемый цветными изображениями, зависит от количества имеющихся в них каналов. Каждый канал является полутоновым, то есть кодируется одним байтом. Если каналов три, как в изображениях в модели RGB или LAB, то на один пиксел приходится 8 бит х 3 =24 бита.В модели CMYK четыре канала и глубина цвета равна 8 бит х 4 = 32 бита. Таким образом, память, занимаемая цветными изображениями, в три или четыре раза больше, чем для полутоновых изображений: 100 пикселей х 100 х 24 бит = 240 000 бит приблизительно 29.3 Кбайт или 100 х 100 х 32 бит = 320 000 бит = 39.1 Кбайт.

Говоря о глубине цвета для типов растровых изображений, мы имели в виду наиболее употребительные изображения с восьмибитными каналами. Adobe Photoshop допускает ограниченное редактирование изображений с 16 битами на канал (Выделение областей, Feather, Клонирующий штамп (Rubber Stamp), в общем, очень мало возможностей.) Нетрудно вычислить, что цветное изображение с восьмибитными каналами может содержать максимум 224=16.7 млн. цветов. С шестнадцатибитными каналами количество цветов увеличивается до 216×3 = 248= 281 млрд. Такое количество цветов имеет смысл использовать лишь в том случае, если ваш сканер поддерживает 48-битный цвет. Пока это под силу только очень дорогим профессиональным сканерам.

Для перевода из 8-ми битного цвета в 16-ти битный и наоборот предназначены одноименные команды из подменю Mode из подменю Image. (8 bits/channel и 16 bits/channel). Еще один тип изображений › индексированные изображения. Это один из первых способов представления цветных точечных изображений. Он широко применялся в те времена, когда компьютеры были не столь мощными, а видеоадаптеры, поддерживающие более 256 цветов, являлись роскошью. Индексированное изображение как раз и рассчитано на хранение не более чем 256 цветов. Цвета, использованные в индексированном изображении, могут быть произвольными, но их общее количество не должно превышать указанного. Какие именно цвета использованы в изображении, определяется его палитрой. Палитра индексированного изображения представляет собой нумерованный список цветов и хранится в файле вместе с изображением. Каждый байт индексированного изображения хранит номер цвета в палитре, а не значения RGB-компонентов цвета. В результате на один пиксель цветного индексированного изображения приходится не 24 бита, а всего 8.

Палитра индексированного изображения может иметь не только 256 цветов, но и меньшее их количество. Сокращение палитры дает возможность сократить и размер файла. Например, если палитра будет состоять не из 256, а из 64 цветов, то для кодирования одного пикселя потребуется только 6 бит, а не 8. В результате размер изображения уменьшится на четверть. Таким образом, глубина цвета индексированных изображений может принимать целые значения в диапазоне от 1 до 8. Компактность представления цветов в индексированных изображениях объясняет нынешнюю сферу их применения – Web-дизайн.

Индексированные изображения получают из полноцветных сокращением количества использованных цветов. Иными словами, изображение приводится к ограниченной палитре. Какие из цветов изображения попадут в палитру, определяется особыми алгоритмами или указывается непосредственно. Первый способ используют, когда необходимо достичь наилучшего приближения индексированного изображения к цветам оригинала. Ко второму прибегают, если хотят достичь одинакового воспроизведения цветов в разных программах или на разных компьютерах. Для перевода изображения в индексированное необходимо выбрать пункт Indexed Color из подпункта Mode меню Image. В ответ получите такое окно:

Разрядность

Разрядность, или глубина цветности, определяет, сколько уникальных оттенков цвета доступны в палитре изображения в терминах количества двоичных 0 и 1, или «бит», используемых для определения каждого цвета. Это не означает, что изображение обязательно использует все эти цвета, а скорее говорит о том, что цвета могут быть описаны с определённым уровнем точности. Для чёрно-белого изображения разрядность определяет количество доступных оттенков серого. Изображения с высокой разрядностью могут использовать больше градаций серого или оттенков цвета, поскольку возможно большее число комбинаций 0 и 1.

Терминология

Каждый цветной пиксель цифрового изображения создаётся посредством комбинации трёх первичных цветов: красного, зелёного и синего. Каждый первичный цвет часто называют «каналом цветности», и он может иметь любые значения интенсивности в пределах заданной разрядности. Разрядность для каждого канала цветности задаётся в «битах на канал». Термин «бит на пиксель» (bpp) означает сумму числа бит во всех трёх каналах и представляет общее количество цветов, доступное для каждого пикселя. Для цветных изображений зачастую неясно, какая из цифр указана. Использование «bpp» в качестве суффикса позволяет внести ясность в этом вопросе.

Пример

Большинство цветных изображений с цифровых камер имеют 8 бит на канал, то есть могут использовать вплоть до восьми 0 и 1. Это позволяет использовать 28 или 256 различных комбинаций, транслируемых в 256 различных значений интенсивности для каждого первичного цвета. Когда все три первичных цвета объединяются в одном пикселе, это позволяет создавать 28×3 или 16.777.216 различных цветов, называемых также «полный цвет». Это означает 24 бита на пиксель, поскольку каждый пиксель состоит из трёх 8-битных каналов. Число оттенков цвета, доступное для любого X-битного изображения, составляет 2X, если X означает количество бит на пиксель, и 23X, если X означает количество бит на канал.

Сравнение

Следующая таблица иллюстрирует различные типы изображений в терминах их разрядности, числа возможных цветов и общеупотребительных названий.

bpp Число цветов Название
1 2 Монохром
2 4 CGA
4 16 EGA
8 256 VGA
16 65536 XGA, High Color
24 16777216 SVGA, True Color
32 16777216 + прозрачность  
48 281 триллион  

Визуализация глубины цветности

Наведя курсор на метки внизу, вы увидите изображение в выбранном числе цветов. Разница между 24 bpp и 16 bpp незначительна, однако чётко видна, если ваш дисплей настроен на полный цвет или более (24 или 32 bpp).

Полезные советы

  • Человеческий глаз может различить порядка 10 миллионов цветов, посему сохранять изображение с большей разрядностью, чем 24 bpp, избыточно, если оно предназначено только для просмотра. С другой стороны, изображения с разрядностью выше 24 bpp полезны, поскольку они лучше выдерживают пост-обработку (см. «Постеризация изображений»).
  • Градации цвета в изображениях менее 8 бит на канал цветности могут быть чётко заметны на гистограмме изображения.
  • Доступная глубина цветности зависит от типа файла. Стандартные файлы JPEG и TIFF могут использовать только 8 и 16 бит на канал, соответственно.

8 или 16 бит: какая глубина цвета вам нужна?

«Битовая глубина цвета» — это один из тех терминов, с которыми мы все сталкиваемся ежедневно, но очень немногие фотографы действительно понимают. Photoshop предлагает 8, 16 и 32-битные форматы файлов. Иногда мы видим файлы, называемые 24 или 48-битные. В настройках своей камеры вы можете найти выбор из 12- или 14-битных файлов. Что все это значит и что действительно имеет значение?

Что такое битовая глубина цвета?

Википедия дает исчерпывающее определение: Глубина цвета — термин компьютерной графики, означающий количество бит (объём памяти), используемое для хранения и представления цвета при кодировании одного пикселя растровой графики или видеоизображения. Часто выражается единицей бит на пиксел (англ. bits per pixelbpp).

Исчерпывающе, но не очень понятно. Давайте разберемся.

Прежде чем сравнивать различные варианты битовой глубины цвета, давайте сначала обсудим, что означает наименование. «Бит» — это компьютерный способ хранения информации в виде 1 или 0. Один бит не очень хорош для чего-либо, кроме «да» или «нет», потому что он может иметь только 2 значения. Если бы это был пиксель изображения, он был бы чисто черным или чисто белым. Не очень полезно.

Чтобы описать более сложный цвет, мы можем объединить несколько битов. Каждый раз, когда мы добавляем еще один бит, количество возможных комбинаций удваивается. Один бит имеет 2 возможных значения, 0 или 1. Когда вы объединяете 2 бита, вы можете иметь четыре возможных значения (00, 01, 10 и 11). Когда вы комбинируете 3 бита, вы можете иметь восемь возможных значений (000, 001, 010, 011, 100, 101, 110 и 111). И так далее. Как правило, число возможных вариантов выбора увеличивается как 2 в степени количества бит. Итак, «8-бит» = два в восьмой степени = 256 возможных целочисленных значений. В Photoshop это представляется как целые числа 0-255 (внутренне для компьютера это двоичный код от 00000000 до 11111111 ). При этом 0 — это черный цвет, 255 — белый. А между этими значениями мы получаем значения цвета, плавно изменяющиеся от черного к белому.

Таким образом, «битовая глубина» определяет, самые маленькие изменения, которые вы можете сделать, относительно некоторого диапазона значений. Если наше изображение является 2-битным, шкалой является яркость из четырех значений: черный, темные средние тона, светлые средние тона и белый. Но если у нас достаточно бит, у нас достаточно серых значений, чтобы сделать то, что кажется идеально плавным градиентом от черного к белому.

На картинке выше пример, сравнивающий градиент от черного к белому с разной битовой глубиной. В зависимости от качества вашего монитора, вы можете увидеть различия только до 8-10 бит.

Как определяется битовая глубина?

Было бы удобно, если бы все «битовые глубины» можно было сравнивать напрямую, но есть некоторые вариации в терминологии, которые полезно понять.

Обратите внимание, что изображение выше является черно-белым изображением. Цветное изображение обычно состоит из трех
каналов красной, зеленой и синей цветности, комбинации которых дают нам возможность создавать различные цвета. Программное обеспечение для фотографий (например, Photoshop и Lightroom) оперирует количеством бит на канал. Таким образом, 8 бит означает 8 бит на канал. Это означает, что 8-битное изображение RGB в Photoshop будет иметь в общей сложности 24 бита, описывающих один пиксель изображения (8 для красного, 8 для зеленого и 8 для синего). 16-битное изображение RGB или LAB в Photoshop будет иметь 48 бит на пиксель и т. д.

Из выше сказанного можно предположить, что 16-битное изображение означает 16-бит на канал в Photoshop. Ну, это так, и это не так одновременно. 15 + 1 возможных значений (что составляет 32 768 + 1 = 32 769 возможных значений). Так что с точки зрения качества было бы очень справедливо сказать, что 16-битный режим Adobe на самом деле только 15-битный. Не верите мне? Посмотрите на 16-битную шкалу в панели «Информация» в Photoshop, которая показывает шкалу от 0 до 32 768 (что составляет 32 769 значений, поскольку мы включаем 0).

Почему Adobe это делает? По словам разработчика Adobe Криса Кокса, это позволяет Photoshop работать намного быстрее и обеспечивает точную среднюю точку для диапазона, что полезно для режимов наложения). Стоит ли беспокоиться об этой «потере» 1 бита? Нет, совсем нет (15-битных данных вполне достаточно, как мы обсудим ниже).

Сколько бит вы можете увидеть?

На чистом градиенте я могу лично обнаружить полосы в 9-битном варианте (то есть 2048 оттенков серого) как на моем дисплее MacBook Pro Retina 2018 года, так и на 10-битном мониторе Eizo. 9-битный градиент очень слабый (едва заметный) на обоих дисплеях. Я почти наверняка не заметил бы его, если бы не присматривался специально. И даже когда я присматриваюсь, я не могу легко сказать точно, где края полос по сравнению с 10-битным градиентом. Я бы почти сказал, что на 9 битах нет полос. 8-битный градиент относительно легко увидеть при просмотре, хотя я все еще мог бы его пропустить, если бы не обращал внимания. Поэтому для моих целей 10-битный градиент визуально идентичен 14-битному или более.

Надо сказать, что на стандартном мониторе среднего ноутбука, полосы еще можно разглядеть на 7-битном градиенте, тогда как градиент 8 — бит выглядит также как и градиент 9- 10- и более бит.

Зачем использовать больше бит, чем можно видеть?

Почему у нас есть варианты более 10 бит в наших камерах и фотошопе? Если бы мы никогда не редактировали фотографии, не было бы необходимости добавлять больше бит, чем может видеть человеческий глаз. Однако, когда мы начинаем редактировать фотографии, могут легко начать отображаться ранее скрытые различия.

При манипуляциях с фотографией программа делает незначительные ошибки или ошибки округления в данных более очевидными. Увеличение контрастности изображения похоже на уменьшение битовой глубины. Если мы достаточно сильно манипулируем фотографией, на плавных градиентах начнет проявляться «полосатость» или ступенчатость. Ступенчатость — очевидные дискретные переходы от одного цвета или тона к другому (вместо плавного градиента). Вы уже видели теоретический пример с низкими битовыми градиентами выше. Типичным примером в реальном мире могут быть различные «полосы», появляющиеся на ясном голубом небе.

Так сколько бит вам действительно нужно в камере?

Коррекция экспозиции на постобработке на 4-ступени равносильно потери чуть более 4 бит. 3-ступенчатое изменение экспозиции ближе всего к потере 2 битов. Я редко регулирую экспозицию RAW-фалов до +/- 4 ступени, но это может случиться с экстремальными ситуациями или плохо проэкспонированными частями изображения. Поэтому я бы посоветовал иметь в запасе дополнительные 4-5 бит по сравнению с пределами видимой полосы, чтобы быть в безопасности. Если принять за предел 9-10 бит, то чтобы избежать видимой полосатости, нам нужно снимать примерно в 14-15 бит.

В действительности, вам, вероятно, никогда не понадобится так много бит по нескольким причинам:

  • Не так много ситуаций, когда вы можете столкнуться с идеальным градиентом. Ясное голубое небо, вероятно, наиболее вероятный случай. В других изображениях намного сложнее увидеть разницу в битовой глубине.
  • Цвет предлагает большую битовую глубину. Мое обсуждение здесь ограничивается одним черно-белым каналом. Если вы обрабатываете черно-белые фотографии, то эти цифры относятся непосредственно к вам. Но если вы обрабатываете в цвете, у вас, вероятно, будет немного больше места для маневра.
  • Точность вашей камеры не так высока, как всем нам хотелось бы. Другими словами, в вашем изображении всегда есть шум. Из-за этого шума при определенной глубине цвета огрехи в градиентах намного сложнее увидеть.
  • Вы можете удалить ступенчатость переходов на постобработке, используя комбинация размытия по Гауссу и / или добавления шума.
  • Дополнительные биты в основном имеют значение только для экстремальных тональных коррекций.

Принимая все это во внимание, 12-бит для изображения звучит как очень разумный уровень детализации, который допускает значительную постобработку.

Подытожим:

  • не снимайте в JPG (8 бит).
  • 12-битный файл RAW отлично подходит для большинства работ и обеспечивает значительную экономию места по сравнению с 14-битным RAW. Это лучший выбор, если вы заботитесь о размере файла.
  • Если вы хотите получить абсолютное наилучшее качество в тенях, снимайте 14-битные файлы RAW (в идеале, используя сжатия без потерь, чтобы сэкономить место). Это лучший выбор, если вы не заботитесь о больших файлах и снимаете сцены с широким динамическим диапазоном (глубокие тени).
  • Если вы можете снимать в 16 бит, это хорошо, но, вероятно, избыточно. Стоит протестировать фотографии с вашей камеры, чтобы увидеть, можете ли вы использовать меньшие настройки, чтобы сэкономить на размере файла.

Сколько бит нужно для интернета?

Преимущества 16-битного режима заключаются в возможности манипулировать изображением, не вызывая проблем. Преобразовав окончательно отредактированного изображения в 8-битное, вы не увидите никакой разницы, и к тому же файл будет гораздо меньшего размера, что важно для более быстрой загрузки / выгрузки. Убедитесь, что сглаживание в Photoshop включено. Перейдите в Edit / Color Settings и убедитесь, что установлен флажок «Использовать дизеринг (8-битные / канальные изображения)». Если вы используете Lightroom для экспорта в JPG, дизеринг используется автоматически (у вас нет выбора). Это помогает добавить немного шума, который должен минимизировать риск появления ступенчатости при окончательном преобразовании в 8 бит.

Сколько бит нужно для печати?

Что делать, если вы отправляете свои изображения через Интернет для печати профессиональной лабораторией? Многие лаборатории примут 16-битные файлы TIF, и это отличный вариант. Однако, если лаборатория требует JPG или вы хотите отправить файл меньшего размера, у вас могут возникнуть вопросы о преобразовании в 8-бит. Если ваша лаборатория печати принимает 16-битные форматы (TIFF, PSD, JPEG2000), то проблем нет — но лучше спросите их, что они рекомендуют, если вы не уверены.

Если вам нужно отправить JPG, он будет в 8 битах, но это не должно быть проблемой. На самом деле, 8-битные данные подходят для окончательного вывода на печать. Помните, что большинство проблем с 8-разрядными процессами вызвано внесением изменений в 8-разрядные данные, а не первоначальным преобразованием. Я напечатал сотни очень высококачественных изображений, которые были загружены моему поставщику в виде 8-битных файлов JPG, и окончательные изображения выглядят потрясающе (экспортировано из Lightroom с качеством 90% и цветовым пространством Adobe RGB). Я бы порекомендовал внесить все изменения (сглаживание, преобразование цветового пространства, повышение резкости и т. д.) перед преобразованием в 8-битное.

Если вы не видите полосы на мониторе после преобразования в 8-битное, то все должно быть в порядке и на печати. Однако вы можете помочь избежать потенциальных проблем, убедившись, что Photoshop использует дизеринг для преобразования в 8-битные.

В чем разница между глубиной цвета и цветовым пространством?

Битовая глубина цвета определяет количество возможных значений или приращений. Цветовое пространство определяет максимальные значения или диапазон (обычно известный как «цветовой охват»). Если бы вы использовали коробку с карандашами в качестве примера, большая битовая глубина была бы похожа на большее количество оттенков (больше цветных карандашей), а большой цветовой охват — как если бы наиболее насыщенный цвет был более насыщенным (независимо от количества цветных карандашей). Чтобы увидеть разницу, рассмотрим следующий упрощенный визуальный пример:

Как вы можете видеть, увеличение глубины в битах снижает риск появления полосатости в градиентах за счет создания большего приращения, а расширение цветового пространства (более широкий цветовой охват) позволяет использовать более экстремальные цвета. Но эти два параметра взаимодействуют друг с другом. Чем больше цветовой охват, тем больше вероятность появления ступенчатых градиентов при одной и той же битовой глубине цвета.

Смотрите в будущее

Как мы уже говорили выше, иногда выбор битовой глубины не имеет значения сегодня. То же самое относится и к мониторам и принтерам. Но в будущем ваш монитор или принтер могут могут иметь лучшую битовую глубину и цветовой охват. Рекомендую хранить свои рабочие файлы не более чем в 16-бит по нескольким причинам: (1) это больше, чем большинство мониторов и принтеров есть или будет в обозримом будущем, и (2) такая глубина цвета остается далеко за пределами нашей способности видеть различия.

Однако, цветовой охват другое дело. Скорее всего, у вас есть монитор с цветовой гаммой sRGB. Если у вас монитор «с расширенным цветовым охватом» (Adobe RGB) или P3, то у вас очень широкий цветовой охват (Adobe RGB расширяет голубые / голубые / зеленые цвета больше, чем P3, а P3 расширяет красные / желтые / зеленые дальше, чем Adobe RGB).

Помимо мониторов P3, в продаже имеются принтеры, которые также превосходят цветовой охват AdobeRGB (особенно в цианах). Таким образом, и sRGB, и AdobeRGB уже не в состоянии охватить весь спектр цветов, которые можно воссоздать на мониторе или принтере сегодня. По этой причине сейчас стоит использовать более широкий цветовой охват , чтобы ваш рабочий файл впоследствии мог использовать преимущества более качественных принтеров и мониторов, таких как ProPhoto RGB. Конечно, вам нужно будет преобразовать RAW в широкую гамму во время первоначального экспорта, переключение цветового пространства в дальнейшем не приведет к восстановлению цветов, которые вы отбрасывали ранее в процессе. И как обсуждалось выше, более широкий
цветовой охват должен использоваться с 16-битными файлами.

Автор: Greg Benz – фотограф из Миннеаполиса, штат Миннесота.

Поделиться ссылкой:

Похожее

Глубина изображения на фотографии

Правила линейной перспективы

Отличительной особенностью фотографии является передача ею двухмерного пространства, тогда как мы живем в трехмерном. Снимок не может передать глубину обстановки напрямую. Это объясняется физиологической особенностью человеческого зрения.

Мы определяем удаленность предметов благодаря, тому, что оба глаза находятся на некотором расстоянии друг от друга. Можно привести в пример детские рисунки, когда ребенок пытается передать мир, основываясь лишь на разнице размеров объекта А от размеров объекта Б. В искусстве фотографии ощущение пространства можно воссоздать с помощью законов линейно перспективы.

Первый из них гласит, что объекты одинакового размера кажутся тем меньше, чем дальше от человека они находятся. Второй сообщает что параллельные линии, направленные вглубь пространства, стремятся в одну точку.

Работа с планами

Воссоздать глубину изображения можно с помощью трех планов. Близко расположенные объекты создают передний план, объекты на некотором расстоянии – средний план и наконец, самые удаленные объекты – дальний план. Это создает иллюзию глубины, так как в сознании человека срабатывает первое правило линейной перспективы.

Передний план максимально информативен для зрителя, можно определить фактуру, цвет, объем объектов. В то же время задний план всегда предстает перед человеком лишь образно.
Работая с планами на снимке фотографу необходимо знать о принципе, при котором масштаб изображения по отношению к фокусному расстоянию прямо пропорционален и зависит от дистанции, с которой ведется съемка.

Чтобы подчеркнуть разницу масштабов объектов применяется широкоугольный объектив. Часто это приводит к неестественным результатам. Это связано с тем, что на фото человек видит разномасштабные детали одновременно, тогда как с помощью зрения – по отдельности (общая картина создается уже на уровне сознания). В то же время вокруг широкоугольного объектива бытует мнение, что он искажает пространство. Это иллюзия вызванная тем, что для того чтобы добиться крупности переднего плана фотограф подходит к нему ближе, чем изменяется разница масштабов планов.


Глубина изображения и битовая глубина

Поддержка глубины изображения, битовой глубины и насыщенного цветного изображения

Битовая глубина — это количество информации о цвете, содержащейся в каждом пикселе изображения. Изображение с битовой глубиной 1 означает, что каждый пиксель в изображении может быть черным или белым, поскольку пиксель может содержать только 2 значения (1 бит либо «включен», либо «выключен»). По мере увеличения битовой глубины изображения количество цветов, которые может содержать каждый пиксель, увеличивается. Новые изображения в Acorn создаются как 8-битные изображения на компонент / 32-битные пиксельные изображения, что подходит для большинства изображений, используемых сегодня.Однако, если вы хотите получить «более глубокую» глубину изображения, перейдите к пункту меню Image ▸ Image Depth . Вы можете выбрать 8 или 16 бит на канал.

Если вы откроете 64- или 48-битное изображение в Acorn, Acorn поместит ваше изображение в 64-битный рабочий процесс и сохранит изображение в 64-битном формате.

Если вы откроете 96- или 128-битное изображение в Acorn, Acorn поместит ваше изображение в 128-битный рабочий процесс и сохранит изображение в 128-битном формате. В большинстве случаев 128-битная глубина будет излишней.Если вам нужны глубокие изображения, но вы не знаете, использовать ли 64 или 128 бит, выберите 64. Если вам нужно 128, вы это узнаете.

Битовая глубина (как и разрешение изображения) также влияет на размер изображения. Изображения с более высокой битовой глубиной имеют тенденцию быть больше по размеру, чем изображения с более низкой битовой глубиной, поскольку количество информации в файле, относящейся к цвету, больше.

Зачем вам нужна более высокая битовая глубина?

  • У вас есть камера, которая создает файлы RAW с размером более 8 бит на канал.Возможно, вы захотите сохранить свое изображение в этом формате, чтобы сохранить его в будущем.
  • Наличие 64- или 128-битного изображения дает Acorn больше пространства для работы с вашим изображением. Такие вещи, как проблемы с предварительным умножением альфа-канала, исчезают, а настройка изображения становится более точной.
  • Научные вычисления. Такие вещи, как работа со спутниковыми или медицинскими изображениями, могут выиграть от более глубоких цветов. Тот факт, что человеческий глаз не видит разницы между двумя цветами, не означает, что ее нет.

Слева направо: 1-битные, 2-битные, 4-битные, 8-битные и 32-битные изображения.

Изображения любезно предоставлены Википедией

Поддержка изображений Deep Color

Если вы используете OS 10.11+ и у вас есть 5k iMac или недавний Mac Pro с 30-битным дисплеем, вы можете наслаждаться новым уровнем точности цветопередачи в Acorn. Когда вы создаете изображение 16bpc, вы будете наслаждаться более глубокими цветами и более широкой гаммой.

Получение фактической глубины цвета изображения

Вы можете получить битовую глубину с помощью ImageMagick в оболочке с помощью:

  магическая идентификация -format "% [битовая глубина]" 12-bit_000000.dpx
12
  

Или, чтобы получить их все за один присест, с префиксом имен файлов:

  magick identify -format "% f:% [битовая глубина] \ n" * .dpx
10-бит_000000.dpx: 10
12-бит_000000.dpx: 12
16-бит_000000.dpx: 16
8-бит_000000.dpx: 8
  

Все остальные детали вы можете увидеть так:

  магическая идентификация -verbose 12-bit_000000.dpx
  

Пример вывода

  Изображение:
  Имя файла: 12-bit_000000.dpx
  Формат: DPX (SMPTE 268M-2003 (DPX 2.0))
  Класс: DirectClass
  Геометрия: 2048x1536 + 0 + 0
  Единицы: Не определено
  Цветовое пространство: sRGB
  Тип: TrueColor
  Порядок байтов: младший значащий бит
  Глубина: 12 бит
  Глубина канала:
    Красный: 12 бит
    Зеленый: 12 бит
    Синий: 12 бит
  Статистика канала:
    Пикселей: 3145728
    Красный:
      мин: 0 (0)
      макс: 2373 (0,579487)
      среднее: 502,223 (0,122643)
      ...
      ...
  

Вы можете получить обильный дамп пикселей в шестнадцатеричном формате, например:

  magick 12-bit_000000.dpx txt:
  

Пример вывода

 ...
...
118,2: (6897,58,6977,6,8017,83) # 1AF21B421F52 srgb (10,525%, 10,6471%, 12,2344%)
119,2: (6945,59,7121,63,8033,84) # 1B221BD21F62 srgb (10,5983%, 10,8669%, 12,2589%)
120,2: (6769,55,7329,68,7921,81) # 1A721CA21EF2 srgb (10,3297%, 11,1844%, 12,0879%)
121,2: (6465,48,7441,7,7825,79) # 19411D121E92 srgb (9,86569%, 11,3553%, 11,9414%)
...
...
  

Самый яркий пиксель можно найти так:

  identify -define identify: locate = максимум 12-bit_000000.dpx

Максимальное количество локаций канала:
   Красный: 37976.7 (0,579487) 1144,1311
   Зеленый: 36376,3 (0,555067) 1146,1311
   Синий: 34808 (0,531136) 1146,1314
  

Это говорит о том, что самая яркая область находится рядом (1144,1311), поэтому мы можем вырезать эту область 4×4 и выгрузить ее в гексагоне:

  magick 12-bit_000000.dpx -crop 4x4 + 1144 + 1311 txt:

# ImageMagick перечисление пикселей: 4,4,65535, srgb
0,0: (37976.7,36040.2,34407.9) # 94598CC88668 srgb (57.9487%, 54.9939%, 52.5031%)
1,0: (37672.6,36248.3,34455.9) # 93298D988698 srgb (57,4847%, 55,3114%, 52.5763%)
2,0: (37208,5,36376,3,34407,9) # 91598E188668 srgb (56,7766%, 55,5067%, 52,5031%)
3,0: ​​(36808.4,36088.3,34055.8) # 8FC88CF88508 srgb (56,1661%, 55,0672%, 51,9658%)
0,1: (37880.7,35704.2,34055.8) # 93F98B788508 srgb (57,8022%, 54,4811%, 51,9658%)
1,1: (37544.6,36040.2,34151.8) # 92A98CC88568 srgb (57,2894%, 54,9939%, 52,1123%)
2,1: (37416.6,36360.3,34407.9) # 92298E088668 srgb (57.094%, 55.4823%, 52.5031%)
3,1: (37096.5,35992.2,34055.8) # 90E88C988508 srgb (56,6056%, 54,9206%, 51,9658%)
0,2: (37768.6,35592.1,33991,8) # 93898B0884C8 srgb (57,6313%, 54,3101%, 51,8681%)
1,2: (37544.6,35960.2,34183.8) # 92A98C788588 srgb (57,2894%, 54,8718%, 52,1612%)
2,2: (37528.6,35992.2,34487.9) # 92998C9886B8 srgb (57,265%, 54,9206%, 52,6252%)
3,2: (37464.6,35560.1,34279.8) # 92598AE885E8 srgb (57,1673%, 54,2613%, 52,3077%)
0,3: (37560.6,35624.2,34263.8) # 92B98B2885D8 srgb (57,3138%, 54,359%, 52,2833%)
1,3: (37336,5,35816,2,34519,9) # 91D98BE886D8 srgb (56,9719%, 54,652%, 52,674%)
2,3: (37544.6,35640.2,34808) # 92A98B3887F8 srgb (57.2894%, 54,3834%, 53,1136%)
3,3: (37688,6,34968,34439,9) # 933988988688 srgb (57,5092%, 53,3578%, 52,5519%)
  

Надеюсь, вы видите, что шестнадцатеричный код каждой выборки заканчивается на 8 , что означает, что нижние 3 бита чистые.


Есть привязки Python к ImageMagick , называемые палочкой.


Другой вариант вообще exiftool :

  exiftool 10-bit_000000.dpx
  

Пример вывода

  Номер версии ExifTool: 12.00
Имя файла: 10-bit_000000.dpx
Справочник:.
Размер файла: 12 МБ
Дата / время изменения файла: 2021: 02: 08 09: 50: 32 + 00: 00
Дата / время доступа к файлу: 2021: 02: 08 09: 59: 45 + 00: 00
Дата / время изменения Inode файла: 2021: 02: 08 09: 50: 32 + 00: 00
Права доступа к файлам: rw-r - r--
Тип файла: DPX
Расширение типа файла: dpx
Тип MIME: image / x-dpx
Порядок байтов: с прямым порядком байтов
Версия заголовка: V2.0
Размер файла DPX: 12584960
То же самое: новый
Имя файла изображения: 10-bit_000000.dpx
Дата создания: 2021: 02: 01 10:45:32
Создатель: flashSuite 2 3.4.5
Проект: Цветовой тест
Авторское право: 2021
Ключ шифрования: ffffffff
Ориентация: горизонтальная (нормальная)
Элементы изображения: 1
Ширина изображения: 2048
Высота изображения: 1536
Знак данных: без знака
Конфигурация компонентов: R, G, B
Битовая глубина: 10 <--- ЗДЕСЬ ЭТО
Описание изображения               :
Имя исходного файла:
Дата создания источника:
Имя устройства ввода: SpinnerS
Серийный номер устройства ввода: 5CFC3FE89CDB
Частота кадров: 16
ID кадра:
Информация о шифере:
ID пользователя                         :
Размер изображения: 2048x1536
Мегапикселей: 3.1
  

Что такое битовая глубина? »Изображения» Windows »Tech Ease

Битовая глубина относится к информации о цвете, хранящейся в изображении. Чем выше битовая глубина изображения, тем больше цветов оно может сохранить. Самое простое изображение, 1-битное изображение, может отображать только два цвета, черный и белый. Это потому, что бит 1 может хранить только одно из двух значений: 0 (белый) и 1 (черный). 8-битное изображение может хранить 256 возможных цветов, а 24-битное изображение может отображать более 16 миллионов цветов.По мере увеличения глубины цвета размер файла изображения также увеличивается, поскольку для каждого пикселя изображения необходимо сохранить больше информации о цвете.

Когда вы сохраняете (или экспортируете) изображение в формате GIF или PNG, вы можете выбрать разрядность итогового файла. С некоторыми типами изображений, которые, естественно, имеют мало цветов, такими как логотипы или простой дизайн, вы можете значительно уменьшить размер файла изображения без ухудшения качества изображения. Для других изображений (особенно с градиентами) уменьшение количества цветов в изображении сильно ухудшит качество изображения.

Примеры ниже демонстрируют взаимосвязь между битовой глубиной и качеством изображения. Мы взяли небольшую деталь из нашей любимой иллюстрации робота-жонглера и экспортировали ее с разной глубиной цвета. Изменения будут наиболее заметны в градациях цветов шляпы.

24-битный цвет: 2 24 = 16 777 216 цветов, 45 КБ

8-битный цвет: 2 8 = 256 цветов, 17 КБ

7-битный цвет: 2 7 = 128 цветов, 13 КБ

6-битный цвет: 2 6 = 64 цвета, 10 КБ

5-битный цвет: 2 5 = 32 цвета, 8 КБ

4-битный цвет: 2 4 = 16 цветов, 6 КБ

3-битный цвет: 2 3 = 8 цветов, 5 КБ

2-битный цвет: 2 2 = 4 цвета, 4 КБ

1-битный цвет: 2 1 = 2 цвета, 3 КБ

Образец рисунка из коллекции иллюстраций роботов FCIT на веб-сайте TIM.

Оценка глубины - BeyondMinds

Подробный обзор методов, используемых для оценки глубины с использованием машинного обучения и классических методов.

Обычные дисплеи двухмерные. Изображение или видео трехмерного мира кодируется для хранения в двух измерениях. Излишне говорить, что мы теряем информацию, соответствующую третьему измерению, которое имеет информацию о глубине.

2D-представления достаточно для большинства приложений.Однако есть приложения, которые требуют предоставления информации в трех измерениях. Важным приложением является робототехника, где для точного перемещения исполнительных механизмов требуется трехмерная информация. Ясно, что необходимо принять некоторые меры для включения утраченной информации о глубине, и в этом блоге исследуются такие концепции.

Как определить глубину?

Наши глаза оценивают глубину, сравнивая изображение, полученное нашим левым и правым глазом. Небольшого смещения между обеими точками обзора достаточно для расчета приблизительной карты глубины.Мы называем пару изображений, получаемых нашим глазом, стереопарой. Это, в сочетании с нашим объективом с переменным фокусным расстоянием и общим опытом «видеть вещи», позволяет нам иметь безупречное трехмерное зрение.

Пара стереоизображений, сформированная из-за разных точек обзора по отношению к левому и правому глазу. (Источник)

Инженеры и исследователи реализовали эту концепцию и попытались воспроизвести ее, чтобы извлечь информацию о глубине из окружающей среды. Существует множество подходов к достижению одного и того же результата.Мы рассмотрим аппаратный и программный подходы отдельно.

Оборудование:

1. Технология двойной камеры

Некоторые устройства имеют две камеры, разделенные небольшим расстоянием (обычно несколько миллиметров) для захвата изображений с разных точек обзора. Эти два изображения образуют стереопару и используются для вычисления информации о глубине.

Двойная камера разнесена на небольшое расстояние на мобильном телефоне. (Источник)

2. Технология Dual Pixel

Альтернативой технологии Dual Camera является технология Dual Pixel Autofocus (DPAF).

Расчет глубины с помощью DPAF на Google Pixel 2. (Источник)

Каждый пиксель состоит из двух фотодиодов, разделенных очень небольшим расстоянием (менее миллиметра). Каждый фотодиод рассматривает сигналы изображения отдельно, а затем анализирует их. Это расстояние разделения на удивление достаточно для того, чтобы изображения, создаваемые фотодиодами, можно было рассматривать как пару стереоизображений. Обычно Google Pixel 2 использует эту технологию для вычисления информации о глубине.

3.Датчики

Хорошей альтернативой нескольким камерам является использование датчиков, которые могут определять расстояние. Например, в первой версии Kinect для этого использовался инфракрасный (ИК) проектор. Узор из инфракрасных точек проецируется на окружающую среду, и монохромный CMOS-датчик (расположенный на расстоянии нескольких сантиметров) принимает отраженные лучи. Для получения информации о глубине рассчитывается разница между ожидаемым и полученным положением точек ИК-излучения. Сенсор

Kinect в действии. (Источник)

LIDAR-системы испускают лазерные импульсы на объекты в окружающей среде и измеряют время, необходимое для отражения этих импульсов обратно (также известное как время полета).Они также дополнительно измеряют изменение длины волны этих лазерных импульсов. Это может дать точную информацию о глубине.

Альтернативным и недорогим решением было бы использование ультразвуковых датчиков. Эти датчики обычно включают в себя передатчик, который направляет ультразвуковые звуковые волны на цель. Волны отражаются целью обратно к датчику. Измеряя время, необходимое волнам, чтобы вернуться к датчику, мы можем измерить расстояние до цели. Однако звуковые датчики могут плохо работать в шумной среде.

Типичный недорогой ультразвуковой датчик. (Источник)

Программное обеспечение:

Использование дополнительного оборудования не только увеличивает стоимость производства, но и делает методы оценки глубины несовместимыми с другими устройствами. К счастью, существуют методы оценки глубины с использованием только программных средств, и они также являются активной темой исследований. Ниже приведены некоторые из популярных методов оценки глубины с помощью программного обеспечения:

1. Методы нескольких изображений

Самый простой способ вычислить информацию о глубине без использования дополнительного оборудования - это сделать несколько изображений одной и той же сцены с небольшими смещениями.Сопоставляя ключевые точки, общие для каждого изображения, мы можем восстановить трехмерную модель сцены. Такие алгоритмы, как масштабно-инвариантное преобразование признаков (SIFT), отлично справляются с этой задачей.

Чтобы сделать этот метод более надежным, мы можем измерить изменение ориентации устройства, чтобы вычислить физическое расстояние между двумя изображениями. Это можно сделать, измерив данные акселерометра и гироскопа устройства. Например, визуально-интерциальная одометрия используется в ARKit от Apple для расчета глубины и других атрибутов сцены.Пользовательский опыт улучшен, поскольку даже незначительных движений устройства достаточно, чтобы создать информацию о стереоизображении.

2. Методы одиночного изображения

Также существует несколько методов оценки глубины одиночного изображения. Эти методы обычно включают нейронную сеть, обученную на парах изображений и их картах глубины. Такие методы легко интерпретировать и строить, и они обеспечивают приличную точность. Ниже приведены примеры некоторых популярных методов обучения.

A. Методы на основе контролируемого обучения

Для обучения контролируемым методам требуются какие-то метки.Обычно метки представляют собой пиксельные карты глубины RGB-D. В таких случаях обученная модель может напрямую выводить карту глубины. Обычно используемые наборы данных глубины включают набор данных NYUv2, который содержит карты глубины RGB-D для изображений внутри помещений, и набор данных Make3D, который содержит карты глубины RGB-D для изображений на открытом воздухе. Вы можете проверить это репозиторий GitHub для получения информации о дополнительных наборах данных.

Пример изображения (слева) и его аннотация глубины в RGB-D (справа). (Источник)

Метки цели не обязательно должны быть чистыми картами глубины, но также могут быть функцией карт глубины, например, нечетких изображений.Следовательно, мы можем использовать пары изображений с дымкой и без дымки для обучения модели, а затем можно извлечь глубину с помощью функции, которая связывает размытое изображение с его значением глубины. В этом обсуждении мы сконцентрируемся только на методах, которые используют карты глубины в качестве целевых меток.

Автоэнкодер - один из самых простых типов сетей, используемых для извлечения информации о глубине. Популярные варианты включают использование U-Nets, которые представляют собой сверточные автокодеры с остаточными пропускными соединениями, соединяющими карты характеристик из рук понижающей дискретизации (вывод сверток) и повышающей дискретизации (вывод транспонированных сверток).

Стандартная архитектура U-Net. (Источник)

Базовая структура может быть улучшена. Например, в статье «Прогнозирование глубины, нормалей поверхности и семантических меток с помощью общей многомасштабной сверточной архитектуры» использовалось несколько нейронных сетей, каждая из которых работает с входными данными в разных масштабах. Параметры каждой сети, такие как размер ядра и шаг, различны. Авторы утверждают, что извлечение информации из нескольких шкал дает более качественную глубину, чем извлечение по одной шкале.

Усовершенствование вышеупомянутого метода представлено в «Сверточных нейронных полях с направлением структурированного внимания для оценки глубины монокуляра». Здесь они используют единую сквозную обучаемую модель, но они объединяют карты функций разного масштаба, используя условные случайные поля (CRF), управляемые структурированным вниманием, перед подачей их в качестве входных данных для последней операции свертки.

Другие методы рассматривают извлечение глубины как проблему преобразования изображения в изображение. Обычные методы перевода изображений основаны на бумаге pix2pix.Эти методы напрямую извлекают карту глубины из входного изображения.

Перевод изображений в действии. (Источник)

Аналогичным образом можно улучшить и эту структуру. Производительность можно повысить, улучшив стабильность GAN и качество вывода, используя такие методы, как штраф за градиент, самовнимание и потеря восприятия.

B. Методы, основанные на неконтролируемом обучении

Трудно получить наборы данных глубины высокого качества, которые учитывают все возможные фоновые условия.Неудивительно, что повышение производительности контролируемых методов сверх определенного уровня затруднено из-за отсутствия точных данных. Полу-контролируемые и неконтролируемые методы устраняют требование изображения целевой глубины и, следовательно, не ограничиваются этим ограничением.

Метод, представленный «Неконтролируемой CNN для оценки глубины одного ракурса: геометрия на помощь», включает создание правого изображения для данного левого изображения в паре стереоизображений (или наоборот). Это может быть выполнено путем обучения автокодировщика, как в контролируемом сценарии.Наша обученная модель может выводить правые изображения для любого левого изображения. Теперь мы вычисляем несоответствие между двумя изображениями, которое в нашем случае является смещением пикселя (или блока) в правом изображении относительно его местоположения в левом изображении. Используя значение несоответствия, мы можем вычислить глубину, учитывая фокусное расстояние камеры и расстояние между двумя изображениями.

Расчет глубины с использованием диспаратности. Базовая линия - это расстояние между двумя камерами (правое и левое изображения).(Источник)

Вышеупомянутый метод считается действительно неконтролируемым, если наш алгоритм может адаптироваться и к парам, не являющимся стереоизображениями. Это можно сделать, отслеживая расстояние между двумя изображениями, проверяя данные датчика на устройстве. Этот метод может быть улучшен, как это сделано в этой работе «Неконтролируемая оценка глубины монокуляра с согласованностью влево-вправо», где расхождение вычисляется как для левого, так и для правого изображения, а затем вычисляется глубина с учетом обоих ценности.

Ограничения

Ограничение использования методов, основанных на обучении, особенно контролируемых методов, состоит в том, что они не могут хорошо обобщаться на все варианты использования. Аналитические методы могут не иметь достаточно информации для создания надежной карты глубины из одного изображения. Однако в некоторых случаях включение знаний предметной области может помочь в извлечении информации о глубине.

Например, рассмотрите возможность удаления дымки на основе Dark Channel Prior. Авторы заметили, что большинство локальных участков нечетких изображений имеют пиксели низкой интенсивности как минимум в одном канале.Используя эту информацию, они создали аналитический метод удаления дымки. Поскольку матовость является функцией глубины, сравнивая размытое изображение с оригиналом, можно легко восстановить глубину.

Явным ограничением неконтролируемых методов является то, что они требуют дополнительной информации о предметной области, такой как фокусное расстояние камеры и данные датчика для измерения смещения изображения. Однако они предлагают лучшее обобщение, чем контролируемые методы, по крайней мере, теоретически.

Приложения для оценки глубины

1.Дополненная реальность

Одним из ключевых приложений оценки глубины является дополненная реальность (AR). Основная проблема в AR - разместить объект в трехмерном пространстве таким образом, чтобы его ориентация, масштаб и перспектива были правильно откалиброваны. Информация о глубине жизненно важна для таких процессов.

Приложение AR, которое может измерять размеры объектов. (Источник)

Одним из впечатляющих приложений является демонстрация IKEA, в которой вы можете визуализировать продукты у себя дома с помощью модуля AR, прежде чем покупать их.Используя этот метод, мы можем визуализировать его размеры, а также просматривать его в нескольких масштабах.

2. Робототехника и оценка траектории объекта

Объекты в реальной жизни перемещаются в трехмерном пространстве. Однако, поскольку наши дисплеи ограничены двумя измерениями, мы не можем точно рассчитать движение по третьему измерению.

Имея информацию о глубине, мы можем оценить траекторию в третьем измерении. Более того, зная значения шкалы, мы можем вычислить значения расстояния, скорости и ускорения объекта с разумной точностью.Это особенно полезно для роботов, чтобы достигать или отслеживать объекты в трехмерном пространстве.

3. Удаление дымки и тумана

Дымка и туман - это природные явления, зависящие от глубины. Далекие объекты скрыты в большей степени.

Пример удаления дымки. (Источник)

Следовательно, методы обработки изображений, направленные на удаление дымки, должны в первую очередь оценивать информацию о глубине. Удаление дымки - активная тема исследований, и предлагается несколько количественных решений, основанных на обучении.

4. Портретный режим

Портретный режим на некоторых смартфонах включает фокусировку на определенных интересующих объектах и ​​размытие других областей. Размытие, применяемое как функция глубины, создает гораздо более привлекательное изображение, чем использование простого размытия.

Размытое изображение (справа), созданное в портретном режиме. (Источник)

Заключение

Оценка глубины - сложная задача для многих приложений. Благодаря усилиям, предпринимаемым исследовательским сообществом, мощные и недорогие решения с использованием машинного обучения становятся все более обычным явлением.Эти и многие другие связанные решения значительно проложат путь для инновационных приложений, использующих оценку глубины во многих областях.

Руководство по исследованию глубины с помощью глубокого обучения | Автор: Деррик Мвити

В этой статье представлена ​​глубокая нейронная сеть (DNN) для кусочно-планарной реконструкции карты глубины из одного изображения RGB. Предлагаемая DNN учится выводить набор параметров плоскости и соответствующие маски сегментации плоскости из одного изображения RGB.

Предлагаемая глубокая нейронная архитектура - PlaneNet - учится напрямую создавать набор параметров плоскости и маски вероятностной сегментации плоскости из одного изображения RGB.Определенная функция потерь не зависит от порядка расположения плоскостей. Кроме того, сеть прогнозирует карту глубины на неплоских поверхностях, потери которых определяются с помощью масок вероятностной сегментации, чтобы обеспечить обратное распространение. Источник

PlaneNet построен на расширенных остаточных сетях (DRN). Три выходные ветви для трех задач прогнозирования составляются с учетом окончательных карт функций высокого разрешения из DRN. Это параметры плоскости, неплоские карты глубины и маски сегментации.

Ветвь параметров плоскости имеет глобальный средний пул для уменьшения размера карты объектов до 1 x 1.Затем следует полностью связанный слой для получения параметров плоскости K × 3 . K - прогнозируемое постоянное количество самолетов. Затем определяется независимая от порядка функция потерь, основанная на метрике расстояния фаски для параметров регрессионной плоскости.

Ветвь сегментации плоскости начинается с модуля объединения пирамид, за которым следует сверточный слой для создания карт правдоподобия каналов для плоских и неплоских поверхностей. Добавляется модуль плотного условного случайного поля (DCRF) на основе алгоритма быстрого вывода.Модуль DCRF обучается совместно с предыдущими уровнями. Стандартные перекрестные энтропийные потери softmax используются для контроля обучения сегментации.

Непланарная ветвь глубины использует один и тот же модуль объединения пирамид, за которым следует сверточный слой, который создает 1-канальную карту глубины.

источник

Вот сравнения точности глубины по набору данных NYUv2.

source

7 советов - Как добавить глубину и размер в ваши фотографии

Как добавить глубины фотографии? И как сделать так, чтобы ваши фотографии выглядели потрясающе трехмерными?

Depth помогает создать ощущение места и привлекает зрителя к вашим изображениям.Кроме того, это отличный способ быстро вывести свои композиции на новый уровень.

В этой статье вы найдете семь техник и советов, которые помогут вам передать более сильное ощущение глубины на ваших фотографиях.

Приступим!

1. Используйте ведущие линии

Вот один из самых простых способов передать глубину в фотографии:

Используйте широкоугольный объектив и включите направляющие линии, идущие от нижней части кадра к верхней.

Этот метод в основном используется в пейзажных и архитектурных фотографиях, но вы также можете использовать направляющие линии в портретах, уличных снимках и т. Д.

Линии не должны быть очевидными. Например, взгляните на это фото:

Камни образуют естественные линии, которые переводят взгляд с переднего плана на остров на горизонте.

На этой фотографии такой же тонкий набор ведущих линий:

Водные пути на среднем расстоянии уводят взор к горам. Но линии скорее извилистые, чем прямые, что помогает придать изображению более органичный вид - такой, который хорошо сочетается с темой пейзажа.

2. Используйте перспективу

На этой фотографии показано, как линии могут по-разному добавлять глубину:

Здания образуют сходящиеся линии, которые исчезают к горизонту, создавая эффектное ощущение глубины.

Обратите внимание, что эта техника похожа на то, как художник использует перспективу. Я добавил оверлей, чтобы вы могли увидеть, как это работает:

3. Думайте передний план, средний план и задний план

Большинство фотографов знакомы с правилом третей, но когда дело доходит до передачи ощущения глубины, полезно разбить фотографию на другой набор третей:

Передний план, средний план и задний план.

То, что вы ищете, - это способ соединить каждую часть фотографии, переводя взгляд зрителя с переднего плана на задний. Наличие в изображении трех зон - различных, но связанных между собой - поможет создать ощущение глубины и трехмерности.

Ведущие линии - это один из способов связать три зоны, но линии не всегда присутствуют в сцене. Так что, когда линий нет, вам нужно работать с каким-то другим композиционным элементом.

Часто это просто означает включение чего-то интересного на переднем плане.

Например, на фото ниже на заднем плане видны несколько зданий, на среднем плане - бетонная пристань, а на переднем - край другого причала. Я добавил причал переднего плана, чтобы создать ощущение глубины.

Вот еще один пример:

Вы видите, как добавление камней на передний план создает композицию с тремя отдельными зонами (передний план, средний план и задний план)?

И как только зоны присутствуют, вы получаете ощущение глубины, когда взгляд зрителя перемещается по кадру.

Помогает то, что благодаря широкоугольному объективу скалы кажутся довольно большими по сравнению с далекими скалами.

4. Используйте перспективу с воздуха

Еще одна техника, которая помогает передать ощущение глубины в фотографии, - это воздушная (или атмосферная) перспектива.

Здесь из-за атмосферных условий объекты на расстоянии кажутся туманными.

Конечно, вы часто ограничены условиями окружающей среды, но как только вы видите дымку вдалеке, я настоятельно рекомендую вам попытаться найти способ включить ее в свою композицию.

На фото ниже видно, что деревья вдалеке с левой стороны закрыты атмосферной дымкой, которая добавляет глубины:

И глубина еще больше увеличивается за счет сходящихся линий, образованных стенами. Таким образом, два метода работают вместе, чтобы придать финальному кадру большую глубину:

5. Сделайте снимок через объект переднего плана

Приемы, которыми я поделился выше, хорошо работают с широкоугольными объективами, но менее полезны, если вы используете телеобъективы.

Видите ли, телеобъективы увеличивают расстояние между вами и вашим объектом, что приводит к более плоской перспективе в целом (то есть перспективе с меньшей глубиной).

Тем не менее, есть несколько приемов, которые можно использовать с телеобъективами для создания ощущения глубины.

Один из способов - снять с по то, что находится между вами и объектом (например, траву, ветки или окна).

На фотографии ниже объект съемки - заходящее солнце. Я снимал через траву (и на самом деле я сфокусировался на траве, немного расфокусировав солнце), чтобы добавить ощущение глубины тому, что в противном случае было бы очень плоским изображением.

Вы также можете использовать эту технику для портретов. Я создал портрет ниже, снимая ветви дерева:

Итак, в следующий раз, когда вы будете снимать объект с помощью телеобъектива, посмотрите вокруг, чтобы не пропустить объекты. Я гарантирую, что вы найдете один или два объекта, которые затем можно использовать для создания глубины!

6. Используйте выборочную фокусировку

Выборочная фокусировка - это метод, при котором вы намеренно устанавливаете широкую диафрагму и фокусируетесь на объекте (и при этом создаете размытый фон).

Это особенно эффективно для портретов, поскольку размытие помогает отделить модель от фона и в конечном итоге создает ощущение глубины.

Следующий портрет был сделан при диафрагме f / 2.0 с объективом, сфокусированным на глазах модели:

Вы видите, как размытый фон и резкий объект создают трехмерное изображение?

Это сила избирательного фокуса!

7. Передайте глубину с помощью цвета

Вот вопрос, который стоит задать себе:

Что происходит с цветами фона, когда вы используете технику выборочной фокусировки (как обсуждалось в предыдущем совете)?

Видите ли, когда фон не в фокусе, цвета сливаются друг с другом.

И если вы аккуратно расставите цвета, вы можете добиться хорошего контраста между цветами фона и цветами на объекте.

Что это делает?

Передает глубину!

Например, посмотрите цвета на этом портрете:

Фон почти белый, тогда как у мужчины свитер и волосы темно-красного цвета; это отделяет его от фона.

Фактически, вы можете довести эту идею до крайности, используя выносную вспышку с оранжевым гелем.Когда вы это сделаете, модель будет освещена оранжевым светом (от гелевой вспышки), но фон будет освещен более холодным окружающим светом.

(Этот метод хорошо работает в сумерках, когда окружающий свет имеет естественный синий цвет.)

В конечном итоге вы получите хороший контраст между более теплой моделью и более холодным фоном. В приведенном ниже примере модель освещалась одной вспышкой, оснащенной софтбоксом диаметром 60 см и оранжевым гелем.

Как добавить размер и глубину в фотографию: заключение

Теперь, когда вы закончили эту статью, вы должны быть хорошо подготовлены к созданию фотографий с большой глубиной и размером!

Так что идите и попрактикуйтесь в некоторых из описанных мною техник.

Теперь к вам:

Какие еще у вас есть идеи для создания и добавления глубины в фотографии? Пожалуйста, дайте нам знать в комментариях ниже!

FCPX Photo Depth - Профессиональные инструменты для карт высот и глубины в FCPX

Часто задаваемые вопросы

.

.

Где мне найти этот плагин внутри FCPX?

.

.

.

Почему маска не совпадает с моим изображением?

.

Если ваша маска не совмещена с вашим медиафайлом, это может быть связано с тем, что разрешение вашего медиафайла отличается от разрешения вашего проекта. Чтобы исправить это, убедитесь, что медиафайлы объединены, выбрав клип на шкале времени, щелкните его правой кнопкой мыши и выберите «Новый составной клип». Созданный составной слой будет иметь такое же разрешение, что и ваш проект. Затем вы можете применить плагин к своему составному клипу и создать маски.

Инструмент маскирования использует разрешение проекта, поэтому, если ваш носитель не того же разрешения, маски будут отображаться не по назначению после применения. Объединение медиафайлов перед применением эффекта решит эту проблему, поскольку в результате составной клип будет иметь такое же разрешение, что и проект.

.

Какое разрешение мне нужно для использования этого проекта?

.

Этот продукт может работать с любым разрешением, однако для этого требуется проект с соотношением сторон 16: 9.Он не будет работать с любым соотношением сторон.

.

.

.

Как мне применить этот плагин?

.