Гамма и мифология

1. Монитор — нелинейное устройство.

1.1 Некоторые соглашения.

1.2 Линейные и нелинейные системы.

1.3 Сигналы для CRT монитора.

1.4 Передаточная функция для CRT монитора.

1.5 История появления "гаммы".

1.6 Гамма-компенсация.

2. Ошибки дискретизации.

2.1 Небольшая вводная часть и соглашения.

2.2 Числа для монитора.

2.3 Сколько градаций светлоты монитора нужно для слитного изображения.

3.1 Психофизиология и физика: глаз, свет, модель.

3.2 Формирование цифровых изображений натуральных сцен.

3. Формирование и обработка цифровых изображений

3.1 Психофизиология и физика: глаз, свет, модель.

3.2 Формирование цифровых изображений натуральных сцен.

3.3 Последствия ввода гамма-компенсации для линейно оцифрованных изображений.

1. Монитор -- нелинейное устройство.

1.1 Некоторые соглашения

Сигнал -- это описание того, как один параметр изменяется от другого. Система -- это какой-то процесс, который дает выходной сигнал в ответ на входной.

рис.1 Система -- любой процесс, который дает отклик y(t) на входной сигнал x(t)

Когда я буду говорить сигнал, то это означает просто математическая зависимость, без знания о том, что это такое: электрический сигнал, светимость люминофора или звук. Когда говорим о системе, точно также, опускаем детали, монитор это или телефон.

1.2 Линейные и нелинейные системы

Системы бывают линейные и нелинейные. Чтобы понять то, что написано ниже на этой странице, чрезвычайно важно понять, что такое линейная система. Линейная система математически обладает двумя свойствами:
а) гомогеничностью (homogeneity): если амплитуду входного сигнала x(t) увеличить в k раз, то выходной сигнал y(t) увеличится тоже в k раз.
б) аддитивностью: если два входных сигнала поданные раздельно, вызывают отклики y1(t) и y2(t), то сумма x1(t)+x2(t) сигналов на входе дает точно y1(t)+y2(t). Не больше и не меньше.

Подобные оценки широко распостранены в инженерной и конструкторской практике. Пример линейной системы: ток в резисторе от напряжения.

рис.2 Линейная система: процесс протекания тока через резистор в зависимости от приложенного напряжения

Изменяя напряжение на выводах резистора, мы меняем ток через резистор по закону Ома: u=R*i. Закон, найденный Омом, гарантирует, что увеличение напряжения k*u обязано привести к увеличению тока в k раз. Пример нелинейной системы: тепло в резисторе от напряжения.

рис.3 Нелинейная система: выделение тепла на резисторе в зависимости от напряжения

Так как тепло, выделившееся в резисторе, растет по степенной функции u2, изменение в k раз напряжения u приведет к изменению в k2 выделившегося тепла.

Аддитивность можно представить как свойство системы не допускать "взаимодействия" между двумя сигналами. В звукотехнике, например, этот параметр используется для оценки качества усилителей: при подаче чистых синусоидальных сигналов система может показаться линейной, однако один сигнал, скажем, низкочастотный, может изменить параметры системы (усилителя) так, что другой сигнал, высокочастотный, окажется промодулирован низкочастотным и к тому же оба изменят свою синусоидальную форму— появится множество дополнительных гармонических сигналов. В итоге, простая сумма гармонических сигналов на входе приведет к искажению их формы и появлению дополнительных компонент на выходе. Такая система нелинейна. Вообще говоря, физических линейных систем не бывает, это математическая идеализация. Однако на каком-то интервале значений входных/выходных сигналов передаточную функцию при заданной точности можно представить линейной моделью.

1.3 Сигналы для CRT монитора

Cathode Ray Tube (CRT) монитор -- система, в которой главную роль играет электронная лампа под названием кинескоп. Входной сигнал -- напряжение, выходной сигнал -- светимость.

1.4 Передаточная функция для CRT монитора

Чтобы выяснить отклик системы, делают серию замеров напряжение-светимость. Конструктивные особенности электронной лампы таковы, что точки на графике, отображающие результаты замеров, ложатся на кривую степенной зависимости. Вы можете открыть любой справочник по электронным лампам и поискать графики анодно-сеточных характеристик триодов. На таких графиках будет представлена зависимость анодного тока от управляющего напряжения на сетке. В нашем случае светимость люминофора прямо пропорциональна анодному току. Вот наш система:

рис.4 Нормированная зависимость интенсивности свечения монитора от напряжения видеосигнала на входном разъеме монитора

Есть три мифа, гуляющие по интернету. Первый: нелинейность системы создает нелинейная светимость люминофорного покрытия [к примеру, 1]. Второй: закон нелинейности экспоненциальный. Оба утверждения ложны. На рисунке 4а показаны зависимости для трехэлектродной лампы [10]. Характеристика лампы обычно рассчитывается в приведенном виде, то есть в объединении всех напряжений, действующих на отдельных электродах. Миф третий -- гамма-коррекция компенсирует нелинейность зрительной системы человека.

рис.4а Статические приведенные характеристики триодной лампы. В этих формулах: Ua– напряжение на аноде; Ug– напряжение на сетке; Rp—статическое внутреннее сопротивление лампы (от катода к аноду Ia/Ua); показатель степени n различен для различных участков характеристики и может принимать значения n=1-:-3; mu – коэффициент усиления лампы, m – ток начальной эмиссии.

1.5 История появления "гаммы".

На заре телевизионной техники, когда парк телевизоров был еще незначителен, разработчики телевизионной сети встали перед задачей: линейный видеосигнал с видикона, поданный на вход телевизора, приводил к почти черной картинке, нужно вводить коррекцию сигнала, но на чьей стороне? Проще и дешевле на передающей, так как в те времена реализовать аппаратно такую коррекцию было дорого, и к тому же расточительно— пришлось бы встраивать такой корректор в каждый телевизор. Так и решено было ввести эти предыскажения на передающей стороне. Телевизоры оказались проще и дешевле. Коррекцию, которую ввели, называют "гамма". Миф третий: гамма— полезная функция в чем-то еще, кроме компенсации нелинейности монитора. Утверждение ложное. Сегодня это технический нонсенс. Подробное обоснование приведу ниже.

1.6 Гамма-компенсация

1.6.1 Тракт прохождения сигнала

Рис. 5 Типичная цепь прохождения сигнала "освещенность в зависимости от пространственного расположения" от предмета до экрана монитора. [2].

Пояснения к рис. 5., слева направо. Будем говорить о самере, использующей матрицу ПЗС (CCD).

а) Зависимость напряжение ПЗС (CCD) от освещения монохромным светом— чрезвычайно линейна. Принцип действия -- светоинтегрирующее устройство. Линейность [свет–ПЗС–напряжение] обеспечивается линейностью накопления заряда и линейностью считывания элемента.

б) Наибольшие проблемы у матриц ПЗС в темновой области— именно в этой части к выходному сигналу матрицы суммируется шум. На рисунке 5: sensor noise.

в) непрофессиональные камеры имеют неотключаемое устройство, на рисунке 5 обозначенное как compressor. Профессиональные устройства позволяют получать RAW-image, то есть данные с матрицы без предыскажений.

г) следующий источник шума, показанный на рисунке— шум дискретизации, шум электронных схем, схем сжатия и кодирования сигнала (JPEG), image noise.

д) Тракт переноса данных. Представлен как "черный ящик" storage, transmission, processing,... Сюда можно отнести кабель, устройства памяти, программы редактирования и т.п.

е) далее, собственно, дисплей, с передаточной функцией, представленной на рис. 4

1.6.1 Система предыскажений

На сегодняшний день линеаризовать передаточную функцию монитора не составляет проблем. Если считать видеокарту компьютера составной частью монитора (то же самое показано на рис.5— expander есть LUT видеокарты), то становится ясно, что такой анахронизм, как предыскажение сигнала в самом начале тракта есть просто дань истории.

Прежде чем говорить о линеаризации, нужно знать характеристику системы. Вообще говоря, для этого пришлось бы сформировать набор напряжений на входе монитора и измерить фактический отклик. Обычно же считается, что монитор достаточно точно следует по форме кривой степенной функции, а степень (гамма) имеет значение 2.5 для каждой пушки (исследование лаборатории Би-Би-Си в этом вопросе, правда, заканчивается утверждением, что гамма зависит от установки уровня черного, однако это вопрос уже методики измерения, а не конструктивно определенной величины. К примеру, нормально спроектированное устройство калибровки и профилирования мониторов обязательно предложит установить уровень черного и белого, перед самим процессом калибровки). Отклонения гаммы составляют примерно плюс-минус 0.25. Уже отсюда видно, что без конкретного промера мы можем расчитывать лишь на приближенное соответствие формулы рис.4 конкретной характеристике монитора.

рис.6 Слева: кривая с рис.4, справа т.н. гамма-компенсация, как правило, "вшитая" в файлы изображений.
рис.7 Так выглядит нормализованный график суммы двух функций
f(u)+f-1(u), физический смысл: эта кривая показывает скорость изменения приращения аргумента (u) относительно линейного приращения.

Солидные источники, такие как [3], указывают несколько иные компенсационные кривые, см. рис.8.

рис.8 HDTV Standard предлагает иную кривую для компенсации нелинейности монитора (предыскажений на передающей стороне). Здесь R это linear-light intensity а R'709 это нелинейность монитора, см. рис.4 Как видим, при малых сигналах степенная функция заменена на отрезок прямой.

Кстати, нет единого мнения, почему при хорошо известной кривой монитора PC (рис.4) с гаммой 2.5 для "компенсации" выбрана 1/2.2. Чаще всего это связывают с тем, что поскольку гамма-компенсация пришла из TV, то в расчет берется неблагоприятные условия просмотра при достаточно ярком окружающем освещении. Потребитель при сильном освещении комнаты, где стоит телевизор, просто прибавляет регулятором яркости общую яркость телевизионной картинки, при этом повышается уровень черного, но самые светлые места попадают в нелинейную область из-за ограничения тока катода кинескопа (а соответственно току, яркости свечения люминофора). Зависимость нелинейности телевизора перестает соответствовать степенной функции по форме, при этом степенная функция 2.2 обеспечивает меньшую среднеквадратичную ошибку аппроксимации. Совершенно ясно, что такое значение гаммы не может компенсировать нелинейность монитора, настроенного правильно по уровню черного, из-за другой формы кривой. Значение гаммы 1/1.72, принятое для рабочего пространства Макинтошей, может сбить с толку, если не знать, что вторая, недостающая часть до 1/2.5, уже применена к монитору. Таким образом, компенсация нелинейности разбита на две части — в рабочем пространстве, и в мониторе (к монитору я отношу и видеокарту). Выбор меньшего значения для гамма-компенсации в рабочем пространстве уменьшает искажения в обработке изображений. Поэтому система Макинтош принципиально лучше, чем PC, позволяет подготовить изображения в области теней, если говорить о начальных установках, предложенных для этих систем производителями. Об этом позже.

1.6.2 Калибровка монитора

На сегодняшний день стало нормой использовать калибраторы монитора в профессиональной работе.

Как правило, во многих статьях даются советы, в которых заметно незнание авторами, теперь уже почти забытой, теории ламповой техники. Но писать что-либо и давать советы для мониторов, не зная этой теории, нонсенс. Прежде чем калибровать монитор, исключительно важно установить рабочую точку анодно-сеточной характеристики нашей лампы-кинескопа (в более общем виде можно посмотреть [11]). Известно, что ламповые выходные каскады по расположению рабочей точки (применительно к монитору, это уровень яркости черного) классифицируются на типы A, AB, B, BC, C. Работа кинескопа относится к режиму работы AB или B, в зависимости от того, где находится рабочая точка. В переводе на понятный язык, в зависимости от того, имеет ли монитор начальный уровень засветки. Чтобы узнать, какую расчетную яркость черного закладывали конструкторы, лучше всего попробовать поискать информацию на сайте производителя, но в общем случае это будет 0.02-0.07. Уровень черного устанавливается регулятором Brightness. Если вы установите слишком большую начальную яркость для черного, -- это может понадобится для работы в сильно освещенном месте, -- понятие "гамма" может оказаться не применимым к нелинейной функции светоотдачи вашего монитора. Такая нелинейность сильно будет отличаться от степенной функции (рис.6, слева).

Например, вот кривые моего монитора:

рис.9 Черная линия с точками -- идеальная характеристика монитора. Синяя линия (target) — заданная пользователем гамма (для моего монитора ViewSonicP810 gamma=2.54). Компенсационные значения, точно компенсирующие характеристику монитора в степенную функцию (синия линия)-- цветные линии около черной линии. Цветовая температура для калибровки указана D65.

Как видим, калибратор не приводит к линейности монитора (за исключением случая калибровки в гамму 1.0). Это миф номер четыре. Вычисленные на основе измерений с экрана с помощью серии промеров градационой шкалы серого поля значения, загружаемые в LUT видеокарты, приводят всего лишь кривую зависимости Output Luminance к точной степенной зависимости от Input RGB. Это синия линия Target на рис.9. А точную степенную зависимость призвана компенсировать гамма-функция, чего на самом деле, в случае применения гаммы=2.2, не происходит. Точно компенсирует эту зависмость только та гамма, в которую происходила калибровка монитора, в моем случае 2.54. Откуда взялось "странное" значение гаммы, выбраной мной?

1.6.3 Выбор значения гамма для монитора при калибровке

Для примера я "откалибровал" свой монитор для гаммы 2.2. Как видим, родная гамма моего монитора явно не 2.2, потому как программное обеспечение калибратора пытается загрузкой коэффициентов в LUT видеокарты привести кривую светоотдачи к правильной степенной зависимости, и делать это приходится большими корректировочными коэффициентами. Вообще говоря, математически правильно было бы корректировать нелинейность монитора в гамму 1.0, то есть, синия линия Target на рис.10 должна совпасть с черной, а цветные кривые могут разъезжаться как им угодно. Но во-первых, это уже будет называться не калибровкой, а линеаризацией. Во-вторых, из-за сегодняшних ограничений 8-битных видеокарт мы получим очень большие ошибки дискретизации [4]. Математическая модель в этом случае имеет свои ограничения, и на этапе калибровки следует придерживаться конструктивных параметров мониторов. В будущем, когда появиться видеопроцессоры 12 бит (этого достаточно) реального времени, и не дороже какого-нибудь таймера 555, мониторы станут линейными от входного разъема до светимости люминофора. При этом видеокарта перейдет из компьютера туда, где ей положено быть по функциональному назначению — в монитор.

рис.10 Черная линия с точками -- идеальная характеристика монитора. Синяя линия (target) — заданная пользователем gamma=2.2. Компенсационные значения, точно компенсирующие характеристику монитора в степенную функцию (синия линия)-- цветные линии около черной линии.

Как видим, все три пушки монитора ведут себя почти одинаково. Причина этого в том, что современные вещества для люминофоров имеют родную цветовую температуру белого около 9000K, и если монитор достаточно хорошего качества (мое мнение), то выбор цветовой температуры не ниже 6500K не должен приводить к сильной разбалансировке по каналам R,G,B. При калибровке в D50 кривые могут разъехаться так, что площадь под ними может доходить до 1/4 от всего графика. На рис. 11 пример калибровки в D50 при gamma=2.2.

рис.11 Черная линия с точками -- идеальная характеристика монитора. Синяя линия (target) — заданная пользователем gamma=2.2. Цветовая температура для калибровки указана D50. Компенсационные значения, точно компенсирующие характеристику монитора в степенную функцию (синия линия) -- цветные линии около черной линии.

Как видим, с математической точки зрения, для идеальной видеокарты прошел вполне нормальный процесс аппроксимаций заданных функций. Реально же, из-за ограничений 8-битной видеокарты -- ошибки, возможно, выйдут за допустимые границы для профессиональной работы. Дело в том, что если потеря для монохромного изображения составляет три градации, то в цветном это уже 3*3*3=27.

При калибровке в родную гамму (она смотрится в *.icm profile от производителя, можно оценить и по минимуму расхождений цветных линий от линейной черной— как на рис.9,10,11; можно пользоваться и специальными тестовыми картинками— но это отдельная тема) и в температуру не ниже 6500, действительно высококачественный монитор будет иметь минимальные корректировки по всем каналам. Соотвественно, и самый широкий цветовой охват. У производителей всё, что сказано в этом пункте, обычно спрятано за фразой: «рекомендуется проводить калибровку при такой-то гамме в такую-то температуру, при этом достигается максимальная производительность устройства.» Калибровать во что-либо иное, чем в родные конструктивные параметры— значит сознательно или бессознательно, но уменьшать гамут (gamut— цветовой охват) монитора и вводить дополнительные ошибки дискретизации в ЦАПе видеокарты (при 8 битах они точно есть, смотрите [4]). При работе с ICM-aware приложением, поддерживающим не менее 12-битную обработку файлов, сегодня калибровка во что-либо иное, чем в конструктивно заложенное, полная бессмыслица. Гамма-функция у монитора, если ее подтянули калибровкой к степенной, может быть очень точно скорректирована с минимальными ошибками дискретизации для любого файла внутри такого приложения, при условии, что вы сделали доступным для этого приложения профиль для вашего монитора.

Кроме сказанного о технической стороне калибровки, нужно предупредить о возможном недоразумении относительно термина "калибровка". Редкий случай, когда собеседники договариваются о едином понимании всех терминов перед началом дискуссии. Общепринятое соглашение для калибровки, относительно нашей темы, есть примерно следующее: калибровка— приведение устройства в то состояние, в котором оно соответствует техническому заданию при изготовлении на заводе-изготовителе (математической модели в конструкторских расчетах). В этом смысле калибровка некоторых устройств, например, недорогих принтеров, будет заключаться в проверке наличия бумаги в лотке и нажатого состояния кнопки "сеть". Все остальные операции и манипуляции могут носить название линеаризация и характеризация (профилирование).

2. Ошибки дискретизации

2.1 Небольшая вводная часть и соглашения

Множество приборов и устройств собирают и отображают для человека сигналы. Математически они описываются функциями, и математически всё выглядит очень гладко. Однако физическая реализация некоторых передаточных, корректирующих, линеаризующих и т.д. фильтров упирается в то, что математические функции отыскиваются в самих электронных приборах, например, логарифмическая функция есть одна из физических зависимостей в транзисторе, включение которого в определенный контекст схемы даст логарифмическую функцию у этой схемы. Однако эта зависимость у транзистора лишь аппроксимация (приближение) математической. Функции умножения сигналов в аналоговой технике— сплошная головная боль конструкторов и инженеров, применяют ее только там, где без этого уже никак не обойтись. Для человека, знакомого с математикой, умножение двух функций не выглядит чем-то особенным. Применение математики в исследовании сигналов глубоко разработанная тема, и была таковой задолго до эры цифровой техники. Математика изучает числа. Поэтому перевод сигналов в поток чисел (наглядно— это как бы следующие друг за другом таблицы чисел, описывающие сигнал интервал за интервалом) позволяет мыслить об обработке, распознавании, сжатии, генерации речи, музыки и т.д. в контексте математики. В конце концов, сетчатка нашего глаза— дискретное устройство, состоящее хоть и из большого, но конечного числа колбочек и палочек. Вопрос о том, почему мы воспринимаем мир не дискретно, каков механизм ощущения слитности образов, запахов (наш нос может различать концентрации некоторых веществ буквально в сотни молекул на кубический сантиметр), звуков — будущая задача исследователей.

2.2 Числа для монитора

От видеокарты компьютера к монитору на вход подаются ступеньки напряжения по каждому каналу: R,G,B. На выходе монитора— светимость точек люминофора. В идеале ступеньки напряжения на входе монитора соответствуют числам в файле. Если у нас 8-битное изображение, для каждого канала RGB имеется 256 возможных значений ступенек.

рис.12 Каждая ступенька напряжения, подаваемая на вход, в идеале представляет собой число в файле (для простоты будем говорить о grayscale файле) В синем кружке — обратная операция
аналог->цифра.

Наши числа для монитора представляют ту же кривую рисунка 4. В линейной системе каждому числу 0...255 из файла соответствует ступенька на входе и ступенька на выходе. Для монитора эти 256 ступенек означают 256 градаций светлоты (светимости). В нелинейной системе ступеньки будут разными как по высоте, так и по ширине, что приведет к уменьшению степеней градации. Мы подразумеваем, что на вход всегда подаем 256 одинаковых по высоте ступенек напряжения. Итак, мы отправили на монитор лесенку из 256 градаций, сколько градаций мы увидим на мониторе? Чтобы это выяснить, посмотрим на график зависимости и на таблицу значений.

рис.13 График зависимости светимости люминофора от дискретного напряжения на разъеме монитора

Таблица того, что происходит на мониторе при подаче на него равномерных линейных отсчетов дискретного сигнала, приведена в таблице ниже. Увеличение напряжения последовательно от 0 до 20 ступенек приводит всего лишь к одной ступеньке расчетной светимости экрана. Дальше хорошо видно, что 46 ступенек на входе приводят к увеличению светимости всего на 3 расчетные ступеньки.


Выход            Вход
---------------------
0.0              0  ---------\   
0.0002455781533  1  ----      \
0.0013891998204  2  ----       \
0.0038281845497  3  ----        \
0.0078585009077  4  ----         \
0.0137282361179  5  ----          \
0.0216554820380  6  ----           \
0.0318371973407  7  ----            \
0.0444543942545  8  ----             \
0.0596754912681  9  ----              \
0.0776586308216  10 ----                = 0
0.0985533615625  11 ----              /
0.1225019055917  12 ----             /
0.1496401414724  13 ----            /
0.1800983850686  14 ----           /
0.2140020220908  15 ----          /
0.2514720290475  16 ----         /
0.2926254083801  17 ----        /
0.3375755563705  18 ----       /
0.3864325775293  19 ----      /
0.4393035557734  20 ---------/  
0.4962927902822  21  
0.5575020021566  22 -------\  
0.6230305167077  23 ----    \ 
0.6929754252173  24 ----     \
0.7674317292710  25 ----      \
0.8464924701832  26 ----       \
0.9302488455870  27 ----         = 1
1.0187903149024  28 ----       /
1.1122046951146  29 ----      /
1.2105782480647  30 ----     /
1.3139957602712  31 ----    / 
1.4225406161459  32 -------/  
1.5362948653469  33 -----\  
1.6553392849045  34 ----  \ 
1.7797534366721  35 ----   \
1.9096157205796  36 ----      = 2
2.0450034241061  37 ----    /
2.1859927683391  38 ----   /
2.3326589509390  39 ----  / 
2.4850761862943  40 -----/  
2.6433177431168  41 ----\  
2.8074559797005  42 ---- \ 
2.9775623770421  43 ----  / = 3
3.1537075700006  44 ---- / 
3.3359613766549  45 ----/  
3.5243928260017  46  
3.7190701841224  47  
3.9200609789347  48  
4.1274320236345  49  
4.3412494389220  50  
4.5615786740995  51  
4.7884845271192  52  
5.0220311636520  53  
5.2622821352445  54  
5.5093003966227  55  
5.7631483221978  56  
6.0238877218256  57  
6.2915798558645  58  
6.5662854495763  59  
6.8480647069082  60  
7.1369773236938  61  
7.4330825003054  62  
7.7364389537908  63  
8.0471049295208  64  
8.3651382123785  65  
8.6905961375109  66  
9.0235356006703  67  
9.3640130681637  68  
9.7120845864337  69  
10.067805791287  70  
10.431231916793  71  
10.802417803858  72  
11.181417908509  73  
11.568286309881  74  
11.963076717940  75  
12.365842480939  76  
12.776636592629  77  
13.195511699236  78  
13.622520106209  79  
14.057713784751  80  
14.501144378151  81  
14.952863207909  82  
15.412921279679  83  
15.881369289031  84  
16.358257627039  85  
16.843636385699  86  
17.337555363196  87  
17.840064069014  88  
18.351211728896  89  
18.871047289673  90  
19.399619423945  91  
19.936976534648  92  
20.483166759479  93  
21.038237975213  94  
21.602237801901  95  
22.175213606956  96  
22.757212509129  97  
23.348281382388  98  
23.948466859692  99  
24.557815336672  100 
25.176372975218  101 
25.804185706973  102 
26.441299236752  103 
27.087759045862  104 
27.743610395353  105 
28.408898329188  106 
29.083667677333  107 
29.767963058785  108 
30.461828884518  109 
31.165309360365  110 
31.878448489838  111 
32.601290076879  112 
33.333877728553  113 
34.076254857674  114 
34.828464685384  115 
35.590550243668  116 
36.362554377811  117 
37.144519748815  118 
37.936488835752  119 
38.738503938072  120 
39.550607177864  121 
40.372840502068  122 
41.205245684640  123 
42.047864328680  124 
42.900737868505  125 
43.763907571689  126 
44.637414541064  127 
45.521299716671  128 
46.415603877682  129 
47.320367644284  130 
48.235631479520  131 
49.161435691100  132 
50.097820433180  133 
51.044825708097  134 
52.002491368084  135 
52.970857116944  136 
53.949962511697  137 
54.939846964197  138 
55.940549742717  139 
56.952109973509  140 
57.974566642331  141 
59.007958595952  142 
60.052324543628  143 
61.107703058548  144 
62.174132579268  145 
63.251651411100  146 
64.340297727496  147 
65.440109571398  148 
66.551124856565  149 
67.673381368885  150 
68.806916767656  151 
69.951768586853  152 
71.107974236368  153 
72.275571003233  154 
73.454596052826  155 
74.645086430051  156 
75.847079060500  157 
77.060610751604  158 
78.285718193755  159 
79.522437961420  160 
80.770806514229  161 
82.030860198050  162 
83.302635246051  163 
84.586167779740  164 
85.881493809989  165 
87.188649238046  166 
88.507669856532  167 
89.838591350417  168 
91.181449297991  169 
92.536279171808  170 
93.903116339631  171 
95.281996065347  172 
96.672953509886  173 
98.076023732108  174 
99.491241689696  175 
100.91864224002  176 
102.35826014099  177 
103.81013005194  178 
105.27428653439  179 
106.75076405295  180 
108.23959697608  181 
109.74081957688  182 
111.25446603394  183 
112.78057043205  184 
114.31916676303  185 
115.87028892642  186 
117.43397073028  187 
119.01024589191  188 
120.59914803858  189 
122.20071070823  190 
123.81496735020  191 
125.44195132591  192 
127.08169590957  193 
128.73423428886  194 
130.39959956557  195 
132.07782475630  196 
133.76894279309  197 
135.47298652407  198 
137.18998871413  199 
138.91998204550  200 
140.66299911840  201 
142.41907245166  202 
144.18823448331  203 
145.97051757118  204 
147.76595399351  205 
149.57457594952  206 
151.39641555998  207 
153.23150486781  208 
155.07987583860  209 
156.94156036121  210 
158.81659024830  211 
160.70499723686  212 
162.60681298878  213 
164.52206909134  214 
166.45079705780  215 
168.39302832782  216 
170.34879426808  217 
172.31812617269  218 
174.30105526378  219 
176.29761269192  220 
178.30782953665  221 
180.33173680696  222 
182.36936544175  223 
184.42074631033  224 
186.48591021285  225 
188.56488788082  226 
190.65770997750  227 
192.76440709842  228 
194.88500977175  229 
197.01954845881  230 
199.16805355449  231 
201.33055538766  232 
203.50708422162  233 
205.69767025452  234 
207.90234361976  235 
210.12113438644  236 
212.35407255974  237 
214.60118808134  238 
216.86251082982  239 
219.13807062106  240 
221.42789720860  241 
223.73202028410  242 
226.05046947765  243  ----\    
228.38327435820  244  ----/
230.73046443390  245 
233.09206915253  246 
235.46811790180  247 
237.85864000977  248 
240.26366474517  249  ----\ 
242.68322131781  250  ----/ 
245.11733887887  251 
247.56604652130  252 
250.02937328017  253 
252.50734813297  254 
255.0            255

3. Формирование и обработка цифровых изображений

Нам придется рассмотреть целый ряд вопросов по физиологии, свойствам зрительного восприятия и построить модели по результатам известных экспериментов. Здесь же рассмотрим способы получения цифровых изображений, рабочих пространств (выбор математического поля) и их оценку.

3.1 Психофизиология и физика: глаз, свет, модель.

Конечно, здесь не будет рассматриваться весь огромный материал, претендующий на размещение под таким заголовком. Останемся в контексте вопроса о гамма-мифологии и рассмотрим содержательную сторону недоразумений, неправильных пониманий и ошибочных представлений.

3.1.1 Чувствительность глаза

В 1942 году трое ученых Hecht, Schlaer & Pirenne провели эксперимент для ответа на вопрос, какова предельная чувствительность глаза в идеальных условиях? [7]. То, что они обнаружили, оказалось весьма неожиданным, поэтому опишем классический эксперимент. Описание этого эксперимента затрагивает фундаментальные принципы работы зрительной системы.

Основа эксперимента очень проста — экспериментаторы предъявляли в качестве стимула вспышки света в поле зрения испытуемого и определили минимальный уровень света. Но прежде чем поставить эксперимент, им пришлось ответить на следующие вопросы:

Мы знаем, что нашему зрению нужно некоторое время, чтобы привыкнуть к темноте. Однако сколько времени? Минута? Две? Три часа? Десять часов? Ответ на этот вопрос на рис. 15.

рис.15 Темновая адаптация глаза

В этом эксперименте за время адаптации принято 40 минут.

К следующему вопросу, где должен быть расположен в поле зрения испытуемого источник вспышек, ответ показан на рис.16. Из этого рисунка видно, что максимальная чувствительность глаза находится в стороне от центральной ямки, так, что направление взгляда на объект должно составлять 20 градусов от самого направления на объект. Это известно с давних пор, когда люди изучали небо невооруженнм глазом. Еле заметную звезду можно было яснее фиксировать, если смотреть не прямо на нее, а чуть в сторону. Однако в какую сторону нужно отводить взгляд, чтобы не попасть на слепое пятно (место, где находится центральный нервный ствол)?

рис.16 Распределение палочек на сетчатке. На горизонтальной оси точка 0 совмещениа с центральной ямкой.

Направление на источник и правильное направление фиксации взгляда показаны на рис.17.

рис.17 Правильное расположение источника световых вспышек относительно правого глаза. Вид сверху.

Размер светового пятна был выбран 10 минут, так как было известно, что от 10 минут и меньше размер светового пятна не играл роли (spatial summation and Ricco’s law).

Продолжительность предъявления стимула была выбрана 1 миллисекунда (temporal summation and Bloch’s law).

Цвет света выбран 510 нм — зеленый, на основе известной кривой, см. ColorData.html (scotopic vision). Интересный вопрос, как была установлена такая зависимость? Сложность здесь в том, что совершенно разные по цвету световые стимулы нужно различить по светлоте, но разные по цвету стимулы человек сравнивает неудовлетворительно. Вновь напомню, что суждение человека "насколько светлее" очень сильно варьируется день ото дня, от количесва выпитого кофе и неспаных ночей. Однако способность человека выступать "нуль-метром" очень стабильна. В случае с разноцветными, бок о бок стимулами, детектирование нуля, баланса, светлоты, не работает. Поэтому комиссией CIE были приняты эксперименты, основанные на методе, подобном для демонстрации стробоскопического эффекта. Называется он фликер-метод (flicker photometry). Наблюдатель смотрит на экран с двумя представленными бок о бок образцами световых пятен. Пятна переключаются попеременно, с частотой примерно 15 Герц -- зрелище, надо сказать, пренеприятное :). Частоту слегка подстраивают, чтобы перемигивания цветами стали менее заметными, и проступил эффект от смешивания цветов, то есть, к примеру, зеленый и красный дали желтый; но сам фликер-эффект от желтого оставался заметным. Затем подстраивают мощности источников света до исчезновения (минимизации) фликер-эффекта, когда человек видит стабильный смесевой цвет. В этот момент считают, что те же световые пятна, светящие постоянно, дают равную светлоту.

Результат эксперимента определения чувствительности глаза: при условиях, перечисленных выше, глаз детектирует 90 фотонов. Даже сегодня изготовление таких детекторов сопряжено с большими трудностями (не имеются в виду аналоги счетчика Гейгера, но датчики с линейной характеристикой в диапазоне хотя бы трех порядков). Однако 90 фотонов — это весь свет, пришедший к оптической системе глаза, при этом:

Оставшиеся 10 фотонов и есть реальная чувствительность палочек.

3.1.2 Механизм темновой адаптации

Заметим, что у нас нет проблем видеть лист бумаги белым как при солнечном свете, так и при свете звезд безоблачным небом. Разница в освещенности сетчатки при этом равна отношению:

светимость листа белой бумаги под прямым солнечным светом равна 10тыс. нит;
светимость под звездным небом 0.00001 нит. Так как нужно учесть автоматическую работу зрачка, учтем диаметр отверстия, сквозь которое свет проходит к сетчатке:
диаметр зрачка для листа под солнцем 2мм, откуда площадь зрачка Pi*r2=3.14мм2.
диаметр зрачка для листа под звездами 8 мм, откуда площадь зрачка Pi*r2=50мм2.
Освещенность сетчатки от белого листа под солнцем равна 10000нит*3.14мм2=31400 троланд (единица в медицинской оптометрии)
Освещенность сетчатки от белого листа под звездами 0.0001нит*50мм2=0.005 троланд

Отношение освещенностей сетчатки: 31400/0.005=6.3миллиона раз.

В целом же человеческое зрение оперирует с объектами, светимость которых относится как 1 к 10 миллиардам.

Посмотрим, как создаваемые человеком приборы оперируют с диапазоном яркости.

Оптическая плотность D -- это десятичный логарифм отношения, которое называют либо коэффициент отражения, либо коэффициент пропускания. Чтобы наглядно представить, что такое D, ниже представлена табличка соответствия:

Соотношения между оптической плотностью, прозрачностью и непрозрачностью
оптическая
плотность D
непрозрачность прозрачность
1 10 1/10
2 100 1/100
3 1000 1/1000
4 10 000 1/10 000
5 100 000 1/100 000
6 1 000 000 1/1 000 000
рис.18 Аналогия работы глаза и фотокамеры для объяснения темновой адаптации.

Фотоаппарат при съемке объектов на сцене имеет записанные яркости оптического изображения на обычной фотопленке, которые переносятся на фотобумагу, и бумага имеет оптическую плотность поверхности не более 2 (практически предельная оптическая плотность поверхности у черного меха — 2.4). В то же время, обычная сцена имеет плотность яркостей 6D. К примеру, фотокамера на рис.18 имеет следующие возможности для "адаптации":

У нашего зрения нет возможности изменить время экспозиции, сетчатка освещается непрерывно. Мы не можем поменять пленку (сетчатку), это тоже понятно. Остается изменение диаметра входного отверстия, зрачка. Расчет, подобный уже проделанному, показывает, что освещенность сетчатки при изменении зрачка от 2 до 9 мм изменяется всего лишь в 20 раз. В сравнении с десятью миллиардами это ничто. Основная доля адаптации базируется на разделе в оперировании освещенностью между двумя типами фоторецепторов: т.н. палочек и колбочек. Палочки слепы к цвету и обеспечивают фотонную чувствительность в темноте (scotopic system). Колбочки отвечают за восприятие цвета и работают в следующем диапазоне яркости (photopic system). Диапазон работы обеих систем слегка перекрываются, так что возможен такой подбор освещенности сцены, когда будут работать оба типа фоторецепторов. Дальнейшее объяснение темновой адаптации состоит в предположении, которое называется фотохимическое объяснение. Его суть состоит в том, что обесцвеченый пигмент (пигмент вступает в химреакцию, запуская процесс рождения сигнала, при этом сам обесцвечивается) регенерирует в первоначальное состояние. При этом расчеты показывают, что восстановившийся на 50% родопсин (пигмент сумеречного видения) должен увеличить порог чувствительности в 10млн. раз. Однако это остается гипотезой, так как эксперименты по восстановлению 50% родопсина показали, что порог изменяется в 1000 раз сильнее. Объяснения этому пока нет.

3.1.3 Световая адаптация

Точно так же, как наше зрение адаптируется к темноте, восстанавливая максимальную чувствительность, очевидно, что такая же способность существует к восстановлению нормального зрения при переходе от темноты к свету. Теперь, наконец, мы подобрались к очень важному, в контексте нашей темы, эксперименту.

Световая адаптация изучается измерением способности испытуемого к возможности обнаружения слабого светового сигнала на светлом фоне. В самом начале испытуемый находится в полной темноте, пока не произойдет темновая адаптация. Затем появляется освещенный экран как фон и испытуемому дают время на адаптацию к посветлевшему фону. Адаптация к свету проходит значительно быстрее, чем к темноте, обычно за 1.5 минуты. На этом фоне проецируют светлое пятно увеличивающейся яркости, и как только испытуемый фиксирует появление пятна, производится отсчет физической величины яркость (luminance) (кд/м2) для фона и для пятна. Процесс продолжается, пока не будет достигнут предел болезненной яркости фона.

В первых экспериментах на основании полученных результатов определилась зависимость [8]:

, где

L – величина изначальной яркости;

дельта L – величина приращения яркости порога различения;

Эта зависимость носит название закон Вебера (Weber's law). Более точные повторные эксперименты выявили некоторую неравномерность, которую не описывал закон Вебера.

рис.19 Световая адаптация глаза.

Секция 1: Почти черный фон, нейронный шум сетчатки определяет первое приращение дельта(I).

Секция 2: очень слабо освещенный фон, видимые флуктуации фона определяют уровень приращений. Эту часть описывает закон DeVries-Rose, по которому приращение дельта(I) возрастает как корень квадратный от яркости Ib.

Секция 3: длинная секция (10 000раз) с наклоном примерно 1. Из этого результата прямо следует, что приращение дельта(I) возрастает прямо пропорционально яркости фона и его точно описывает математическое выражение с названием закон Вебера (Weber's law). Постоянная k называется постоянной Вебера. Для палочек эта постоянная примерно равна 0.14. Это означает буквально: если фон имеет яркость 100ед, детектируемое приращение будет 14ед; если фон имеет 1000ед, приращение будет 140ед. Это самый главный принцип человеческого зрения. Глаз и мозг сконструированы так, что главным образом отмечают разницу в яркости, почти игнорируя абсолютную яркость. Светлота (lightness) на этом участке почти не зависит от свойств самого света. Допустим, мы держим в руках белый лист бумаги с черным шрифтом при освещенности, соответствующей самой нижней части секции три. Запомним яркость черной краски. Затем выше, в конце секции три, мы по-прежнему видим точно тот же черный текст на белой бумаге. Но на этот раз яркость черной краски такова, какая была у белой бумаги в начале секции. Тем не менее, бумага выглядит белой, а текст выглядит черным. В то же время, увеличение приращения, нужного для уверенного обнаружения, возрастает с увеличением яркости фона, что означает уменьшение чувствительности глаза. Это необходимо для нашего зрения, чтобы продолжать эффективно работать.

Секция 4: Резкий излом — результат построения графика в осях log/log. На самом деле, в линейных осях все происходит плавно, зато в линейных осях практически не разглядеть секции 1 и 2. Вообще, я постарался не давать здесь логарифмических осей, так как человек, никогда не работавший, скажем, с Децибелами (это не медицинский термин, а технический:), не сможет понять физического смысла в поведении кривой на графике. Однако здесь всё объяснено покусочно, поэтому появление такого графика не должно вызвать кривого толкования. Секция 4 показывает момент, когда палочки при работе со светом начинают входить в режим насыщения, кстати, насыщению соответствует всего 10% обесцветившегося родопсина. В тот же момент начинают работать колбочки, которые тоже дают свой вклад в ощущение светлота (lightness). Обратите внимание: физически ничего не происходит с нашими фоном, и стимулом, в виде пятна света на фоне. Равномерное приращение физической величины яркость (luminance) на этом участке приводит к неравномерному ощущению светлота (lightness). Еще раз подчеркну: прямой связи между физическими величинами и ощущением нет. Этот участок заканчивает сумеречное (scotopic) бесцветное зрение и появляется ощущение цвета. Вначале самыми светлыми покажуться синие предметы (Purkinje Shift or Purkinje Phenomenon).

Секция 5: Это полностью колбочковое, цветное, зрение (photopic system). Здесь снова результаты описываются законом Вебера, с другим коэффицентом: 0.015. Этот участок продолжается до самого конца.

Наиболее важный момент: секция 3 и секция 5 имеют наклон 45 градусов. В осях log/log это возможно, если приращение ощущения светлота есть постоянное отношение физической величины яркость фона к значению приращения яркости. Это и есть закон Вебера. Если в линейных осях наклон прямой линии зависит от коэффициента пропорциональности, то в осях log/log обе линии буду иметь один и тот же наклон, 45 градусов и параллельный сдвиг. Как видите, понять, что показывает кривая на логарифмических осях, бывает затруднительно.

рис.19а Световая адаптация глаза. График в линейном масштабе.

3.1.4 Аналогия между адаптацией глаза к условиям освещения и регулировкой экспозиции в фотокамере.

Рассмотрим, для чего фотокамере нужны устройства, регулирующие экспозицию (освещенность фотослоя в секунду: лк/с), см. рис.20.

рис.20 Стандартный бланк и характеристическая кривая
(ГОСТ10691.0-84)
H ¬ экспозиция фотослоя
D – оптическая плотность

Участок 0-1 — плотность вуали. 1-3 — начальный участок характеристической кривой с непропорциональной передачей яркостей объекта. 3-4 — прямолинейный участок с пропорциональной передачей яркостей, 4-6 верхний участок непропорциональной передачи, 6-7 область соляризации.

рис.20а Процесс фиксации объектов сцены на фотографическом материале (позитивный процесс). При правильной экспозиции полезный интервал яркостей объектов отображется почти целиком в оптический интервал яркостей фотослоя. Незначительная компрессия сигнала в темной и светлой части фотослоя.
рис.20бНедодержка. Экспозиция фотослоя недостаточна, светлые детали маскируются шумом фотослоя. Значительная нелинейность передачи градаций.
рис.20в Передержка. Экспозиция слоя слишком велика, средние полутона чернеют, большая часть деталей в тенях потеряна.

Обратите внимание, что стандартный бланк построен в осях Log-Lin. Сделано это просто для удобства наблюдения за участками характеристической кривой. Заметьте, что изображенный процесс на рисунках 20а,б,в — позитивный. Заметьте также: по оси абсцисс по-прежнему отложен логарифм экспозиции. При этом никакой ошибки между тремя величинами: плотности D, экспозиции H, и интервала яркостей B нет. Это, наверное, трудный момент для понимания, но обо всем на одной странице не расскажешь. И последний момент: ни о какой линейности в передаче яркостей в негативном хим. фотопроцессе не может быть и речи.

Фотослой разрабатывается таким образом, чтобы весь полезный интервал яркостей оказался записан в фотослое. Правильная выдержка характерна тем, что наиболее информативный интервал яркостей попадает на линейный (в логарифмическом масштабе экспозиции) участок характеристической кривой. На рисунках 20б,в показаны ситуации, когда настройка фотоаппарата не совпадает с освещенностью сцены. По аналогии, для глаза можно указать, что рисунок 20а "Правильная экспозиция" соответствует полной адаптации цветного зрения (photopic system), рис.20б "Недодержка" соответствует резкой смене освещенности в сторону уменьшения, и рис.20в "Передержка" — наблюдению за объектом против слепящего света. Здесь важно отметить, что сама характеристическая кривая на всех трех рисунках при этом не меняется, она — конструктивный параметр. Увеличилась освещенность сцены, и человек адаптирует фотоаппарат, уменьшая время выдержки, уменьшая отверстие диафрагмы объектива, и если этого недостаточно, то меняет фотоматериал на менее чувствительный. Аналогично, наша система зрения автоматически уменьшает диаметр зрачка, и перестраивает химический состав фоточувствительного слоя, или даже полностью меняет слой — с колбочек на палочки (конечно не стоит это воспринимать буквально, мы только проводим аналогию). Если мы хотим фотографировать белую бумагу с черным текстом под прямыми солнечными лучами, мы должны адаптировать фотоаппарат к освещенности такой сцены, а наша зрительная система делает то же самое автоматически. Когда мы входим с этим листом в комнату с тусклым освещением, мы снова должны адаптировать фотоаппарат к новым условиям освещения, в то время как зрительная система делает это вновь автоматически. Мы видим по-прежнему белый лист с черным текстом, а фотоаппарат может "увидеть" лист черным. Кстати, по этой причине "на глаз" учесть освещенность и поставить правильно выдержку очень сложно, опытные фотографы скорее анализируют общий вклад источников света в освещенность сцены, чем доверяют глазам. На сегодня для обычных условий съемки всё это уже забыто и вытеснено экспонометрами.

Может ли человек одновременно видеть весь диапазон яркостей в 10млрд. раз одинаково хорошо? Конечно нет, если принять одно только время темновой адаптации, примерно, пусть 5 минут, и световой адаптации, около полутора минут, это уже указывает на невозможность одновременного наблюдения столь большого интервала яркостей. Точно также фотоаппарат, обладая еще худшими характеристиками, чем наш глаз, требует времени на смену фотопленки с другой чувствительностью и на перенастройку времени экспозиции ("время адаптации фотоаппарата"). Простой опыт покажет наличие непропорциональных участков восприятия яркостей: посмотрите на монетку в руке на уровне пояса, а потом на монетку в вытянутой руке возле диска Солнца. Адаптация сработает по мощному источнику света — Солнцу, и детали диска станут неразличимы в потемневшем диске монетки. Куда делись детали? Они перешли в область непропорциональной передачи яркостей. Очень хорошо нам всем знаком и эффект ослепления бликом хромированых поверхностей тел вращения, когда сам блик выглядит не бесконечной острой и малой в угловых размерах точкой, что соответствует физическому распределению яркостей, а вполне приличным по размерам пятном "засветки". Бликовое рапределение яркостей на таких поверхностях (этот вопрос хорошо изучен в программах генерации 3D графики по методу raytracing) обещает нам бесконечно малый размер светящей точки, и это можно подтвердить, если фотоаппаратом сфотографировать эту же сцену, выбрав экспозицию не по средней освещенности сцены, а по максимальной освещенности в окрестности блика. Размер пятна, в фотослое, будет уменьшаться по мере уменьшения экспозиции. Объяснить это можно одним и тем же, для фотоматериала и глаза, проявлением нелинейности, непропорциональной передачей яркостей, когда настройка экспозиции, как и настройка зрительной системы (адаптация), выводит меньший по площади, но очень яркий источник за пределы линейного участка восприятия/экспозиции.

Итак, по аналогии мы можем предположить, что наша зрительная система для одномоментного просмотра имеет характеристическую S-образную кривую, подобную для фотоматериала на рис. 20, на которую как бы откладываются яркости объектов сцены. При таком предположении появляется интересный физический смысл показанной на рис.19, 19а, зависимости. Это хорошо известное из теории линейных систем дополнительное требование к линейным системам: сдвиг по оси сигнала x(t) приводит к такому же сдвигу выходного сигнала y(t). То есть, перемещение вверх-вниз S-образной кривой по секции 3 или 5 освещенности сцены, на рис. 19, не должно искажать форму S-образной кривой. Это в принципе подтверждается многими фактами, например, цвет светового пятна в результате смешения световых пучков не зависит от абсолютностной яркости пучков, а только от их соотношения, константность восприятия цветов и др.

3.1.4 Линейность восприятия яркости в пределах характеристической кривой зрительной системы.

Если для фотоматериала построение кривой рис. 20 представляет лишь технические трудности, то построение с помощью приборов подобной кривой для нашей зрительной системы принципиально невозможно. Мы пока не научились физическими методами измерять ощущения.

рис.21 Предположительная S-образная кривая характеристической чувствительности зрительной системы человека, B — яркость объектов. Обратите внимание, что график представлен в линейных осях.

Однако у нас есть инструмент под названием логическая машина, которой можно проанализировать работу зрительной системы в нашей гипотезе об S-образной кривой. Мы будем исходить из того факта, что если бы мы сумели изготовить физическое устройство с идеальной линейной передаточной характеристикой, заведомо многократно линейнее нашего глаза и конечно, много линейнее худшего, в сравнении с глазом, фотопроцесса, и воспроизвести на таком физическом устройстве какую-нибудь сцену, то линейное отображение на таком устройстве можно было бы сравнивать с реальной сценой. Тогда, если проверяемое физическими методами исключительно линейное устройство покажет нам точно такое же соотношение градаций, число деталей, четкость, правильность цветопередачи и прочие параметры в сравнении с реальной сценой, то исходя из подобия мы сможем сделать заключение о линейности системы нашего зрения. Если нам захочется где-то что-то подправить в изображении на нашем идеальном воспроизводящем устройстве, скажем, в области теней, в светах или в балансе белого, тогда мы сможем сделать заключение о характере нелинейности системы нашего зрения.

Такое устройство есть. Называется оно зеркало. Это идеальное записывающе-воспроизводящее устройство с практически идеальной характеристикой. Входной сигнал x(t) самое большее, масштабируется с коэффициентом отражения, меньшим единицы. Если вам захочется что-то подправить в таком отображающем устройстве на предмет улучшения изображения, это весьма тревожный сигнал :) значит, вам, наконец, пора выспаться.

Таким образом, мы имеем все данные, чтобы разобрать миф номер шесть: «гамма-компенсация со степенью 1/2.2 необходима для изображений, предъявляемых на мониторе или на бумаге, так как наше зрение имеет тот же характер нелинейности, что и функция гамма-компенсации с рис.6. Или: глаз обладает нелинейностью почти по логарифмическому закону, поэтому, де, и т.д.» Для нашего зрения за образец качества отображения всегда будет выступать линейное зеркальное отображение. Для получения зеркального качества отображения сцены устройство приема-записи-обработки-отображения должно быть идеальной линейной системой.

Кстати, уже после описания предположительной "характеристическую S-образную кривой" я обнаружил точно такую же аналогию в книге кинооператора Железнякова [15]. Где, несмотря на обширный список литературы по цветоведению, он тоже употребляет по отношению к "характеристическую S-образную кривой" слова "по-видимому". Еще позже, на форуме Matlab в дискуссии со мной один из разработчиков примеров для использования Matlab в обработке изображений также вначале указал на S-образную кривую зрения, однако источников вспомнить не смог. Когда он, по-видимому, заглянул в книги, то не смог удержаться на логически верном плато -- и в дальнейшем он указал, что S-образная кривая построена в осях Lin-Log, что превратило эту кривую в логарифмическую на линейных осях, с небольшими искажениями на границах диапазона. Впрочем, автор не смог даже объяснить две из начальных формул в своем "Кратком курсе теории обработки изображений".


3.2 Формирование цифровых изображений натуральных сцен.

В этой главе я постараюсь остаться только в контексте гаммы и гамма-коррекции.

3.2.1 Цифровые фотокамеры и сканеры.

Для того, чтобы понять принцип работы сканера или цифровой фотокамеры, необязательно брать реальное устройство. Множество несущественных деталей можно опустить, без потери принципа. Давайте посмотрим на фотокамеру и сканер, нельзя нам обойтись чем-нибудь одним? Оба устройства фиксируют изображение на плоскости.

рис.22 Процесс формирования изображения.

Система получает, неважно каким образом, информацию с каждой точки картинной плоскости сцены x1,y1 и отображает ее в картинную плоскость изображения. Разница между фотокамерой и сканером существует в источнике подсветки, оптической системе, в размерах фоточувствительной матрицы и прочих несущественных для принципа деталях. Насчет третьего измерения беспокоится не будем, так как наше зрение тоже "не видит" третье измерение, получая изображение на внутренней стенке глазного яблока, а лишь оценивает его глубину, и делает это пока неясным для нас способом. Выделить четкое физическое соответствие конкретной точки x,y на картинной плоскости объектов каждой точке x1,y1 плоскости изображения не удастся, так как каждая точка x,y будет содержать информацию от точки x1,y1, от ее соседней точки, а возможно, и от всех точек на сцене. Кроме того, в реальности существует проблема и на стороне x,y — это насыщение и "засветка" (не оптическая!) соседних ячеек и интерполяция реальных пикселов в математическую матрицу изображения. Однако предположив, что система формирования изображения линейна, а значит, информация от всех точек накапливается линейно, еще более упростим, посчитаем, что информация точки x,y складывается только из малой окрестности точки x1,y1. Таким образом, чуть-чуть сдвинув картину объектов, сдвинувшуюся картину изображения можно считать изменившейся только в окрестностях точек по границе изображения. Ну вот, вроде все упрощения изложены. Теперь давайте еще упростим устройство получения изображения, указав на равнозначность всех точек перед системой. Мы можем представить, что наше устройство имеет всего одну точку на плоскости объектов и соответственно, одну точку на изображении. Представим, что картинная плоскость протяжённее окрестности точки x1,y1, и вопрос о границе картинной плоскости изображения тоже снимается. В итоге мы имеем устройство с разрешением 1х1 пиксел, и мы понимаем, какие ограничения имеет эта модель.

,.........

,............

3.2.2 .......

,.......

,..........

3.2.3 Причины ввода функции гамма-компенсации.

Если бы у нас отсутствовал элемент "черный ящик" storage, transmission, processing,.. , между камерой и дисплеем (смотри рис.23), то вопрос в необходимости применения гамма-коррекции внутри камеры отпадает сам собой. Вопрос становится бессодержательным, потому что не имеет значения, вводится гамма-коррекция в камере или в дисплее. Гамма-коррекция нужна, без нее на мониторе мы получим сильно искаженное изображение. Её обязательно вводят перед подачей сигнала на дисплей.

Однако всё круто меняется, если "черный ящик" storage, transmission, processing,.. , существует.

рис.23 Повтор рис.5

,............

3.2.4 ...........

,............

3.3 Последствия ввода гамма-компенсации для линейно оцифрованных изображений.

Для иллюстрации того, что происходит с вашим линейно оцифрованным файлом, будь то RAW-data с цифровой камеры, или линейно сканированное изображение (no color corrections, Gamma=1.0), или CGI, я приведу внизу длинную таблицу с числовыми значениями, на этот раз для гамма-компенсации. Гамма-компенсация скрыта от поверхностного взгляда, и находится в профайлах (profile) рабочих пространствах (Working spaces) Adobe Photoshop, в которых значение "гамма" не равно 1.0, например:

Значения Gamma

Приблизительная
оценка Gamma

1.8 2.2 2.2 2.2 2.5 2.5

Формула, которая
применяется
к числовым
значениям
пикселов

Y=X1/1.72 Y=X1/2.22  

Примеры
некоторых
color space

ProPhoto RGB

AdobeRGB(1998)

sRGB [14]

Kodak Photo
CD YCC

SMPTE-C

(PAL)

Lab

Apple RGB

CIE RGB 

       

ColorMatch RGB

Wide Gamut RGB 

       

 

Simplified KODAK
DC Series
Digital Camera 

       

 

SMPTE-C (NTSC) 

       

x – числовые значения пиксела

у – гамма-скорректированные значения пиксела

Когда пользователь открывает в Photoshop любой файл, у него только три выбора:

Обойтись без назначения profile в Photoshop не удастся. Но можно создать собственный profile, который вас устроит.

Обратите внимание, что происходит с градациями линейно оцифрованного файла, если к числовым значениям пикселов применяется гамма-компенсация. В последней правой колонке видно, что в тенях градации разрываются, в то время как в средних тонах и в светах отдельные градации начинают компрессироваться в общее ближайшее дискретное значение. Во второй колонке одним цветом выделены дискреты, "сливающиеся" в ближайшее дискретное число при округлении.

Таблица-иллюстрация применения гамма-компенсации
к линейно оцифрованному изображению, которое содержало все градации.
Картинки иллюстрируют первые 129 значений 8-битного grayscale файла.

Первая колонка --
значения x, взятые из
линейно оцифрованного
файла.

Вторая колонка --
пересчитанные по
приведенной формуле
значения, для гамма-
компенсации 2.2.
Одинаковым цветом
выделена потерянная
пространственная
информация.

третья и четвертая
колонки -- иллюстрации
первой и второй,
соответственно.

x  x (1/2.2) 255 (---) 255
0 0
1 20.5427
2 28.1508
3 33.8479
4 38.5764
5 42.6945
6 46.3835
7 49.7501
8 52.8632
9 55.7705
10 58.5064
11 61.0968
12 63.5617
13 65.9168
14 68.1751
15 70.3469
16 72.4412
17 74.4652
18 76.4252
19 78.3267
20 80.1744
21 81.9723
22 83.7241
23 85.433
24 87.1018
25 88.7331
26 90.3292
27 91.8921
28 93.4238
29 94.9259
30 96.4
31 97.8476
32 99.2698
33 100.668
34 102.043
35 103.397
36 104.729
37 106.042
38 107.335
39 108.61
40 109.867
41 111.107
42 112.331
43 113.539
44 114.731
45 115.909
46 117.073
47 118.223
48 119.36
49 120.484
50 121.595
51 122.695
52 123.783
53 124.859
54 125.924
55 126.979
56 128.023
57 129.057
58 130.082
59 131.096
60 132.102
61 133.098
62 134.085
63 135.064
64 136.035
65 136.997
66 137.951
67 138.897
68 139.835
69 140.766
70 141.69
71 142.607
72 143.516
73 144.419
74 145.315
75 146.204
76 147.087
77 147.963
78 148.834
79 149.698
80 150.556
81 151.409
82 152.256
83 153.097
84 153.933
85 154.763
86 155.588
87 156.408
88 157.222
89 158.032
90 158.837
91 159.636
92 160.431
93 161.222
94 162.007
95 162.788
96 163.565
97 164.337
98 165.105
99 165.869
100 166.628
101 167.384
102 168.135
103 168.882
104 169.626
105 170.365
106 171.101
107 171.833
108 172.561
109 173.285
110 174.006
111 174.723
112 175.437
113 176.147
114 176.854
115 177.558
116 178.258
117 178.955
118 179.648
119 180.339
120 181.026
121 181.71
122 182.391
123 183.069
124 183.744
125 184.416
126 185.085
127 185.752
128 186.415
129 187.076
130 187.733
131 188.388
132 189.041
133 189.69
134 190.337
135 190.982
136 191.623
137 192.263
138 192.899
139 193.533
140 194.165
141 194.794
142 195.421
143 196.045
144 196.667
145 197.287
146 197.904
147 198.519
148 199.132
149 199.742
150 200.351
151 200.957
152 201.56
153 202.162
154 202.762
155 203.359
156 203.954
157 204.548
158 205.139
159 205.728
160 206.315
161 206.9
162 207.483
163 208.065
164 208.644
165 209.221
166 209.797
167 210.37
168 210.942
169 211.512
170 212.08
171 212.646
172 213.21
173 213.773
174 214.333
175 214.892
176 215.45
177 216.005
178 216.559
179 217.111
180 217.662
181 218.211
182 218.758
183 219.303
184 219.847
185 220.389
186 220.93
187 221.469
188 222.007
189 222.543
190 223.077
191 223.61
192 224.142
193 224.671
194 225.2
195 225.727
196 226.252
197 226.776
198 227.299
199 227.82
200 228.339
201 228.858
202 229.375
203 229.89
204 230.404
205 230.917
206 231.428
207 231.938
208 232.447
209 232.954
210 233.46
211 233.965
212 234.468
213 234.97
214 235.471
215 235.97
216 236.469
217 236.966
218 237.461
219 237.956
220 238.449
221 238.941
222 239.432
223 239.922
224 240.41
225 240.897
226 241.383
227 241.868
228 242.352
229 242.835
230 243.316
231 243.796
232 244.276
233 244.754
234 245.231
235 245.706
236 246.181
237 246.655
238 247.127
239 247.599
240 248.069
241 248.538
242 249.007
243 249.474
244 249.94
245 250.405
246 250.869
247 251.332
248 251.794
249 252.255
250 252.715
251 253.174
252 253.632
253 254.089
254 254.545
255 255

Около 70 градаций в светах потеряны. Немного отличающиеся по яркости пикселы потеряли границу между собой, а вместе с ней и пространственную информацию в изображении. Информация в тенях, с первого взгляда, не теряется, но это при условии, что когда-нибудь, еще до любого последующего преобразования (к нему относится любой пересчет пикселов по аппертуре, например, пересчет размеров изображения по bicubic, фильтры unsharp mask, find edges...) будет произведена операция, обратная гамма-коррекции. Если же пересчет пикселов по аппертуре был произведен, то последует потеря информации и в тенях.

Самые тяжелые последствия гарантирует конвертация в Lab, с эквивалентной гаммой 2.5, далее в порядке уменьшения ущерба: гамма 2.5, гамма 2.2, и гамма 1.8.

Не имеет значения и то, производите вы гамма-компенсацию в 8-битном представлении или предварительно конвертируете имеющиеся 256 значений в 16 бит. Результат будет точно такой же. Если АЦП вашей видео/фотокамеры/сканера имеет внутренний формат 8 бит (что должно иметь место, рассматривая многие среднего уровня камеры), то внутренняя конвертация в 16 бит даст всего лишь бессмысленную двойную точность описания для тех же 8 бит. Такова природа дискретных сигналов. Еще одну вещь стоит напомнить, что Adobe Photoshop при открытии файла 16 бит (диапазон градаций 0-65535) прежде всего конвертирует данные в 15+1 бит (диапазон градаций 0-32768), где один бит используется под знак. При записи в файл он снова конвертирует в 16 бит. В принципе, это несущественно, если вы не выполняете пару десятков преобразований с этим файлом в Adobe Photoshop. Некий Chris Cox (его имя есть в заставке Adobe Photoshop) в небольшой дискуссии пытался сохранить хорошую мину Adobe при плохой игре.

Из этой таблицы хорошо видно, что если вы владелец цифровой фотокамеры с возможностью получать RAW-данные, или владелец сканера, позволяющего получать RAW-данные, и в тоже время сохраняли оцифрованные файлы изображений конвертированными из RAW-данных в любой профайл с гаммой 2.2 или 1.8, то ваши конвертированные файлы оптимизированы для просмотра на мониторе, но более никуда не годятся — ни для серьезной работы в полиграфии, ни для качественной печати на фотопринтерах, ни для использования в программах рендеринга, ни просто для архивных целей. Эти файлы потеряны.

Итак, самые тяжелые последствия приносит миф номер семь: «гамма-компенсация, вводимая как трансформация числовых значений пикселов, дает улучшение качества воспроизведения теней, светов и пр.»

Q: какой смысл во всём сказанном, если я не вижу на мониторе никакого ухудшения после конвертации в профайл с гамма-коррекцией?

A: естественно, что на хорошем оригинале реальной сцены не видно потерь, происходящих, например, при конвертации RAW -> Lab. Если был проведен тест с постеризацией (menu: Layer>New Adjastmens Layer>Posterize) этого же оригинала, как было описано выше в разделе 2.3, то можно заметить, что потеря половины градаций также не сильно влияет на визуальное качество изображения на мониторе. Все артефакты от потерь в градациях увидите позже, когда проведете коррекцию изображения для своих нужд и конвертируете в профайл оконечного устройства.

3.4 ..................

,............

,........

,.....

,...

,..

,.


основная дискуссия по поводу гамма-Мифов шла некоторое время в

news://195.42.160.111/cps.prepress.color (NNTP и Web)


Reference:

1.

2. Steve Mann. Comparametric Equations with Practical Applications in Quantigraphic Image Processing. IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 9, NO. 8, AUGUST 2000 [offline(75K), только страницы 1389-1392]

3. ITU-R Recommendation BT.709, Basic Parameter Values for the HDTV Standard for the Studio and for International Programme Exchange (1990), [formerly CCIR Rec. 709], ITU, 1211 Geneva 20, Switzerland.

4. http://www.ukl.uni-freiburg.de/aug/mit/bach/ops/crtlimits.html

5. http://www.brucelindbloom.com/DanMargulis.html

6. Hurvitch (Hurvich) L.M., Jameson D., The Perception of Brightness and Darkness, Boston: Allyn and Bacon, 1966

7. Cornsweet, T. Visual Perception. Academic Press, New York, 1970.

8. И.М.Журавель. Модель зрительного восприятия света человеком и ее использование при создании методов обработки изображений http://www.matlab.ru/imageprocess/book2/1.asp

9. Основы ФПМ ПЗС для высококачественного формирования изображений http://www.ssga.ru/metodich/ph_ccd/00_index.html

10. Г.Г.Гинкин. Справочник по радиотехнике. изд.4, перераб., Государственное Энергетическое Издательство: Москва-Ленинград, 1948.

11. Устройство цветных кинескопов. Курс лекций. http://www.do.sssu.ru/virt/library/uchebnik/tv/colkin5.html

12. Dr. Victor Zamyatin's Personal Web Site. Dark Adaptation. http://wmed.narod.ru/w_ophth/physiol/ph_03.htm

13. Dr. Victor Zamyatin's Personal Web Site. Light adaptation. http://wmed.narod.ru/w_ophth/physiol/ph_02.htm

14. M.Nielsen, M.Stokes. The Creation of the sRGB ICC Profile. http://www.srgb.com/c55.pdf, http://www.srgb.com/srgbgammacalculation.pdf

15. http://www.ezhe.ru/data/vgik/zhv-cvet_kontrast_3.html


Сайт создан в системе uCoz