Базовые модели графических изображений
1. Характеристики и свойства электромагнитного излучения Объекты внешней среды, являющиеся источниками графических и видеоизображений, воздействуют на устройства регистрации посредством электромагнитного излучения, состоящего из переменных электрических и магнитных полей, направленных перпендикулярно друг другу и направлению распространения. Особенностью излучений является их волновой характер. Поэтому сигналы группируются по длинам волн и частотам. Длина волны равна расстоянию одного цикла (периода) колебаний в направлении распространения. Длина волны и частота электромагнитных сигналов находятся в соотношении f=c/l, где f - частота, l - длина волны, c - скорость света в вакууме, равная 2.998*108 метра в секунду. Диапазон электромагнитного излучения показан на рис.1. Свет является электромагнитным излучением, воспринимаемым органами зрения человека. Непосредственно видимый диапазон электромагнитного спектра охватывает длину волны приблизительно от 0,43мкм до 0,79мкм (рис.2). Рис.1 Диапазон электромагнитного излучения
Ощущение цвета является психофизиологическим явлением и определяется спектральным составом света не однозначно. Условно цветовой спектр делят на семь полос (цветов): фиолетовый, синий, голубой, зеленый, желтый, оранжевый и красный, имеющих плавные переходы. Различаемые зрением человека цвета предметов определяются характером света, отраженного от этих предметов. Тело, которое отражает свет приблизительно одинаково во всем видимом диапазоне волн, представляется наблюдателю белым, тогда как тело, отражающее свет в каком-то ограниченном диапазоне длин волн, воспринимается с некоторым цветовым оттенком. Например, зеленый предмет в основном отражает свет с длинами волн 500…570 нм, поглощая большинство энергии в других интервалах длин волн.
Свет, лишенный цветовой окраски, называется ахроматическим или монохроматическим. Единственным параметром такого освещения является его интенсивность, или яркость. Для описания монохроматической яркости также используется понятие уровень серого, поскольку яркость изменяется от черного до белого уровня, с промежуточными серыми оттенками. Хроматические источники света характеризуются тремя основными параметрами: энергетическим потоком, световым потоком и яркостью (субъективной). Энергетический поток - это общее количество энергии, излучаемой источником света, обычно измеряемое в ваттах (Вт). Световой поток, измеряемый в люменах (лм), характеризует количество энергии, которое наблюдатель воспринимает от светового источника. Например, световой источник, работающий в дальнем инфракрасном диапазоне, может давать значительный энергетический поток, но наблюдатель его практически не ощущает. Поэтому световой поток такого источника почти нулевой. Яркость описывает субъективное восприятие света и практически не поддается измерению. Она трактует понятие интенсивности в ахроматическом случае и является одним из ключевых факторов при описании цветовых ощущений.
Формирование большинства цифровых изображений электромагнитного излучения основано на измерении содержащейся в нем энергии, причем изображения могут быть получены от любого типа излучения, испускаемого объектами и регистрируемого соответствующей принимающей системой. Электромагнитная энергия квантуется, т.е. для заданной частоты ее энергия может быть только числом, кратным кванту действия , где h - постоянная Планка. Единица измерения энергии – электрон-вольт [эВ] - указывает на кинетическую энергию, которую мог бы приобрести электрон, ускоряясь при прохождении через разность потенциалов один вольт. Квант электромагнитной энергии называется фотоном. При любом взаимодействии сигнала с веществом (излучение или поглощение) энергия изменяется кратно квантам. Чем выше частота электромагнитного сигнала, тем больше проявляется корпускулярная природа, т.к. кванты энергии возрастают. Фотон движется со скоростью света, не имеет массы покоя, но имеет конечную энергию. С фотоном связано понятие момента, определяемого по выражению .
Наличие возможности подсчета количества поглощенных фотонов имеет определяющее значение для формирования изображений.
2. Регистрация излучения светового диапазона Сигналы регистрируются с помощью специальных светочувствительных датчиков – сенсоров (рис.3).
Захват изображения, т.е. преобразование энергии освещения в изображение, основан на фильтрации красной, зеленой и синей компонент и их регистрации с помощью отдельных сенсорных матриц (рис.4).
Для формирования компьютерного цифрового изображения сигналы, полученные от сенсоров в аналоговой форме, преобразуются в цифровую форму. В результате оцифровки формируется матрица действительных чисел из L строк и M столбцов. Координаты исходного аналогового изображения представлены в матрице дискретными значениями. Для ясности обозначений и удобства использования эти дискретные координаты представляются целочисленно, принимая за начало координат левый верхний угол изображения.
После оцифровки выходные сигналы сенсоров хранятся в компьютере в виде двумерных матриц красного, зеленого и синего цветов, скомпонованных в единый массив RGB (рис.6).
3.Модель монохромных изображений В случае отсутствия цветного фильтра в сенсорах изображение формируется в соответствии с уровнем энергии излучения. Как результат, каждый элемент изображения обладает яркостью. Яркость (Brightness) – это атрибут зрительного ощущения, согласно которому объект воспринимается как испускающий определенное количество света. С увеличением интенсивности излучения яркость возрастает, а граничные значения яркости воспринимаются как черный и белый цвета. Воспринимаемая яркость не является простой функцией истинной яркости. Например, вблизи границ соседних областей с отличающимися, но постоянными яркостями зрение человека усиливает яркостные перепады, добавляя несуществующие выбросы яркости. К тому же, присутствует явление одновременного контраста, когда на восприятие яркости оказывают влияние условия наблюдений. Примеры на рис.8 показывают, что одинаковые объекты (квадрат на фоне черного, серого, белого) воспринимаются как объекты разной яркости в зависимости от условий наблюдения, т.е. фона. Поэтому кроме яркости, в обработке изображений используется понятие светлоты. Светлота – это субъективная яркость объекта, оцениваемая относительно яркости белой поверхности при равной освещенности.
Рис.8 Примеры восприятия яркости и светлоты Для формализованной оценки яркости и светлоты используется шкала оттенков серого цвета от черного до белого уровней. При меньшем уровне серого объект воспринимается более светлым. Значения яркости расположены в некотором интервале , где Imin и Imax – граничные уровни интенсивности: , , а интервал называется диапазоном яркостей. Теоретически, к границам интервала предъявляются только требования положительности Imin и конечности Imax. На практике диапазон яркости сдвигается по числовой оси, получая в результате интервал , границы которого принимаются за уровень черного и уровень белого . Все промежуточные значения в этом интервале соответствуют некоторым оттенкам серого при изменении от черного цвета до белого. 4. Первичные цветовые модели Ощущение цвета является психофизиологическим явлением и определяется спектральным составом света не однозначно. Теория формирования цветовых ощущений называется цветовой моделью. Метод формализованного описания цветовых сочетаний называется цветовым пространством. Кроме яркости (светлоты) каждый цветной объект имеет: - цветовой тон (Hue) – атрибут зрительного ощущения, указывающий на воспринимаемый цвет при наличии других цветов, - полнота цвета – атрибут зрительного ощущения, согласно которому объект воспринимается с некоторым уровнем цвета, - насыщенность (Saturation) – соотношение (различие) между уровнем полноты цвета и уровнем белого при равной освещенности, - чистота цвета – отношение полноты цвета к яркости. В отличие от насыщенности, чистота цвета является характеристикой относительно собственной яркости объекта. Чистота также может быть выражена как отношение насыщенности к светлоте.
Первичные цветовые модели основаны на том, что яркость изображения (уровень серого) может быть получена сочетанием цветовых компонент одинаковой интенсивности. В модели RGB (red, green, blue) яркость изображения (уровень серого) получается в результате смешения в равной пропорции трёх основных цветов - красного, синего и зелёного. При сложении базовых цветов максимальной интенсивности формируется белый цвет, а при минимальной - черный. Сложение цветовых компонент при промежуточных значениях интенсивности формирует серые оттенки. Отсутствие равенства интенсивностей базовых цветов приводит к появлению в изображении цветовых составляющих.
Модель RGB графически поясняется цветовым кубом (рис.9). Значения координат нормированы, а при оцифровке они изменяются в пределах от 0 до 255 (белый = 255 255 255). Цветной пиксел в объеме куба задается тремя координатами – R, G, B, которые указывают на степень присутствия в пикселах этих основных цветов. Рис.9 Цветовой куб и пространство RGB Пространство RGB удобно использовать при регистрации (захвате) и воспроизведении цветных изображений. В свою очередь, в пространстве CMY используются вторичные основные цвета - голубой (Cyan), пурпурный (Magenta) и желтый (Yellow), которые являются результатом суммирования основных цветов. Например, желтый - красного и зеленого цветов. Но желтый цвет может быть получен вычитанием синего цвета из белого. Аналогично, голубой – вычитанием красного из белого цвета, а пурпурный – вычитанием зеленого из белого цвета. Это преобразование соответствует следующему правилу, при котором предполагается нормирование цветовых компонент: Рис.10 Преобразование пространства RGB в CMY Из этого правила следует, что , , . Согласно модели CMY в результате суммирования голубого, пурпурного и желтого должен формироваться черный цвет (рис.11). Однако на практике при смешении этих цветов получается осветленный черный цвет, качество которого не удовлетворяет требованиям печати. Поэтому для формирования истинного черного цвета цветовая модель CMY дополняется четвертым цветовым компонентом – черным цветом. Такая модель используется в устройствах печати и имеет название CMYK. Рис.11 Пространство CMYK Применение цветовых фильтров можно трактовать как выделение в модели куба определенных цветовых свойств. Например, фильтрация зеленым указывает на факт выделения в изображении оттенков только зеленого цвета, что соответствует регистрации значений координат куба только из плоскости, к которой принадлежат вершины белого, черного и зеленого цветов. Таким образом, фильтр указывает цветовой тон слоя, а результат RGB-фильтрации – яркости (интенсивности, энергии) каждого из цветов. Третий параметр модели – направление сортировки, сопоставляет каждому из цветов его яркость. Несмотря на удобную техническую реализацию, пространства RGB и CMY обладают рядом недостатков: - Недостаточно учитывают особенности восприятия цветных изображений органами зрения человека. Цветовое восприятие определяется спектральным распределением энергии цветового стимула, состояния зрительной системы и ее адаптации к условиям наблюдения. Характеристики цветового восприятия человека имеют нелинейный характер, что вызвано различным количеством рецепторов, их расположением и чувствительностью к освещенности. Однако в пространствах RGB и CMY этот факт не учитывается и все три цвета считаются равнозначными и кодируются с одинаковым цифровым разрешением. - Цифровая обработка видеосигналов в пространстве RGB связана с преобразованием чрезвычайно большого объема данных. Например, последовательность кадров размером 720х576 пикселов, воспроизводимых в течение 2 часов на частоте 25Гц в стандарте RGB, имеет примерно 210Гбайт. 5. Элементы зрительного восприятия Зрительное восприятие образов возможно благодаря распределению дискретных светочувствительных клеток (рецепторов) по внутренней поверхности сетчатки. Существуют рецепторы двух видов — колбочки (от 6 до 7 миллионов) и палочки (от 75 до 150 миллионов). Колбочки обладают высокой чувствительностью к спектральным составляющим света и располагаются преимущественно в центральной области сетчатки, называемой желтым пятном, в центре которого имеется центральная ямка - область наибольшей остроты зрения. Имеется три типа колбочек с максимальной чувствительностью при 445нм, 535нм и 575нм. Человек различает мелкие детали изображения в основном благодаря колбочкам, поскольку каждая из них соединена с отдельным нервным окончанием. Колбочки обеспечивают фотопическое зрение, т.е. зрение в ярком свете. Большая, чем у колбочек, область распределения палочек и тот факт, что к одному нервному окончанию присоединено сразу несколько палочек (в среднем около 10), уменьшают возможности различения деталей с помощью этих рецепторов. Палочки позволяют сформировать общую картину всего поля зрения. Они наиболее чувствительны при низких уровнях освещенности и не обеспечивают цветность. Предметы, имеющие яркую окраску при дневном свете, при сумеречном освещении выглядят как лишенные цветов образы, поскольку возбуждаются только палочки. Это явление известно как скотопическое (или сумеречное) зрение. На рис.12б показана плотность распределения палочек и колбочек по сетчатке в зависимости от величины угла между зрительной осью и линией, проведенной из центра хрусталика до сетчатки. Отсутствие рецепторов в месте выхода зрительного нерва приводит к появлению так называемого слепого пятна. В остальной области сетчатки распределение рецепторов центрально симметрично относительно центра желтого пятна.
Центральная ямка представляет собой углубление круглой формы в сетчатке диаметром около 1.5мм и плотностью 150 тыс. колбочек на 1 мм2. Рецепторы возбуждаются в соответствии с интенсивностью падающего света, что приводит к преобразованию энергии светового излучения в электрические нервные импульсы, которые декодируются в мозге человека. Зрительная система человека способна адаптироваться к диапазону значений яркости от порога чувствительности скотопического зрения до ослепляющего блеска, что составляет примерно 1010. Субъективная яркость является логарифмической функцией от физической яркости света, попадающего в глаз (рис.13).
6. Яркостно-цветовые модели При восприятии изображений основная информация содержится в яркостной составляющей, а цветовые носят дополнительный характер. Это связано с тем, что органы зрения менее чувствительны к изменению цвета объектов, чем к изменению их яркости. Следовательно, при цифровой обработке необходимо: - отделить яркость от цветности, - применять полученные компоненты с различным разрешением. Поэтому наибольший интерес представляют относительные атрибуты восприятия, т.е. светлота, цветовой тон и насыщенность. При этом в моделях понятие светлота иногда подменяется яркостью, а тон – цветностью. При анализе куба как единой структуры можно модифицировать модель к виду, в большей степени соответствующему цветовосприятию. Для однозначного определения в трехмерном объеме куба каждая точка должна иметь три координаты. По отношению к пикселам цветного изображения координаты могут характеризовать: - цветовой тон изображения в целом – принадлежность к некоторой цветовой плоскости (задается углом поворота относительно точки отсчета), - насыщенность – расстояние до черно-белой прямой, на которой изображение воспринимается в уровнях серого (при большем расстоянии от оси яркости насыщенность возрастает), - яркость (интенсивность) – координата точки на черно-белой оси.
На основе этих понятий разработана модель HSB, в которой цвет характеризуется тоном (Hue), насыщенностью (Saturation) и яркостью (Brightness). Модель имеет также другое название – HSI, в которой I указывает на интенсивность (Intensity). Согласно этой модели цветовой куб рассматривается установленным на черную вершину, тогда как белая вершина оказывается расположенной вертикально над ней (рис.14а). Рис.14 Расположение цветового куба в модели HSI Каждая точка в объеме куба принадлежит некоторой цветовой треугольной плоскости, образуемой соединением трех вершин – черной, белой и одной цветной (рис.14б). Все точки треугольной плоскости являются комбинациями от смешения трех цветов вершин плоскости. Поскольку черная и белая точки не изменяют цвет, то только третья вершина определяет цветовой тон. Если цветной является, например, синяя вершина, то получается плоскость с оттенками только синего цвета. Насыщенность (чистота цвета) увеличивается согласно расстоянию от точки на плоскости до оси яркости. Все оттенки серого цвета расположены на отрезке, соединяющем черную и белую вершины. Яркость (интенсивность) в некоторой цветной точке определяется координатой пересечения этого отрезка с перпендикулярной ему плоскостью, к которой также принадлежит выбранная точка. Модель HSI можно представить как состоящую из вертикальной оси яркости и цветных точек, расположенных на цветной плоскости, перпендикулярной этой оси (рис.15 и 16).
Рис.16 Геометрическое пояснение модели HSI Тон (H) задается на диаграмме углом, на который нужно повернуть против часовой стрелки луч, выходящий из центра к опорной точке, в качестве которой принимается вершина красного. Следовательно, тон красного равен 0, желтого 60, зеленого 120, синего 270 градусов. Насыщенность (S) задается расстоянием от рабочей точки до вертикальной оси. Яркость (I) задается положением точки пересечения цветовой плоскости и вертикальной оси. Различные цветовые тона получаются при повороте цветной плоскости вокруг вертикальной черно-белой оси. Поэтому значения тона, насыщенности и яркости для пространства HSI можно получить из цветовых координат модели RGB при помощи геометрических формул.
Другая модель – HSV – аналогична модели HSI. Цветовое пространство HSV также рассматривается вдоль черно-белой оси, но отличие состоит в представлении куба не в виде обоюдоострого конуса, как в модели HSI, а виде шестигранной пирамиды, основанием которой является шестигранная плоскость, представляющая собой диаграмму цветов (рис.17).
Значения тона, насыщенности и яркости для пространства HSV можно получить из цветовых координат модели RGB при помощи формул. Те же параметры, т.е. тон, насыщенность и яркость, используются также в модели YIQ, которая используется в формате NTSC телевидения США. Поскольку яркость отделена от цветности, то один и тот же сигнал можно использовать как в цветном, так и черно-белом телевидении. В модели Y обозначает яркость (светлоту), I – цветовой тон, Q – насыщенность. Компоненты YIQ получаются из RGB с помощью матричного преобразования (рис.18а). Сумма элементов первой строки матрицы равна единице, а второй и третьей строк – нулю, что указывает на возможность передачи цветного RGB изображения посредством только яркостной составляющей черно-белого изображения. Компоненты RGB получаются из YIQ с помощью обратного матричного преобразования (рис.18б).
Рис.18 Преобразования компонент моделей YIQ и RGB В яркостно-цветовых моделях хорошо решена задача отделения яркостной компоненты от цветовых. В свою очередь, информация о цветности присутствует как результат смешения базовых составляющих (красного, синего, зеленого) при одновременном отсутствии данных о степени их наличия. Решение задачи управления цветовым разрешением требует знания соответствия координат кодируемой точки в рабочем объеме конуса (тона и насыщенности) цветовым оттенкам. 7. Цветоразностная модель Яркость вычисляется как взвешенное усреднение компонент цветности по формуле: . Использованием нормирующих коэффициентов обеспечивается учет разной чувствительности к восприятию базовых цветов – красного, зеленого и синего. Согласно рекомендациям ITU-T BT.601 (для цифрового телевидения) kr =0.299, kb =0.114, kg =0.587 (kr =76.5/256, kb =29.2/256, kg =150.3/256). В цветоразностной модели основная компонента яркости дополняется компонентами цветностей, указывающих на степень присутствия (интенсивности) базовых цветов - YCrCgCb. Наличие раздельных слоев цветностей позволяет удобно управлять их разрешением независимо друг от друга. Сумма коэффициентов цветности равна единице: . Поэтому при обработке сигналов достаточно использовать только две из них. Как результат, в модели YCbCr (YUV) используется две цветовых компоненты – краснота Cr и синева Cb, а зеленоватость Cg вычисляется. Компоненты цветоразностной модели рассчитываются по формулам: Таким образом, формулы преобразований приобретают следующий вид:
Сумма коэффициентов в выражении для расчета яркости равна единице, а сумма коэффициентов в выражениях для расчета цветоразностных компонент равна 0.5. Присутствие отрицательных коэффициентов предполагает возможность формирования отрицательных значений красноты Cr и синевы Cb при определенных сочетаниях компонентов R,G,B, что усложняет процедуру числовой обработки и представления изображений. Например, при значениях R=0.11, G=0.56, B=0.68 Y=0.439, Cr=-0.235, Cb=0.136. При переводе в целочисленный формат получаются значения: Y=0.439х255=112, Cr=-0.235х255=-60, Cb=0.136х255=35. Поэтому требуется корректировка полученного результата или другая методика, но в обоих случаях назначен иной диапазон допустимых значений компонентов цветоразностной модели: Y=16…235, Cb =16…240, Cr =16…240. В первом варианте дробные значения вначале масштабируются, т.е. Y=0.439х(235-16)=96, Cr=-0.235х(240-16)=-53, Cb=0.136х(240-16)=30, после чего полученные значения переводятся в допустимый диапазон операцией суммирования, что эквивалентно корректировке: Y=96+16=112, Cr=-53+128=75, Cb=30+128=158. Другой вариант имеет матричное преобразование (MATLAB): Логическая связь с предыдущей формой расчета следует из соотношений: , , . Суммирование чисел вектор-столбца позволяет перевести возможные отрицательные значения компонентов в допустимый диапазон. В свою очередь, диапазон входных компонентов R,G и B при таком вычислении равен от 0 до 1. Например: - R=G=B=0 Y=16, Cr =128, Cb =128 (черный). - R=G=B=1 Y=235, Cr =128, Cb =128 (белый). - R=1, G=B=0.5 Y=158, Cr =184, Cb =109. - R=0, G=B=1 Y=170, Cr =16, Cb =166. - R=0.11, G=0.56, B=0.68 Y=112, Cr =75, Cb =158.
При обратном преобразовании компоненты цветоразностной модели предварительно корректируются: , , . Например: Y’=112-16=96/219=0.438, C’r =75-128=-53/224=-0.237, C’b=158-128=30/224=0.134. Далее компоненты RGB вычисляются по формулам:
Таким образом: R = 0.438 + 1.402(-0.237) = 0.106, G = 0.438 - 0.344x0.134 - 0.714(-0.237) = 0.56, B = 0.438 + 1.772x0.134 = 0.68.
8. Применение цветоразностной модели при видеокодировании Применение цветоразностной модели при кодировании видео учитывает пространственную избыточность последовательности кадров: · Когерентность областей изображения – малое изменение параметров изображения в соседних пикселах, · Избыточность в цветовых плоскостях – яркость имеет большую важность по сравнению с цветовыми компонентами. Форматы кодирования видео устанавливают соответствие между пространственными пикселами и цифровыми отсчетами (семплами), содержащими данные о компонентах яркости и цветностей (Y, Cb, Cr.) Каждый формат назначает степень присутствия каждой из компонент при воспроизведении видео. Согласно формату 4:4:4 каждому пикселу сопоставляются все три компоненты, для кодировки которых используется три байта (рис.20а). Согласно рекомендации ITU-R BT.601для всех компонент используется одинаковая частота дискретизации, равная 13.5МГц. Число в названии формата указывает на относительную долю присутствия каждой компоненты. Например, при размере изображения 720х576 пикселов, общее количество пикселей равно 720*576=414 720. Для представления каждого пиксела используются три байта, т.е. количество битов для каждого пиксела равно 24. Суммарное количество бит для представления изображения равно 9953280 (1215кбайт). Согласно формату 4:2:2 для цветовых компонент используется частота дискретизации 6.75МГц, что предполагает формирование вдвое меньшего количества отсчетов, чем отсчетов яркости. Цветовые компоненты располагаются в каждой строке через один отсчет (рис.20б). Таким образом, для представления пары пикселей используются два отсчета яркости и по одному цветовому отсчету синевы и красноты, т.е. 4 байта. При размере изображения 720х576 пикселов общее количество битов равно 6 635 520 (810кбайт). Формат 4:2:2 используется для высококачественного цветного видео. В формате 4:2:0 для воспроизведения квадратного фрагмента из четырех пикселей используются четыре компоненты яркости и по одной компоненте цветности (рис.20в). Формат используется во многих потребительских приложениях.
Рис.20 Форматы семплирования Например, при размере изображения 720х576 пикселов количество битов равно: - по яркости – 720*576*8=3 317 760, - по цветностям – 2*8*(720*576)/4=1 658 880. Всего: 4 976 640 бит (607.5 кбайт). Если разделить количество бит на общее количество пикселей (720*576), то в среднем используется 12 бит на один пиксель. Поэтому такой формат также обозначается YV12. Характерно, что в формате 4:2:0 для воспроизведения группы из четырех пикселей требуются 6 байт (четыре для яркости и по одному для цветоразностных компонент), тогда как в формате 4:4:4 - 12 байт, т.е. вдвое больше. а) б) в) г) Рис.21 Временные диаграммы передачи компонент яркости и цветностей для форматов: а) 4:4:4, б) 4:2:2, в) 4:1:1, г) 4:2:0 В формате 4:1:1 для группы из четырех пикселей также используется четыре компоненты яркости и по одной компоненте цветностей. Цветоразностные компоненты передаются в каждой строке, но их частоты дискретизации в четыре раза меньше частоты дискретизации сигнала яркости, т.е. равны 3.375 МГц. Соотношение между пикселами и отсчетами отличается от формата 4:2:0, т.к. группы из четырех пикселей располагаются в одной строке. Формат 4:1:1 используется в системе NTSC, а формат 4:2:0 – в системе PAL/SECAM. В формате 4:1:0 для группы из 16-ти пикселей используется 16 отсчетов яркости и по одному Cb и Cr.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|