Методы цифровой обработки изображений. Обработка изображений: основные методы

19.04.2019

Обработка изображений активно применяется в фотографии, модельном бизнесе, печатном деле и при размещении статей в интернете. Вариантов, способов, инструментов и методов выполнения этого процесса присутствует масса. О некоторых из них и пойдёт речь в этой статье.

Цифровая обработка изображений: для чего нужна и где применяется

В задачи обработки изображений входит придание им вида, в котором они будут наиболее ярко и понятно отражать действительность или же, наоборот, искажать её. Например, подготовка фотографий со свадьбы позволяет убрать лишние элементы, скрасить вид гостей, жениха и невесты. Особенно актуально при обработке устранение эффекта «красных глаз» и подтягивание фигуры.

Создание коллажей также не обходится без пост- и предварительной обработки. С их помощью можно рисовать картины, которые не могли произойти в действительности.

Корректировка графического контента получает исходники как из цифровых камер, так и от устройств обработки изображений, например, сканеров или веб-камер.

Существует несколько универсальных методов для подготовки картинок для будущих проектов. Из основных можно выделить следующие:

баланс белого;
коррекция экспозиции;
обработка шумов;
устранение искажений;
детализация;
обработка контраста;
композиция;
ретушь;
размер;
резкость на выходе.

Идеальный баланс белого - залог качественной картинки

Цветопередача имеет большое значение для восприятия картинки. Обработка изображений для баланса белого придаёт им реальную цветность и действительность.

Очень часто цифровые камеры по умолчанию неправильно или искаженно передают цвет на снимок. Регулировку баланса белого можно произвести, используя ползунки теплоты. В некоторых программах для обработки изображений и вовсе имеется предназначенный для этого отдельный режим.

Экспозиция не только у фотоаппарата, но и в обработке

Настройки различных цифровых камер позволяют установить идеальную экспозицию на этапах съёмки. Однако такое возможно не всегда. Поэтому приходится исправлять её с помощью последующей обработки изображений.

В частности, за счёт изменения контраста и тона, можно придать картинке естественный цвет и падающий свет. Нужные элементы должны быть правильно затенены, а находящиеся в лучах света — освещены естественно, без излишков.

Обработка шумов - устранение лишнего

Высокая светочувствительность может породить шумы на картинке. Выражаются они, как правило, мелкой «сыпью» артефактов. Устранить их можно на этапе обработки графических изображений. Подавление шумов нужно применять с умом, так как слишком малое их количество сделает картинку неестественной.

Искажения

Широкоугольные и телеобъективы способны порождать небольшие изменения геометрии картинки. Их исправление может быть востребовано при выравнивании макета или печати. Для панорамы пейзажа, например, искажение не несёт больших потерь.

Детализация позволит разглядеть всё

Данный метод основан на регулировке резкости. То есть обработка изображения таким образом, чтобы различимость объектов на картинке улучшилась. Резкость, в свою очередь, определяется двумя факторами — разрешение и чёткость. Первый параметр описывает количество элементов, расположенных на минимальном расстоянии. Второй выражает степень размытия границ между объектами. Чем они чётче, тем более детализированной выглядит фотография или картинка.

Контраст - выделение ключевых особенностей и деталей

Контраст выражает отличие между разными цветами различных объектов на фото. Если он высокий, они очень хорошо различимы для глаз и выглядят более эффектно. С другой стороны, слишком большой контраст может сделать изображение неестественным. Идеально сбалансированный, он придаёт картинке сочность, при этом оставляя живость.

Композиция

Композиция может включать в себя несколько методов обработки изображений. Один из них — кадрирование. Он характеризуется выделением из рисунка наиболее важных участков и акцентированием горизонта и фокусов на них. Это актуально при фотографировании пейзажей, когда нужно убрать лишний участок неба или земли.

Ретушь - общий метод

Ретушь — это комплекс мер по устранению с изображений дефектов камеры и различных артефактов. Основным для этого метода обычно является выборочная коррекция. Она выражается в ручном устранении частиц пыли с объектива, зональном исправлении шумов и подобных способах.

Размер

Данный метод может придать изображению как большее, так и меньшее значение. При увеличении, как правило, используется интерполяция, то есть замещение ближайших точек ориентировочно схожими. Это может пригодиться при печати баннеров или плакатов.

Уменьшение без обработки может придать картинке неестественный муар. Поэтому применять изменение размера нужно после проведения работ по обработке изображения.

Программы для обработки изображений

Существует масса программных систем обработки изображений. Все они отличаются набором функционала, поддержкой дополнительных возможностей и ценой.

GIMP - бесплатный и мощный

Один из Скачать его можно бесплатно с сайта разработчиков. Этот продукт хоть и является некоммерческим, обладает огромными возможностями. Обработка векторной графики, работа со слоями, подключение большого количества плагинов, использование формата RAW.

Помимо всего этого у GIMP имеется большое русскоязычное сообщество, в котором можно узнать много полезной информации и трюков. Программа также имеет русский язык.

Adobe Photoshop - настоящий комбайн в графике

Имя этого продукта с давних пор стало нарицательным. Говоря фразу «отфотошопь», человек даёт понять, что ему нужно обработать изображение. Причем не важно, будет ли это действительно Adobe Photoshop или другая программа для обработки графики.

С помощью этого мощного инструмента многие мастера создают настолько яркие и естественные шедевры, что их очень трудно отличить от хорошей фотографии.

Однако изучение Photoshop - дело непростое и требует немалого количества времени. Интерфейс программы имеет огромное количество настроек, функций, методик и инструментов. Разобраться с ходу в нем очень сложно.

PhotoScape

Мало кто слышал об этом продукте, кроме профессиональных дизайнеров и фотографов. Возможно, его использование затрудняет отсутствие такого удобного инструмента, как слои, которые позволяют быстро копировать и накладывать изображения друг на друга.

Из плюсов программы можно выделить бесплатное распространение, русскую локализацию, подключение плагинов и поддержку RAW.

Picasa

Данный продукт разработала корпорация Google. Программа легка в освоении, имеет простой интерфейс. Прекрасно подойдёт для первичной обработки изображений в домашних условиях. Профессионалы же увидят в этой программе большое количество недостающих им инструментов.

Приложение бесплатно, однако Google с 2016 года прекратил его поддержку. При этом последние версии использовать можно.

Paint.NET

Своеобразная реинкарнация штатного редактора операционной системы Windows — Paint. Может работать со слоями, имеет набор подключаемых плагинов. Много интересных инструментов и функций.

Для введения в мир подойдёт идеально.

CorelDRAW

Платный продукт. Благодаря тому, что его главная направленность — векторные изображения, используется практически везде. Это и разнообразные макеты для печати, моделирование, проектирование зданий и обычные рисунки. Благодаря большому распространению имеет значительное количество готовых плагинов. Программа русифицирована.

Онлайн-обработка

В последнее время набирает популярность обработка изображений в режиме онлайн. У этого метода имеется много плюсов:

Скорость обработки. Все вычисления производятся на стороне сервера, который обычно гораздо мощнее домашнего компьютера.
Простота. Достаточно всего лишь загрузить изображение или указать ссылку, и можно приступать. Для этого имеется большой набор готовых инструментов, мало в чем уступающих многим оффлайн-редакторам.
Доступность. Где бы ни был человек, какой бы слабый компьютер ни использовал, онлайн-редакторы всегда доступны в сети интернет.
Поддержка многих форматов и конвертация их «на лету».

Заключение

Говорить о лучших методах, применяемых для обработки изображений, немного риторично. Ведь каждый профессионал, работающий в этой сфере, определяет свой набор инструментария. В зависимости от того, работает он с фотографией, коллажами, макетами для печатных изданий или моделированием, всегда существуют те продукты, которые он считает наиболее удобными и простыми.

Для начинающих редакторов могут пригодиться бесплатные продукты, методика обработки изображений в которых имеет самый примитивный уровень. А это значит, что можно понять, как они работают, перед тем как перейти в профессионалы.

Акулы графики же предпочитают мощные платные решения, требующие больших системных ресурсов и вложений. Но, как правило, человек, имеющий талант к этой работе, очень быстро окупает все свои затраты.

В общем, цифровая обработка изображений — это целое искусство, в котором крайне важно видеть золотую середину, уметь обращать внимание на мелкие детали и творчески подходить к реализации возможной задумки.

Разрешение: измеряется обычно в dpi (dot per inch – количество точек на дюйм). Например, на экране монитора разрешение обычно 72 dpi, при выводе на бумагу – 600 dpi, при регистрации на ПЗС-матрице с размером одного элемента 9 мкм разрешение составит почти 3000 dpi. В процессе обработки разрешение можно изменить: на само изображение это не повлияет, но изменится его отображение устройством визуализации.

Количество цветов (глубина цвета) : точнее количество бит, отводимое для хранения цвета, определяется упрощением электронных схем и кратно степени 2. Изображение для хранения информации о цветах которого необходим 1 бит называется бинарным. Для хранения полутоновых (gray scale, gray level) изображений используется обычно 8 бит. Цветные изображения хранятся обычно с использованием 24 бит по 8 на каждый из трех цветовых каналов.

Размер: этот параметр может быть любым, но часто выбирается исходя из особенностей регистрации изображения (например, видеостандарты PAL (625, 4:3), SECAM (625, 4:3), NTSC (525, 4:3)), особенностей последующей обработки (алгоритмы быстрого преобразования Фурье предъявляют особые требования) и т.п. Хотя в последнее время фреймграбберы интерполируют изображение до любых размеров, библиотеки БПФ справляются с изображением любых размеров.

Основные характеристики изображения

Обычно физический сигнал, возникающий в точке, является функцией зависящей от многих параметров (- глубина, – длина волны, – время). Однако мы будем рассматривать статические, и чаще монохроматические изображения.

Для обработки на компьютере изображение должно быть дискретизировано и квановано. Дискретизованное и квантованное изображение называется цифровым. Цифровое изображение представлено в дискретном двумерном пространстве, где – номер строки, а – номер столбца. Элемент, расположенный на пересечении -ой строки и -го столбца называется пиксел (pixel – picture element). Интенсивность пиксела может описываться либо вещественным или целым числом. Относительная интенсивность в вещественных числах обычно изменяется от 0 до 1, а в целых числах от 0 до 255.

Необходимо отметить, что мы будем манипулировать с двумерными изображениями. Под изображением будем понимать функцию двух вещественных переменных, где – это интенсивность (яркость) в точке с координатами.Иногда обработке будет подвергаться не всё изображение, а некоторая его часть,которую в англоязычной литературе принято называть region-of-interest, ROI (область представляющая интерес, ОПИ).

Определение цифрового изображения

Задачи

Цели

Обработка изображений может производиться в различных целях:

Изменение (искажение) изображения с целью достижения каких-либо эффектов (художественное улучшение). Эти преобразования не будут рассматриваться в рамках данного курса;
Image Processing – визуальное (заметное глазом) улучшение качества изображения (коррекция яркости и контраста, цветокорреция и т.п.); объективное улучшение качества изображения (устранение искажений типа дисторсия, смаз, расфокусировка и т.п.);
Image Analysis – проведение измерений на изображении (анализ интерферограмм, гартманограмм, ФРТ и т.п.);
Image Understanding – распознавание образов (распознавание символов, отпечатков пальцев, лиц, приборы наведения и т.п.)

Для достижения поставленных целей рассмотрим решение следующих задач:

Дискретизация, квантование и кодирование изображений.
Геометрические преобразования изображений.
Логические и арифметические операции над изображениями.
Фильтрация изображений.
Препарирование изображений.

Среди характеристик цифровых изображений следует выделить:

В основе алгоритмов обработки изображений положены в основном интегральные преобразования: cвертка, преобразование Фурье и др. Также используются статистические методы.

Что такое изображение ? На этот вопрос можно ответить по-разному. Самое простое и широкое определение этого понятия: изображение – это то, что мы видим. Другое определение: изображение – это информация, пригодная для визуального восприятия. В зависимости от происхождения условно можно выделить следующие типы изображений :

Рисованное или печатное (художник, полиграфия, принтер).
Оптическое (распределение интенсивности электромагнитного поля создаваемое оптическим прибором в некоторой области пространства (области локализации) например, на сетчатке глаза, на экране при проецировании, в плоскости приемника объектива фотоаппарата).
Фотографическое (оптическое изображение, зарегистрированное на фотоматериале в результате химического процесса).
Электронное или цифровое (оптическое изображение, зарегистрированное с помощью электронного приемника, например, ПЗС-матрицы, сканера, микроденситометра). Электронным также называют изображение, отображаемое на экране монитора.

Как видим, деление условное. Изображение из одного типа сразу переходит в другой. Цепочка этих преобразований в большинстве случаев заканчивается изображением на сетчатке глаза и образом в мозге человека. Существуют ли понятие изображения в отдельности от глаза человека? Какова доля субъективности в изображении? Это философские вопросы, которые мы не будем обсуждать. Попытаемся дать изображению формализованное определение, которое позволит нам описать этот объект математически и манипулировать им для достижения определенных целей. Эти манипуляции назовем обработка изображений.

Цели

Обработка изображений может производиться в различных целях:

Изменение (искажение) изображения с целью достижения каких-либо эффектов (художественное улучшение). Эти преобразования не будут рассматриваться в рамках данного курса;
Image Processing – визуальное (заметное глазом) улучшение качества изображения (коррекция яркости и контраста, цветокорреция и т.п.); объективное улучшение качества изображения (устранение искажений типа дисторсия, смаз, расфокусировка и т.п.);
Image Analysis – проведение измерений на изображении (анализ интерферограмм, гартманограмм, ФРТ и т.п.);
Image Understanding – распознавание образов (распознавание символов, отпечатков пальцев, лиц, приборы наведения и т.п.)

Задачи

Для достижения поставленных целей рассмотрим решение следующих задач:

Дискретизация, квантование и кодирование изображений.
Геометрические преобразования изображений.
Логические и арифметические операции над изображениями.
Фильтрация изображений.
Препарирование изображений.

Определение цифрового изображения

Необходимо отметить, что мы будем манипулировать с двумерными изображениями. Под изображением будем понимать функцию двух вещественных переменных , где – это интенсивность (яркость) в точке с координатами . Иногда обработке будет подвергаться не всё изображение, а некоторая его часть, которую в англоязычной литературе принято называть region-of-interest , ROI (область представляющая интерес , ОПИ ).

Для обработки на компьютере изображение должно быть дискретизировано и квановано. Дискретизованное и квантованное изображение называется цифровым . Цифровое изображение представлено в дискретном двумерном пространстве, где – номер строки, а – номер столбца. Элемент, расположенный на пересечении -ой строки и -го столбца называется пиксел (pixel – picture element). Интенсивность пиксела может описываться либо вещественным или целым числом. Относительная интенсивность в вещественных числах обычно изменяется от 0 до 1, а в целых числах от 0 до 255.

Обычно физический сигнал, возникающий в точке , является функцией зависящей от многих параметров ( - глубина, – длина волны, – время). Однако мы будем рассматривать статические, и чаще монохроматические изображения.

Основные характеристики изображения

Среди характеристик цифровых изображений следует выделить:

Размер : этот параметр может быть любым, но часто выбирается исходя из особенностей регистрации изображения (например, видеостандарты PAL (625, 4:3), SECAM (625, 4:3), NTSC (525, 4:3)), особенностей последующей обработки (алгоритмы быстрого преобразования Фурье предъявляют особые требования) и т.п. Хотя в последнее время фреймграбберы интерполируют изображение до любых размеров, библиотеки БПФ справляются с изображением любых размеров.

Количество цветов (глубина цвета ) : точнее количество бит, отводимое для хранения цвета, определяется упрощением электронных схем и кратно степени 2. Изображение для хранения информации о цветах которого необходим 1 бит называется бинарным. Для хранения полутоновых (gray scale, gray level) изображений используется обычно 8 бит. Цветные изображения хранятся обычно с использованием 24 бит по 8 на каждый из трех цветовых каналов.

Разрешение : измеряется обычно в dpi (dot per inch – количество точек на дюйм). Например, на экране монитора разрешение обычно 72 dpi, при выводе на бумагу – 600 dpi, при регистрации на ПЗС-матрице с размером одного элемента 9 мкм разрешение составит почти 3000 dpi. В процессе обработки разрешение можно изменить: на само изображение это не повлияет, но изменится его отображение устройством визуализации.

Методы обработки изображения

Методы обработки изображений классифицируют обычно по количеству пикселов участвующих в одном шаге преобразования.

Цифровая обработка изображений

1. Ввод и представление изображений

Принципиальными вопросами в теории обработки изображений являются вопросы: формирования, ввода, представления в компьютере и визуализации. Получение изображений в виде электронно-микроскопических снимков с помощью электронного микроскопа описаны в работе. Область ввода видеоинформации представляет собой прямоугольное поле, задаваемое верхней, нижней, левой и правой границами. Форму поверхности можно описать в виде функции расстояния F(x,y) от поверхности до точки изображения с координатами x и y. Учитывая, что яркость точки на изображении зависит исключительно от яркости соответствующего участка поверхности, то можно считать, что визуальная информация с определенной степенью точности отражает состояние яркости или прозрачности каждой точки. Тогда под изображением понимается ограниченная функция двух пространственных переменных f(x,y), заданная на ограниченной прямоугольной плоскости Оху и имеющая определенное множество своих значений. Например, черно-белая фотография может быть представлена как f(x,y)³=0 , где f (x,y) – яркость (иногда называемая оптической плотностью или степенью белизны) изображения в точке (x,y); a – ширина кадра, b – высота кадра.

В связи с тем, что цифровая память компьютера способна хранить только массивы данных, сначала изображение преобразуется в некоторую числовую форму (матрицу). Ввод изображений в память компьютера осуществляется с помощью видео датчиков. Видео датчик переводит оптическое распределение яркости изображения в электрические сигналы и далее в цифровые коды. Поскольку изображение является функцией двух пространственных переменных x и y, а электрический сигнал – функцией одной переменной t (времени), то для преобразования используется развертка. Например, при использовании телевизионной камеры изображение считывается по строкам, при этом в пределах каждой строки зависимость яркости от пространственной координаты x преобразуется в пропорциональную зависимость амплитуды электрического сигнала от времени t. Переход от конца предыдущей строки к началу следующей происходит практически мгновенно.

Ввод изображений в компьютер неизбежно связан с дискретизацией изображений по пространственным координатам x и y и квантованием значения яркости в каждой дискретной точке. Дискретизация достигается с помощью координатной сетки, образованной линиями, параллельными осям x и y декартовой системы координат. В каждом узле такой решетки делается отсчет яркости или прозрачности носителя зрительно воспринимаемой информации, которая затем квантуется и представляется в памяти компьютера. Элемент изображения, полученной в процессе дискретизации изображения, называется пиксел. Для качественного представления полутонового изображения достаточно 2^8 = 256 уровней квантования, т.е. 1 пиксел изображения кодируется 1 байтом информации.

В цифровом комплексе IBAS-2000 информация, содержащаяся в изображении, представляется в виде различных уровней серой шкалы для отдельных точек изображения. Максимальный объем видеоинформации ограничивается количеством пикселов (512х512 или 768х512), а также количеством уровней серой шкалы – 256: 0 – черный, 255 – белый. Одновременно в видеопамяти может быть сформировано от 8 до 56 различных ячеек в зависимости от размера изображения. Видеопроцессор имеет матричную структуру, обеспечивает 10 млн. умножений в сек., изображение в нем представляется в векторной форме. Полутоновое или цветное изображение может быть выведено на монитор или распечатано.

2. Улучшение контраста

Слабый контраст – наиболее распространенный дефект фотографических, сканерных и телевизионных изображений, обусловленный ограниченностью диапазона воспроизводимых яркостей. Под контрастом обычно понимают разность максимального и минимального значений яркости. Путем цифровой обработки контраст можно повысить, изменяя яркость каждого элемента изображения и увеличивая диапазон яркостей. Для этого разработано несколько методов.

Пусть, например, уровни некоторого черно-белого изображения занимают интервал от 6 до 158 со средним значением яркости 67 при возможном наибольшем интервале значений от 0 до 255. На рисунке 1а приведена гистограмма яркостей исходного изображения, показывающая, сколько пикселов N с близким значением яркости f попадает в интервал от fi до f +Δfi. Это изображение является малоконтрастным, превалирует темный оттенок. Возможным методом улучшения контраста может стать так называемая линейная растяжка гистограммы (stretch), когда уровням исходного изображения, лежащим в интервале , присваиваются новые значения с тем, чтобы охватить весь возможный интервал изменения яркости, в данном случае . При этом контраст существенно увеличивается (рис. 1б). Преобразование уровней яркости осуществляется по формуле:

где fi - старое значение яркости i-го пиксела, gi - новое значение, a, b - коэффициенты. Для рис. 1а fмин = 6, fмакс = 158. Выберем a и b таким образом, чтобы gмин = 0, gмакс = 255. Из (1) получаем: a = - 10,01; b = 1,67.

Еще более можно улучшить контраст, используя нормализацию гистограммы. При этом на весь максимальный интервал уровней яркости растягивается не вся гистограмма, лежащая в пределах от fмин до fмакс, а её наиболее интенсивный участок (fмин", fмакс"), из рассмотрения исключаются малоинформативные "хвосты". На рис. 2б исключено 5% пикселов.

Целью выравнивания гистограммы (эту процедуру называют также линеаризацией и эквализацией - equalization) является такое преобразование, чтобы, в идеале, все уровни яркости приобрели бы одинаковую частоту, а гистограмма яркостей отвечала бы равномерному закону распределения (рис. 3).

Пусть изображение имеет формат: N пикселов по горизонтали и M по вертикали, число уровней квантования яркости равно J. Общее число пикселов равно N ·M, на один уровень яркости попадает, в среднем, no = N ·M/J пикселов. Например, N = M = 512, J = 256. В этом случае no = 1024. Расстояние Δf между дискретными уровнями яркости от fiдо fi+1 в гистограмме исходного изображения одинаковое, но на каждый уровень выпадает различное число пикселов. При эквализации гистограммы расстояние Δgi между уровнями gi и gi+1 различно, но число пикселов на каждом уровне, в среднем, одинаковое и равно no. Алгоритм эквализации несложен. Пусть уровнями с малой яркостью обладает небольшое количество пикселов, как на рис. 3а. Например, уровень яркости 0 на исходном изображении имеют 188 пикселов, уровень 1 - 347

пикселов, уровень 2 - 544 пиксела. В сумме это 1079 пикселов, т.е. приблизительно no. Присвоим всем этим пикселам уровень 0. Пусть на исходном изображении число пикселов с уровнями яркости 3 и 4 в сумме приблизительно также равно no. Этим пикселам присваивается уровень 1. С другой стороны, пусть число пикселов с уровнем 45 на исходном изображении составляет 3012, т.е. приблизительно 3no. Всем этим пикселам присваивается некоторый одинаковый уровень gi, не обязательно равный 45, а соседние два уровня остаются незаполненными. Рассмотренные процедуры выполняются для всех уровней яркости. Результат эквализации можно видеть на рис. 4б. В каждом конкретном случае выбирают ту процедуру преобразования гистограмм, которая приводит к наилучшему, с точки зрения пользователя, результату.

3. Фильтрация изображений

Реальные изображения наряду с полезной информацией содержат различные помехи. Источниками помех являются собственные шумы фотоприемных устройств, зернистость фотоматериалов, шумы каналов связи. Наконец, возможны геометрические искажения, изображение может быть расфокусировано. Пусть f (x,y) – некоторое изображение, х, у – координаты.Реальное растровое изображение имеет конечные размеры: A ≤ x ≤ B, C ≤ y ≤ D и состоит из отдельных пикселов, расположенных с некоторым шагом в узлах прямоугольной сетки. Линейное преобразование изображения можно описать выражением

Выражение (2), где интегрирование ведется по всей области определения x и y, характеризует преобразование всего изображения целиком - глобальную фильтрацию. Ядро преобразования h1 (x,y,x",y")в оптике именуют функцией рассеяния точки (ФРТ). Это изображение точечного источника на выходе оптической системы, которое уже является не точкой, а некоторым пятном. В соответствии с (2), все точки изображения f (x",y") превращаются в пятна, происходит суммирование (интегрирование) всех пятен. Не следует думать, что эта процедура обязательно приводит к расфокусировке изображения, наоборот, можно подобрать такую ФРТ, которая позволит сфокусировать расфокусированное изображение.

На рис. 5 представлена одна из возможных ФРТ. Вообще говоря, ФРТ определена на (- ?

На практике глобальная фильтрация применяется редко. Чаще используют локальную фильтрацию, когда интегрирование и усреднение проводится не по всей области определения x и y, а по сравнительно небольшой окрестности каждой точки изображения. Функция рассеяния точки при этом имеет ограниченные размеры. Достоинством такого подхода является хорошее быстродействие. Линейное преобразование принимает вид:

При обработке растровых изображений, которые состоят из отдельных пикселов, интегрирование заменено суммированием. Проще всего реализовать ФРТ конечных размеров в виде прямоугольной матрицы форматом N?N. N может быть равным 3, 5, 7 и т.д. Например, при N = 3

Суммирование ведется по окрестности D точки (i, j); akl - значения ФРТ в этой окрестности. Яркости пикселов f в этой точке и в её окрестности умножаются на коэффициенты akl, преобразованная яркость (i,j) -го пиксела есть сумма этих произведений. Элементы матрицы удовлетворяют условию пространственной инвариантности, поэтому a11= a13 =a31= a33, a12 = a21= a23 = a32. Только три элемента матрицы размером 3х3 независимы, в этом случае матрица инвариантна относительно поворотов, кратных 90º. Опыт обработки изображений показывает, что отсутствие более строгой осевой симметрии ФРТ слабо сказывается на результатах. Иногда используют 8-угольные матрицы, инвариантные относительно поворотов на 45ª.

Фильтрация согласно (3) осуществляется перемещением слева направо (или сверху вниз) маски на один пиксел. При каждом положении апертуры производятся упомянутые выше операции, а именно перемножение весовых множителей akl с соответствующими значениями яркостей исходного изображения и суммированием произведений. Полученное значение присваивается центральному (i,j) -му пикселу. Обычно это значение делится на заранее заданное число K (нормирующий множитель). Маска содержит нечетное число строк и столбцов N, чтобы центральный элемент определялся однозначно.

Рассмотрим некоторые фильтры, сглаживающие шум. Пусть маска размером 3х3 имеет вид:

Тогда яркость (i,j) -го пиксела после фильтрации определится как

Хотя коэффициенты akl можно выбрать из среднеквадратического или иного условия близости не искаженного шумом si,j и преобразованного gi,j изображений, обычно их задают эвристически. Приведем еще некоторые матрицы шумоподавляющих фильтров:

У фильтров H1 - H4 нормирующие множители K подобраны таким образом, чтобы не происходило изменения средней яркости обработанного изображения. Наряду с масками 3х3 используются маски большей размерности, например, 5х5, 7х7 и т.п. В отличие от фильтра H2, у фильтров H1, H3, H4 весовые коэффициенты на пересечении главных диагоналей матрицы больше, чем коэффициенты, стоящие на периферии. Фильтры H1, H3, H4 дают более плавное изменение яркости по изображению, чем H2.

Пусть отсчеты полезного изображения fk,m мало меняются в пределах маски. На изображение накладывается аддитивный шум: fk,m + nk,m , отсчеты шума nk,m случайны и независимы (или слабо зависимы) со статистической точки зрения. В этом случае механизм подавления шума с использованием приведенных фильтров состоит в том, при суммировании шумы компенсируют друг друга. Эта компенсация будет происходить тем успешнее, чем большее число членов в сумме, т.е. чем больше размер (апертура) маски. Пусть, например, используется маска N?N, в пределах её полезное изображение имеет постоянную яркость f, шум с независимыми значениями отсчетов nk,m, средним значением? = 0 и дисперсией?² в пределах маски (такой шум называют белым). Отношение квадрата яркости (i,j)-го пиксела к дисперсии шума, т.е. отношение сигнал/шум, равно f²/?².

Рассмотрим, например, маску типа H2:

Средний квадрат яркости равен f², средний квадрат интенсивности шума

Двойная сумма отвечает k= p, m = q, эта сумма равна?²/N². Четырехкратная сумма равна нулю, так как отсчеты шума при k ≠ p, m ≠ q независимы: = 0. В результате фильтрации отношение сигнал/шум становится равным N²f²/?², т.е. возрастает пропорционально площади маски. Отношение яркости (i,j)-го пиксела полезного изображения к среднеквадратическому отклонению шума возрастает пропорционально N. Применение маски 3х3, в среднем, повышает отношение сигнала к шуму в 9 раз.

При импульсной помехе механизм подавления состоит в том, что импульс "расплывается" и становится мало заметным на общем фоне.

Однако часто в пределах апертуры значения полезного изображения все же изменяются заметным образом. Это бывает, в частности, когда в пределы маски попадают контуры. С физической точки зрения, все H1 - H4 являются фильтрами нижних частот (усредняющими фильтрами), подавляющими высокочастотные гармоники и шума, и полезного изображения. Это приводит не только к ослаблению шума, но и к размыванию контуров на изображении. На рис. 6а показано исходное зашумленное изображение, результат применения фильтра типа Н2 приведен на рис. 6б (маска 5х5).

Рассмотренная выше фильтрация характеризовалась тем, что выходные значения фильтра g определялись только через входные значения фильтра f. Такие фильтры называются не рекурсивными. Фильтры, в которых выходные значения g определяются не только через входные значения f , но и через соответствующие выходные значения, называются рекурсивными.

При рекурсивной фильтрации можно сохранять те же значения весовых множителей, что и приведенные выше, существуют рекурсивные фильтры со специально подобранными множителями. Элементы входного изображения в пределах окна изменятся и примут вид:

Весовые и нормирующий множители рекурсивного фильтра зависят от местоположения маски; рекурсивный локальный фильтр позволяет учитывать все входные значения фильтруемого изображения, т.е. приближается по своему действию к глобальному фильтру.

Для устранения эффекта размывания контуров при подавлении шума следует переходить к нелинейной обработке. Примером нелинейного фильтра для подавления шума служит медианный фильтр. При медианной фильтрации (i,j)-му пикселу присваивается медианное значение яркости, т.е. такое значение, частота которого равна 0,5. Пусть, например, используется маска 3?3, в пределы которой наряду с более или менее равномерным фоном попал шумовой выброс, этот выброс пришелся на центральный элемент маски:

Строится вариационный ряд. Вариационным рядом V1,..., Vn выборки f1,..., fn называют упорядоченную по не убыванию последовательность элементов выборки, т.е. V1 = min(f1,..., fn), Vn= max (f1,..., fn) и т.д. В нашем случае вариационный ряд имеет вид: 63, 66, 68, 71, 74, 79, 83, 89, 212. Здесь медианное значение - пятое по счету (подчеркнуто), так как всего чисел в ряду 9. При медианной фильтрации значение 212, искаженное шумовым выбросом, заменяется на 74, выброс на изображении полностью подавлен. Результат применения медианного фильтра показан на рис. 6в.

Функция рассеяния точки для медианного фильтра есть нуль. При размерах окна (2k+1)·(2k+1) происходит полное подавление помех, состоящих не более, чем из 2(k² + k) пикселов, а также тех, которые пересекаются не более, с k строками или k столбцами, При этом не изменяется яркость в точках фона. Разумеется, при медианной фильтрации может происходить искажение объекта на изображении, но только на границе или вблизи нее, если размеры объекта больше размеров маски. Фильтр обладает высокой эффективностью при подавлении импульсных помех, однако это качество достигается подбором размеров маски, когда известны минимальные размеры объектов и максимальные размеры искаженных помехой локальных областей.

4. Выделение контуров

Линейные фильтры могут быть предназначены не для подавления шума, а для подчеркивания перепадов яркости и контуров. Выделение вертикальных перепадов осуществляется дифференцированием по строкам, горизонтальных - по столбцам. Дифференцирование производится в цифровой форме:

Здесь Δx=1 - приращение вдоль строки, равное 1 пикселу, Δy=1 - приращение вдоль столбца, также равное 1 пикселу. Выделение перепадов по диагонали можно получить, вычисляя разности уровней диагональных пар элементов.

Для выделения перепадов используются следующие наборы весовых множителей, реализующих двумерное дифференцирование:

север северо-восток восток юго-восток

юг юго-запад запад северо-запад

Название географических направлений говорит о направлении склона перепада, вызывающего максимальный отклик фильтра. Сумма весовых множителей масок равна нулю, поэтому на участках изображения с постоянной яркостью эти фильтры дают нулевой отклик.

Выделение горизонтального перепада можно выполнить также путем вычисления приращения разности яркостей пикселов вдоль строки, что равноценно вычислению второй производной по направлению (оператор Лапласа):

Это отвечает одномерной маске Н = | -1 2 -1|, сумма весовых множителей равна нулю. Таким же образом можно искать перепады по вертикали и по диагонали. Для выделения перепадов без учета их ориентации используются двумерные операторы Лапласа:

Здесь сумма весовых множителей также равна нулю. На рис. 7 приведено исходное изображение и результат применения оператора Лапласа Н13.

Операторы Лапласа реагируют на перепады яркости в виде ступенчатого перепада и на "крышеобразный" перепад. Они также выделяет изолированные точки, тонкие линии, их концы и острые углы объектов. Линия подчеркивается в 2 раза ярче, чем ступенчатый перепад, конец линии в 3 раза, а точка - в 4 раза ярче. Оператор Лапласа не инвариантен к ориентации перепадов: например, отклик оператора на наклонный перепад в диагональном направлении почти вдвое больше, чем в горизонтальном и вертикальном.

С физической точки зрения, фильтры H5 - H15 являются фильтрами верхних частот, они выделяют высокочастотные составляющие полезного изображения, ответственные за перепады яркости и контуры и подавляют "постоянную составляющую". Однако при их использовании уровень шума на изображении возрастает.

Фильтры для выделения перепадов и границ, как и фильтры H1 - H4 для подавления шума, могут быть рекурсивными.

Изображение с подчеркнутыми границами (контурами) субъективно воспринимается лучше, чем оригинал. Происходит фокусировка частично расфокусированного изображения. При использовании оператора Лапласа для этих целей применяют три типовых набора весовых множителей:

H16 - H18 отличаются от фильтров H13 - H15 тем, что к центральному элементу матрицы прибавлена 1, т.е. при фильтрации исходное изображение накладывается на контур.

Для выделения контуров и перепадов яркости могут применяться нелинейные фильтры. В нелинейных алгоритмах используют нелинейные операторы дискретного дифференцирования. В фильтре Робертса используется перемещающаяся по изображению маска 2?2:

дифференцирования производится с помощью одного из выражений

Прэтт У. Цифровая обработка изображений. М.: Мир, т.1,2. 1982.

Сойфер В.А. Компьютерная обработка изображений, Ч. 1//Соровский образовательный журнал, № 2, 1996, с. 118-124.

Сойфер В.А. Компьютерная обработка изображений Ч. 2//Соровский образовательный журнал, № 3, 1996 , c. 110-121.

Хорн Б.К.П. Зрение роботов. М.: Мир, 1989.

Техническое описание IBAS-2000.

Фролов Г.И., Бондаренко Г.В. Получение и исследование физических свойств пленок 3d-металлов, осажденных в условиях сверхбыстрой конденсации//Метод. указания к специальному практикуму по курсу «Физическое материаловедение», САА, Красноярск, 1998.

Цифровая обработка изображений

(Учебное пособие)

1. Математический аппарат описания непрерывных изображений. 3

Представление непрерывных изображений. 3

Системы преобразования непрерывных изображений. 4

Двумерное преобразование Фурье. 6

Детерминированное и вероятностное описание непрерывных изображений. 7

Вопросы.. 9

2. Представление изображений в цифровой форме. 10

Идеальная дискретизация изображений. 10

Дискретизация изображений в реальных системах. 13

Квантование изображений. 14

Вопросы.. 15

3. Математический аппарат описания дискретных изображений. 17

Векторное представление дискретных изображений. 17

Дискретное двумерное преобразование Фурье. 17

Линейные преобразования дискретных изображений. 18

Вероятностное описание дискретных изображений. 20

Вопросы.. 22

4. Улучшение изображений. 23

Поэлементные преобразования. 23

Простые пространственные преобразования. 28

Вопросы.. 29

5. Линейная фильтрация изображений. 31

Восстановление изображений. Оптимальный линейный фильтр. 31

Обнаружение объектов. Согласованный фильтр. 40

Совмещение изображений. Линейный прогноз. 45

Вопросы.. 51

6. Компьютерная томография. 52

Преобразование Радона. Задача томографии. 52

Теорема о центральном сечении. 54

Фурье-алгоритм восстановления томограммы.. 56

Восстановление томограммы методом свертки и обратного проецирования. 57

Восстановление томограммы методом обратного проецирования и двумерной фильтрации 60

Восстановление томограммы по проекциям, полученным в веерном пучке. 61

Влияние шума в проекционных данных на результаты восстановления. 61

Вопросы.. 65

7. Восстановление трехмерных поверхностей по стереопаре. 66

Модель регистрирующей камеры.. 66

Связь между различными системами координат. 68

Стереоскопическая система. 69

Калибровка камеры.. 72

Взаимное ориентирование. 77

Поиск сопряженных точек. 79

Вопросы.. 84

Рассмотрим простую двумерную линейную систему, преобразующую входное изображение в выходное посредством воздействия на входное изображение оператора https://pandia.ru/text/78/315/images/image031_18.gif" width="135" height="21">.

Представим входное изображение в виде (1.5в)..gif" width="532" height="53">.

Но поскольку оператор действует только на функцию, зависящую от переменных https://pandia.ru/text/78/315/images/image003_66.gif" width="15" height="17 src=">, то

Введем обозначение

Рассматривая как изображение точечного объекта, помещенного в точку с координатами https://pandia.ru/text/78/315/images/image038_14.gif" width="13" height="17 src=">.gif" width="16 height=21" height="21">. Эта функция называется импульсным откликом системы, а в применении к оптическим системам – функцией рассеяния точки (ФРТ). Таким образом, воздействие линейной двумерной системы на изображение можно представить в виде интеграла суперпозиции

. (1.9)

Как следует из (1.8), в общем случае линейная система по-разному воздействует на различные участки входного изображения, в частности, одинаковые точечные объекты, помещенные в разных участках входного изображения, могут иметь различную форму в выходном изображении. Форма выходного изображения точечного объекта сохраняется, если импульсный отклик системы зависит только от разности координат . В этом случае воздействие линейной системы представляется в виде интеграла свертки

, (1.10)

который в символической форме записывается как

Линейные двумерные системы, описываемые соотношением (1.10), называются пространственно-инвариантными (в оптике – изопланатическими).

Двумерное преобразование Фурье

Одним из полезных инструментов, используемых при анализе линейных систем, является преобразование Фурье. В результате двумерного преобразования Фурье получается двумерный спектр исходного изображения :

, . (1.11)

Для существования Фурье-спектра функции достаточно выполнения условия

. (1.11а)

В общем случае спектр - комплексная функция, которая может быть представлена либо в виде действительной и мнимой составляющих:

либо в виде модуля и фазы:

Преобразование Фурье обратимо:

Напомним ряд свойств двумерного преобразования Фурье .

Если , то , где , https://pandia.ru/text/78/315/images/image055_14.gif" width="52" height="23 src="> – Фурье-спектры функций , и https://pandia.ru/text/78/315/images/image057_14.gif" width="135 height=23" height="23">, то , где и https://pandia.ru/text/78/315/images/image061_13.gif" width="37" height="23"> и .

Если и , то и , т. е. Фурье-спектр действительной четной функции – действительная четная функция (здесь и далее надстрочный индекс * обозначает комплексную сопряженность).

Если и – Фурье-спектр функции , то Фурье-спектр функции есть

(теорема о спектре свертки).

Наоборот, если , то

Квадраты модулей исходного изображения и его Фурье-спектра связаны соотношением

(1.16)

(теорема Парсеваля).

Соотношения (1.15) и (1.15а) широко используются при анализе линейных пространственно-инвариантных систем..gif" width="51 height=21" height="21"> описывается интегралом свертки (1.10), то в частотных координатах оно сводится к простому умножению спектра изображения на спектр импульсного отклика, называемый частотной характеристикой системы.

Детерминированное и вероятностное описание непрерывных изображений

С точки зрения определенности конкретных значений изображения в данных координатах и в данный момент времени существует два основных подхода к его описанию. Первый подход, называемый детерминированным, предполагает, что в каждой точке функция определяется единственным образом. Иногда более плодотворным для анализа изображений представляется их вероятностное описание, когда данное изображение рассматривается как реализация случайного процесса. Случайный процесс в точках отсчета , , https://pandia.ru/text/78/315/images/image081_12.gif" width="240" height="24">, (1.17)

определяющей вероятность того, что – значения процесса в точках с координатами https://pandia.ru/text/78/315/images/image079_12.gif" width="19" height="25 src="> удовлетворяют условиям

, , https://pandia.ru/text/78/315/images/image029_16.gif" width="51 height=21" height="21"> определяется как

Здесь – область допустимых значений функции .

Второй момент, или автокорреляционная функция, по определению равен

(1.20)

Здесь подстрочные индексы 1 и 2 при соответствуют не двум разным процессам, а значениям одного процесса, соответствующим двум разным точкам пространства. Второй центральный момент, автоковариационная функция, определяется как

Нетрудно показать, что

Аналогичным образом для двух разных процессов и определяются кросс-корреляционная и кросс-ковариационная функции:

(1.20а)

Еще один момент второго порядка, дисперсия , есть

Случайный процесс, порождающий изображения, называется стационарным в широком смысле, если его среднее значение и дисперсия постоянны, а автокорреляционная (автоковариационная) функция зависит только от разностей , https://pandia.ru/text/78/315/images/image097_10.gif" width="93" height="25">, (1.19а)

Несложно убедиться, что автокорреляционная (автоковариационная) функция действительного стационарного процесса есть функция четная, т. е.

Выполнение условия (1.11а) для случайного процесса не гарантировано, поэтому нельзя говорить о его преобразовании Фурье. Однако к ковариационной функции стационарного процесса, которая есть функция детерминированная, преобразование Фурье может быть применено. Функция

называется спектром мощности стационарного случайного процесса . Результат преобразования Фурье кросс-ковариационной функции, иногда называемый кросс-спектром мощности, по определению есть

Рассмотрим линейную пространственно-инвариантную систему, действие которой на входное изображение, являющееся реализацией стационарного случайного процесса представляется выражением (1.10). Вычислим среднее значение выходного изображения :

https://pandia.ru/text/78/315/images/image104_8.gif" width="493" height="27 src="> (1.25)

и спектр мощности

DIV_ADBLOCK101">

Прэтт У. Цифровая обработка изображений, т.1. М., “Мир”, 1982 Папулис А. Теория систем и преобразований в оптике. М., “Мир”, 1971 Гудмен Дж. Введение в фурье-оптику. М., “Мир”, 1970

2. Представление изображений в цифровой форме

Получение изображения в цифровой форме, представляющего собой двумерный массив чисел с дискретно изменяющимися значениями, из изображения, представляющего собой непрерывное пространственное распределение некоторой физической величины, способной принимать непрерывный набор значений (аналоговой величины), состоит из двух основных операций. Первая операция (дискретизация) заключается в замене пространственно непрерывного изображения набором его отсчетов в отдельных точках, вторая (квантование) – в преобразовании аналоговых отсчетов в отсчеты, представляемые числами с конечным числом знаков. При этом возникает вопрос о величине погрешностей, возникающих при последующем восстановления непрерывного изображения по его дискретному аналогу. Здесь мы попытаемся оценить искажения, которые возникают при переводе непрерывного изображения в цифровую форму.

Идеальная дискретизация изображений

При идеальной дискретизации предполагается, что исходное непрерывное изображение имеет бесконечные размеры, а дискретизованное получается посредством взятия значений исходного в узлах некоторой бесконечной решетки. Для простоты изложения рассмотрим прямоугольную решетку, ориентированную вдоль координатных осей и имеющую шаг вдоль оси и вдоль оси .

Дискретизованное изображение в непрерывных координатах можно представить как набор дельта-функций в узлах решетки, умноженных на значения соответствующих отсчетов непрерывного изображения:

Поскольку вне точек , это представление можно переписать в виде

где - пространственная дискретизирующая функция.

Рассмотрим Фурье-спектр дискретизованного изображения. В силу (1.15а)

где https://pandia.ru/text/78/315/images/image116_6.gif" width="49" height="21"> – Фурье-спектр дискретизирующей функции. Используя (1.7), можно показать, что