Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования

Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2008
Hauptverfasser: Полякова, М.В., Крылов, В.Н., Гуляева, Н.А.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/7656
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-7656
record_format dspace
spelling irk-123456789-76562010-04-07T12:01:38Z Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования Полякова, М.В. Крылов, В.Н. Гуляева, Н.А. Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора. Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро- диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального оператора. The method of linear scale-space of image is developed on the basis of integro-differential equation of first order with a convolution of wavelets as the kernel of integral operator. 2008 Article Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/7656 681.3.01:519.67 ru Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
spellingShingle Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
description Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора.
format Article
author Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
author_facet Полякова, М.В.
Крылов, В.Н.
Гуляева, Н.А.
author_sort Полякова, М.В.
title Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_short Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_full Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_fullStr Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_full_unstemmed Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
title_sort линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2008
topic_facet Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
url http://dspace.nbuv.gov.ua/handle/123456789/7656
citation_txt Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос.
work_keys_str_mv AT polâkovamv linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ
AT krylovvn linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ
AT gulâevana linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ
first_indexed 2025-07-02T10:27:10Z
last_indexed 2025-07-02T10:27:10Z
_version_ 1836530564337762304
fulltext «Искусственный интеллект» 4’2008 776 9П УДК 681.3.01:519.67 М.В. Полякова, В.Н. Крылов, Н.А. Гуляева Одесский национальный политехнический университет, Украина Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора. Введение Масштабно-пространственное представление – это множество копий исходного изображения с разными масштабами, которые позволяют охарактеризовать объекты иерархической структуры [1], т.е. объекты, которые содержат подобъекты. При реше- нии прикладных задач используются те копии исходного изображения, которые имеют наибольшую семантическую значимость в зависимости от цели обработки. Масштабно-пространственное представление изображения широко используется при обработке медицинских изображений, изображений аэрофотосъемки, а также при контроле качества изделий в промышленности, когда решаются задачи определения формы объекта, контурной сегментации, определения оптического потока и стереозрения. Такое представление позволяет существенно повысить оперативность обработки и достоверность распознавания объектов на изображениях. Масштабно-пространственное представление изображения может быть линей- ным или нелинейным. Линейное масштабно-пространственное представление строится на основе уравнения диффузии и ставит в соответствие изображению I(x,y) зависящее от масштаба t однопараметрическое семейство изображений I(x,y,t), которое удов- летворяет уравнению ),,,(),,( tyxI t tyxI    (1) с начальным условием I(x,y,0) = I(x,y), где ,2 2 2 2 yx       x, y – пространственные координаты. Предполагается, что масштабный параметр t  0 монотонно возрастает и некоторым образом может быть соотнесен с пространственным масштабом [1]. В [1] показано, что I(x,y,t) может быть получено с помощью свертки с гауссовской функцией G(x,y,t) = t yx e t 4 22 4 1    . В этом случае построение масштабно- пространственного представления сводится к построению последовательности сглажен- ных изображений. Производные изображений I(x,y,t) также удовлетворяют уравне- Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 777 9П нию диффузии, а производные гауссовских функций генерируют масштабно-прост- ранственное представление, подчеркивающее контуры объектов на разных масш- табах. Процесс получения масштабно-пространственного представления изображения на основе уравнения (1) называется изотропной диффузией. Изотропная диффузия обеспечивает помехоустойчивость представления путем сглаживания изображения, однако в этом случае размываются контуры, которые часто являются наиболее информативной частью объекта распознавания. Для решения этой проблемы часть информации о контурах вносят в качестве нелинейности в дифференциальное уравнение в частных производных. Тогда внутри однородных областей изображение сглаживается сильнее, чем вдоль границ облас- тей. Полученное в результате решения задачи Коши для нелинейного дифференциаль- ного уравнения в частных производных масштабно-пространственное представление изображения называется нелинейным, а подход, который применяется для его построения – анизотропным диффузионным [2]. Этот подход позволяет повысить качество выделения контуров и улучшить результат сегментации. Уравнение анизо- тропной диффузии имеет вид:   ,),,( IIgdiv t tyxI    где div – дивергенция, yx div       ; – градиент, ;,            yx  Ig  – поро- говая функция для перепадов интенсивности изображения такая, что g(0) = 1, 0)(lim,0)(   xgxg x . Выбор g(x) производится по аналогии с выбором порога для I в дифференциальных методах контурной сегментации изображений [2]. Недостатком анизотропного диффузионного подхода являются большой объем вычислений по сравнению с линейной диффузией и низкая помехоустойчивость из-за использо- вания производных по пространственным координатам. Значительная часть практи- ческих задач характеризуется высоким уровнем помех. Поэтому задача разработки нового подхода к построению масштабно-пространственного представления изобра- жения, позволяющего локализовать контуры и обеспечивающего высокую помехо- устойчивость, является актуальной. В случае иерархической структуры объекта распознавания для получения масштабно-пространственного представления изображения вместо пространствен- ного дифференцирования в данной работе предлагается применять репагулярное вейвлет-преобразование. Это преобразование определено в [3] как свертка строки или столбца изображения с функцией         ,,0 ;,sgn),( a a a x xxxax    где a – фиксированное число, зависящее от а(0,1) – параметра преобразования. Применение репагулярного вейвлет-преобразования для подчеркивания перепадов интенсивности изображения в задаче контурной сегментации изображений позволило достичь более высокой помехоустойчивости методов сегментации по сравнению с применением дифференцирования [3]. Для характеристики помехоустойчивости в работе используется показатель качества масштабно-пространственного представления, оценивающий близость резуль- татов представления для зашумленного и незашумленного изображений, и пока- Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 778 9П затель эффективности, учитывающий уменьшение энтропии изображения при сни- жении уровня помех. Так как применение репагулярного вейвлет-преобразования при построении масштабно-пространственного представления обусловлено необходи- мостью сохранения границ объектов при подавлении шума на однородных участках изображения, целью работы является повышение эффективности линейного масштабно-пространственного представления изображения с помощью вейвлет- преобразования. Для достижения поставленной цели решены следующие задачи: – разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора; – экспериментально исследованы качество и эффективность предложенного метода. Построение линейного масштабно-пространственного представления изображения с помощью вейвлет-преобразования Как уже упоминалось, линейное масштабно-пространственное представление строится на основе уравнения диффузии (1). Обозначим m-ю строку изображения I(x,y,t) через u(x,t): u(x,t) = I(x,ym,t). Тогда (1) для m-й строки изображения имеет вид: .),(),( 2 2 x txu t txu      (2) При моделировании изображения, содержащего перепады интенсивности, последние описываются функцией Хевисайда. Поэтому в общем случае функция u(x,t), удовлетворяющая (2), имеет разрывы 1-го рода и может быть представлена как обобщенная функция, зависящая от параметра t. Дифференцирование в (2) выполняется для обобщенной функции [4]. Дифференцирование по пространственной координате можно представить в виде свертки строки изображения с производной дельта-функции [4], тогда (2) имеет вид: )),(*)((*)(),( txuxx t txu     . (3) При использовании вейвлет-преобразования для подчеркивания контуров изображения задача сегментации сводится к задаче определения точек, в которых изменяется регулярность функции значений интенсивности изображения в зависимости от пространственных координат. Для обнаружения изменений регулярности функции целесообразно использовать специальный вид вейвлет-преобразования, характеризу- ющийся не изменением параметра масштаба, а изменением показателя регулярности вейвлет-функции. Этот вид вейвлет-преобразования, которое называется репагулярным (от латинского repagulum – сдерживающая преграда), реализуется как свертка изображения с вейвлет-функциями разной регулярности, локализованными в одной точке. Известно, что подчеркивание перепадов интенсивности изображения с помощью вейвлет-функций разной регулярности ),( ax , где а(0,1), обеспечивает Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 779 9П большую по сравнению с операцией дифференцирования помехоустойчивость [3]. Поэтому заменим в (3) )(x на функцию вида ),( ax , где а(0,1) фиксировано, получаем ).,(*),((*),(),( txuaxax t txu    (4) Формула (4) представляет собой обыкновенное интегро-дифференциальное уравнение 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора [5]. Поставим задачу Коши: найти решение этого уравнения (обобщенную функцию, которая зависит от параметра t), обращающееся при t = 0 в заданную обобщенную функцию f(x). Чтобы раскрыть физический смысл (4), учтем, что первообразная функция ),( ax имеет вид: ),( 1 1),( 1 aCx a ax a     где С(а) – произвольная функция а [4], поэтому выберем С(а) = 0. В этом случае ).,(),( ax x ax     Тогда (4) можно представить как .),(*),(*),(),(              txuax x ax x tx t u  (5) Согласно свойству дифференцирования свертки обобщенных функций, фор- мула (5) принимает вид:            2 2 ),(*),(*),(),( x txuaxax t txu  . (6) В области преобразования Фурье (6) преобразуется к следующему виду: ).,()),((),( 2 2 22 tuat t u         (7) Формула (7) представляет собой в области преобразования Фурье уравнение диффузии в неоднородной среде. Использование такого уравнения предполагает, что сглаживание спектральной плотности изображения можно представить как процесс диффузии в неоднородной среде. Чтобы найти концентрацию вещества в любой точке среды в любой момент времени, недостаточно одного уравнения (7). Необходимо знать еще распределение концентрации вещества в начальный момент времени – начальное условие: ).()0,(  fu  Таким образом получаем в области преобразования Фурье задачу Коши для уравнения диффузии в неоднородной изотропной среде:           ).()0,( ,),()),((),( 2 2 22    fu tua t tu (8) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 780 9П Решение задачи Коши (8), описывающей преобразование спектральной плотности изображения как процесс диффузии в неоднородной среде, получается путем применения преобразования Фурье к решению (4) с начальным условием )()0,( xfxu  . (9) Для нахождения решения обыкновенного интегро-дифференциального уравне- ния 1-го порядка (4) выполняется преобразование Фурье обеих частей этого уравне- ния. Получаем линейное однородное уравнение относительно ),( au  с переменными коэффициентами:   ),(),(),( 2 tua t tu     . (10) Общее решение уравнения (10) имеет вид: taeCtE 2)),(( 0),(   . Выполнив обратное преобразование Фурье по переменной  , получаем   deeCtxE xi ta 2)),(( 0),(     . Фундаментальным решением уравнения (4) называется решение E(x,t), удов- летворяющее начальному условию E(x,0) = )(x . Если обобщенная функция f(x) в (9) финитна, то решение задачи Коши для уравнения (4) с начальным условием (9) запи- сывается в виде: u(x,t) = E(x,t) f(x). (11) Для определения константы С0 воспользуемся начальным условием задачи Коши для уравнения (4): )()0,( xxE  . В области преобразования Фурье по переменной х получаем 1)0,( 0 CE  . Тогда  deetxE xita    2)),((),( , причем полученное решение не ограничивает выбор вейвлета только репагулярной вейвлет-функцией. Докажем, что обобщенная функция u(x,t) = E(x,t) f(x) удовлетворяет уравне- нию (10). Выполнив преобразование Фурье по переменной х, имеем )(),(),(  ftEtu  . (12) Подставляя (12) в уравнение (10), получаем     0),(),(),()()(),(),()(),( 22             tEa t tEfftEaf t tE  . Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 781 9П Докажем, что (12) удовлетворяет начальному условию задачи Коши u(x,0) = f(x). В области преобразования Фурье по переменной х это условие принимает вид: )()0,(  fu  . Тогда )()(lim),(lim 2)),(( 00   ffeau ta tt   . Реализация линейного масштабно-пространственного представления изображения с помощью вейвлет-преобразования Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования согласно формуле (11) реализуется в виде свертки каждой строки, а затем каждого столбца матрицы значений интенсивности изображения с фильтром   Ne nt ne 0 , коэффициенты которого представляют собой дискретные значения функции Е(х,t). Для вычисления коэффициентов фильтра   Ne nt ne 0 задается параметр масштабно-пространственного представления а(0,1). Затем определяются значения функции  2, a для последовательности дискретных значений  , например, из интервала  3,3 с шагом 0,25. Для упрощения вычислений в качестве  a, использовалась функция      sgn1 2 cos2,~ 1 aaaia , являющаяся пре- образованием Фурье xxax a sgn),(~   . Результат вычисления интеграла для каждого значения частоты потенцируется, а затем к полученной последовательности значений применяется обратное дискретное преобразование Фурье. Получаем коэффициенты фильтра   Ne nt ne 0 (рис. 1, 2). а) б) Рисунок 1 – Функция, производящая масштабно-пространственное представление в пространственной (а) и частотной (б) области: 1 – гауссовская (t = 1/32), 2 – предложенная (t = 1/4) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 782 9П а) б) Рисунок 2 – Масштабно-пространственное представление изображения: линейное (а) (t = 2, 4, 8, 12, 20), линейное с помощью вейвлет-преобразования (б) (t = 1/24, 1/12, 1/6, 1/4, 1/2) Экспериментальные исследования и выводы Экспериментальные исследования предложенного масштабно-пространственного представления проведены на изображении размером 256  256 пикселей, в центре которого – белый квадрат 64  64 на черном фоне. На это изображение накладывался аддитивный гауссовский шум, для которого отношение сигнал/шум q определялось по формуле 22 /  hq , где h – величина контраста объекта,  – стандартное отклонение шума. Показателем качества масштабно-пространственного представления, применяемого для улучшения изображения, выбрана величина t ПроF , определяемая по формуле [6]:              N i M j эт N i M j этt t Про jiIjiI jiIjiI F 1 1 20 1 1 2 ),(),( ),(,( , где ),( jiI эт – результат масштабно-пространственного представления тестового изображения; ),( jiI t – результат масштабно-пространственного представления зашум- ленного изображения; ),(0 jiI – зашумленное изображение. Для оценки эффективности масштабно-пространственного представления изображения предложено использовать коэффициент уменьшения энтропии, так как снижение уровня помех приводит к уменьшению энтропии изображения [6]: HP HDH  , где Н – энтропия зашумленного изображения; )(log)( 1 2   L i ii xPxPH ; L – количество значений интенсивности изображения; )( ixP – вероятность появления значения интенсивности ix ; HP – энтропия изображения, полученного в результате масштабно- пространственного представления. Линейное масштабно-пространственное представление изображения... «Штучний інтелект» 4’2008 783 9П Получены графики зависимости значения показателей эффективности и качества масштабно-пространственного представления изображения от отношения сигнал/шум по мощности (рис. 3). а) б) Рисунок 3 – Зависимости показателей качества (а) и эффективности (б) от отношения сигнал/шум по мощности для масштабно-пространственного представления: линейного (1), предложенного (2), нелинейного (3) Анализируя полученные результаты, заметим, что предложенное масштабно- пространственное представление изображений, пораженных аддитивным гауссовским шумом, превышает по эффективности линейное и нелинейное масштабно-пространст- венное представление в 1,4 – 2,1 раза при значениях отношения сигнал/шум 100 и менее по мощности. По значениям показателя качества предложенное масштабно-пространственное представление хуже линейного представления до 5 раз при отношении сигнал/шум 20 и менее по мощности. При значениях отношения сигнал/шум 50 и более по мощности предложенное представление превышает по показателю качества линейное масштабно-пространственное представление до 2,3 раза. Сравнение предложенного масштабно-пространственного представления с нелинейным представлением показало, что оба представления сходны по показателю качества. По быстродействию предложенное масштабно-пространственное представление сравнимо с линейным представлением и лучше нелинейного представления в Cn раз, где n – количество итераций при вычислении нелинейного масштабно-пространст- венного представления (в наших экспериментах 30 – 45), С – постоянная, которая приблизительно равна 0,1 (рис. 4). Рисунок 4 – Время вычисления нелинейного масштабно-пространственного представления изображения 256  256 пикселей в зависимости от количества итераций (вычисление предложенного масштабно-пространственного представления заняло 0,5 – 0,6 с) Полякова М.В., Крылов В.Н., Гуляева Н.А. «Искусственный интеллект» 4’2008 784 9П Таким образом предложенное линейное масштабно-пространственное представле- ние целесообразно использовать для улучшения изображений, пораженных аддитивным гауссовским шумом при отношении сигнал/шум 100 и менее по мощности в задачах, где требуется высокое быстродействие и эффективность. Литература 1. Lindeberg T. Scale-Space Theory in Computer Vision. – Boston: Kluwer Academic Publishers, 1994. – 423 p. 2. Perona P., Malik J. Scale-space and edge detection using anisotropic diffusion // IEEE Trans. Pattern Analysis and Machine Intelligence. – 1990. – Vol. 12. – P. 629-639. 3. Полякова М.В., Крылов В.Н. Морфологический метод контурной сегментации изображений на основе репагулярного вейвлет-преобразования // Труды Одес. политех. ун-та. – Одесса, 2006. – Вып. 1 (25). – С. 98-103. 4. Гельфанд И.М., Шилов Г.Е. Обобщенные функции и действия над ними. Вып. 1. – М.: Физматгиз, 1959. – 470 с. 5. Вольтера В. Теория функционалов, интегральных и интегро-дифференциальных уравнений: Пер. с англ. / Под ред. П.И. Кузнецова. – М.: Наука, 1982. – 304 с. 6. Абакумов В.Г., Крылов В.Н., Антощук С.Г. Повышение эффективности обработки образной информации в автоматизированных системах // Электроника и связь: Темат. вып. «Проблемы электроники». – 2005. – Ч. 1. – С. 100-105. М.В. Полякова, В.М. Крилов, Н.А. Гуляєва Лінійне масштабно-просторове представлення зображення за допомогою вейвлет-перетворення Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро- диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального оператора. M.V. Polyakova, V.N. Krylov, N.A. Gulyayeva Linear Scale-space of Image with Wavelet Transform Help The method of linear scale-space of image is developed on the basis of integro-differential equation of first order with a convolution of wavelets as the kernel of integral operator. Статья поступила в редакцию 29.05.2008.