Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования
Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора....
Gespeichert in:
Datum: | 2008 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут проблем штучного інтелекту МОН України та НАН України
2008
|
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/7656 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-7656 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-76562010-04-07T12:01:38Z Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования Полякова, М.В. Крылов, В.Н. Гуляева, Н.А. Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Разработан метод линейного масштабно-пространственного представления изображения на основе интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального оператора. Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро- диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального оператора. The method of linear scale-space of image is developed on the basis of integro-differential equation of first order with a convolution of wavelets as the kernel of integral operator. 2008 Article Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/7656 681.3.01:519.67 ru Інститут проблем штучного інтелекту МОН України та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами |
spellingShingle |
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Полякова, М.В. Крылов, В.Н. Гуляева, Н.А. Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
description |
Разработан метод линейного масштабно-пространственного представления изображения на основе
интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра
интегрального оператора. |
format |
Article |
author |
Полякова, М.В. Крылов, В.Н. Гуляева, Н.А. |
author_facet |
Полякова, М.В. Крылов, В.Н. Гуляева, Н.А. |
author_sort |
Полякова, М.В. |
title |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
title_short |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
title_full |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
title_fullStr |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
title_full_unstemmed |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
title_sort |
линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования |
publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
publishDate |
2008 |
topic_facet |
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами |
url |
http://dspace.nbuv.gov.ua/handle/123456789/7656 |
citation_txt |
Линейное масштабно-пространственное представление изображения с помощью вейвлет-преобразования / М.В. Полякова, В.Н. Крылов, Н.А. Гуляева // Штучний інтелект. — 2008. — № 4. — С. 776-784. — Бібліогр.: 6 назв. — рос. |
work_keys_str_mv |
AT polâkovamv linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ AT krylovvn linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ AT gulâevana linejnoemasštabnoprostranstvennoepredstavlenieizobraženiâspomoŝʹûvejvletpreobrazovaniâ |
first_indexed |
2025-07-02T10:27:10Z |
last_indexed |
2025-07-02T10:27:10Z |
_version_ |
1836530564337762304 |
fulltext |
«Искусственный интеллект» 4’2008 776
9П
УДК 681.3.01:519.67
М.В. Полякова, В.Н. Крылов, Н.А. Гуляева
Одесский национальный политехнический университет, Украина
Линейное масштабно-пространственное
представление изображения с помощью
вейвлет-преобразования
Разработан метод линейного масштабно-пространственного представления изображения на основе
интегро-дифференциального уравнения 1-го порядка со сверткой вейвлет-функций в качестве ядра
интегрального оператора.
Введение
Масштабно-пространственное представление – это множество копий исходного
изображения с разными масштабами, которые позволяют охарактеризовать объекты
иерархической структуры [1], т.е. объекты, которые содержат подобъекты. При реше-
нии прикладных задач используются те копии исходного изображения, которые имеют
наибольшую семантическую значимость в зависимости от цели обработки.
Масштабно-пространственное представление изображения широко используется
при обработке медицинских изображений, изображений аэрофотосъемки, а также при
контроле качества изделий в промышленности, когда решаются задачи определения
формы объекта, контурной сегментации, определения оптического потока и
стереозрения. Такое представление позволяет существенно повысить оперативность
обработки и достоверность распознавания объектов на изображениях.
Масштабно-пространственное представление изображения может быть линей-
ным или нелинейным. Линейное масштабно-пространственное представление строится
на основе уравнения диффузии и ставит в соответствие изображению I(x,y) зависящее
от масштаба t однопараметрическое семейство изображений I(x,y,t), которое удов-
летворяет уравнению
),,,(),,( tyxI
t
tyxI
(1)
с начальным условием I(x,y,0) = I(x,y), где ,2
2
2
2
yx
x, y – пространственные
координаты. Предполагается, что масштабный параметр t 0 монотонно возрастает
и некоторым образом может быть соотнесен с пространственным масштабом [1].
В [1] показано, что I(x,y,t) может быть получено с помощью свертки с
гауссовской функцией G(x,y,t) = t
yx
e
t
4
22
4
1
. В этом случае построение масштабно-
пространственного представления сводится к построению последовательности сглажен-
ных изображений. Производные изображений I(x,y,t) также удовлетворяют уравне-
Линейное масштабно-пространственное представление изображения...
«Штучний інтелект» 4’2008 777
9П
нию диффузии, а производные гауссовских функций генерируют масштабно-прост-
ранственное представление, подчеркивающее контуры объектов на разных масш-
табах.
Процесс получения масштабно-пространственного представления изображения
на основе уравнения (1) называется изотропной диффузией. Изотропная диффузия
обеспечивает помехоустойчивость представления путем сглаживания изображения,
однако в этом случае размываются контуры, которые часто являются наиболее
информативной частью объекта распознавания.
Для решения этой проблемы часть информации о контурах вносят в качестве
нелинейности в дифференциальное уравнение в частных производных. Тогда внутри
однородных областей изображение сглаживается сильнее, чем вдоль границ облас-
тей. Полученное в результате решения задачи Коши для нелинейного дифференциаль-
ного уравнения в частных производных масштабно-пространственное представление
изображения называется нелинейным, а подход, который применяется для его
построения – анизотропным диффузионным [2]. Этот подход позволяет повысить
качество выделения контуров и улучшить результат сегментации. Уравнение анизо-
тропной диффузии имеет вид:
,),,( IIgdiv
t
tyxI
где div – дивергенция,
yx
div
; – градиент, ;,
yx
Ig – поро-
говая функция для перепадов интенсивности изображения такая, что g(0) = 1,
0)(lim,0)(
xgxg
x
. Выбор g(x) производится по аналогии с выбором порога для I
в дифференциальных методах контурной сегментации изображений [2]. Недостатком
анизотропного диффузионного подхода являются большой объем вычислений по
сравнению с линейной диффузией и низкая помехоустойчивость из-за использо-
вания производных по пространственным координатам. Значительная часть практи-
ческих задач характеризуется высоким уровнем помех. Поэтому задача разработки
нового подхода к построению масштабно-пространственного представления изобра-
жения, позволяющего локализовать контуры и обеспечивающего высокую помехо-
устойчивость, является актуальной.
В случае иерархической структуры объекта распознавания для получения
масштабно-пространственного представления изображения вместо пространствен-
ного дифференцирования в данной работе предлагается применять репагулярное
вейвлет-преобразование. Это преобразование определено в [3] как свертка строки
или столбца изображения с функцией
,,0
;,sgn),(
a
a
a
x
xxxax
где a –
фиксированное число, зависящее от а(0,1) – параметра преобразования. Применение
репагулярного вейвлет-преобразования для подчеркивания перепадов интенсивности
изображения в задаче контурной сегментации изображений позволило достичь более
высокой помехоустойчивости методов сегментации по сравнению с применением
дифференцирования [3].
Для характеристики помехоустойчивости в работе используется показатель
качества масштабно-пространственного представления, оценивающий близость резуль-
татов представления для зашумленного и незашумленного изображений, и пока-
Полякова М.В., Крылов В.Н., Гуляева Н.А.
«Искусственный интеллект» 4’2008 778
9П
затель эффективности, учитывающий уменьшение энтропии изображения при сни-
жении уровня помех. Так как применение репагулярного вейвлет-преобразования при
построении масштабно-пространственного представления обусловлено необходи-
мостью сохранения границ объектов при подавлении шума на однородных участках
изображения, целью работы является повышение эффективности линейного
масштабно-пространственного представления изображения с помощью вейвлет-
преобразования. Для достижения поставленной цели решены следующие задачи:
– разработан метод линейного масштабно-пространственного представления
изображения на основе интегро-дифференциального уравнения 1-го порядка со
сверткой вейвлет-функций в качестве ядра интегрального оператора;
– экспериментально исследованы качество и эффективность предложенного метода.
Построение линейного масштабно-пространственного
представления изображения с помощью
вейвлет-преобразования
Как уже упоминалось, линейное масштабно-пространственное представление
строится на основе уравнения диффузии (1). Обозначим m-ю строку изображения
I(x,y,t) через u(x,t):
u(x,t) = I(x,ym,t).
Тогда (1) для m-й строки изображения имеет вид:
.),(),(
2
2
x
txu
t
txu
(2)
При моделировании изображения, содержащего перепады интенсивности,
последние описываются функцией Хевисайда. Поэтому в общем случае функция
u(x,t), удовлетворяющая (2), имеет разрывы 1-го рода и может быть представлена как
обобщенная функция, зависящая от параметра t. Дифференцирование в (2) выполняется
для обобщенной функции [4].
Дифференцирование по пространственной координате можно представить в
виде свертки строки изображения с производной дельта-функции [4], тогда (2)
имеет вид:
)),(*)((*)(),( txuxx
t
txu
. (3)
При использовании вейвлет-преобразования для подчеркивания контуров
изображения задача сегментации сводится к задаче определения точек, в которых
изменяется регулярность функции значений интенсивности изображения в зависимости
от пространственных координат. Для обнаружения изменений регулярности функции
целесообразно использовать специальный вид вейвлет-преобразования, характеризу-
ющийся не изменением параметра масштаба, а изменением показателя регулярности
вейвлет-функции. Этот вид вейвлет-преобразования, которое называется репагулярным
(от латинского repagulum – сдерживающая преграда), реализуется как свертка
изображения с вейвлет-функциями разной регулярности, локализованными в одной
точке. Известно, что подчеркивание перепадов интенсивности изображения с
помощью вейвлет-функций разной регулярности ),( ax , где а(0,1), обеспечивает
Линейное масштабно-пространственное представление изображения...
«Штучний інтелект» 4’2008 779
9П
большую по сравнению с операцией дифференцирования помехоустойчивость [3].
Поэтому заменим в (3) )(x на функцию вида ),( ax , где а(0,1) фиксировано,
получаем
).,(*),((*),(),( txuaxax
t
txu
(4)
Формула (4) представляет собой обыкновенное интегро-дифференциальное
уравнение 1-го порядка со сверткой вейвлет-функций в качестве ядра интегрального
оператора [5]. Поставим задачу Коши: найти решение этого уравнения (обобщенную
функцию, которая зависит от параметра t), обращающееся при t = 0 в заданную
обобщенную функцию f(x). Чтобы раскрыть физический смысл (4), учтем, что
первообразная функция ),( ax имеет вид:
),(
1
1),( 1 aCx
a
ax a
где С(а) – произвольная функция а [4], поэтому выберем С(а) = 0. В этом случае
).,(),( ax
x
ax
Тогда (4) можно представить как
.),(*),(*),(),(
txuax
x
ax
x
tx
t
u
(5)
Согласно свойству дифференцирования свертки обобщенных функций, фор-
мула (5) принимает вид:
2
2 ),(*),(*),(),(
x
txuaxax
t
txu
. (6)
В области преобразования Фурье (6) преобразуется к следующему виду:
).,()),((),( 2
2
22 tuat
t
u
(7)
Формула (7) представляет собой в области преобразования Фурье уравнение
диффузии в неоднородной среде. Использование такого уравнения предполагает, что
сглаживание спектральной плотности изображения можно представить как процесс
диффузии в неоднородной среде.
Чтобы найти концентрацию вещества в любой точке среды в любой момент
времени, недостаточно одного уравнения (7). Необходимо знать еще распределение
концентрации вещества в начальный момент времени – начальное условие:
).()0,( fu Таким образом получаем в области преобразования Фурье задачу
Коши для уравнения диффузии в неоднородной изотропной среде:
).()0,(
,),()),((),(
2
2
22
fu
tua
t
tu
(8)
Полякова М.В., Крылов В.Н., Гуляева Н.А.
«Искусственный интеллект» 4’2008 780
9П
Решение задачи Коши (8), описывающей преобразование спектральной плотности
изображения как процесс диффузии в неоднородной среде, получается путем
применения преобразования Фурье к решению (4) с начальным условием
)()0,( xfxu . (9)
Для нахождения решения обыкновенного интегро-дифференциального уравне-
ния 1-го порядка (4) выполняется преобразование Фурье обеих частей этого уравне-
ния. Получаем линейное однородное уравнение относительно ),( au с переменными
коэффициентами:
),(),(),( 2 tua
t
tu
. (10)
Общее решение уравнения (10) имеет вид:
taeCtE
2)),((
0),( .
Выполнив обратное преобразование Фурье по переменной , получаем
deeCtxE xi
ta 2)),((
0),(
.
Фундаментальным решением уравнения (4) называется решение E(x,t), удов-
летворяющее начальному условию E(x,0) = )(x . Если обобщенная функция f(x) в (9)
финитна, то решение задачи Коши для уравнения (4) с начальным условием (9) запи-
сывается в виде:
u(x,t) = E(x,t) f(x). (11)
Для определения константы С0 воспользуемся начальным условием задачи
Коши для уравнения (4):
)()0,( xxE .
В области преобразования Фурье по переменной х получаем
1)0,( 0 CE .
Тогда
deetxE xita
2)),((),( ,
причем полученное решение не ограничивает выбор вейвлета только репагулярной
вейвлет-функцией.
Докажем, что обобщенная функция u(x,t) = E(x,t) f(x) удовлетворяет уравне-
нию (10). Выполнив преобразование Фурье по переменной х, имеем
)(),(),( ftEtu . (12)
Подставляя (12) в уравнение (10), получаем
0),(),(),()()(),(),()(),( 22
tEa
t
tEfftEaf
t
tE .
Линейное масштабно-пространственное представление изображения...
«Штучний інтелект» 4’2008 781
9П
Докажем, что (12) удовлетворяет начальному условию задачи Коши u(x,0) = f(x).
В области преобразования Фурье по переменной х это условие принимает вид:
)()0,( fu .
Тогда
)()(lim),(lim
2)),((
00
ffeau ta
tt
.
Реализация линейного масштабно-пространственного
представления изображения с помощью
вейвлет-преобразования
Линейное масштабно-пространственное представление изображения с помощью
вейвлет-преобразования согласно формуле (11) реализуется в виде свертки каждой
строки, а затем каждого столбца матрицы значений интенсивности изображения с
фильтром Ne
nt ne 0 , коэффициенты которого представляют собой дискретные значения
функции Е(х,t). Для вычисления коэффициентов фильтра Ne
nt ne 0 задается параметр
масштабно-пространственного представления а(0,1). Затем определяются значения
функции 2, a для последовательности дискретных значений , например, из
интервала 3,3 с шагом 0,25. Для упрощения вычислений в качестве a,
использовалась функция sgn1
2
cos2,~ 1 aaaia , являющаяся пре-
образованием Фурье xxax a sgn),(~
. Результат вычисления интеграла для каждого
значения частоты потенцируется, а затем к полученной последовательности значений
применяется обратное дискретное преобразование Фурье. Получаем коэффициенты
фильтра Ne
nt ne 0 (рис. 1, 2).
а) б)
Рисунок 1 – Функция, производящая масштабно-пространственное
представление в пространственной (а) и частотной (б) области:
1 – гауссовская (t = 1/32), 2 – предложенная (t = 1/4)
Полякова М.В., Крылов В.Н., Гуляева Н.А.
«Искусственный интеллект» 4’2008 782
9П
а)
б)
Рисунок 2 – Масштабно-пространственное представление изображения:
линейное (а) (t = 2, 4, 8, 12, 20), линейное с помощью вейвлет-преобразования
(б) (t = 1/24, 1/12, 1/6, 1/4, 1/2)
Экспериментальные исследования и выводы
Экспериментальные исследования предложенного масштабно-пространственного
представления проведены на изображении размером 256 256 пикселей, в центре
которого – белый квадрат 64 64 на черном фоне. На это изображение накладывался
аддитивный гауссовский шум, для которого отношение сигнал/шум q определялось
по формуле 22 / hq , где h – величина контраста объекта, – стандартное
отклонение шума.
Показателем качества масштабно-пространственного представления, применяемого
для улучшения изображения, выбрана величина t
ПроF , определяемая по формуле [6]:
N
i
M
j
эт
N
i
M
j
этt
t
Про
jiIjiI
jiIjiI
F
1 1
20
1 1
2
),(),(
),(,(
,
где ),( jiI эт – результат масштабно-пространственного представления тестового
изображения; ),( jiI t – результат масштабно-пространственного представления зашум-
ленного изображения; ),(0 jiI – зашумленное изображение.
Для оценки эффективности масштабно-пространственного представления
изображения предложено использовать коэффициент уменьшения энтропии, так как
снижение уровня помех приводит к уменьшению энтропии изображения [6]:
HP
HDH ,
где Н – энтропия зашумленного изображения; )(log)(
1
2
L
i
ii xPxPH ; L – количество
значений интенсивности изображения; )( ixP – вероятность появления значения
интенсивности ix ; HP – энтропия изображения, полученного в результате масштабно-
пространственного представления.
Линейное масштабно-пространственное представление изображения...
«Штучний інтелект» 4’2008 783
9П
Получены графики зависимости значения показателей эффективности и качества
масштабно-пространственного представления изображения от отношения сигнал/шум
по мощности (рис. 3).
а) б)
Рисунок 3 – Зависимости показателей качества (а) и эффективности (б)
от отношения сигнал/шум по мощности для масштабно-пространственного
представления: линейного (1), предложенного (2), нелинейного (3)
Анализируя полученные результаты, заметим, что предложенное масштабно-
пространственное представление изображений, пораженных аддитивным гауссовским
шумом, превышает по эффективности линейное и нелинейное масштабно-пространст-
венное представление в 1,4 – 2,1 раза при значениях отношения сигнал/шум 100 и
менее по мощности.
По значениям показателя качества предложенное масштабно-пространственное
представление хуже линейного представления до 5 раз при отношении сигнал/шум
20 и менее по мощности. При значениях отношения сигнал/шум 50 и более по
мощности предложенное представление превышает по показателю качества линейное
масштабно-пространственное представление до 2,3 раза. Сравнение предложенного
масштабно-пространственного представления с нелинейным представлением показало,
что оба представления сходны по показателю качества.
По быстродействию предложенное масштабно-пространственное представление
сравнимо с линейным представлением и лучше нелинейного представления в Cn раз,
где n – количество итераций при вычислении нелинейного масштабно-пространст-
венного представления (в наших экспериментах 30 – 45), С – постоянная, которая
приблизительно равна 0,1 (рис. 4).
Рисунок 4 – Время вычисления нелинейного масштабно-пространственного
представления изображения 256 256 пикселей в зависимости от количества
итераций (вычисление предложенного масштабно-пространственного представления
заняло 0,5 – 0,6 с)
Полякова М.В., Крылов В.Н., Гуляева Н.А.
«Искусственный интеллект» 4’2008 784
9П
Таким образом предложенное линейное масштабно-пространственное представле-
ние целесообразно использовать для улучшения изображений, пораженных аддитивным
гауссовским шумом при отношении сигнал/шум 100 и менее по мощности в задачах,
где требуется высокое быстродействие и эффективность.
Литература
1. Lindeberg T. Scale-Space Theory in Computer Vision. – Boston: Kluwer Academic Publishers,
1994. – 423 p.
2. Perona P., Malik J. Scale-space and edge detection using anisotropic diffusion // IEEE Trans. Pattern
Analysis and Machine Intelligence. – 1990. – Vol. 12. – P. 629-639.
3. Полякова М.В., Крылов В.Н. Морфологический метод контурной сегментации изображений на
основе репагулярного вейвлет-преобразования // Труды Одес. политех. ун-та. – Одесса, 2006. –
Вып. 1 (25). – С. 98-103.
4. Гельфанд И.М., Шилов Г.Е. Обобщенные функции и действия над ними. Вып. 1. – М.: Физматгиз,
1959. – 470 с.
5. Вольтера В. Теория функционалов, интегральных и интегро-дифференциальных уравнений: Пер. с
англ. / Под ред. П.И. Кузнецова. – М.: Наука, 1982. – 304 с.
6. Абакумов В.Г., Крылов В.Н., Антощук С.Г. Повышение эффективности обработки образной
информации в автоматизированных системах // Электроника и связь: Темат. вып. «Проблемы
электроники». – 2005. – Ч. 1. – С. 100-105.
М.В. Полякова, В.М. Крилов, Н.А. Гуляєва
Лінійне масштабно-просторове представлення зображення за допомогою вейвлет-перетворення
Розроблено метод лінійного масштабно-просторового представлення зображення на основі інтегро-
диференційного рівняння 1-го порядку зі згорткою вейвлет-функцій у якості ядра інтегрального
оператора.
M.V. Polyakova, V.N. Krylov, N.A. Gulyayeva
Linear Scale-space of Image with Wavelet Transform Help
The method of linear scale-space of image is developed on the basis of integro-differential equation of first
order with a convolution of wavelets as the kernel of integral operator.
Статья поступила в редакцию 29.05.2008.
|