Использование клеточных технологий в системах обработки и распознавания изображений

Показано применение клеточных технологий для решения различных задач обработки и распознавания изображений, инвариантных к ориентации, масштабу и динамическим изменениям в реальном времени. На основе введенного понятия геометрического типа решаются задачи выделения информационных элементов при ра...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2008
Автор: Белан, С.Н.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/6952
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Использование клеточных технологий в системах обработки и распознавания изображений / С.Н. Белан // Штучний інтелект. — 2008. — № 3. — С. 244-253. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-6952
record_format dspace
spelling irk-123456789-69522010-03-22T12:02:30Z Использование клеточных технологий в системах обработки и распознавания изображений Белан, С.Н. Распознавание образов. Системы цифровой обработки сигналов и изображений Показано применение клеточных технологий для решения различных задач обработки и распознавания изображений, инвариантных к ориентации, масштабу и динамическим изменениям в реальном времени. На основе введенного понятия геометрического типа решаются задачи выделения информационных элементов при распознавании изображений фигур, обработке лазерных трасс и идентификации личности по рукописному тексту. Наведено використання клітинних технологій для розв’язання різноманітних задач обробки та розпізнавання зображень, інваріантних до орієнтації, масштабу і динамічних змін в реальному часі. На основі наведеного поняття геометричного типу розв’язуються задачі виділення інформаційних елементів при розпізнаванні зображень фігур, обробці лазерних трас і ідентифікації особистості за рукописним текстом. 2008 Article Использование клеточных технологий в системах обработки и распознавания изображений / С.Н. Белан // Штучний інтелект. — 2008. — № 3. — С. 244-253. — Бібліогр.: 12 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/6952 658.012:681.32 ru Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Распознавание образов. Системы цифровой обработки сигналов и изображений
Распознавание образов. Системы цифровой обработки сигналов и изображений
spellingShingle Распознавание образов. Системы цифровой обработки сигналов и изображений
Распознавание образов. Системы цифровой обработки сигналов и изображений
Белан, С.Н.
Использование клеточных технологий в системах обработки и распознавания изображений
description Показано применение клеточных технологий для решения различных задач обработки и распознавания изображений, инвариантных к ориентации, масштабу и динамическим изменениям в реальном времени. На основе введенного понятия геометрического типа решаются задачи выделения информационных элементов при распознавании изображений фигур, обработке лазерных трасс и идентификации личности по рукописному тексту.
format Article
author Белан, С.Н.
author_facet Белан, С.Н.
author_sort Белан, С.Н.
title Использование клеточных технологий в системах обработки и распознавания изображений
title_short Использование клеточных технологий в системах обработки и распознавания изображений
title_full Использование клеточных технологий в системах обработки и распознавания изображений
title_fullStr Использование клеточных технологий в системах обработки и распознавания изображений
title_full_unstemmed Использование клеточных технологий в системах обработки и распознавания изображений
title_sort использование клеточных технологий в системах обработки и распознавания изображений
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2008
topic_facet Распознавание образов. Системы цифровой обработки сигналов и изображений
url http://dspace.nbuv.gov.ua/handle/123456789/6952
citation_txt Использование клеточных технологий в системах обработки и распознавания изображений / С.Н. Белан // Штучний інтелект. — 2008. — № 3. — С. 244-253. — Бібліогр.: 12 назв. — рос.
work_keys_str_mv AT belansn ispolʹzovaniekletočnyhtehnologijvsistemahobrabotkiiraspoznavaniâizobraženij
first_indexed 2025-07-02T09:46:52Z
last_indexed 2025-07-02T09:46:52Z
_version_ 1836528029529014272
fulltext «Искусственный интеллект» 3’2008 244 4Б УДК 658.012:681.32 С.Н. Белан Государственный экономико-технологический университет транспорта, г. Киев, Украина bstepan@ukr.net Использование клеточных технологий в системах обработки и распознавания изображений Показано применение клеточных технологий для решения различных задач обработки и распознавания изображений, инвариантных к ориентации, масштабу и динамическим изменениям в реальном времени. На основе введенного понятия геометрического типа решаются задачи выделения информационных элементов при распознавании изображений фигур, обработке лазерных трасс и идентификации личности по рукописному тексту. Введение Современный этап развития общества характеризуется широким и стремительным внедрением информационных технологий во все сферы жизнедеятельности человека. В первую очередь это помогает автоматизировать многие процессы, особенно в умствен- ной деятельности. Широкое внедрение информационных технологий и широкий обхват всех отраслей породило неизмеримое множество различных методов и технических средств, которые облегчают и частично заменяют интеллектуальную деятельность человека. В нынешней науке об искусственном интеллекте его делят на «сильный» и «слабый» [1-3]. В основном все усилия нацелены на решение задач, которые относятся к функциям «слабого» интел- лекта. К ним относятся и задачи по обработке и распознаванию изображений [4], [5]. В большинстве своем они решаются программными методами, при этом мало внимания уделяется новым схемотехническим и архитектурным подходам. Одним из подходов к решению задач распознавания изображений является использование клеточных технологий [4], [6], [7]. Однако чисто программная обработка и распознавание изображений с использованием клеточных технологий накладывает целый ряд ограничений, обусловленных, в первую очередь, ограничением быстродействия и необходимостью распараллеливания многих процессов. Преимущества использования клеточных автоматов (КА) для решения описанных задач неоспоримы, и в этой области получены хорошие результаты. До настоящего времени, в большинстве своем, КА все больше использовались для задач компьютерной графики (создание изображений) и задач предварительной обработки изображений (выделение контура, закраска, удаление помех и др.), а также для описания различных динамических процессов [7-10]. Однако в целом из них не строились конретные системы, предназначенные для осуществления идентификации, распознавания, прогнозирования и других задач «слабого» искусственного интеллекта. Кроме того, в настоящее время остро стоит проблема распознавания изображений, инвариантных к ориентации, масштабу, а также изображений, динамически изменяющих свои параметры и место расположения. В этой области существуют определенные наработки [11], которые решают многие задачи по данной специфике. Использование клеточных технологий в системах обработки и распознавания... «Штучний інтелект» 3’2008 245 4Б В работе предлагается многоканальная система распознавания, реализованная на клеточных автоматах [4]. Распознавание изображений в динамике, ориентации и масштабе дает введенное понятие геометрического типа изображения, который представляет собой множество информационных элементов, связанных между собой определенными отношениями. Совокупность информационных элементов определяется в каналах системы, каждый из которых по своей специфике выделяет информационные элементы по цвету, текстуре, яркости, геометрической форме и динамике. На выходе такой системы формируется геометрический тип изображения и сравнивается с эталоном. Для каждого геометрического типа присутствует один эталон. А за счет выполнения операций сдвига и определения отношений между информационными элементами, определяется ориентация изображения, его масштабность и динамические изменения. Многоканальная клеточная система распознавания изображений Предложенная система организована на клеточных автоматах (КА), которые соста- вляют каждый параллельный канал в последовательном расположении. Каждый КА выполняет заданные ему функции по предварительной обработке массива точек изобра- жений. На выходах каналов формируются наборы информационных элементов, представ- ленных в виде векторов либо кодов, а также формируются отношения между получен- ными информационными элементами. Из полученных отношений и информационных элементов формируется последовательность числовых значений, которая определяется как геометрический тип изображения. Структура системы представлена на рис. 1. Рисунок 1 – Структурная схема многоканальной клеточной системы распознавания Система состоит из поля рецепторов – преобразователей (ПРП), в котором осу- ществляется преобразование входного изображения в изображение дискретной среды, клеточной среды предварительной подготовки (КСПП), в которой осуществляются опе- рации предварительной обработки изображения и преобразования их в необходимые оптимальные формы для еффективного определения признаков. Канал определения атрибутивных направлений передачи (КВОНП) определяет каналы и полученные формы, которые в этих каналах должны обрабатываться, блок направлений передачи (БНП) определяет каналы, в которых должна происходить обработка, блок внутренней обработки в каналах (БВОК) содержит необходимое коли- чество операционных каналов, в которых осуществляется выделение необходимых признаков, многоблоковая среда определения количественных значений атрибутов (МБСОКЗА) формирует все векторы необходимых признаков, а блок объединения атрибутов и получения смыслового описания изображения (БОАПСОИ) объединяет векторы признаков и формирует G. Структурная реализация БНП и БВОК представлена на рис. 2. ПРП КСПП КВОНП БНП БВОК МБСОКЗА БОАПСОИ F Івх Белан С.Н. «Искусственный интеллект» 3’2008 246 4Б БНП БВОК КА Рисунок 2 – Структурная реализация БНП и БВОК Модель функционирования зрительного канала имеет следующий вид //пор порп к Т ТкТ Т вх н FІ І І І∑ ∑→ → → → , Ін – изображение, записаное на носитель; І к∑ – множество изображений атрибутивних элементов, которые распределены по к каналам; І / ∑ – множество изображений после канальной обработки и неполного объединения; F – множество символов описательного алфавита изображений; Тп – операция преобразования физического изображения в изображение носителя Ін; Тк – операция разбиения Ін по к каналам; Тпор – операция последовательно- параллельно-иерархического сравнения по каждому атрибутивному каналу; / порT – операция сравнения изображений послеканального их объединения. Данный подход позволяет формировать геометрический тип G для изображений с измененной ориентацией и масштабом. Примеры таких простых изображений и некоторых информативных элементов поданы на рис. 3. Геометрический тип G – это наиболее информационные элементы множества I, которые находятся в постоянном соседстве при любых афинных преобразованиях. Таким образом для представления G используются те клетки изображения, которые формируют оптимальный базис. С этой точки зрения G определяется как множество кортежей клеток КА второго порядка, сумма клеток окрестностей которых отличается от суммы клеток окрестностей соседних клеток. Геометрический тип изображения отдельной замкнутой фигуры в поле U определяется следующей моделью. ( ) ( ) ( ){ }i,jfwI,IG aa ww == +1 . где w – количество клеток множества или ее длина. Использование клеточных технологий в системах обработки и распознавания... «Штучний інтелект» 3’2008 247 4Б Рисунок 3 – Примеры изображений с одинаковым G, Iвх, Ie Для поля с множеством объектов G определяется как ( ) ( ) ( ) ( ) ( ) ( )       +++= aaaaaa ss w,Iw;........;w,Iw;w,IwG ss 111 2211 2211 . Общий цикл и пример формирования G представлен на рис. 4 и 5. Рисунок 4 – Общий вид формирования G по каналам Івх Іе Івх Іе Івх Іе а) б) в) анализ Клетка информативна, если в ее окрестности нет ни одной клетки с тем же результатом анализа окрестности Информативные клетки по геометрии 1 3 5 7 9 с т 1 ( t 0 ) с т 2 ( t 0 ) с т 3 ( t 0 ) с т 4 ( t 0 ) с т 5 ( t 0 ) с т 6 ( t 0 ) с т 7 ( t 0 ) с т 1(t+ 1) с т 6(t+ 1) Р1 Р2 Р3 Р4 Р5 Р6 Р7 Р8 Р9 Р 10 Р11 Р12 Р13 Р14 Р ( t+1 ) т 3 ( t+1) с т 5 ( t+1 ) с т 7( t+1 ) Р1 Р2 Р3 Р4 Р5 Р6 Р7 Р8 Р9 Р10 Р11 Р12 Р13 Р14 Р15 Р16 Р17 Р18 Р19 Р20 0 5 10 15 20 25 3 3 1 ( t+ 1 ) с т 3 ( t+ 1 ) с т 5 ( t+ 1 ) с т 7 ( t+ 1 ) Р 1 Р 2 Р 3 Р 4 Р 5 Р 6 Р 7 Р 8 Р 9 Р 1 0 Р 1 1 Р 1 2 Р 1 3 Р 1 4 Информационные клетки по яркости Информационные центры 1-го канала Информационные центры 2-го канала Информационные центры n-го канала Множество отношений между информационными центрами 1-го канала Множество отношений между информационными центрами 2-го канала Множество отношений между информационными центрами n-го канала G Белан С.Н. «Искусственный интеллект» 3’2008 248 4Б Рисунок 5 – Пример определения геометрических отношений и наиболее информативных элементов Компьютерное моделирование клеточной обработки изображений при выделении информационных элементов При создании геометрического типа одними из наиболее информативных элементов изображения являются точки излома его контура, которые являются вершинами многоугольника, описывающего внешние границы фигуры. Количество вершин характеризует один из главных признаков G-фигуры, который дает возможность перенести ее к соответствующему классу для более точной идентификации. Известны различные методы [12] определения вершин, которые основаны на клеточной обработке изображений. Более оптимальным методом определения вершин является метод, основанный на последовательном отслеживании контура сигналом возбуждения, который перио- дически распространяется по нему. Однако в клеточной среде присутствует алиайзинг, для учета которого предложено метод, базирующийся на анализе клеток окрест- ности, которые расположены в заданном радиусе (рис. 6). Рисунок 6 – Пример определения вершин многоугольника Данный метод реализован программно в виде алгоритма, который предназначен для распознавания контурных фигур, представленных в виде бинарной матрицы. Алгоритм допускает присутствие шума в виде размытия изображения и разрывов линии контура. Фигуры могут быть не замкнуты, но тогда вероятность правильного распознавания уменьшается. Допускается пересечение и объединение линий фигуры. A B C D a b A’ B’ C’ D’ a’ b’ A’’ B’’ C’’ D’’ a’’ b’’ a/b = a’/b’ a/b = a’’/b’’ a = a’’ b = b’’ Масштабные изменения Изменения ориентации С r А В Использование клеточных технологий в системах обработки и распознавания... «Штучний інтелект» 3’2008 249 4Б У исходного изображения фигуры определяется начальная вершина, около которой вращается определенный сектор круга с выбранным радиусом. Когда сектор совмещается с точками стороны, определяется их большее количество. Проводится прямая линия до края стороны. В данной точке происходит процедура поворота сектора круга и определя- ется следующая сторона. В дальнейшем процедура определения вершин повторяется. Примеры работы программы, которая реализует данный алгоритм для фигур разной формы с возможными помехами, представлены на рис. 7. Рисунок 7 – Примеры определения вершин для данного алгоритма При моделировании данного алгоритма получены зависимости количества вершин фигуры от угла поворота, которые определялись количеством ложных результатов для произвольных десяти фигур при заданном угле поворота и ширине линии (рис. 8). Рисунок 8 – Анализ ложных результатов при распознавании фигур при повороте их и заданной ширине сканирующей линии При таком подходе имеется возможность определения оптимальной ширины линии сканирования для устранения алиайзинга. Длина Пересечение Лишние линии Лишние замкнутые контуры Ана л із х ибних ре зул ьта тів 0 0 ,5 1 1 ,5 2 2 ,5 3 3 ,5 4 4 ,5 1 2 3 4 5 6 7 8 кут повороту кі ль кі ст ь по м ил ок ширина л ін ії 1 ширина л ін ії 2 ширина л ін ії 3 ширина л ін ії 4 ширина л ін ії 5 Анализ ложных результатов К ол ич ес тв о ош иб ок Угол поворота Ширина линии 1 Ширина линии 2 Ширина линии 3 Ширина линии 4 Ширина линии 5 Белан С.Н. «Искусственный интеллект» 3’2008 250 4Б Реализация алгоритмов клеточной обработки на примерах обработки лазерных трасс Решение поставленной задачи дает возможность применить клеточные технологии для обработки и распознавания изображений в реальном времени с учетом динамических изменений в различных геометрических формах и энергетических параметрах. Под воздействием атмосферы происходит изменение структуры профиля лазерного луча. Искажение формы лазерного луча не дает возможности точного определения центра изображения, что заставляет применять специализированные алгоритмы для решения данной задачи. Для решения поставленной задачи был использован клеточный подход, который требует представления изображений каждого кадра набором клеток с разными яркостями. Метод реализован программой, которая дает возможность определить центр с точностью до одного пикселя, причем программа, на основе полученных данных, дает возможность спрогнозировать центр следующего кадра изображения. Результаты работы программы при определении центра и прогнози- ровании представлены на рис. 9. Рисунок 9 – Результаты работы программы при определении центра лазерного пучка и его прогнозировании Результаты работы программы показали, что центр изображения профиля лазерного луча определяется и прогнозируется с точностью до одного пикселя. Использование клеточных технологий для идентификации человека по личной подписи Клеточные подходы дают возможность реализации методов при идентификации личности по почерку. При этом, учитывая понятие геометрического типа, существует возможность идентификации при изменениях в ориентации и масштабе. Идентифика- ция осуществляется по определении динамики формирования траектории символа в клеточной среде. Рассмотрим процесс идентификации траектории символов в графической идентификации и попробуем идентифицировать символы с масштабными изменениями. Для этого построим графики для двух символов, одинаковых по геометрическому типу и разных в масштабе (рис. 10а, б). Использование клеточных технологий в системах обработки и распознавания... «Штучний інтелект» 3’2008 251 4Б Доказательство того, что графики (рис. 10а, б) отображают один и тот же процесс, проведем на основе принципа взаимооднозначного соответствия теории множеств с помощью графической интерполяции. Перенесем точки из рис. 10а на рис. 10в, растянув их по оси абсцисс. Рисунок 10 – Графики символов, одинаковых по геометрическому типу Установим взаимооднозначное соответствие между точками рис. 10в и рис. 10б с помощью вертикальных линий (обычный перебор и сравнение). На рис. 10в необходимо восстановить промежуточные точки и сравнить их с промежуточными точками рис. 10б. Процедуру воссоздания реализуем с помощью графической интерполяции, используя формулу Лагранжа для 4-х точек. Главная идея такова: на каждом участке между 2-мя соседними опорными точками истинная кривая заменяется некоторой кривой с учетом 3-й степени, которая имеет с истиной кривой еще по одной общей точке из каждой стороны от участка, который рассматривается. По формуле Лагранжа для кривой 3-й степени, которая проходит через 4 данные точки, будем иметь (приняв Х = 0) ( )yyyyY 12340 9916 1 −++−= . в) с и м в о л 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 т а к т ы на пр ав ле ни я Р я д 1 а б с а) символ 0 2 4 6 8 10 1 2 3 4 5 6 7 8 9 10 11 12 такты на пр ав ле ни я Ряд1 б) символ 0 2 4 6 8 10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 такты на пр ав ле ни я Ряд1 Белан С.Н. «Искусственный интеллект» 3’2008 252 4Б Найдем промежуточные точки и отметим на рис. 10в, начиная с участка – 2 – 3, поскольку на краях не хватает одной точки. Y2-3 = 6,437; Y3-4 = 5,937; Y4-5 = 6,062; Y5-6 = 5,562; Y6-7 = 4,5; Y7-8 = 3,5; Y8-9 = 2,437; Y9-10 = 1,937; Y10-11 = 2,062. Точки возможно найти для всех промежуточных отрезков, кроме крайних. Для крайних участков нет дальнейших точек и поэтому новую точку слева Y1-2 возможно найти, используя обычную параболичную зависимость, для которой нужны 3 точки (точки а, б, с для расчетов, воспроизводя большую черную точку). Справа крайняя точка воспроизводится по правилу экстраполяции (продолжается ордината на один шаг). Сравнение воспроизведенных ординат Y2-3, Y3-4 ,…, Y10-11 на рис. 10в с ана- логичными точками рис. 10б говорит об их совпадении с небольшими отклонениями. Наибольшую погрешность вносят крайние точки, которые являются обычными для графической интерполяции. Установив взаимооднозначное соответствие между дискретным множеством точек рис. 10в и рис. 10б можно говорить о таком же соответствии между рис. 10б и рис. 10а, что и необходимо было доказать. Программная реализация данного подхода на примере символов С и О представлена на рис. 11. Рисунок 11 – Результаты работы программы, реализующей предложенные методы Реализация данных методов на основе клеточных технологий позволила сократить количество входных изображений при обучении. При количестве обучающих эталонов меньше 100 точность увеличивается на 50 % по сравнению с известными методами. Использование клеточных технологий в системах обработки и распознавания... «Штучний інтелект» 3’2008 253 4Б Выводы В работе показано применение клеточных технологий для решения различных задач, при решении которых осуществляется обработка и распознавание изображений, инвариантных к повороту, масштабу и динамическим изменениям в реальном времени. Это расширяет возможности системы распознавания для решения множества задач распознавания, прогнозирования и идентификации. Литература 1. Джонс М.Т. Программирование искусственного интеллекта в приложениях / М. Тим Джонс: Пер. с англ. Осипов А.И. – М.: ДМК Пресс, 2006 – 312 с. 2. Рабинович З.Л. О концепции машинного интеллекта и ее развитии // Кибернетика и системный анализ. – 1995. – № 2. – С. 163-173. 3. Рабинович З.Л., Воронков Г.С. Представление и обработка знаний во взаимодействии сенсорной и языковой нейросистем человека // Кибернетика и системный анализ. – 1998. – № 2. – С. 3-11. 4. Паралельно-ієрархічне перетворення і Q-обробка інформації для систем реального часу: Монографія / М.О. Ковель, Л.І. Тимченко, Ю.Ф. Кутаєв, С.В. Свєчніков, В.П. Кожем’яко, О.І. Стасюк, С.М. Білан, Л.В. Загоруйко. – Київ: КУЕТТ, 2006 – 492 с. 5. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. – М.: Машиностроение, 1990 – 320 с. 6. Пульсирующие информационные решетки / В.И. Шмойлов, А.И. Адамацкий, М.Н. Кузьо, Б.П. Русын. – Л.: Меркатор – 2004. – 301 с. 7. Білан С.М. Клітинні аперіодичні нейроавтомати для ефективного розпізнавання зображень // Оптико- електронні інформаційно енергетичні технології. – 2005. – № 1 (9). – С. 44-55. 8. Пайтчен Х.О., Рихтер П.Х. Красота фракталов. Образы комплексных динамических систем. – М.: Мир. – 1993. – 176 с. 9. Вирт Н. Алгоритмы и структуры данных. – М.: Мир, 2000. – 360 с. 10. Пригожин И., Ситенгерс И. Порядок из хаоса. Новый диалог человека с природой. – М.: Эдито- риал УРСС, 2000. – 406 с. 11. Hu M.K. Visual pattern recognition by momrnt invariants ||IRE Trans. On pattern signal in feature spaces // Electronic and Communication in Japan. – 1966. – Vol. 49, № 7 – P. 104-113. 12. Кожемяко В.П., Белан С.Н., Ал-Зоуби Салим. Модели алгоитмов выделения вершин изображения плоской фигуры и определение расстояний между ними в системах распознавания // Оптоелектронні інформаційно-енергетичні технології. – 2001. – № 2. – С. 39-44. С.М. Білан Використання клітинних технологій в системах обробки і розпізнавання зображень Наведено використання клітинних технологій для розв’язання різноманітних задач обробки та розпізнавання зображень, інваріантних до орієнтації, масштабу і динамічних змін в реальному часі. На основі наведеного поняття геометричного типу розв’язуються задачі виділення інформаційних елементів при розпізнаванні зображень фігур, обробці лазерних трас і ідентифікації особистості за рукописним текстом. Статья поступила в редакцию 10.07.2008.