Алгоритм распознавания, основанный на нечетком подходе

Рассматривается задача распознавания образов при условии линейной неразделимости классов на примере тестовой задачи, связанной с классификацией образцов топлива. Предложен алгоритм решения задачи, основанный на нечетком подходе. Описан подход к построению терм-множеств, основанный на анализе част...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2008
Автори: Козловский, В.А., Максимова, А.Ю.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/7580
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Алгоритм распознавания, основанный на нечетком подходе / В.А. Козловский, А.Ю. Максимова // Штучний інтелект. — 2008. — № 4. — С. 594-599. — Бібліогр.: 10 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-7580
record_format dspace
spelling irk-123456789-75802010-04-06T12:01:14Z Алгоритм распознавания, основанный на нечетком подходе Козловский, В.А. Максимова, А.Ю. Нейросетевые и нечеткие системы Рассматривается задача распознавания образов при условии линейной неразделимости классов на примере тестовой задачи, связанной с классификацией образцов топлива. Предложен алгоритм решения задачи, основанный на нечетком подходе. Описан подход к построению терм-множеств, основанный на анализе частоты встречаемости значений. Приведена оценка результатов работы алгоритма для тестовой задачи. Розглядається задача розпізнавання образів за умови лінійної нероздільності класів на прикладі тестової задачі, пов’язаної з класифікацією зразків палива. Запропоновано алгоритм рішення задачі, заснований на нечіткому підході. Описано підхід до побудови терм-множин, заснований на аналізі частоти зустріваності значень. Наведена оцінка результатів роботи алгоритму для тестової задачі. 2008 Article Алгоритм распознавания, основанный на нечетком подходе / В.А. Козловский, А.Ю. Максимова // Штучний інтелект. — 2008. — № 4. — С. 594-599. — Бібліогр.: 10 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/7580 519.711 ru Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Нейросетевые и нечеткие системы
Нейросетевые и нечеткие системы
spellingShingle Нейросетевые и нечеткие системы
Нейросетевые и нечеткие системы
Козловский, В.А.
Максимова, А.Ю.
Алгоритм распознавания, основанный на нечетком подходе
description Рассматривается задача распознавания образов при условии линейной неразделимости классов на примере тестовой задачи, связанной с классификацией образцов топлива. Предложен алгоритм решения задачи, основанный на нечетком подходе. Описан подход к построению терм-множеств, основанный на анализе частоты встречаемости значений. Приведена оценка результатов работы алгоритма для тестовой задачи.
format Article
author Козловский, В.А.
Максимова, А.Ю.
author_facet Козловский, В.А.
Максимова, А.Ю.
author_sort Козловский, В.А.
title Алгоритм распознавания, основанный на нечетком подходе
title_short Алгоритм распознавания, основанный на нечетком подходе
title_full Алгоритм распознавания, основанный на нечетком подходе
title_fullStr Алгоритм распознавания, основанный на нечетком подходе
title_full_unstemmed Алгоритм распознавания, основанный на нечетком подходе
title_sort алгоритм распознавания, основанный на нечетком подходе
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2008
topic_facet Нейросетевые и нечеткие системы
url http://dspace.nbuv.gov.ua/handle/123456789/7580
citation_txt Алгоритм распознавания, основанный на нечетком подходе / В.А. Козловский, А.Ю. Максимова // Штучний інтелект. — 2008. — № 4. — С. 594-599. — Бібліогр.: 10 назв. — рос.
work_keys_str_mv AT kozlovskijva algoritmraspoznavaniâosnovannyjnanečetkompodhode
AT maksimovaaû algoritmraspoznavaniâosnovannyjnanečetkompodhode
first_indexed 2025-07-02T10:24:18Z
last_indexed 2025-07-02T10:24:18Z
_version_ 1836530384086499328
fulltext «Искусственный интеллект» 4’2008 594 7К УДК 519.711 В.А. Козловский, А.Ю. Максимова ИПММ НАН Украины, г. Донецк, Украина lunaplus@iamm.ac.donetsk.ua, kozlovskii@iamm.ac.donetsk.ua Алгоритм распознавания, основанный на нечетком подходе Рассматривается задача распознавания образов при условии линейной неразделимости классов на примере тестовой задачи, связанной с классификацией образцов топлива. Предложен алгоритм решения задачи, основанный на нечетком подходе. Описан подход к построению терм-множеств, основанный на анализе частоты встречаемости значений. Приведена оценка результатов работы алгоритма для тестовой задачи. Задачи распознавания образов в различных своих аспектах в настоящее время встречаются практически во всех сферах человеческой деятельности. Часто такие задачи возникают при создании систем поддержки принятия решений, позволяющих усо- вершенствовать и ускорить работу эксперта. Природа исходных данных в некоторых задачах допускает ситуацию, когда образ может принадлежать к нескольким классам по своим физическим параметрам, т.е. множества значений классов пересекаются, и отсутствует практическая их разделимость (даже при наличии генеральной выборки обучающего множества). На практике же такую неразделимость усугубляют неполные обучающие выборки. Задачи такого типа рассматриваются в статье. В них нечеткость присутствует по своей природе и априорная вероятность принадлежности образа определенному классу отсутствует, а есть предва- рительная выборка, обработка которой приводит к нечетким моделям образов. Нечеткие модели в теории распознавания становятся в последние годы одним из традиционных направлений. В частности, в некоторых задачах распознавания исполь- зуются нечеткие модели и нечеткий вывод [1]. В работах профессора Ротштейна и его учеников [2], [3] говорится об идентификации нелинейных объектов нечеткими базами знаний и использовании нечетких моделей в задачах распознавания. Интересным явля- ется использование нечетких чисел на выходе алгоритма (исключается этап дефаззи- фикации). Авторами были изучены существующие алгоритмы распознавания образов, и для задач описанной выше специфики был предложен свой алгоритм, который иллю- стрируется на примере задачи классификации образца топлива. В работе описан естес- твенный вариант модели, состоящий из набора нечетких множеств, соответствующих каждому классу образов. Целью работы является рассмотрение задачи распознавания при наличии разно- родных признаков с учетом нечеткости, связанной с измерением соответствующих параметров и оценкой принадлежности получаемых значений образам, принадлежащим различным классам. Постановка задачи и подходы к ее решению Рассматривается задача распознавания в традиционной постановке. Под образом понимаем n-мерный вектор n n Rxxx  ),...,( 1 . Задано множество классов образов {vi}V  , i = 1,…,p и обучающая выборка M как множество пар },...,1,,|,{( )()()()( miVvRxvxM iniii  . Алгоритм распознавания, основанный на нечетком подходе «Штучний інтелект» 4’2008 595 7К Рассматривается традиционная задача построения на основе обучающей выборки решаю- щего правила, которое позволило бы по предъявленному образу nRx  указать класс Vv . При этом возможна неопределенность указания класса, степень которой необходимо оценить. Соответствующую оценку предполагается давать на основе методов нечеткой логики. В данной работе задача распознавания образов рассматривается на примере следующей практической задачи. Существует множество видов топлива, которые производят на различных заво- дах. При получении образца топлива в лаборатории необходимо быстро определить его марку и производителя. Таким образом, формируется совокупность классов образов. Информация о каждом образце формально представлена набором показа- телей, измеренных различными приборами, определяющими состав предъявленного образца, т.е. формируются образы в виде векторов, компонентами которых высту- пают значения измеряемых показателей. Результаты измерений, проведенных в раз- личные моменты времени и для различных образцов, являются исходной информацией для обучающей выборки. Существует множество подходов к решению задачи распознавания образов от традиционных методов распознавания до систем нечеткого вывода [4-7]. Каждый из существующих методов зарекомендовал себя в рамках решения определенных содержательных задач. Отметим следующие особенности рассматри- ваемой задачи. В рассматриваемом случае существенными аргументами для выбора нечеткого подхода являются следующие: во-первых, данные обладают содержательной неточ- ностью. Например, для тестовой задачи, различные образцы по набору показателей могут иметь близкие значения для различных производителей, что в ряде случаев не позволяет однозначно определить производителя. Во-вторых, стоимость некоторых измерений весьма высока, и не всегда возможно получить весь набор необходимых параметров для каждого образца, что при работе с обучающей выборкой не всегда дает возможность однозначного разбиения на классы, а при распознавании ведет к неоднозначности. Кроме того, возможна динамика изменения показателей по каж- дому производителю во времени. И, наконец, для пользователя (эксперта) важным является содержательное обоснование полученной классификации и возможность оценить степень соответствия образа каждому из зафиксированных классов. Авторам представляется, что учет указанных особенностей достаточно адекватно может быть осуществлен на основе использования понятий и методов нечеткой логики и нечет- ких множеств. Сформулируем основные моменты предлагаемого подхода. 1. Вначале осуществляется построение моделей классов образов («портреты» класса). Для каждого класса такой «портрет» есть совокупность функций, взаимно- однозначно соответствующих отдельным показателям и описывающих степень уверенности в соответствии значения показателя выбранному классу образов. Эта совокупность функций строится по элементам выборки, принадлежащим опреде- ленному классу. Первичной характеристикой интегральной уверенности в принадлежности анали- зируемого образа класса является сумма соответствующих функций. Отметим, что при формировании указанных функций осуществляется пред- варительная обработка данных с целью уменьшения их зашумленности. Козловский В.А., Максимова А.Ю. «Искусственный интеллект» 4’2008 596 7К 2. На основе моделей классов и первичных характеристик интегральной увереннос- ти вычисляются степени уверенности принадлежности предъявленного образа заданным классам. При рассмотрении задачи исходим из того, что множество информативных признаков выбрано с помощью эксперта, поэтому подзадача их выделения не рас- сматривается. Создание моделей классов Основная идея подхода состоит в следующем. Для каждого класса образов формируется совокупность проекций нечетких «портретов». Каждая такая инте- гральная проекция образуется на основании измеряемой информативной характеристики элементов выборки, входящих в данный класс. Первичная обработка данных необходима для удаления из обучающей выборки заведомо неточных ошибочных данных – выбросов, которыми в практической дея- тельности оказываются «засорены» экспериментальные данные. Для рассматри- ваемого типа задачи встречаются выбросы двух типов. Источник выбросов первого типа – человеческий фактор, приводящий к занесению заведомо некорректных значений в сводный журнал. Второй тип выбросов связан с технологической зашумленностью образцов, например, в ситуации, когда измерялись данные образца с примесями. Опре- делить выбросы в такой ситуации можно с помощью эксперта либо на основании статистических методов поиска выбросов [8]. В исходной задаче каждая компонента вектора nRx определяет значение одного из n информативных признаков для данного образца. В соответствии с выделенными информативными признаками для каждого из них строится лингвистическая переменная L [9] на универсальном множестве из множества допустимых значений данного признака. Каждый терм  этой лингви- стической переменной является нечеткой характеристикой данного признака для опре- деленного класса образов. Подзадача построения функций принадлежности терм – множеств лингвисти- ческой переменной может быть решена несколькими методами. Функция принадлеж- ности может носить субъективный характер или интерпретироваться на основе понятия вероятности [10]. В данной задаче функции принадлежности каждого терма строятся по алгоритму, в основу которого положена частотная характеристика встречаемости значений приз- нака в обучающей выборке для данного класса образов. Алгоритм формирования функций принадлежности Как уже говорилось выше, в основу построения функции принадлежности положена частотная характеристика встречаемости значений признака. Универсальным множест- вом каждой лингвистической переменной является объединение носителей нечетких множеств термов – множество всех допустимых значений признака. На этапе построения отсеиваются резко выделяющиеся значения – выбросы. Значением функции принадлежности ]1,0[)( iij x является степень уверенности, с которой образец x со значением i-ой компоненты, равным ix , соответствует j-ому клас- су образов. Алгоритм распознавания, основанный на нечетком подходе «Штучний інтелект» 4’2008 597 7К Таблица 1 – Оценка степеней уверенности соответствия предложенного образа Функции строятся методом скользящего окна. Размер скользящего окна подби- рается экспериментально. На рис. 1 приведен пример терм-множества лингвистической переменной при- знака «Суммарная ароматика» для ситуации, когда количество классов образов n = 6. Рисунок 1 – Терм-множество лингвистической переменной «Суммарная ароматика» Из рисунка видно, что функции принадлежности термов часто очень близки или пересекаются, что не дает возможности сделать вывод по данным только одного признака, поэтому необходима интегральная оценка по совокупности признаков. Вывод о принадлежности образа классу Чтобы получить значение степени уверенности соответствия предложенного образа каждому из классов образов iv , строится таблица W оценки степени уве- ренности. },..1),)(,,...,,...,,{( 21 pjwwwwwW jnjijjj   , )( iijij xw  ,    n i jij ww 1 ,)( , где )(xij – функция принадлежности j-ого терма i-ой лингвистической переменной, )(w – интегральная уверенность, a ix – i-ая компонента распознаваемого образа x . W Признак 1L Признак 2L … Признак nL   n i iL 1 Класс 1v 11w 21w 1iw 1nw )( 1w Класс 2v 12w 22w 2iw 2nw )( 2w … jw1 jw2 ijw njw )( jw Класс pv pw1 pw2 ipw npw )( pw Козловский В.А., Максимова А.Ю. «Искусственный интеллект» 4’2008 598 7К Ранжируем таблицу по последнему столбцу интегральных уверенностей и получаем класс lv , для которого )(w максимально. Он и определяется как наиболее соответствующий предложенному образу x . Эксперт по таблице W определяет класс образов, которому наиболее соответ- ствует распознаваемый образец. В некоторых ситуациях оказывается, что с не намного меньшей степенью уверенности алгоритм относит этот образец и к другим классам образов. Такая ситуация объясняется излагавшимися выше факторами: классы не всегда линейно разделимы. Процент правильных ответов зависит от полноты обу- чающей выборки и количества используемых для распознавания информативных признаков. Тестовый пример Для тестовой задачи о распознавании марки и типа топлива был проведен ряд экспериментов. Была написана программа, работающая с базой данных и реализую- щая описанный алгоритм. Тестирование проводилось на обучающей выборке, состоящей из двух с поло- виной тысяч образцов, соответствующих 7 классам образов. В 91,5 % случаев пред- ложенный образ был распознан правильно. В 8,8 % случаев правильный класс образов оказывался в ранжированной таблице rW на 2 или 3 позиции. При тестировании программы был использован неполный набор инфор- мативных признаков (в базу не попала информация по некоторым характеристикам, что, по мнению авторов, стало причиной уменьшения количества точных решений). Анализ показал, что правильный результат в 99 % случаев попадает в первую тройку. Дообучение алгоритма Использованный способ принятия решения по максимуму интегральной характеристики можно понимать как построение разделяющей функции   i i l ii k i kl ikl xxxd ))()(()( )()()(  , отличающей образы k-ого класса от образов l-того класса при 1)( kl j : если значения всех функций 0)( xd kl при фиксированном k, то x относится к k-ому классу. Можно осуществить дообучение соответствующего алгоритма, подобрав соответствующим образом коэффициенты )(kl j . Для этого можно использовать, например, алгоритм обучения персептрона при условии линейной разделимости модифицированных образов. Для обучения по этому алгоритму выборка разбивается на обучающую и контрольную. На контрольной выборке тестируется полученный алгоритм. Заключение Предложенный подход и реализованный на его основе алгоритм показали приемлемое качество результатов даже в варианте отсутствия прямого обучения. Качество распознавания может быть улучшено за счет указанного варианта до- обучения, хотя это и усложняет алгоритм. Нелинейность строящихся функций принад- Алгоритм распознавания, основанный на нечетком подходе «Штучний інтелект» 4’2008 599 7К лежности в общем случае усиливает различающую способность алгоритма. Допол- нительно нечеткость измеряемых значений показателей может быть учтена при интерпретации их как нечетких чисел. Это позволит повысить качество принятия решения при классификации в случаях достаточно высокой степени неопреде- ленности. Литература 1. Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. – СПб.: БХВ-Петер- бург, 2003. – 736 с. 2. Ротштейн А.П., Кательников Д.И. Идентификация нелинейных объектов нечеткими базами знаний // Кибернетика и системный анализ. – 1998. – № 5. 3. Штовба С.Д. Настройка нечеткой модели по обучающей выборке с нечетким выходом // Киберне- тика и системный анализ. – 2007. – № 3. 4. Ту Дж., Гонсалес Р. Принципы распознавания образов: Пер. с англ. – М.: Мир, 1978. – 415 с. 5. Хант Э. Искусственный интеллект: Пер. с англ. – М.: Мир, 1978. – 558 с. 6. Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального анализа. – Новосибирск: Наука, 1986. 7. Гайдышев И.П. Решение научных и инженерных задач средствами Excel, VBA и С.С++. – СПб.: БХВ-Петербург, 2004. – 512 с. 8. Румшинский Л.З. Математическая обработка результатов эксперимента. – М.: Наука, 1971. – 192 с. 9. Zadeh L.A. Fuzzy sets // Information and Control. – 1965. – Vol. 8. – Р. 338-353. 10. Кофман А. Введение в теорию нечетких множеств: Пер. с франц. – М.: Радио и связь, 1982. – 432 с. В.А. Козловський, О.Ю. Максимова Алгоритм розпізнавання, заснований на нечіткому підході Розглядається задача розпізнавання образів за умови лінійної нероздільності класів на прикладі тестової задачі, пов’язаної з класифікацією зразків палива. Запропоновано алгоритм рішення задачі, заснований на нечіткому підході. Описано підхід до побудови терм-множин, заснований на аналізі частоти зустріваності значень. Наведена оцінка результатів роботи алгоритму для тестової задачі. Статья поступила в редакцию 29.07.2008.