Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек

Розглянуто метод нечітких зв'язаних точок (Fuzzy Joint Points - FJP), в якому нечіткість кластеризації полягає в детальності врахування властивостей елементів під час формування множин схожих елементів. На підставі цього підходу запропоновано новий перешкодостійкий варіант алгоритму FJP. Дослід...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2008
Автор: Насибов, Э.Н.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2008
Назва видання:Кибернетика и системный анализ
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/71930
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек / Э.Н. Насибов // Кибернетика и системный анализ. — 2008. — № 1. — С. 10-22. — Бібліогр.: 14 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-71930
record_format dspace
spelling irk-123456789-719302014-12-15T03:01:41Z Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек Насибов, Э.Н. Кибернетика Розглянуто метод нечітких зв'язаних точок (Fuzzy Joint Points - FJP), в якому нечіткість кластеризації полягає в детальності врахування властивостей елементів під час формування множин схожих елементів. На підставі цього підходу запропоновано новий перешкодостійкий варіант алгоритму FJP. Досліджено властивості алгоритму FJP і доведено достатню умову для коректного розпізнавання прихованої структури класів, що є в наявності. 2008 Article Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек / Э.Н. Насибов // Кибернетика и системный анализ. — 2008. — № 1. — С. 10-22. — Бібліогр.: 14 назв. — рос. http://dspace.nbuv.gov.ua/handle/123456789/71930 519.8 ru Кибернетика и системный анализ Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Кибернетика
Кибернетика
spellingShingle Кибернетика
Кибернетика
Насибов, Э.Н.
Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
Кибернетика и системный анализ
description Розглянуто метод нечітких зв'язаних точок (Fuzzy Joint Points - FJP), в якому нечіткість кластеризації полягає в детальності врахування властивостей елементів під час формування множин схожих елементів. На підставі цього підходу запропоновано новий перешкодостійкий варіант алгоритму FJP. Досліджено властивості алгоритму FJP і доведено достатню умову для коректного розпізнавання прихованої структури класів, що є в наявності.
format Article
author Насибов, Э.Н.
author_facet Насибов, Э.Н.
author_sort Насибов, Э.Н.
title Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
title_short Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
title_full Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
title_fullStr Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
title_full_unstemmed Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
title_sort помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2008
topic_facet Кибернетика
url http://dspace.nbuv.gov.ua/handle/123456789/71930
citation_txt Помехоустойчивый алгоритм решения проблемы нечеткой кластеризации на базе метода нечетких связанных точек / Э.Н. Насибов // Кибернетика и системный анализ. — 2008. — № 1. — С. 10-22. — Бібліогр.: 14 назв. — рос.
series Кибернетика и системный анализ
work_keys_str_mv AT nasibovén pomehoustojčivyjalgoritmrešeniâproblemynečetkojklasterizaciinabazemetodanečetkihsvâzannyhtoček
first_indexed 2025-07-05T20:49:50Z
last_indexed 2025-07-05T20:49:50Z
_version_ 1836841530724188160
fulltext ÓÄÊ 519.8 Ý.Í. ÍÀÑÈÁΠÏÎÌÅÕÎÓÑÒÎÉ×ÈÂÛÉ ÀËÃÎÐÈÒÌ ÐÅØÅÍÈß ÏÐÎÁËÅÌÛ ÍÅ×ÅÒÊÎÉ ÊËÀÑÒÅÐÈÇÀÖÈÈ ÍÀ ÁÀÇÅ ÌÅÒÎÄÀ ÍÅ×ÅÒÊÈÕ ÑÂßÇÀÍÍÛÕ ÒÎ×ÅÊ Êëþ÷åâûå ñëîâà: êëàñòåðèçàöèÿ, íå÷åòêèå ñâÿçàííûå òî÷êè (FJP), íå÷åòêîå ñâÿçàííîå ìíîæåñòâî, ïîìåõîóñòîé÷èâîñòü. ÂÂÅÄÅÍÈÅ Çàäà÷à êëàñòåðèçàöèè ÿâëÿåòñÿ îäíîé èç îñíîâíûõ çàäà÷, èñïîëüçóåìûõ â ñîâðåìåííîé òåõíîëîãèè èíòåëëåêòóàëüíîé îáðàáîòêè äàííûõ ñ ïðèìåíåíèåì êîìïüþòåðîâ [1, 2]. Îáùàÿ ôèëîñîôèÿ êëàñòåðèçàöèè áàçèðóåòñÿ íà ðàçáèåíèè èñõîäíîãî ìàññèâà äàííûõ íà ãîìîãåííûå (ñõîæèå) êëàññû îòíîñèòåëüíî áëèçîñòè ñâîéñòâ. Ïðè ýòîì ýëåìåíòû â îäíîì êëàññå ÿâëÿþòñÿ ìàêñèìàëüíî áëèçêèìè, à ýëåìåíòû â ðàçëè÷íûõ êëàññàõ ÿâëÿþòñÿ ìàêñèìàëüíî äàëåêèìè ïî îòíîøåíèþ îäèí ê äðóãîìó.  êëàññè÷åñêîé çàäà÷å êëàñòåðèçàöèè ãðàíèöû êëàññîâ ÿâëÿþòñÿ ÷åòêèìè è ëþáîé ýëåìåíò ìîæåò ïðèíàäëåæàòü òîëüêî îäíîìó èç èìåþùèõñÿ êëàññîâ. Îäíàêî íà ïðàêòèêå ãðàíèöû ìåæäó êëàññàìè, êàê ïðàâèëî, íå ìîãóò áûòü îïðåäåëåíû ÷åòêî è íåêîòîðûå ýëåìåíòû ìîãóò îäíîâðåìåííî ïðèíàäëåæàòü ðàçëè÷íûì êëàññàì ñ îòëè÷íûìè îò íóëÿ ñòåïåíÿìè ïðèíàäëåæíîñòåé.  òàêèõ ñëó÷àÿõ àäåêâàòíîñòü çàäà÷è êëàñòåðèçàöèè, ïîäîáíî çàäà÷å èäåíòèôèêàöèè [3–5], ìîæåò áûòü ïîâûøåíà ñ ïðèìåíåíèåì òåîðèè íå÷åòêèõ ìíîæåñòâ [2].  íà- ñòîÿùåé ñòàòüå ðàññìàòðèâàåòñÿ äðóãàÿ êîíöåïöèÿ çàäà÷è êëàñòåðèçàöèè — ñ èñ- ïîëüçîâàíèåì òàê íàçûâàåìîãî ìåòîäà íå÷åòêèõ ñâÿçàííûõ òî÷åê (Fuzzy Joint Points — FJP) [6]. Îñíîâíîå îòëè÷èå òàêîãî ìåòîäà çàêëþ÷àåòñÿ â òîì, ÷òî ïîíÿòèå ðàçìûòîñòè êëàñòåðèçàöèè ðàññìàòðèâàåòñÿ ñ èåðàðõè÷åñêîé òî÷êè çðåíèÿ. À èìåííî íå÷åòêîñòü êëàñòåðèçàöèè ïîíèìàåòñÿ â òîì ñìûñëå, íàñêîëüêî äåòàëüíî ðàññìàòðèâàþòñÿ ñâîéñòâà ýëåìåíòîâ ïðè ôîðìèðîâàíèè ìíîæåñòâà ñõîæèõ ýëåìåíòîâ. Ïîíÿòíî, ÷òî ÷åì áîëåå äåòàëüíî ðàññìàòðèâàþòñÿ ñâîéñòâà, òåì áîëüøå îòëè÷èé âûÿâëÿåòñÿ ìåæäó ýëåìåíòàìè. Åñëè ñâîéñòâà ðàññìàòðèâàþòñÿ áîëåå ðàçìûòî, ò.å. íå âäàâàÿñü â äåòàëè, òî ýëåìåíòû èìåþò áîëüøå ñõîæåñòè.  òàêîì ñëó÷àå ðàçìûòîñòü êëàñòåðèçàöèè îïðåäåëÿåòñÿ «äåòàëüíîñòüþ» ó÷åòà èññëåäóåìûõ ñâîéñòâ. Òîãäà ïðè ìèíèìàëüíîé ñòåïåíè ðàçìûòîñòè âñå ýëåìåíòû â êàêîé-òî ñòåïåíè áóäóò îòëè÷àòüñÿ îäèí îò ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 10 © Ý.Í. Íàñèáîâ, 2008 äðóãîãî è êàæäûé ýëåìåíò äîëæåí ðàññìàòðèâàòüñÿ êàê îòäåëüíûé êëàññ, à ïðè ìàêñèìàëüíîé ñòåïåíè ðàçìûòîñòè âñå ýëåìåíòû áóäóò ïîõîæè îäèí íà äðóãîãî è, ñëåäîâàòåëüíî, âñå îíè áóäóò ïðèíàäëåæèòü îäíîìó êëàññó. Ïðè êàêîé-òî ñòåïåíè ðàçìûòîñòè ìåæäó 0 è 1 íåêîòîðûå ýëåìåíòû ñ áëèçêèìè ñâîéñòâàìè áóäóò ïîõîæè îäèí íà äðóãîãî è ïðèíàäëåæàòü îäíîìó è òîìó æå êëàññó, à áîëåå óäàëåííûå ýëåìåíòû áóäóò ïðèíàäëåæàòü ðàçëè÷íûì êëàññàì. Îñíîâíûìè âîïðîñàìè â ïðîáëåìå îïðåäåëåíèÿ íå÷åòêîé êëàñòåðèçàöèè ÿâëÿþòñÿ: à) íàõîæäåíèå îïòèìàëüíîãî êîëè÷åñòâà ãîìîãåííûõ êëàññîâ; á) ôîðìèðîâàíèå íà÷àëüíîãî ðàçáèåíèÿ èñõîäíûõ ýëåìåíòîâ íà êëàññû; â) íåïîñðåäñòâåííûå àëãîðèòìû êëàñòåðèçàöèè ñ èòåðàòèâíûì óëó÷øåíèåì ðàçáèåíèÿ. Ñóùåñòâóåò äîñòàòî÷íîå ÷èñëî ïóáëèêàöèé ïî óêàçàííûì âîïðîñàì [7–11]. Ñðåäè ðàññìîòðåííûõ ìåòîäîâ íàèáîëåå ÷àñòî èñïîëüçóþòñÿ ìåòîä áëèæàéùèõ K-ñîñåäåé (K-Nearest Neighbors — KNN) è ìåòîä õîëìîâ (Mountain Method) [8–10]. Îäíàêî îíè èìåþò íåêîòîðûå íåäîñòàòêè. Òàê, â ìåòîäå KNN òðåáóåòñÿ çàðàíåå çàäàâàòü êîëè÷åñòâî êëàñòåðîâ, êðîìå òîãî, ðàçáèåíèå ÿâëÿåòñÿ äîñòàòî÷íî ãðóáûì. Îñíîâíûì íåäîñòàòêîì ìåòîäà õîëìîâ — ñëîæíîñòü ïðè åãî âû÷èñëåíèè. Ðàññìîòðåííûé â íàñòîÿùåé ñòàòüå ìåòîä FJP ñâîáîäåí îò âûøåïåðå÷èñëåí- íûõ íåäîñòàòêîâ [6]. Îäíèì èç ïðåèìóùåñòâ óêàçàííîãî ìåòîäà — ñóùåñòâîâà- íèå ìåõàíèçìà àâòîìàòè÷åñêîãî íàõîæäåíèÿ êîëè÷åñòâà êëàññîâ, êîòîðûé îòñóòñòâóåò â áîëüøèíñòâå äðóãèõ àëãîðèòìîâ èåðàðõè÷åñêîé êëàñòåðèçàöèè. Ýòîò ìåòîä ìîæåò òàêæå ðàñïîçíàâàòü îòäåëåííûå ýëåìåíòû êàê îòäåëüíûå êëàññû, ÷òî ñâèäåòåëüñòâóåò â ïîëüçó ìåòîäà FJP, ïîñêîëüêó óäàëåííûå îò ìàññû ýëåìåíòû ìîãóò áûòü íå èãíîðèðîâàíû êàê òî÷êè øóìà, à ðàññìîòðåíû êàê ñàìîñòîÿòåëüíûå èíäèâèäóàëüíûå êëàññû. Ýòî ìîæåò èìåòü çíà÷åíèå, íàïðèìåð, ïðè èññëåäîâàíèè â îáëàñòè ìåäèöèíû, áèîëîãèè è ò.ï., ãäå àíîìàëüíûå ñëó÷àè èìåþò îïðåäåëåííûé èíòåðåñ.  íàñòîÿùåé ñòàòüå èññëåäóåòñÿ óñëîâèå êîððåêòíîãî ðàñïîçíàâàíèÿ êëàññîâ àëãîðèòìîì FJP è ïðåäëàãàåòñÿ ïîìåõîóñòîé÷èâûé âàðèàíò ýòîãî àëãîðèòìà, â êîòîðîì åãî ÷óâñòâèòåëüíîñòü ê øóìó ìîæåò áûòü îòðåãóëèðîâàíà. 1. ÏÎÑÒÀÍÎÂÊÀ ÇÀÄÀ×È Ïóñòü èìååòñÿ ìíîæåñòâî òî÷åê X x x xn� { }1 2, , . . ., , ãäå x E i ni p� �, ,1 . Òðåáóåòñÿ ðàçäåëèòü ìíîæåñòâî X íà ãîìîãåííûå êëàññû, ò.å. ïðîèçâåñòè êëàñòåðèçàöèþ ìíîæåñòâà X . Äðóãèìè ñëîâàìè, òðåáóåòñÿ âû÷èñëèòü ïîäìíîæåñòâà X X X k1 2, , . . ., òàêèå, ÷òî � � � ��i j X Xi j (1) è i k iX X � � 1 � . (2) Îòìåòèì, ÷òî ïîäìíîæåñòâà X X X k1 2, , . . ., ÿâëÿþòñÿ ìíîæåñòâàìè â êëàññè÷åñêîì ñìûñëå, ò.å. áåç íå÷åòêîñòè. Êîëè÷åñòâî êëàññîâ k çàðàíåå íåèçâåñòíî. Ïîýòîìó òðåáóåòñÿ òàêæå îïðåäåëèòü êîëè÷åñòâî êëàññîâ, àäåêâàòíî îòðàæàþùåå ñòðóêòóðó äàííûõ.  ðàññìàòðèâàåìîì ñëó÷àå ïîäõîäÿùåå çíà÷åíèå k áóäåò îïðåäåëÿòüñÿ íà îñíîâå îïòèìàëüíîñòè íåêîòîðîé ôóíêöèè, áàçèðóþùåéñÿ íà ìàêñèìàëüíîñòè ìåæêëàññîâûõ ðàññòîÿíèé. Êàê áûëî ñêàçàíî âî ââåäåíèè, ýëåìåíòû âíóòðè îäíîãî êëàññà äîëæíû áûòü ðàñïîëîæåíû ìàêñèìàëüíî áëèçêî, à ðàçëè÷íûå êëàññû äîëæíû ðàñïîëàãàòüñÿ 11 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 êàê ìîæíî äàëüøå îäèí îò äðóãîãî. Ïðè ýòîì áëèçîñòü ýëåìåíòîâ ìîæåò îïðåäåëÿòüñÿ íà îñíîâå ðàçëè÷íûõ ìåòðèê. Îòìåòèì, ÷òî áîëüøèíñòâî ìåòîäîâ êëàñòåðèçàöèè íà áàçå äèñòàíöèè èñïîëüçóþò êëàññè÷åñêóþ ýâêëèäîâó äèñòàíöèþ, ò.å. äèñòàíöèÿ ìåæäó îáû÷íûìè òî÷êàìè a è b p-ìåðíîãî ïðîñòðàíñòâà E p îïðåäåëÿåòñÿ êàê d a b a b i p i i( , ) ( )� � � 1 2 . (3) Ñëåäóåò îòìåòèòü, ÷òî ñóùåñòâóþò òàêæå ìåòîäû, ãäå èñïîëüçóþòñÿ äðóãèå áîëåå îáîáùåííûå äèñòàíöèè. Íàïðèìåð, â [12] ðàññìàòðèâàåòñÿ ïðîáëåìà êëàñòåðèçàöèè ñ ïðèìåíåíèåì àëãîðèòìà íå÷åòêîé êëàñòåðèçàöèè (Fuzzy c-Means — FCM) íà áàçå ìàñøòàáèðóåìîé ïî íàïðàâëåíèÿì äèñòàíöèè è äåìîíñòðèðóþòñÿ íåêîòîðûå ïðåèìóùåñòâà òàêîé äèñòàíöèè. Îäíàêî â íàñòîÿùåé ñòàòüå áóäåì èñïîëüçîâàòü äèñòàíöèþ â ñìûñëå (3). 2. ÍÅ×ÅÒÊÈÅ ÑÂßÇÀÍÍÛÅ ÒÎ×ÊÈ È ÈÕ ÑÂÎÉÑÒÂÀ Îáîçíà÷èì F E p( ) ìíîæåñòâî âñåõ íå÷åòêèõ ïîäìíîæåñòâ ïðîñòðàíñòâà E p . Ïóñòü �A pE: [ , ] 0 1 îáîçíà÷àåò ôóíêöèþ ïðèíàäëåæíîñòè íå÷åòêîãî ìíîæåñòâà A F E p� ( ). Ñíà÷àëà íàïîìíèì íåêîòîðûå ïîíÿòèÿ, ââåäåííûå â ðàáîòå [6]. Îïðåäåëåíèå 1. Íå÷åòêîé òî÷êîé êîíóñíîé ôîðìû A a R F E p� �( , ) ( ) ïðîñòðàíñòâà E p áóäåì íàçûâàòü íå÷åòêîå ìíîæåñòâî (ðèñ. 1), ôóíêöèÿ ïðèíàäëåæíîñòè êîòîðîãî îïðåäåëÿåòñÿ êàê �A x d x a R d x a R ( ) ( , ) ( , ) ,� � � � � � �� 1 0 â ïðîòèâíîì ñëó àå (4) Çäåñü a E p� ÿâëÿåòñÿ öåíòðîì íå÷åòêîé òî÷êè A, à R E� 1 ÿâëÿåòñÿ ðàäèóñîì åãî íîñèòåëÿ supp A, ãäå supp { }A x E xp A� � �| ( ) .� 0 Î÷åâèäíî, ÷òî �-óðîâíåâîå ìíîæåñòâî íå÷åòêîé òî÷êè êîíóñíîé ôîðìû A a R� ( , ) áóäåò ìíîæåñòâî â êëàññè÷åñêîì ñìûñëå A x E x x E d x a Rp A p � � � �� � � � � � � �{ } { }| ( ) | ( , ) ( )1 (5) Äàëåå áóäåì óïîòðåáëÿòü ñîêðàùåííûé òåðìèí «íå÷åòêàÿ òî÷êà», ïîäðàçóìåâàÿ ïðè ýòîì íå÷åòêóþ òî÷êó êîíóñíîé ôîðìû (•, )R , îïðåäåëåííóþ êàê (4). Ïóñòü A a R� ( , ) è B b R� ( , ) — íå÷åòêèå òî÷êè èç ìíîæåñòâà X F E p� ( ). Îïðåäåëèì íå÷åòêîå îòíîøåíèå T X X: [ , ]� 0 1 ìåæäó ýëåìåíòàìè ìíîæåñòâà X , ñòåïåíü âûïîëíåíèÿ êîòîðîãî îïðåäåëÿåòñÿ êàê ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 12 Ðèñ. 1. Íå÷åòêàÿ òî÷êà êîíóñíîé ôîðìû A a R� �( , ) � P E( )2 â ïðîñòðàíñòâå E2 T A B d a b R ( , ) ( , ) , ,� � � � � � � max 1 2 0 (6) ãäå a E p� è b E p� ÿâëÿþòñÿ öåíòðàìè íå÷åòêèõ òî÷åê A è B ñîîòâåòñòâåííî (ðèñ. 2). Èç îòíîøåíèÿ (6) ñëåäóåò, ÷òî ïðè T A B( , ) ( , ]� 0 1 ñïðàâåäëèâî ðàâåíñòâî d a b R T A B( , ) ( ( , ))� �2 1 . (7) Ïîíÿòíî, ÷òî îòíîøåíèå T ÿâëÿåòñÿ ðåôëåêñèâíûì, ò.å. � �A X âûïîëíÿåòñÿ ðàâåíñòâî T A A( , ) �1. Îïðåäåëåíèå 2. Ïóñòü A è B ÿâëÿþòñÿ íå÷åòêèìè òî÷êàìè èç ìíîæåñòâà X F E p� ( ). Åñëè ïðè ôèêñèðîâàííîì çíà÷åíèè ��( , ]0 1 óäîâëåòâîðÿåòñÿ íåðàâåíñòâî T A B( , ) � �, (8) òî òî÷êè A è B íàçîâåì �-ñîñåäíèìè íå÷åòêèìè òî÷êàìè: A B~ � (ñì. ðèñ. 2). Îïðåäåëåíèå 3.Åñëè ïðè ôèêñèðîâàííîì çíà÷åíèè ��( , ]0 1 ìåæäó íå÷åòêèìè òî÷êàìè A è B èìååòñÿ ïîñëåäîâàòåëüíîñòü íå÷åòêèõ �-ñîñåäíèõ òî÷åê C C kk1 0, . . ., , � , ò.å. A C C C C Ck k~ , ~ , . . ., ~� � � 1 1 2 1� è C Bk ~ � , òî íå÷åòêèå òî÷êè A è B íàçîâåì íå÷åòêèìè �-ñâÿçàííûìè òî÷êàìè. Îïðåäåëåíèå 4. Ïóñòü X F E p� ( ) ÿâëÿåòñÿ ìíîæåñòâîì íå÷åòêèõ òî÷åê. Åñëè ïðè ôèêñèðîâàííîì çíà÷åíèè ��( , ]0 1 äëÿ ëþáûõ A B X, � íå÷åòêèå òî÷êè A è B ÿâëÿþòñÿ �-ñâÿçàííûìè, òî ìíîæåñòâî X íàçîâåì íå÷åòêèì �-ñâÿçàííûì ìíîæåñòâîì. Ëåììà 1.Äëÿ òîãî ÷òîáû ïðè ôèêñèðîâàííîì ��( , ]0 1 íå÷åòêèå òî÷êè A a R� ( , ) è B b R� ( , ) áûëè �-ñîñåäíèìè, íåîáõîäèìî è äîñòàòî÷íî âûïîëíåíèå íåðàâåíñòâà d a b R( , ) ( )� �2 1 � , (9) ãäå d a b( , ) — ðàññòîÿíèå ìåæäó öåíòðàìè íå÷åòêèõ òî÷åê A è B. Ëåììà 2. Äëÿ òîãî ÷òîáû äëÿ íåêîòîðîãî ��( , ]0 1 íå÷åòêèå òî÷êè A è B áûëè �-ñîñåäíèìè, íåîáõîäèìî è äîñòàòî÷íî âûïîëíåíèå îòíîøåíèÿ A B� �� ��. (10) Äîêàçàòåëüñòâà ýòèõ óòâåðæäåíèé èìåþòñÿ â ðàáîòå [6]. Ïóñòü îòíîøåíèå � : [ , ]T X X� 0 1 ÿâëÿåòñÿ òðàíçèòèâíûì çàìûêàíèåì íå÷åòêîãî îòíîøåíèÿ T X X: [ , ]� 0 1 . Ïðè îïðåäåëåíèè òðàíçèòèâíîãî çàìûêàíèÿ áóäåì ïðåäïîëîãàòü êëàññè÷åñêóþ max–min-êîìïîçèöèþ íå÷åòêèõ îòíîøåíèé. Ñëåäóþùàÿ òåîðåìà çàäàåò ìåòîä îïðåäåëåíèÿ �-ñâÿçàííîñòè ìåæäó ëþáûìè çàäàííûìè íå÷åòêèìè òî÷êàìè. Òåîðåìà 1. Íåáõîäèìûì è äîñòàòî÷íûì óñëîâèåì �-ñâÿçàííîñòè ëþáûõ 13 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 Ðèñ. 2. Íå÷åòêèå �-ñîñåäíèå òî÷êì A a R� ( , ) è B b R� ( , ) â ïðîñòðàòñòâå E2 íå÷åòêèõ òî÷åê A B X, � êîíå÷íîãî ìíîæåñòâà X ïðè ôèêñèðîâàííîì ��( , ]0 1 ÿâëÿåòñÿ íåðàâåíñòâî � ( , )T A B � �. (11) Äîêàçàòåëüñòâî òåîðåìû èìååòñÿ â ðàáîòå [6]. 3. ÏÎÌÅÕÎÓÑÒÎÉ×ÈÂÛÉ ÀËÃÎÐÈÒÌ ÌÅÒÎÄÀ ÍÅ×ÅÒÊÈÕ ÑÂßÇÀÍÍÛÕ ÒÎ×ÅÊ Äëÿ ðåøåíèÿ çàäà÷è (1), (2) ïðåäëàãàåòñÿ ñëåäóþùèé àëãîðèòì, ÿâëÿþùèéñÿ ïîìåõîóñòîé÷èâûì âàðèàíòîì àëãîðèòìà íå÷åòêèõ ñâÿçàííûõ òî÷åê (Fuzzy Joint Points — FJP), èçëîæåííîãî â ðàáîòå [6]. Ýòîò àëãîðèòì âû÷èñëÿåò ïîäõîäÿùåå çíà÷åíèå ÷åòêîñòè �, ñîîòâåòñòâóþùåå êîëè÷åñòâî êëàññîâ k, à òàêæå ðàçáèåíèå èñõîäíîãî ìíîæåñòâà X x x xn� { }1 2, , . . ., íà êëàññû X X X k1 2, , . . ., , óäîâëåòâîðÿþùèå îòíîøåíèÿì (1) è (2). Ïðè ýòîì X X X k1 2, , . . ., ÿâëÿþòñÿ íå÷åòêèìè �-ñâÿçàííûìè ìíîæåñòâàìè.Ïóñòü N x( ) — íå÷åòêîå ñîñåäñòâî çàäàííîé òî÷êè x X� íà îñíîâå îòíîøåíèÿ T , ò.å. N x y T x y y X( ) ( , ( , ))|� �{ } (12) N x y X T x y( , ) | ( , )� �1 1� � �{ } (13) ÿâëÿåòñÿ �1-óðîâíåâûì ìíîæåñòâîì íå÷åòêîãî ìíîæåñòâà N x( ), ò.å. íå÷åòêèì �1-ñîñåäñòâîì òî÷êè x X� . Îïðåäåëåíèå 5. Òî÷êà x X� íàçûâàåòñÿ òî÷êîé øóìà ñ ïàðàìåòðàìè � �1 2, äëÿ çàäàííûõ �1 0� è �2 0� , åñëè óäîâëåòâîðÿåòñÿ íåðàâåíñòâî card N x( , )� �1 2� , ãäå card N x T x y y N x ( , ) ( , ) ( , ) � � 1 1 � � ÿâëÿåòñÿ íå÷åòêîé ìîùíîñòüþ ìíîæåñòâà N x( , )�1 . Ïðåäëîæåííûé íèæå àëãîðèòì FJP ÿâëÿåòñÿ ïîìåõîóñòîé÷èâûì. Åñëè â äàííîì àëãîðèòìå äëÿ çàäàííîé òî÷êè íå÷åòêàÿ ìîùíîñòü åãî íå÷åòêîãî �1-ñîñåäñòâà ìåíüøå �2 , òî ýòà òî÷êà âîñïðèíèìàåòñÿ â êà÷åñòâå øóìà. Îòìåòèì, ÷òî íàñòðîéêîé ïàðàìåòðîâ �1 è �2 ìîæíî ðåãóëèðîâàòü ÷óâñòâèòåëüíîñòü àëãîðèòìà FJP ê ïîìåõàì. Î÷åâèäíî, ÷òî ïðèíèìàÿ �2 0� , ìîæíî çàãëóøèòü ïîìåõîóñòîé÷èâîñòü àëãîðèòìà. Ïîìåõîóñòîé÷èâûé FJP-àëãîðèòì Øàã 1 . Âû÷èñëèòü d d x x i j n d dij i j i j n ij: ( , ), , , ; : ; , , � � � � 1 1 max max �: , , , � � � 0 01 1 min i j n ijd . Óñòàíîâèòü çíà÷åíèÿ �1 è �2 . Ïóñòü � 0 1:� . Øàã 2.Âû÷èñëèòü íå÷åòêîå îòíîøåíèå T d d i j nij ij : , , ,� � �1 1 max . Øàã 3.Âûçâàòü ïðîöåäóðó NoiseFilter( , )� �1 2 äëÿ ðàçáèåíèÿ èñõîäíîãî ìíîæåñòâà X íà ÿäðî X core è øóì X noise , ò.å. X X Xcore noise� � , X Xcore noise� ��. Âû÷èñëèòü òðàíçèòèâíîå çàìûêàíèå �T îòíîøåíèÿ T íà ìíîæåñòâå X core . Øàã 4.Ïóñòü nc — êîëè÷åñòâî ýëåìåíòîâ X core; îáîçíà÷èòü: y x i n t k ni i c c: , , ; : ; :� � � �1 1 . Øàã 5. Âû÷èñëèòü d y y d x x x y x yi j i j( , ) ( , )| ,� � � � �� � ��min{ }, i j k, ,�1 ; d d y yt i j i j: ( , )� � min ; � � t td d : ,� � � � � � � � max max 1 0 . ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 14 Øàã 6. Âûçâàòü ïðîöåäóðó Clusters t( )� äëÿ âû÷èñëåíèÿ íå÷åòêèõ � t - ñâÿçàííûõ ìíîæåñòâ X X X k1 2, , . . ., ñ íå÷åòêèìè òî÷êàìè êîíóñíîé ôîðìû x d i ni c, , ,max 2 1 � � ! " # � , è äëÿ îïðåäåëåíèÿ êîëè÷åñòâà k ýòèõ ìíîæåñòâ äëÿ çàäàííîãî çíà÷åíèÿ � t . Øàã 7.Åñëè k �1, òî îáîçíà÷èòü y Xi i:� , i k�1, ; t t� �1è ïåðåéòè íà øàã 5. Åñëè k �1, òî ïåðåéòè íà øàã 8. Øàã 8. Âû÷èñëèòü $� � �i i i:� � � 1, i t z i t i� � � � � 0 1 0 1 , ; : , arg max $� ; � � �:� �z . Øàã 9. Âûçâàòü ïðîöåäóðó Clusters( )� ñ ïàðàìåòðîì �. Øàã 10. � — îïòèìàëüíîå çíà÷åíèå óðîâíÿ ÷åòêîñòè êëàñòåðèçàöèè; k — îïòèìàëüíîå êîëè÷åñòâî êëàñòåðîâ; X X k1, . . ., — îïòèìàëüíîå ðàçáèåíèå ìíîæåñòâà X . Øàã 11. Äëÿ êàæäîãî ýëåìåíòà x X noise� ïîâòîðèòü øàã 12. Øàã 12. Âû÷èñëèòü k dist x X k kk* ( , )| , . . .,� �arg min{ }1 ; ýëåìåíò x îòíåñòè ê ìíîæåñòâó X k* . End. Ïðîöåäóðà NoiseFilter( , )� �1 2 èñïîëüçóåòñÿ äëÿ ðàçáèåíèÿ èñõîäíîãî ìíîæåñòâà X íà äâà íåïåðåñåêàþùèåñÿ ìíîæåñòâà ÿäðà X core è øóìà X noise , ò.å. X X X X Xcore noise core noise� � � ��, . ÏðîöåäóðàNoiseFilter( , )� �1 2 : Âõîäíûå ïàðàìåòðû: �1 è �2 . Âûõîäíûå ïàðàìåòðû:ìíîæåñòâà X core è X noise . Øàã 1.Ïóñòü X x x xn% { }1 2, , . . ., ÿâëÿåòñÿ ìíîæåñòâîì èñõîäíûõ òî÷åê, X noise ��. Øàã 2.Äëÿ êàæäîé òî÷êè x X� ïîâòîðèòü øàãè 3 è 4. Øàã 3. Âû÷èñëèòü card N x T x y y N x ( , ) ( , ) ( , ) � � 1 1 � � . Øàã 4. Åñëè cardN x( , )� �1 2� , òî x ïîìåòèòü êàê òî÷êó øóìà: X X xnoise noise:� �{ }. Øàã 5.Îáîçíà÷èòü X X Xcore noise: \� . Øàã 6. Âîçâðàòèòü ìíîæåñòâà X core è X noise . End. Ïðîöåäóðà Clusters(�) ðàçáèâàåò ìíîæåñòâî X x x xn� { }1 2, , . . ., íà íå÷åòêèå �-ñâÿçàííûå ìíîæåñòâà äëÿ âõîäíîãî ïàðàìåòðà �, âîçâðàùàåò ýòè ìíîæåñòâà è êîëè÷åñòâî ýòèõ ìíîæåñòâ. Ïðîöåäóðà Clusters(�): Âõîäíîé ïàðàìåòð:�. Âûõîäíûå ïàðàìåòðû:ìíîæåñòâà X X X k1 2, , . . ., , îòðàæàþùèå ãîìîãåí- íûå êëàññû íå÷åòêèõ �-ñâÿçàííûõ òî÷åê; k — êîëè÷åñòâî ýòèõ êëàññîâ. Øàã 1. S X x x xn: , , . . .,� � { }1 2 ; k :�1. 15 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 Øàã 2. Âûáèðàòü ýëåìåíò A S� ìíîæåñòâà S . Îáðàçîâàòü ìíîæåñòâà: X B S T A Bk : | � ( , )� � �{ }� ; S S k: \� . Øàã 3. Åñëè S ��, òî îáîçíà÷èòü k k:� �1 è ïåðåéòè ê øàãó 2; â ïðîòèâíîì ñëó÷àå ïåðåéòè ê øàãó 4. Øàã 4. Âîçâðàòèòü ìíîæåñòâà X X X k1 2, , . . ., è êîëè÷åñòâî k ýòèõ ìíîæåñòâ. End. Îòìåòèì, ÷òî â àëãîðèòìå FJP äëÿ íîðìàëèçàöèè íå÷åòêîãî îòíîøåíèÿ T X X: [ , ]� 0 1 ðàäèóñ ðàññìàòðèâàåìûõ íå÷åòêèõ òî÷åê ïðåäïîëàãàåòñÿ â âèäå R d x x x x X di j i j � � % max{ } max ( , ) | , . 2 2 Òàêèì îáðàçîì, � �A B X, ñòåïåíü âûïîëíåíèÿ îòíîøåíèÿ T îïðåäåëèòñÿ êàê T A B d a b d ( , ) ( , ) ;� �1 max (14) ñëåäîâàòåëüíî, d a b d T A B( , ) ( ( , ))� �max 1 . Ïóñòü X k , k t�1, , — ãîìîãåííûå êëàññû, ñôîðìèðîâàííûå â ðåçóëüòàòå êëàñòåðèçàöèè. Çàäàäèì ñëåäóþùèå îáîçíà÷åíèÿ (ñì. ðèñ. 3): d d T x y k in x y Xk � � � � max , ( min � ( , ))1 , d din k k in max max� , d d X Xout i j i j min min� � ( , ), d d X Xout i j i j max max� � ( , ), ãäå �T — òðàíçèòèâíîå çàìûêàíèå îòíîøåíèÿ T . Êðèòåðèé äëÿ íàõîæäåíèÿ îïòèìàëüíîé ñòðóêòóðû êëàññîâ îñíîâûâàåòñÿ íà ìàêñèìàëüíîñòè øèðîòû èçìåíåíèÿ �-óðîâíåé, äëÿ êîòîðûõ êîëè÷åñòâî êëàññîâ íå ìåíÿåòñÿ. Äðóãèìè ñëîâàìè, â êà÷åñòâå îïòèìàëüíîé ïðèíèìàåòñÿ ñòðóêòóðà êëàññîâ, äëÿ êîòîðîé óäîâëåòâîðÿåòñÿ V d dFJP out in% � min max max. (15)  òàáë. 1 òàêæå îòðàæåíû äðóãèå ñóùåñòâóþùèå â ëèòåðàòóðå îñíîâíûå êðèòåðèè îïðåäåëåíèÿ îïòèìàëüíîãî êîëè÷åñòâà êëàññîâ ïðè êëàñòåðèçàöèè [7]. Ïðè ýòîì èñïîëüçîâàíû ñëåäóþùèå îáîçíà÷åíèÿ: uij — ñòåïåíü ïðèíàäëåæíîñòè ýëåìåíòà x j ê i-ìó êëàññó, vi — öåíòð êëàññà i, �( )ui — äèàìåòð êëàññà i, mX — öåíòð ìíîæåñòâà âñåõ òî÷åê X . ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 16 Ðèñ. 3. Ðàñïîëîæåíèå ãîìîãåííûõ ìíîæåñòâ, âûçûâàåìûõ àëãîðèòìîì FJP Ò à á ë è ö à 1 . Êðèòåðèè äëÿ îïðåäåëåíèÿ îïòèìàëüíîãî êîëè÷åñòâà êëàññîâ Íàçâàíèå êðèòåðèÿ Ôóíêöèîíàëüíîå âûðàæåíèå Íàèëó÷øàÿ êëàñòåðèçàöèÿ Êîýôôèöèåíò ðàçáèåíèÿ (Partition coefficient) V n uPC i c j n ij � � � 1 1 1 2 max( , , )V U cPC Ýíòðîïèÿ êëàñòåðèçàöèè (Classification entropy) V n u uCE i c j n ij a ij� � � � 1 1 1 log min ( , , )V U cCE Êðèòåðèè Ôóêóÿíî–Ñóãåíî (Fukuyamo-Sugeno criteria) V u d x v d m vFS i c j n ij m j i X im � � � � 1 1 2 2[ ( , ) ( , )] min ( , , )V U cFS Èíäåêñ ðàçäåëåíèÿ (Separation index) V d u u u SI i k k i i k i i � � max min min , ( , ) ( )� max( , )V USI Êðèòåðèé FJP (FJP criteria) V d dFJP out in � � min max max( , )V UFJP Ïðèâåäåííàÿ íèæå òåîðåìà îïðåäåëÿåò äîñòàòî÷íîå óñëîâèå êîððåêòíîé êëàñòåðèçàöèè äàííûõ ñ ïîìîùüþ àëãîðèòìà FJP. Òåîðåìà 2.Åñëè èìååòñÿ íåêîòîðàÿ ñêðûòàÿ ñòðóêòóðà ìíîæåñòâà X ñ âîçìîæíûì ðàçáèåíèåì (1), (2), óäîâëåòâîðÿþùèì ñîîòíåøåíèÿì d d d d d in out out in out max min min max max � � �1 2 , (16) òî àëãîðèòì FJP ðàñïîçíàåò ýòî ðàçáèåíèå êàê îïòèìàëüíîå. Äîêàçàòåëüñòâî. Ïðåäïîëîæèì, ÷òî èìååòñÿ ñêðûòàÿ ñòðóêòóðà ñ âîçìîæíûì ðàçáèåíèåì, óäîâëåòâîðÿþùèì ñîîòíîøåíèÿì (16). Çíà÷åíèÿ �, ïîëó÷åííûå â ðå- çóëüòàòå öèêëè÷åñêîãî ïðèìåíåíèÿ øàãîâ 5–7 ïîìåõîóñòîé÷èâîãî àëãîðèòìà FJP, îáîçíà÷èì � � �0 1, , . . ., t . Ñîãëàñíî ôîðìóëå (7) êàæäîìó çíà÷åíèþ ñòåïåíåé � i i t, ,� 0 , ñîîòâåòñòâóåò íåêîòîðîå çíà÷åíèå ðàäèóñà îêðóæíîñòè, êîòîðîå îïðåäåëÿåò �-óðîâíåâîå ìíîæåñòâî. Ïî óòâåðæäåíèþ ëåììû 2 ïåðåñå÷åíèÿìè ýòèõ �-óðîâíåâûõ ìíîæåñòâ îïðåäåëÿåòñÿ ìíîæåñòâî �-ñîñåäíèõ íå÷åòêèõ òî÷åê äëÿ çàäàííîé ñòåïåíè. Êàê âèäíî èç ôîðìóëû (7), ñ óìåíüøåíèåì ñòåïåíè � � T A B( , ) ðàäèóñ ýòèõ îêðóæíîñòåé óâåëè÷èâàåòñÿ. Ïîíÿòíî, ÷òî åñëè àëãîðèòìîì FJP ïîëó÷åíî íåêîòîðîå ðàçáèåíèå ìíîæåñòâà X , òî âûïîëíÿåòñÿ íåðàâåíñòâî d d din out out max min max� � è íåò òàêèõ òî÷åê x y X, � , ÷òîáû âûïîëíÿëîñü íåðàâåíñòâî d d x y din out max min � �( , ) . Ñëåäîâàòåëüíî, â ïîñëåäîâàòåëüíîñòè çíà÷åíèé ñòåïåíåé � i , i t� 0, , ñãåíåðèðîâàííûõ øàãîì 5 ïîìåõîóñòîé÷èâîãî àëãîðèòìà FJP, íåêîòîðûå ïîñëåäîâàòåëüíûå çíà÷åíèÿ � z è � z � 1 áóäóò ñîîòâåòñòâîâàòü çíà÷åíèÿì äèñòàíöèé d in max è d out min . Çíà÷åíèÿ ñòåïåíåé îòíîøåíèÿ T , ñîîòâåòñòâóþùèå çíà÷åíèÿì ðàññòîÿíèé 0 0� d , d din out max min , è d out max , îáîçíà÷èì ÷åðåç 1 0 1 2� � � �, , è � 3 ñîîòâåòñòâåííî. Ñîãëàñíî øàãàì 8–10 äëÿ òîãî ÷òîáû àëãîðèòì FJP âûäàâàë ïðåäïîëîãàåìîå 17 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 âûøå ðàçáèåíèå â êà÷åñòâå îïòèìàëüíîãî, äîëæíî âûïîëíÿòüñÿ ðàâåíñòâî � � � � � �1 2 1 0 1 � � � � �� � � $ $z z z i t imax , . Ïðåäïîëîæèì, ÷òî íåðàâåíñòâà (16) âûïîëíÿþòñÿ. Ñíà÷àëà ðàññìîòðèì ïåðâóþ ÷àñòü ýòèõ íåðàâåíñòâ. Ïóñòü óäîâëåòâîðÿåòñÿ íåðàâåíñòâî d d in out max min � 1 2 . Îòñþäà, ó÷èòûâàÿ d0 0� , ìîæíî çàïèñàòü ñëåäóþùóþ öåïî÷êó íåðàâåíñòâ: 2 0d d d d d d d din out in out in in max min max min max max m � � � � � in max out ind� . (17) Ñ ó÷åòîì îòíîøåíèÿ (14) èìååì � �0 1 01 1� � � � � ! " ## � � � � ! " # # � d d d d din in max max max max � d d 0 max è � �1 2 1 1� � � � � ! " # # � � � � ! " # # � d d d d din out max max min max min max max out ind d � . (18) Ñîãëàñíî (17) ïîëó÷àåì, ÷òî � � � �0 1 1 2� � � . Òîãäà � �� � � �i j, [ , ]1 0 ñïðàâåäëèâî íåðàâåíñòâî | |� � � � � �i j� � � � �0 1 1 2 . Ñëåäîâàòåëüíî, � ��� � � �i i, [ , ]1 1 0 ñïðàâåäëèâî íåðàâåíñòâî � � � �i i� � �� 1 1 2 . (19) Äàëåå ðàññìîòðèì âòîðóþ ÷àñòü íåðàâåíñòâà (16). Ïóñòü âûïîëíÿåòñÿ íåðàâåíñòâî 1 2 � �d d d out in out min max max . Îòñþäà âûòåêàåò d d dout out in max min max� �2( ). Ñëåäîâàòåëüíî, d d d d d dout out out in out in max min min max min max� � � � �2 , ò.å. d d d dout out out in max min min max� � � . (20) Ïåðåõîäÿ íà îòíîøåíèå T , ìîæíî çàïèñàòü � �2 3 1 1� � � � � ! " # # � � � � ! " # # � d d d d out out min max max max d d d out out max min max � . (21) Ó÷èòûâàÿ ðàâåíñòâà (21) è (18), èç íåðàâåíñòâà (20) ïîëó÷àåì � � � �2 3 1 2� � � . Òîãäà � �� � � �i j, [ , ]3 2 ñïðàâåäëèâî íåðàâåíñòâî ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 18 | |� � � � � �i j� � � � �2 3 1 2 . Ñëåäîâàòåëüíî, � ��� � � �i i, [ , ]1 3 2 ñïðàâåäëèâî íåðàâåíñòâî � � � �i i� � �� 1 1 2 . (22) Òàêèì îáðàçîì, èç (19) è (22) ñëåäóåò, ÷òî � � �1 2 0 1 � � � � max i t i , $ . Ýòèì çàâåðøàåòñÿ äîêàçàòåëüñòâî òåîðåìû. Îòìåòèì, ÷òî äîêàçàííàÿ âûøå òåîðåìà èìååò íåïîñðåäñòâåííîå îòíîøåíèå ê ïðîñòîìó àëãîðèòìó FJP, ïðåäëîæåííîìó â [6]. Äëÿ ïîìåõîóñòîé÷èâîãî âàðèàíòà àëãîðèòìà FJP, ïðåäëîæåííîãî â íàñòîÿùåé ñòàòüå, óñëîâèÿ òåîðåìû 2 äîëæíû âûïîëíÿòüñÿ òîëüêî äëÿ òî÷åê ÿäåð êëàññîâ. 4. ÂÛ×ÈÑËÈÒÅËÜÍÛÅ ÝÊÑÏÅÐÈÌÅÍÒÛ Ïîâåäåíèå ïîìåõîóñòîé÷èâîñòè àëãîðèòìà FJP è êîððåêòíîñòü åãî ðàáîòû áóäåì äåìîíñòðèðîâàòü íà áàçàõ äàííûõ ñ ðàçëè÷íûìè êîíôèãóðàöèÿìè, ïðåäñòàâëåííû- ìè â [13]. Èñïîëüçóåìûå àëãîðèòìû çàïðîãðàììèðîâàíû íà ÿçûêå Ñ++ äëÿ ïåðñî- íàëüíûõ êîìïüþòåðîâ òèïà Pentium IV è ïðîâåäåíû âû÷èñëèòåëüíûå ýêñïåðèìåí- òû. Íà ðèñ. 4–6 îòðàæåíû ðåçóëüòàòû ðàáîòû ïðîãðàìì, ãäå òî÷êè ÿäåð êëàññîâ ïîêàçàíû öèôðàìè 0, 1, 2, à òî÷êè øóìà — áîëåå æèðíûìè êâàäðàòàìè. Òàê êàê êëàññû ñìåøàíû ìíîæåñòâàìè òî÷åê ïîìåõà, ðàáîòà àëãîðèòìà FJP áåç ìåõàíèçìà ïîìåõîóñòîé÷èâîñòè (ñì. [6]) áóäåò äàâàòü íåêîððåêòíûå ðåçóëüòàòû. Êàê âèäíî èç ðèñ. 4–6, ðåçóëüòàò ïðåäëîæåííîãî â íàñòîÿùåé ñòàòüå ïîìåõîóñòîé÷èâîãî âàðèàíòà àëãîðèòìà FJP ÿâëÿåòñÿ êîððåêòíûì. Îòìåòèì, ÷òî ïðè ðàáîòå àëãîðèòìà ñíà÷àëà îïðåäåëÿþòñÿ ÿäðà êëàññîâ, à çàòåì êàæäàÿ òî÷êà øóìà ïåðåäàåòñÿ áëèæàéøåìó ÿäðó. 19 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 Ðèñ. 4. Ðåçóëüòàò êëàñòåðèçàöèè ÁÄ-1 ñ ïàðàìåòðàìè � �1 20 9 0 2� �, , , , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 0 9208, Äàííûå ñ íåñáàëàíñèðîâàííûì ðàñïðåäåëåíèåì (ÁÄ-1). Âíà÷àëå ðàññìîòðèì áàçó äàííûõ ñ êëàññàìè, ñóùåñòâåííî ðàçëè÷àþùèìèñÿ ïî êîëè÷åñòâó òî÷åê. Ðåçóëüòàò êëàñòåðèçàöèè ïîìåõîóñòîé÷èâûì àëãîðèòìîì FJP ñ ïàðàìåòðàìè � �1 209 02� �. , . , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 09208. , ôèêñèðóåò ðèñ. 4. ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 20 Ðèñ. 5. Ðåçóëüòàò êëàñòåðèçàöèè ÁÄ-2 ñ ïàðàìåòðàìè � �1 20 9 0 45� �, , , , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 0 9787, Ðèñ. 6. Ðåçóëüòàò êëàñòåðèçàöèè ÁÄ-2 ñ ïàðàìåòðàìè � �1 20 9 0 3� �, , , , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 0 9405, Äàííûå ñ ýëëèïòè÷åñêèìè ðàñïðåäåëåíèÿìè (ÁÄ-2). Íà ðèñ. 5 îòðàæåíà áàçà äàííûõ, ãäå êëàññû èìåþò ïðèáëèçèòåëüíî îäèíàêîâûå ðàçìåðû ñ ýëëèïòè÷åñêèìè ôîðìàìè è ïðèâåäåí ðåçóëüòàò ðàáîòû àëãîðèòìà ñ ïàðàìåòðàìè � �1 209 0 45� �. , . , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 09787. . Äàííûå ñ ëèíåéíî íåðàçäåëèìûì ðàñïðåäåëåíèåì (ÁÄ-3). Ðàññìîòðèì áàçó äàííûõ ñ êîíôèãóðàöèåé, ãäå êëàññû íå ìîãóò áûòü ðàçäåëåíû ïðÿìîé ëèíèåé. Ðåçóëüòàò ðàáîòû ïîìåõîóñòîé÷èâîãî àëãîðèòìà FJP äëÿ ÁÄ-3 ñ ïàðàìåòðàìè � �1 209 03� �. , . , ãäå ïîëó÷åíî îïòèìàëüíîå çíà÷åíèå � � 09465. , îòðàæåí íà ðèñ. 6. Âèçóàëüíîå íàáëþäåíèå ðàñïîëîæåíèÿ äàííûõ íà ðèñ. 4–6 ïîäòâåðæäàåò ñïðàâåäëèâîñòü êîëè÷åñòâà êëàññîâ è èõ ñòðóêòóðó, ðàñïîçíàâàåìûõ àëãîðèòìîì FJP. Îòìåòèì, ÷òî, êàê ïðàâèëî, êëàññè÷åñêèé àëãîðèòì êëàñòåðèçàöèè FCM (Fuzzy c-Means) äàåò íåàäåêâàòíûå ðåçóëüòàòû ïðè êëàñòåðèçàöèè áàç äàííûõ òèïà ÁÄ-1 è ÁÄ-3 [14]. ÇÀÊËÞ×ÅÍÈÅ Â íàñòîÿùåé ñòàòüå áûë ïðåäëîæåí ïîìåõîóñòîé÷èâûé âàðèàíò àëãîðèòìà FJP. Êàê áûëî ïîêàçàíî, îñíîâíûì äîñòîèíñòâîì ïðåäëîæåííîãî àëãîðèòìà ÿâëÿåòñÿ âîçìîæíîñòü ðåãóëèðîâêè ïîìåõîóñòîé÷èâîñòè êëàñòåðèçàöèè è àâòîìàòè÷åñêîãî îïðåäåëåíèÿ êîëè÷åñòâà êëàññîâ. Áûëè èñïîëüçîâàíû ïîíÿòèÿ íå÷åòêîé òî÷êè êîíóñíîé ôîðìû, íå÷åòêèõ �-ñîñåäíèõ è íå÷åòêèõ �-ñâÿçàííûõ òî÷åê, ïðîâåäåíû èññëåäîâàíèÿ íåêîòîðûõ ñâîéñòâ îòíîñèòåëüíî ýòèõ ïîíÿòèé. Äîêàçàíî äîñòàòî÷íîå óñëîâèå ïðàâèëüíîãî ðàñïîçíàâàíèÿ àëãîðèòìîì FJP èìåþùåéñÿ ñêðûòîé ñòðóêòóðû ðàñïîëîæåíèÿ êëàññîâ ïðè êëàñòåðèçàöèè. Îòìåòèì, ÷òî ðàññìîòðåííûé àëãîðèòì ìîæåò áûòü èñïîëüçîâàí êàê â êà÷åñòâå ïîäãîòîâèòåëüíîãî ýòàïà êëàññè÷åñêîãî àëãîðèòìà íå÷åòêîé êëàñòåðèçàöèè FCM äëÿ îïðåäåëåíèÿ íà÷àëüíûõ êëàññîâ è èõ êîëè÷åñòâà, òàê â êà÷åñòâå ñàìîñòîÿòåëüíîãî àëãîðèòìà êëàñòåðèçàöèè è ðàñïîçíàâàíèÿ îáðàçîâ. ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ 1. H a n J . , K a m b e r M . Data mining: concepts and techniques. — San Diego: Acad. Press, 2001. — 550 p. 2. D u m i t r e s c u D . , L a z z e r i n i B . , J a i n L . C . Fuzzy sets and their application to clustering and training. — New York: CRC Press LLC, 2000. — 622 p. 3. Í à ñ è á î â Ý . Í . Èäåíòèôèêàöèÿ ñîñòîÿíèé ñëîæíûõ ñèñòåì ñ îöåíêîé äîïóñòèìîé ïîãðåøíîñòè èçìåðåíèé ïðè íå÷åòêîé èíôîðìàöèè // Êèáåðíåòèêà è ñèñòåìíûé àíàëèç. — 2002. — 38, ¹ 1. — Ñ. 63–71. 4. Í à ñ è á î â Ý . Í . Îá îäíîé çàäà÷å èäåíòèôèêàöèè ñîñòîÿíèé ñèñòåìû ïî íå÷åòêèì çíà÷åíèÿì èíôîðìàòèâíûõ ïðèçíàêîâ // Àâòîìàòèêà è âû÷èñë. òåõíèêà. — 2002. — 36, ¹ 2. — Ñ. 33–40. 5. N a s i b o v E . N . , U l u t a g a y G . Program tools for fuzzy clustering analysis // Proc. Intern. Sci- entific Conf. «Inform. Tech. and Telecomm. in Educ. and Science». — Antalya (Turkey), 2006. — Ð. 195–197. 6. Í à ñ è á î â Ý . Í . , Ó ë ó ò à ã à é à . Íîâûé ïîäõîä ê ïðîáëåìå êëàñòåðèçàöèè ñ èñïîëüçîâàíèåì ìåòîäà íå÷åòêèõ ñâÿçàííûõ òî÷åê // Àâòîìàòèêà è âû÷èñë. òåõíèêà. — 2005. — 39, ¹ 6. — Ñ. 11–21. 7. P a l N . R . , B e z d e k J . C . On cluster validity for the fuzzy C-means model // IEEE Trans. on Fuzzy Systems. — 1995. — 3, N 3. — Ð. 370–379. 8. Z a h i d N . , A b o u e l a l a O . , L i m o u r i M . , E s s a i d A . Fuzzy clustering based on K-near- 21 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 est-neighbours rule // Fuzzy Sets and Systems. — 2001. — 120. — Ð. 239–247. 9. V e l t h u i z e n R . P . , H a l l L . O . , C l a r k e L . P . , S i l b i g e r M . L . An investigation of mountain method clustering for large data sets // Pattern Recognition. — 1997. — 30, N 7. — Ð. 1121–1135. 10. Y a g e r R . R . , F i l e v D . P . Approximate clustering via the mountain method // IEEE Trans. on Systems, Man and Cybernetics. — 1994. — 24, N 8. — Ð. 1279–1284. 11. D u n n J . C . A fuzzy relative of the ISODATA process and its use in detecting compact well-sepa- rated clusters // Cybernetics. — 1973. — 3, N 3. — Ð. 32–57. 12. H a m m a h R . E . , C u r r a n J . H . On distance measures for the fuzzy K-means algorithm for joint data // Rock Mech. Rock Eng. — 1999. — 32, N 1. — Ð. 1–27. 13. T a o C . W . Unsupervised fuzzy clustering with multi-center clusters // Fuzzy Sets and Systems. — 2002. — 128. — Ð. 305–322. 14. B e n s a i d A . M . , H a l l L . O . , B e z d e k J . C . e t a l . Validity-Guided (Re)clustering with applications to image segmentation // IEEE Trans. on Fuzzy Systems. — 1996. — 4, N 2. — Ð. 112–123. Ïîñòóïèëà 08.02.2006 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2008, ¹ 1 22