Вхождения в моноидах треков

Запропоновано ефективні алгоритми для розв’язання декількох задач входження трека-зразка в трек-об’єкт. Розглянуто задачі пошуку зразка в треку, пов’язані з задачею пошуку частих зразків в структурованих даних, та задачі обчислення числа вікон, що містять зразок....

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2010
Автори: Шахбазян, К.В., Шукурян, Ю.Г.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2010
Назва видання:Кибернетика и системный анализ
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/45241
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Вхождения в моноидах треков / К.В. Шахбазян, Ю.Г. Шукурян // Кибернетика и системный анализ. — 2010. — № 4. — С. 31-38. — Бібліогр.: 14 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-45241
record_format dspace
spelling irk-123456789-452412013-06-11T03:09:01Z Вхождения в моноидах треков Шахбазян, К.В. Шукурян, Ю.Г. Кибернетика Запропоновано ефективні алгоритми для розв’язання декількох задач входження трека-зразка в трек-об’єкт. Розглянуто задачі пошуку зразка в треку, пов’язані з задачею пошуку частих зразків в структурованих даних, та задачі обчислення числа вікон, що містять зразок. Efficient pattern matching algorithms for traces and their dependence graphs are proposed. Pattern matching problems related to problems of recognizing frequent patterns in structured data, counting the number of windows of trace-object where pattern is included are considered. 2010 Article Вхождения в моноидах треков / К.В. Шахбазян, Ю.Г. Шукурян // Кибернетика и системный анализ. — 2010. — № 4. — С. 31-38. — Бібліогр.: 14 назв. — рос. 0023-1274 http://dspace.nbuv.gov.ua/handle/123456789/45241 519.712 ru Кибернетика и системный анализ Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Кибернетика
Кибернетика
spellingShingle Кибернетика
Кибернетика
Шахбазян, К.В.
Шукурян, Ю.Г.
Вхождения в моноидах треков
Кибернетика и системный анализ
description Запропоновано ефективні алгоритми для розв’язання декількох задач входження трека-зразка в трек-об’єкт. Розглянуто задачі пошуку зразка в треку, пов’язані з задачею пошуку частих зразків в структурованих даних, та задачі обчислення числа вікон, що містять зразок.
format Article
author Шахбазян, К.В.
Шукурян, Ю.Г.
author_facet Шахбазян, К.В.
Шукурян, Ю.Г.
author_sort Шахбазян, К.В.
title Вхождения в моноидах треков
title_short Вхождения в моноидах треков
title_full Вхождения в моноидах треков
title_fullStr Вхождения в моноидах треков
title_full_unstemmed Вхождения в моноидах треков
title_sort вхождения в моноидах треков
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2010
topic_facet Кибернетика
url http://dspace.nbuv.gov.ua/handle/123456789/45241
citation_txt Вхождения в моноидах треков / К.В. Шахбазян, Ю.Г. Шукурян // Кибернетика и системный анализ. — 2010. — № 4. — С. 31-38. — Бібліогр.: 14 назв. — рос.
series Кибернетика и системный анализ
work_keys_str_mv AT šahbazânkv vhoždeniâvmonoidahtrekov
AT šukurânûg vhoždeniâvmonoidahtrekov
first_indexed 2025-07-04T03:55:22Z
last_indexed 2025-07-04T03:55:22Z
_version_ 1836687112606318592
fulltext ÓÄÊ 519.712 Ê.Â. ØÀÕÁÀÇßÍ, Þ.Ã. ØÓÊÓÐßÍ ÂÕÎÆÄÅÍÈß Â ÌÎÍÎÈÄÀÕ ÒÐÅÊΠÊëþ÷åâûå ñëîâà: ñðàâíåíèå ñ îáðàçöîì, ìîíîèä òðåêîâ, ãðàô çàâèñèìîñòè. ÂÂÅÄÅÍÈÅ Äëÿ äâóõ òðåêîâ òðåêà-îáúåêòà t è òðåêà-îáðàçöà p, ïðèíàäëåæàùèõ çàäàííîìó ñâîáîäíîìó ÷àñòè÷íî-êîììóòàòèâíîìó ìîíîèäó M D( , )� òðåêîâ, ñòàâÿòñÿ ñëåäó- þùèå çàäà÷è. • Îïðåäåëèòü, âõîäèò ëè òðåê-îáðàçåö p M D� ( , )� â òðåê-îáúåêò t M D� ( , )� . Òðåê p âõîäèò â òðåê t , åñëè ãðàô çàâèñèìîñòè p ìîæíî ïîëó÷èòü èç ãðàôà çàâèñèìîñòè t óäàëåíèåì íåêîòîðûõ âåðøèí è ïðèìûêàþùèõ ê íèì äóã. • Ïîäñ÷èòàòü äëÿ çàäàííîãî ñëîâà-ïðåäñòàâëåíèÿ y òðåêà t è öåëîãî ïîëîæè- òåëüíîãî w ÷èñëî w-òðåêîâûõ îêîí ñëîâà y , â êîòîðûå âõîäèò òðåê-îáðàçåö p . • Ïîäñ÷èòàòü ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ òðåêà-îáúåêòà t , â êîòîðûå âõî- äèò òðåê-îáðàçåö p . Ïðîáëåìà ñðàâíåíèÿ íåêîòîðîãî îáúåêòà (target) ñ îáðàçöîì (pattern) äëÿ ìàñ- ñèâîâ ñòðóêòóðèðîâàííûõ äàííûõ ïðèâëåêàåò áîëüøîå âíèìàíèå, è åå ðåøåíèå âàæíî äëÿ ðàçâèòèÿ ìåòîäîâ âñêðûòèÿ äàííûõ (date mining). Îäíèì èç íàèáîëåå îá- ùèõ ôîðìàëèçìîâ äëÿ ìîäåëèðîâàíèÿ ñòðóêòóðèðîâàííûõ äàííûõ ÿâëÿþòñÿ ãðàôû. Îäíàêî ïðè ðàññìîòðåíèè ãðàôîâ îáùåãî âèäà âîçíèêàþò ïðîáëåìû, ñâÿçàííûå ñ ýôôåêòèâíîñòüþ. Êàê ïðàâèëî, ïîäîáíûå çàäà÷è èìåþò î÷åâèäíûå ïåðåáîðíûå àë- ãîðèòìû è ïîýòîìó çäåñü ðå÷ü èäåò î íàõîæäåíèè ýôôåêòèâíûõ àëãîðèòìîâ. Ïðîáëåìà ñðàâíåíèÿ îáúåêòà ñ îáðàçöîì ñòàâèòñÿ îáû÷íî â îäíîé èç ñëåäóþ- ùèõ ïîñòàíîâîê: 1) íàéòè âõîæäåíèå îáðàçöà â îáúåêò — ìàññèâ äàííûõ — â âèäå ôàêòîðà ýòî- ãî ìàññèâà, ò.å. öåëèêîì, áåç ïðåðûâàíèé; 2) íàéòè âõîæäåíèå îáðàçöà â îáúåêò â âèäå ïîäïîñëåäîâàòåëüíîñòè, ò.å. ñ âîç- ìîæíûìè ïðåðûâàíèÿìè; 3) ïðè çàäàííîì ðàçìåðå îêíà — ôàêòîðà îáúåêòà — íàéòè âõîæäåíèÿ îáðàçöà â âèäå ïîäïîñëåäîâàòåëüíîñòåé, îãðàíè÷åííûõ âðåìåííûìè óñëîâèÿìè, ò.å. âõîæ- äåíèÿ â îêíà-ôàêòîðû çàäàííîãî ðàçìåðà; 4) ïîäñ÷èòàòü ÷èñëî îêîí, ñîäåðæàùèõ îáðàçåö. Ïîñëåäíÿÿ ïîñòàíîâêà òåñíî ñâÿçàíà ñ ïðîáëåìîé ÷àñòûõ ýïèçîäîâ (frequent episodes), ãäå ïîä ýïèçîäîì ïîíèìàåòñÿ âõîæäåíèå îáðàçöà âíóòðü îêíà, ò.å. âíóòðü çàäàííîãî èíòåðâàëà âðåìåíè. Ïðîáëåìû ñðàâíåíèÿ ñ îáðàçöîì â ñâîáîäíûõ ìîíîèäàõ (äëÿ ñëîâ) ðàçðàáàòû- âàëàñü ìíîãèìè àâòîðàìè. Øèðîêî èçâåñòåí àëãîðèòì Êíóòà, ðåøàþùèé çàäà÷ó ïî- èñêà îáðàçöà êàê ôàêòîðà. Ðàáîòû [1–7] ýôôåêòèâíî ðåøàþò çàäà÷è âõîæäåíèÿ ñëî- âà-îáðàçöà â îêíî ñëîâà-îáúåêòà â êà÷åñòâå ïîäïîñëåäîâàòåëüíîñòè — ïðè çàäàííîì ðàçìåðå îêíà. Çàäà÷è âõîæäåíèÿ, îòíîñÿùèåñÿ ê äåðåâüÿì, ðàññìàòðèâàëèñü â [7–10]. Çäåñü ïðåäëîæåíû ýôôåêòèâíûå àëãîðèòìû ðåøåíèÿ çàäà÷è î ÷àñòûõ ýïèçîäàõ ïðè ðàç- ëè÷íûõ ïîíÿòèÿõ îêíà â äåðåâüÿõ. Çàäà÷à âõîæäåíèÿ òðåêà-îáðàçöà â îáúåêò, êàê ôàêòîðà, â ìîíîèäàõ òðåêîâ ðàñ- ñìîòðåíà â [11], ãäå ïðåäëîæåí ëèíåéíûé àëãîðèòì åå ðåøåíèÿ. Ìîíîèäû òðåêîâ (êîíå÷íî-ïîðîæäåííûå ÷àñòè÷íî êîììóòàòèâíûå ìîíîè- äû) — ïðèçíàííûé èíñòðóìåíò äëÿ îïèñàíèÿ ñòðóêòóð ñîáûòèé â ïàðàëëåëüíûõ è ðàñïðåäåëåííûõ ñèñòåìàõ [13], à òàêæå èñïîëüçóþòñÿ ïðè èññëåäîâàíèè çàäà÷ òå- îðåòè÷åñêîãî ïðîãðàììèðîâàíèÿ [13, 14]. ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 31 © Ê.Â. Øàõáàçÿí, Þ.Ã. Øóêóðÿí, 2010 Äàííàÿ ðàáîòà ïðåäëàãàåò ýôôåêòèâíûå àëãîðèòìû äëÿ ðåøåíèÿ íåêîòîðûõ çà- äà÷ âõîæäåíèÿ è ïîäñ÷åòà îêîí â ìîíîèäàõ òðåêîâ. Îíà ñîñòîèò èç ÷åòûðåõ ÷àñòåé. Ïîñëå ïðåäâàðèòåëüíûõ ñâåäåíèé âî âòîðîé ÷àñòè ïðåäëàãàåòñÿ äâà àëãîðèòìà äëÿ ïðîáëåìû âõîæäåíèÿ, êîãäà îáðàçåö p è îñíîâíîé òðåê t ïðåäñòàâëåíû ñëîâàìè x p� è y t� . Ïåðâûé àëãîðèòì çàêëþ÷àåòñÿ â ïîñòðîåíèè àâòîìàòà ïî çàäàííîìó ñëîâó x p� . Ýòîò àâòîìàò ñêàíèðóåò ñëîâî y t� , äîïóñêàÿ ñëîâî y , åñëè t ñîäåðæèò òðåê p. Âòîðîé àëãîðèòì ïàðàëëåëüíî ñêàíèðóåò ñëîâà, ïðåäñòàâëÿþùèå òðåê-îáðà- çåö è òðåê-îáúåêò, ÷èòàÿ êàæäûé ñèìâîë x îäèí ðàç, íî òðàíñôîðìèðóÿ y è âîçâðàùàÿñü ê åãî íà÷àëó. Ñëîæíîñòü àëãîðèòìà — O t p( | | | | ) . Òðåòüÿ ÷àñòü ïðåäñòàâëÿåò àëãîðèòì, êî- òîðûé ïîäñ÷èòûâàåò ÷èñëî w-òðåê-îêîí çàäàííîãî ïðåäñòàâëåíèÿ-ñëîâà y òðåêà t , âêëþ÷à- þùèõ òðåê-îáðàçåö.  ïîñëåäíåé ÷àñòè îïèñàí àëãîðèòì, êîòîðûé ïîäñ÷èòûâàåò ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ t, âêëþ÷àþùèõ îáðàçåö p . ÏÐÅÄÂÀÐÈÒÅËÜÍÛÅ ÑÂÅÄÅÍÈß Â ýòîì ðàçäåëå ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è îáîçíà÷åíèÿ, ïîäðîáíåå ñì. [12]. Ïóñòü � — êîíå÷íûé àëôàâèò, D � �� � — ðåôëåêñèâíîå è ñèììåòðè÷íîå îò- íîøåíèå çàâèñèìîñòè, l D� �( ) \� � — îòíîøåíèå íåçàâèñèìîñòè è ïåðåñòàíîâî÷- íîñòè. Îòíîøåíèå I èíäóöèðóåò îòíîøåíèå ýêâèâàëåíòíîñòè � I íà � * . Äâà ñëîâà x y, * �� ýêâèâàëåíòíû îòíîñèòåëüíî � I , åñëè ñóùåñòâóåò ïîñëåäîâàòåëüíîñòü z zk1 , ,� ñëîâ òàêèõ, ÷òî x z� 1 , y zk� è äëÿ âñåõ i i k( )1 ñóùåñòâóþò ñëîâà �zi , ��zi è áóêâû ai , bi , óäîâëåòâîðÿþùèå óñëîâèÿì z z a b zi i i i i� � �� , z z b a zi i i i i� � � ��1 è ( , )a b Ii i � , ò.å. äâà ñëîâà ýêâèâàëåíòíû òîãäà è òîëüêî òîãäà, êîãäà îäíî ìîæåò áûòü ïîëó÷åíî èç äðóãîãî äîïóñòèìûìè ïåðåñòàíîâêàìè ñîñåäíèõ íåçàâèñèìûõ áóêâ. Òîãäà ìíîæåñòâî M D( , )� — òðåêîâûé ìîíîèä, åãî ýëåìåíòàìè ÿâëÿþòñÿ êëàññû ýêâèâàëåíòíûõ ñëîâ èç � * ïî îòíîøåíèþ � I , íàçûâàåìûå òðåêàìè. Íà òðå- êàõ îïðåäåëåíî óìíîæåíèå. Òðåê t îáîçíà÷àåòñÿ [ ]x äëÿ ëþáîãî ïðåäñòàâëÿþùåãî ñëîâà x t� . Äëèíà | |t òðåêà t åñòü äëèíà ëþáîãî åãî ïðåäñòàâëåíèÿ x t� . Äëÿ ëþáî- ãî x �� * ÷åðåç | |x îáîçíà÷àåì äëèíó x , à | |x a — ÷èñëî âõîæäåíèé áóêâû a â ñëîâî x . Èñïîëüçóåì äâà ïðåäñòàâëåíèÿ òðåêîâ: â âèäå ãðàôîâ çàâèñèìîñòè è íàáîðà ñëîâ. Ëþáîé òðåê t M D� ( , )� èìååò åäèíñòâåííîå ïðåäñòàâëåíèå â âèäå îòìå÷åí- íîãî íàïðàâëåííîãî àöèêëè÷åñêîãî ãðàôà Gt , îáîçíà÷àþùåãî ÷àñòè÷íûé ïîðÿäîê. Ãðàô Gt îïðåäåëÿåòñÿ ðåêóðñèâíî: Gt — ïóñòîé ãðàô, Gt a[ ] ïîëó÷àåòñÿ èç ãðàôà Gt äîáàâëåíèåì ê íåìó âåðøèíû, îòìå÷åííîé áóêâîé a è íîâûìè äóãàìè, âåäóùèìè ê ýòîé âåðøèíå èç âñåõ âåðøèí Gt , îòìå÷åííûõ ñèìâîëàìè, îò êîòîðûõ çàâèñèò áóêâà a . Ãðàô Gt íàçûâàåòñÿ ãðàôîì çàâèñèìîñòè òðåêà t . Ñ ãðàôîì Gt àññîöèèðî- âàíî ìíîæåñòâî ñëîâ, èíäóöèðóåìûõ âñåìè ïðè÷èííûìè ïîðÿäêàìè íà Gt . Ýòî ìíîæåñòâî ñëîâ ôîðìèðóåò òðåê t . Ðàññìîòðèì âòîðîå ïðåäñòàâëåíèå òðåêà — c ïîìîùüþ íàáîðà ñëîâ. Ïóñòü { , , }� �1 � m — ïîêðûòèå àëôàâèòà çàâèñèìîñòè (�, )D êëèêàìè, ò.å. ñåìåéñòâî ïîä- ìíîæåñòâ � òàêèõ, ÷òî � �i i m � � 1 � , � �i i D� � (i m� �1 2, , , ) ( , )a b D i� � : a b i, �� . Òîãäà òðåê t M D� ( , )� ìîæåò áûòü ïðåäñòàâëåí m-êîé ñëîâ � ( )t � � �{ ( ), , ( )}� �1 t tm , ãäå � i it( ) * �� , è � i t( ) — ïðîåêöèÿ ïðîèçâîëüíîãî ñëîâà y t� íà � * [12]. Ñ÷èòàåòñÿ, ÷òî äëÿ çàäàííûõ äâóõ òðåêîâ: p t M D, ( , )� � p åñòü ïðåôèêñ t , åñëè t pq� , ãäå q M D� ( , )� , Pref t( ) îáîçíà÷àåò ìíîæåñòâî ïðåôèêñîâ òðåêà t . Åñëè t pqr� , ãäå p q r M D, , ( , )� � , òî q íàçûâàåòñÿ ôàêòîðîì t . Çàìåòèì, ÷òî åñëè p Pref t� ( ) , òî ñóùåñòâóþò x, y �� * , t y� [ ] , p x� [ ] è x åñòü ïðåôèêñ ñëîâà y . 32 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 Ïóñòü òðåê t çàäàí ñâîèì ïðåäñòàâëåíèåì � ( )t . Òîãäà ëþáîé ïðåôèêñ s òðåêà t (îòíîñèòåëüíî � ( )t ) ìîæíî ïðåäñòàâèòü ìàññèâîì öåëûõ ÷èñåë s k km� � �( , , )1 �N m , èìåÿ ââèäó, ÷òî k si i� | ( ) |� , (i m� �1 2, , , ), è � i s( ) åñòü ïðåôèêñ äëèíû ki ñëîâà � i t( ) . Òàêèì îáðàçîì, ( , , , )0 0 0� � e ïðåäñòàâëÿåò ïóñòîé ïðåôèêñ e , â òî âðåìÿ êàê ïîëíûé òðåê t ïðåäñòàâëÿåòñÿ íàáîðîì t n n nm� �( , , , )1 2 , ãäå n ti i� | ( )|� [12]. Ãðàô ïðåôèêñîâ òðåêà t åñòü îðèåíòèðîâàííûé àöèêëè÷åñêèé ãðàô G V UPref t( ) ( , , )� � ñ ìíîæåñòâîì îòìå÷åííûõ äóã, ãäå V s s Pref t� �{ }/ ( ) , U — ìíîæåñòâî óïîðÿäî÷åííûõ ïàð ( , )s r , � — îòìå÷àþùàÿ ôóíêöèÿ äëÿ äóã è äóãà ( , )s r èìååò ìåòêó � (( , ))s r a� , a �� , åñëè s r Pref t, ( )� , s r a� [ ] , ãäå [ ]a — òðåê, ñîäåðæàùèé åäèíñòâåííîå îäíîáóêâåííîå ñëîâî a . Äëÿ ìîíîèäà M M D� ( , )� M-àâòîìàò A M Q q F� ( , , , , )� 0 ïðåäñòàâëÿåòñÿ êî- íå÷íûì ìíîæåñòâîì Q ñîñòîÿíèé, íà÷àëüíûì ñîñòîÿíèåì q Q0 � , ïîäìíîæåñòâîì F Q� çàêëþ÷èòåëüíûõ ñîñòîÿíèé, ôóíêöèåé ïåðåõîäîâ � èç Q M� â Q , óäîâëåòâî- ðÿþùèìè ñëåäóþùèì óñëîâèÿì: � � �q Q q e q: ( , )� (e — ïóñòîé òðåê), � �q Q , � � �t , t M D q t , t q t , t1 2 1 2 1 2( , ): ( , ) ( ( , ) )� � � � . Ìíîæåñòâî T M M D� � ( , )� , ðàñïîçíàâàåìîå àâòîìàòîì A, îïðåäåëÿåòñÿ ñëåäó- þùèì îáðàçîì: T t M q t F� � �{ }/ ( , )� 0 . Àâòîìàò Çåëåíêè (àñèíõðîííûé àâòîìàò îòíîñèòåëüío M) åñòü M-àâòîìàò A M Q q F� ( , , , , )� 0 , êîòîðûé óäîâëåòâîðÿåò ñëåäóþùèì äîïîëíèòåëüíûì óñëîâèÿì: 1) ñîñòîÿíèå Q åñòü ïðÿìîå ïðîèçâåäåíèå Q Qi i n � � � 1 ; 2) ñ êàæäûì a �� àññîöèèðîâàíî ìíîæåñòâî èíäåêñîâ K a i i n( ) / , , ,� � �{ { }}1 2 , òàêîå ÷òî K a K b( ) ( )� � � òîãäà è òîëüêî òîãäà, êîãäà ( , )a b I� ; 3) ôóíêöèÿ ïåðåõîäîâ � çàäàåòñÿ íàáîðîì îòîáðàæåíèé { }�a i K a i i K a i aQ Q: ( ) ( )� � �� � �� . Äàëåå ôèêñèðóåì ìîíîèä M M D� ( , )� , ïîêðûòèå êëèêàìè {� �1 , ,� m } àëôà- âèòà ( , )� D è öåëîå m — ÷èñëî êëèê â ïîêðûòèè. ÂÕÎÆÄÅÍÈÅ ÒÐÅÊÀ-ÎÁÐÀÇÖÀ  ÒÐÅÊ-ÎÁÚÅÊÒ Îïðåäåëèì ïîíÿòèå âõîæäåíèÿ òðåêîâ è èññëåäóåì çàäà÷ó âõîæäåíèÿ. Îïðåäåëåíèå 1. Òðåê p âõîäèò â òðåê t, åñëè äëÿ íåêîòîðûõ t p M Di i, ( , )� � , i n� �0 1, , , , ñïðàâåäëèâî t t p t t p tn n n� � �0 1 1 1 , (1) p p p pn� �1 2 . (2)  ýòîì ñëó÷àå ñ÷èòàåòñÿ, ÷òî t ñîäåðæèò p è çàïèñûâàåì p t� . Ïðåäñòàâëå- íèå (1) íàçûâàåì âõîæäåíèåì. Ïóñòü r — íåêîòîðûé ïðåôèêñ òðåêà t r Pref t: ( )� , R rt ( ) — ìíîæåñòâî ìåòîê äóã, âûõîäÿùèõ èç óçëà r â ãðàôå ïðåôèêñîâ G Pref t( ) . Ñëåäîâàòåëüíî, a R t s r a Pref tt� � �( ) [ ] ( ) . Ñ êàæäîé áóêâîé a �� ñâÿæåì ìíîæåñòâî èíäåêñîâ I ( ) ={a i m a i� �{ , ,... , }| }1 2 � òàêèõ, ÷òî ( , ) ( ) ( )a b I a b� � � �I I . Óòâåðæäåíèå 1. Ïóñòü òðåê t çàäàí ñâîèì ïðåäñòàâëåíèåì � � �( ) ( ) ( )t t tm� �{ }1 , ãäå � � �i i i nt t t i ( ) ( ) ( ), , * � � �1 � . 1.1. Åñëè r Pref t� ( ) , z �� * , òî s r z Pref t� �[ ] ( ) òîãäà è òîëüêî òîãäà, êîãäà ñóùåñòâóåò íàïðàâëåííûé ïóòü â G tPref ( ) èç r â s, êîòîðûé íåñåò ñëîâî z . Ïóòü â G tPref ( ) ìàêñèìàëüíûé òîãäà è òîëüêî òîãäà, êîãäà îí ñîîòâåòñòâóåò íåêîòîðîìó ñëîâó z t� . ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 33 1.2. Äëÿ ëþáîãî r Pref t� ( ) , åñëè r k km� �( , , )1 , ìíîæåñòâî R rt ( ) ìîæåò áûòü âû÷èñëåíî êàê R r a i a at i ki ( ) / ( ) ,� � � ��{ }I � 1 . 1.3. Äëÿ ëþáîãî r Pref t� ( ) è a R rt� ( ), åñëè r k ki m� �( , , ) , ïðåäñòàâëåíèå s r a k ki m� � � � �[ ] ( , , ) ìîæåò áûòü âû÷èñëåíî êàê k ki i� � , åñëè i a�I ( ) , k ki i� � � 1, åñëè i a�I ( ) , i m� �1 2, , , . 1.4. Äëÿ ëþáûõ r Pref t� ( ) è ( , )a b I� , ãäå a R rt� ( ) è s r a� [ ] , ñïðàâåäëèâî b R s b R tt t� �( ) ( ) , r a b r b a[ ][ ] [ ][ ]� . Äîêàçàòåëüñòâî ñëåäóåò èç îïðåäåëåíèÿ G Pref t( ) . Ïóñòü p t M D, ( , )� � . Ïîñòðîèì äâà M-àâòîìàòà, ðåøàþùèõ ïðîáëåìó âõîæ- äåíèÿ. Ïåðâûé àâòîìàò A p( ) îïðåäåëÿåòñÿ îáðàçöîì p è ðàñïîçíàåò òðåê-îáúåêò t M D� ( , )� òîãäà è òîëüêî òîãäà, êîãäà p âõîäèò â t . Âòîðîé àâòîìàò B t( ) îïðåäåëÿåòñÿ òðåêîì-îáúåêòîì t è ðàñïîçíàåò îáðàçåö p M D� ( , )� òîãäà è òîëüêî òîãäà, êîãäà p âõîäèò â t . Äîïóñòèì, ÷òî | | | |t p� � 1 è ÷òî òðåêè p è t çàäàíû ñâîèìè ñëîâàðíûìè ïðåä- ñòàâëåíèÿìè x p� , y t� . Óòâåðæäåíèå 2. Äëÿ ëþáîãî òðåêà p M D� ( , )� ñóùåñòâóåò äåòåðìèíèðîâàí- íûé àñèíõðîííûé àâòîìàò Çåëåíêè A p( ) , êîòîðûé ðàñïîçíàåò t M D� ( , )� òîãäà è òîëüêî òîãäà, êîãäà p t� . Äîêàçàòåëüñòâî. Äëÿ ïîñòðîåíèÿ M-àâòîìàòà A p( ) ðàññìîòðèì ãðàô ïðåôèêñîâ äëÿ p G p V p EPref: ( ) ( ( ), , )� � , ãäå V p s s Pref p( ) / ( )� �{ }. Äîáàâèì ê ìíîæåñòâó äóã E ìíîæåñòâî îòìå÷åííûõ ïåòåëü E s s s V p b R s bb t� � � � �{ }( , ) / ( ), ( ), � , ÷òîáû ïîëó÷èòü ãðàô G p� ( ) : G p V p E E� � � � �( ) ( ( ), , )� , � �� �(( , )) (( , ))s r s r , åñëè ( , )s r E� , � �� (( , ) )s s bb . Òîãäà A p M V p q e F p( ) ( , ( ), , , )� � �� 0 { } , ãäå � îïðåäåëÿåòñÿ äèàãðàììîé ïåðå- õîäîâ G p s a s a� �( ) : ( , ) [ ]� , åñëè a R st� ( ), è � ( , )s a s� , åñëè a R st� ( ) . Èç óòâåðæäåíèÿ 1.1 çàêëþ÷àåì, ÷òî àâòîìàò A p( ) ðåøàåò íàñòîÿùóþ çàäà÷ó. Çàìåòèì, ÷òî èç óòâåðæäåíèÿ 1.4 ñëåäóåò ÷òî äëÿ ëþáîãî s Pref p� ( ) ñïðàâåä- ëèâî sab sba� , åñëè ( , )a b I� . Ñëåäîâàòåëüíî, A p( ) — M-àâòîìàò. Î÷åâèäíî, ÷òî A p( ) ÿâëÿåòñÿ òàêæå àñèíõðîííûì àâòîìàòîì Çåëåíêè. Óòâåðæäåíèå 3. Ñóùåñòâóåò online àëãîðèòì äëÿ ðåøåíèÿ çàäà÷è âõîæäåíèÿ p t� ñî âðåìåííîé ñëîæíîñòüþ O m t( | | ) äëÿ ëþáûõ p t M D, ( , )� � , ïðåäñòàâëåí- íûõ ñëîâàìè x p� è y t� . Ïðîñòðàíñòâåííàÿ ñëîæíîñòü — O m p( | | ) . Àëãîðèòì 1 äëÿ çàäà÷è âõîæäåíèÿ Øàã 1. Îáðàáîòêà òðåêà p : online ñêàíèðîâàíèåì ñòðîèòñÿ ïðîåêöèÿ � ( )p . Ñîãëàñíî óòâåðæäåíèÿì 1.2 è 1.3 ýòîò øàã òðåáóåò âðåìåíè O p(| | ) . (Ïîñòðîåíèå àâòîìàòà A p( ) íå òðåáóåòñÿ.) Øàã 2. Îáðàáîòêà òðåêà t — ìîäåëèðîâàíèå ðàáîòû àâòîìàòà A p( ) íà ñëî- âå y . Ñêàíèðóÿ online ñëîâî y t� , àëãîðèòì ïðîõîäèò ïóòü íà ãðàôå G p� ( ) ñëåäóþ- ùèì îáðàçîì. Íà÷èíàÿ ñ ñîñòîÿíèÿ e � �( , , )0 0 , åñëè ñîñòîÿíèå s k k G pm� � � �( , , ) ( )1 äîñ- òèãíóòî è òåêóùàÿ áóêâà y åñòü a , òî èìåþòñÿ ñëåäóþùèå âîçìîæíîñòè: 1) s p� , òîãäà ÂÛÕÎÄ: p t� ; 2) a åñòü ïîñëåäíÿÿ áóêâà ñëîâà y è s a p[ ] � , òîãäà ÂÛÕÎÄ: p t� ; 3) a R sp� ( ) ; òîãäà ïåðåõîä ê ñëåäóþùåìó ñîñòîÿíèþ r s a� [ ] ; 4) a R sp� ( ) ; òîãäà ñëåäóþùåå ñîñòîÿíèå îñòàåòñÿ ïðåæíèì s . Êîíåö àëãîðèòìà 1. Ýòîò àëãîðèòì èñïîëüçóåòñÿ äàëåå äëÿ ïîñëåäóþùèõ àëãîðèòìîâ â ðàçä. 3, 4. Óòâåðæäåíèå 4. Ïóñòü p t M D, ( , )� � . 34 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 4.1. p t� òîãäà è òîëüêî òîãäà, êîãäà ãðàô çàâèñèìîñòè òðåêà-îáðàçöà Gp åñòü ïîäãðàô ãðàôà çàâèñèìîñòè òðåêà-îáúåêòà Gt . 4.2. p t� òîãäà è òîëüêî òîãäà, êîãäà äëÿ ëþáîãî ñëîâà y t� ñóùåñòâóåò ñëîâî x p� òàêîå, ÷òî x åñòü ïîäïîñëåäîâàòåëüíîñòü ñëîâà y . Äîêàçàòåëüñòâî. ßñíî, ÷òî 4.2 ñëåäóåò èç 4.1. Äîêàçàòåëüñòâî âûòåêàåò èç îïðåäåëåíèé. Çàìå÷àíèå. Èç ñïðàâåäëèâîñòè p t� íå ñëåäóåò, ÷òî äëÿ êàæäîãî ñëîâà x p� ñóùåñòâóåò ñëîâî y t� òàêîå, ÷òî x — ïîäïîñëåäîâàòåëüíîñòü y . Ýòî âèäíî èç ñëå- äóþùåãî ïðèìåðà. Ïðèìåð. Ðàññìîòðèì ìîíîèä M D( , )� , ãäå � � { }a b c, , , D a b b c� { }( , ), ( , ) . Ïóñòü t abc� [ ] . Òðåê t ñîñòîèò èç åäèíñòâåííîãî ñëîâà y abc� . Åñëè ïîëîæèòü p ac� [ ] , òî ca p� , îäíàêî ca íå ÿâëÿåòñÿ ïîäïîñëåäîâàòåëüíîñòüþ ñëîâà y . Ïóñòü s t M D, ( , )� � . Èç óòâåðæäåíèÿ 4.1 è îïðåäåëåíèÿ âõîæäåíèÿ s t� òîãäà è òîëüêî òîãäà, êîãäà äëÿ ëþáûõ ñëîâ x a a ss� � �1 | | , y b b tt� � �1 | | ñóùåñòâóåò âëîæåíèå èíäåêñíûõ ìíîæåñòâ �x y s tX X, : � . Çäåñü X ss � �{ }1, , | | , X tt � �{ }1, , | | òàêîå, ÷òî 1) �x y, ñîõðàíÿåò ìåòêó: a b ii x y � �( , ) ( ) ; 2) �x y, ñîõðàíÿåò ïîðÿäîê Gp : åñëè i jGp è ( , )a a Di j � , òo � �x y x yi j, ,( ) ( ) . (3) Òàêèå âëîæåíèÿ íàçûâàåì êîððåêòíûìè. Ïóñòü X — ïðîèçâîëüíîå ïîäìíîæåñòâî X t . Îáîçíà÷èì X k l X k l� � � { / : , è ( , )y y Dk l � } . Óòâåðæäåíèå 5. Ïóñòü s t M D, ( , )� � , x a a ss� � �1 | | , y b b tt� � �1 | | . Åñëè s t� , a �� , òî s a t[ ] � òîãäà è òîëüêî òîãäà, êîãäà � �i t b ai0 0 | | : , i X Xxy s xy s0 � �� �( ) ( ) . (4) Äîêàçàòåëüñòâî. Äîïóñòèì, s a t[ ] � . Ñîãëàñíî äîïóùåíèþ äëÿ ëþáîãî ñëîâà x a a aa a s aa j j s� � � ��1 1 | | [ ] , ãäå ïîñëåäíåå âõîæäåíèå áóêâû a âûäåëåíî è äëÿ ñëîâà y b b tt� � �1 | | ñóùåñòâóåò êîððåêòíîå âëîæåíèå � x y x ta aX X , : � , ãäå X s xa � � �{ }1 1, , | | . Âû÷åðêíåì ñèìâîë a èç ñëîâà xa . Î÷åâèäíî ðåçóëüòèðóþùåå ñëîâî x a a a a sj j s� � � �� �1 1 1| | è, ñëåäîâàòåëüíî, âëîæåíèå �x y s yX X, : � , ãäå � �x y x y i ia, , ( ) ( )� , åñëè i j , è � �x y x y i ia, , ( ) ( )� � 1 , åñëè i j� , êîððåêòíî. Ïîëîæèì i j x ya0 1� �� , ( ) . Äîïóñòèì i X Xx y s x y s0 � �� �, ,( ) ( ) . Òîãäà (3) íàðóøåíî. Îòñþäà ñëåäóåò êîððåêòíîñòü (4). Òåïåðü äîïóñòèì, ÷òî (4) âåðíî. Òîãäà ïîñòðîèì � x ya ñëåäóþùèì îáðàçîì: � � x y x ya i i( ) ( ),� , åñëè i i 0 , � x ya i i( ) � 0 , åñëè i i� 0 , � � x y x ya i i( ) ( ),� �1 , åñëè i i� 0 . Îòñþäà ñëåäóåò, ÷òî s a t[ ] � . Àëãîðèòì 2 äëÿ çàäà÷è âõîæäåíèÿ. Ñîãëàñíî óòâåðæäåíèþ 5 àëãîðèòì ñêà- íèðóåò ñëîâî x a a p� �1 | | , ÷èòàÿ êàæäûé ñèìâîë îäèí ðàç è ïðåîáðàçóåò ñëîâî y â ïîñëåäîâàòåëüíîñòü ñëîâ y y y y p� � �, , , | |1 . Íà i-ì øàãå (i p� �1 2, , , | |), êîãäà ÷è- òàåòñÿ ai , ñëîâî yi�1 ïðåîáðàçóåòñÿ ñëåäóþùèì îáðàçîì: åñëè y b bi n� � �1 1 , òî ñëåäóþùåå ñëîâî y b bi n� � � �1 ïîëó÷àåòñÿ èç yi�1 óäàëåíèåì áóêâ ìíîæåñòâà { / ( , ) }b b b Dj j i0 � , 1 0 j i , ãäå bi0 — ïåðâîå âõîæäåíèå áóêâû ai â ñëîâo yi�1 , ò.å. a bi i� 0 . ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 35 Âðåìåíí�ÿ ñëîæíîñòü àëãîðèòìà — O p t(| | | | ) , ïðîñòðàíñòâåííàÿ — O t p(| | | | )� . Óòâåðæäåíèå 6. Äëÿ ëþáîãî òðåêà t M D� ( , )� ñóùåñòâóåò äåòåðìèíèðîâàí- íûé àñèíõðîííûé àâòîìàò Çåëåíêè B t( ) , êîòîðûé ðàñïîçíàåò p M D� ( , )� òîãäà è òîëüêî òîãäà, êîãäà p t� . Äîêàçàòåëüñòâî. Äëÿ ïîñòðîåíèÿ M-àâòîìàòà B t( ) ðàññìîòðèì ãðàô çàâèñè- ìîñòè G V Et t t t� ( , , )� è ìíîæåñòâî âñåõ ïîäìíîæåñòâ ìíîæåñòâà Vt : W V V Vt t� � � �{ }/ . Êàæäîå ïîäìíîæåñòâî ïðåäñòàâëÿåò òðåê, âõîäÿùèé â t . Ïóñòü M-àâòîìàò B t M W q Ft( ) ( , , , , )� � 0 , ãäå q Vt0 � , F Wt� , ôóíêöèÿ ïåðå- õîäîâ îïðåäåëÿåòñÿ â ñîîòâåòñòâèè ñ óòâåðæäåíèåì 5 ñëåäóþùèì îáðàçîì: åñëè ñó- ùåñòâóåò v V� � òàêîå, ÷òî � ( )v a� , è åñëè v v v aGt � � � �� ( ) , òî � � �( , ) \ , ( ( ), ( )) }V a V v v v v DGt � � � � � �{ . Çäåñü G îçíà÷àåò îòíîøåíèå ïðåäøåñòâîâàíèÿ â Gt . Èç óòâåðæäåíèÿ 5 çà- êëþ÷àåì, ÷òî B t( ) ðåøàåò ïîñòàâëåííóþ çàäà÷ó. Î÷åâèäíî, ÷òî äëÿ ëþáîãî V V a b V b a� � � �: ( , [ ][ ]) ( , [ ][ ])� � , ò.å. B t( ) åñòü M-àâ- òîìàò. Ïî òåîðåìå Çåëåíêè ñóùåñòâóåò ñèíõðîííûé àâòîìàò, ðàñïîçíàþùèé p t� . ÏÎÄÑ×ÅÒ w-ÒÐÅÊÎÂÛÕ ÎÊÎÍ, ÑÎÄÅÐÆÀÙÈÕ ÎÁÐÀÇÅÖ Çàäà÷à. Äàíû äâà òðåêà: p t M D, ( , )� � , ïðåäñòàâëåííûõ ñëîâàìè x p� è y t� . Òðåáóåòñÿ ïîäñ÷èòàòü êîëè÷åñòâî w-òðåêîâûõ îêîí, ñîäåðæàùèõ òðåê-îáðàçåö p . Îïðåäåëåíèå 2. Ïóñòü ñëîâî y b bn� � �1 � * . Òîãäà w-îêíî ðàçìåðà w íà ñëî- âå y åñòü ïîäñëîâî b bi i w� �1 ... äëèíû w . Òðåê [ ... ]b bi i w� �1 íàçûâàåòñÿ w-òðåêîâûì îêíîì ðàçìåðà w íà ñëîâå y . Î÷åâèäíî, ÷òî ÷èñëî w-îêîí, ñîäåðæàùèõ p , ìîæåò áûòü ðàçëè÷íûì äëÿ ñëîâ y y t, � � , åñëè y y� � . Øòàìïîâàííûé ïðåôèêñ òðåêà p M D� ( , )� åñòü óïîðÿäî÷åííàÿ ïàðà ( , )r n , ãäå r Pref p� ( ) , n N� . Êîíôèãóðàöèÿ åñòü ïîñëåäîâàòåëüíîñòü øòàìïîâàííûõ ïðåôèêñîâ äàííîãî òðåêà. Óòâåðæäåíèå 7. Ñóùåñòâóåò àëãîðèòì ïîäñ÷åòà êîëè÷åñòâà w-òðåêîâûõ îêîí ñëîâà y t� , ñîäåðæàùèõ òðåê p . Âðåìåííaÿ� ñëîæíîñòü àëãîðèòìà — O mw t( | | ) , ïðîñòðàíñòâåííàÿ — O w p(| | | | ) . Èäåÿ àëãîðèòìà. Ñêàíèðóÿ y b bn� � �1 � * , àëãîðèòì ñòðîèò êîíôèãóðàöèè Ci äëÿ êàæäîé áóêâû bi ñëîâà y . Øòàìïîâàííûé ïðåôèêñ ( , )r u ( ( ))r Pref p� âõî- äèò â êîíôèãóðàöèþ Ci òîãäà è òîëüêî òîãäà, êîãäà òðåêîâîå îêíî, ò.å. òðåê [ ]b bi u i� � �1 äëèíû u w ñîäåðæèò ïðåôèêñ r . Ïî çàäàííûì Ci è bi�1 âîçìîæíî ïîäñ÷èòàòü Ci�1 . Åñëè Ci ñîäåðæèò øòàìïîâàííûé ïðåôèêñ ( , )p u , ãäå u w , òî w-òðåêîâîå îêíî [ ]b bi w i� � �1 ñîäåðæèò p . Àëãîðèòì ïîäñ÷åòà w-òðåêîâûõ îêîí Ïóñòü p t M D, ( , )� � . ÂÕÎÄ — äâà ñëîâà: x p� , y t� . ÂÛÕÎÄ — counter (÷èñëî w-òðåêîâûõ îêîí y , ñîäåðæàùèõ [ ]x ) Øàã 1. Ïðåäîáðàáîòêà p x� [ ] — âû÷èñëåíèå � ( )p . Èíèöèàëèçàöèÿ: counter :� 0 ; C e0 0: (( , ))� . Øàã 2. Îáðàáîòêà òðåêà t. for i t� �1, , | | do a bi:� ; C ei : (( , ))� 0 (èíèöèàëèçàöèÿ è âû÷èñëåíèå Ci ) for all ( , )r u Ci� �1 do if r a p[ ] � and u w� � 1 then counter counter:� � 1 (w-òðåêîâîå îêíî ñîäåðæèò p) end if; if a R rp� ( ) , u w � 1, then äîáàâèòü øòàìïîâàííûé 36 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 ïðåôèêñ ( [ ], )r a u � 1 ê Ci , ò.ê. y yi u i� � �1 ìîæåò áûòü íà÷àëîì òðåáóåìîãî w-òðåêîâîãî îêíà è ïîäñëîâî y yi u i� � �1 äîëæíî áûòü ïåðåäàíî â Ci�1 end if; if a R rp� ( ) , u w � 1 then äîáàâèòü ( , )r u � 1 ê Ci�1 ; end do end for all if a R ep� ( ) then äîáàâèòü ( , )a 1 ê Ci (ñîçäàòü íà÷àëî íîâîãî îêíà) end if end do end for. ÂÛÕÎÄ: counter Êîíåö àëãîðèòìà. ÏÎÄÑ×ÅÒ ×ÈÑËÀ ÌÈÍÈÌÀËÜÍÛÕ ÔÀÊÒÎÐΠÎÁÚÅÊÒÀ, ÑÎÄÅÐÆÀÙÈÕ ÎÁÐÀÇÅÖ Ïóñòü (1) è (2) âåðíû, ò.å. p t� . Ôàêòîð f p t t pn n� � �1 1 1 òðåêà t , ñîäåðæàùèé p , íàçûâàåòñÿ ìèíèìàëüíûì, åñëè êàæäûé ñîáñòâåííûé ôàêòîð òðåêà f íå ñîäåðæèò p . Çàäà÷à. Äàíû äâà òðåêà: p t M D, ( , )� � , ïðåäñòàâëåííûõ ñëîâàìè x p� è y t� . Ïîäñ÷èòàòü ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ òðåêà t , ñîäåðæàùèõ òðåê p . Óòâåðæäåíèå 8. Ñóùåñòâóåò àëãîðèòì ïîäñ÷åòà ÷èñëà ìèíèìàëüíûõ ôàêòîðîâ òðåêà t , ñîäåðæàùèõ òðåê p . Âðåìåíía'ÿ ñëîæíîñòü àëãîðèòìà åñòü O m t( | | )2 , ïðî- ñòðàíñòâåííàÿ ñëîæíîñòü — O m t( | | ) . Èäåÿ àëãîðèòìà. Ïóñòü t qrs� è q r s p M D, , , ( , )� � è r — ìèíèìàëüíûé ôàê- òîð òðåêà-îáúåêòà t , ñîäåðæàùèé òðåê-îáðàçåö p . Òîãäà äëÿ êàæäîãî ñëîâà y b b tt� � �1 | | ñóùåñòâóåò òðåêîâîå îêíî (áåç îãðàíè÷åíèÿ íà äëèíó) [ ]b bk i� òà- êîå, ÷òî p r b bk i� � �[ ] . Î÷åâèäíî, ÷òî ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ òðåêà t , åñëè t y� [ ] , ðàâíî ÷èñëó òàêèõ ïîäñëîâ ñëîâà y , ñîáñòâåííûå òðåê-ïîäñëîâà êîòîðûõ íå ñîäåðæàò p . Òàêèì îá- ðàçîì, íóæíî íàéòè è ïîäñ÷èòàòü êîëè÷åñòâî òàêèõ ìèíèìàëüíûõ ïîäñëîâ. Ñêàíèðóÿ ñëîâî y , àëãîðèòì àññîöèèðóåò ñ êàæäîé áóêâîé bi ñëîâà y êîíôèãóðàöèþ C r ri l� �( , , )1 , r Pref pk � ( ) , k l� �1, , , ò.å. ïîñëåäîâàòåëüíîñòü ïðåôèêñîâ p M D� ( , )� (íå øòàìïîâàííûõ, êàê â ïðåäûäóùåé ñåêöèè) òàêèõ, ÷òî r b bk v ik � �[ ] è v v il1 � . Äîïóñòèì, ÷òî äëÿ íåêîòîðîãî j l� �{ }1, , ñïðàâåäëèâî p r p r p r p rj j l� � � �� � ���1 1, , , , , 1 j l . (5) Òîãäà âñå [ ]b bv ik � äëÿ k j ñîäåðæàò îäèíàêîâûé ìèíèìàëüíûé òðåê-ôàêòîð òðåêà t , òðåê-ôàêòîð y , ñîäåðæàùèé ìèíèìàëüíûé òðåê-ôàêòîð t íàéäåí è ñ÷åò- ÷èê äîëæåí áûòü óâåëè÷åí íà 1. Ïðè ýòîì âîçìîæíî ðàññìàòðèâàòü òîëüêî òðå- êîâûå îêíà ñ [ ]b bk l� ñ b R ek p� ( ) . Êîíôèãóðàöèÿ Ci�1 äëÿ j , óäîâëåòâîðÿþùàÿ (5), ñòðîèòñÿ ñëåäóþùèì îáðàçîì: If C r ri l� �( , , )1 and b ai� �1 , put s r ak j k� � [ ] if s r a Pref pk j k� �� [ ] ( ) and s rk j k� � if r a Pref pj k� �[ ] ( ) for k l j� � �1, , . Then C s si i j� �� �1 1( , , ) if a R ep� ( ) , j l , C s s ai i j� �� �1 1( , , , [ ]) if a R ep� ( ) , j l , C ei� �1 { } if j l� , a R ep� ( ) , C ai� �1 { }[ ] if j l� , a R ep� ( ) , ãäå e — ïóñòîé òðåê. Ñêàíèðóÿ ñëîâî y, ìîæíî ïîäñ÷èòàòü ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ. ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4 37 Çàìå÷àíèå. Àëãîðèòì ïîäñ÷èòûâàåò òîëüêî ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ, íî íå ñàìè ìèíèìàëüíûå ôàêòîðû. Äëÿ òîãî ÷òîáû ïîëó÷èòü ìèíèìàëüíûå ôàêòîðû t , íåîáõîäèìî äîïîëíèòü àëãîðèòì ïðîöåäóðîé óäàëåíèÿ èç ìèíèìàëüíûõ ïîäñëîâ ëèøíèõ áóêâ. Ýòî óâåëè÷èò ñëîæíîñòü äî O m t( | | )3 . Àëãîðèòì âû÷èñëåíèÿ ìèíèìàëüíûõ ôàêòîðîâ ÂÕÎÄ: äâà ñëîâà: x p� , y t� . ÂÛÕÎÄ: counter — ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ òðåêà t , ñîäåðæàùèõ òðåê p . Øàã 1. Ïðåäîáðàáîòêà [ ]x : âû÷èñëåíèå � ( )p . Øàã 2. Èíèöèàëèçàöèÿ C e0 � ( ) ; counter:� 0 ; for i t� �1, , | | (äëÿ êàæäîé áóêâû ñëîâà y b b t� �1 | | — ïîñòðîåíèå Ci�1 .) � :� 0 ; Ci� � �1 : ; a bi:� �1 ; (èíèöèàëèçàöèÿ) for all s Ci� do if p s a� [ ] then � :� 1 (ìèíèìàëüíûé ôàêòîð íàéäåí) else if s a Pref p[ ] ( )� then add s a[ ] to Ci�1 else add s to Ci�1 end if end if end do end for all if a R ep� ( ) then add [ ]a to Ci�1 else if Ci� � �1 then add e to Ci�1 end if end if counter counter:� � � end for Êîíåö àëãîðèòìà. Ñëîæíîñòü: ÷èñëî ïðåôèêñîâ â Ci îãðàíè÷åíî | |t -äëèíîé ñëîâà y . Ñëåäîâà- òåëüíî, ñëîæíîñòü àëãîðèòìà O m t( | | )2 . ÇÀÊËÞ×ÅÍÈÅ Â íàñòîÿùåé ñòàòüå ïðèâîäÿòñÿ àëãîðèòìû ðåøåíèÿ ñëåäóþùèõ çàäà÷: ðåøèòü, âõîäèò ëè p M D� ( , )� â t M D� ( , )� ; ïîäñ÷èòàòü ÷èñëî w-òðåêîâûõ îêîí y t� , êîòîðûå ñîäåðæàò îáðàçåö p ; ïîäñ÷èòàòü ÷èñëî ìèíèìàëüíûõ ôàêòîðîâ òðåêà t , êîòîðûå ñîäåðæàò îáðàçåö p . ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ 1. C h i Y . , W a n g H . , Y u P . S . , M u n t z R . R . Catch the moment: maintaining closed frequent itemsets over a date stream sliding window // Knowledge and Inform. Systems. — 2006. — 10, N 3. — P. 265–294. 2. L i H - F . , S h a n M - K . , L e e S - Y . DSM-FI: an efficient algorithm for mining frequent itemsets in data streams // Ibid. — 2008. — 17, N 1. 3. B a C . , F e r r a r i M . H . , M u s i c a n t e M . A . Composing Web Services with PEWS : a trace-theoretical approach // 4-th Europ. Conf. on WEB Services. — 2006. 4. M a n n i l a H . , T o i v o n e n H . , V e r k a m o A . Discovering Frequent Episodes in Sequences // Proc. KDD Conf.— 1955. 5. A v e l l o n e A . , G o l d w u r m M . Analysis of algorithms for the recgnition of rational ànd context-free trace languages // Theoretical Inform. and Appl. — 1998. — 32. — P. 141–152. 6. C h i Y . , M u n t z R . , N i j s s e n S . , K o k J . Frequent Subtree Mining. — An Overview // Fundamentà Inform. — 2001. — 21. — P. 161–198. 7. C r o c h e m o r e M . , I l i e L . Maximal repetitions in strings // J. of Comput. and System. Scie. — 2008. — 74. — P. 796–807. 8. B o a s s o n L . , C e g i e l s k i P . , G u e s s a r i a n I . , M a t i y a s e v i c h Y . Window-Accumulated Subsequence Problem is linear // Annals of Pure and Appl. Logic. — 2001. — 113. — P. 74–87. 9. C e g i e l s k i P . , G u e s s a r i a n I . , M a t i y a s e v i c h Y . Tree Inclusion Problems // RAIRO — Theoreti- cal Inform. and Appl. — 2008. — 42. — P. 5–20. 10. G u e s s a r i a n I . , C e g i e l s k i P . Tree Inclusions in Windows and Slices // CSIT Conf. — 2000. 11. M e s s n e r J . Pattern Matching in Trace Monoids // Symposium on Theoretical Aspects of Comput. Scie. — 1997. 12. D i k e r t V . , R o z e n b e r g G . The Book of Traces // Handbook of formal languages. — N.Y.: Springer-Verlag, 1997. — 568 p. 13. L e t i c h e v s k y A . A . On the equivalence of automata over semigroup // Theoretic Cybernetics. — 1970. — 6. — P. 3–71 (in Russian). 14. S h a k h b a z y a n K . V . , S h o u k o u r i a n Y u . H . On process languages in finite graphs // J. of Mathemat. Scie. — 2000. — 101, 4. — P. 205–215. Ïîñòóïèëà 19.05.2009 38 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2010, ¹ 4