Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги
Описан подход к решению проблемы перевода с вербального на жестовый язык глухих людей. Для обеспечения перевода построены обобщенные грамматические конструкции на основе корпуса предложений, используемых людьми с недостатками слуха при обычном общении. Рассмотрены практическая реализация инфологичес...
Збережено в:
Дата: | 2014 |
---|---|
Автори: | , , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2014
|
Назва видання: | Кибернетика и системный анализ |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/115769 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги / Ю.В. Крак, А.В. Бармак, С.А. Романишин // Кибернетика и системный анализ. — 2014. — Т. 50, № 1. — С. 130-138. — Бібліогр.: 14 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-115769 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1157692017-04-13T03:02:39Z Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги Крак, Ю.В. Бармак, А.В. Романишин, С.А. Программно-технические комплексы Описан подход к решению проблемы перевода с вербального на жестовый язык глухих людей. Для обеспечения перевода построены обобщенные грамматические конструкции на основе корпуса предложений, используемых людьми с недостатками слуха при обычном общении. Рассмотрены практическая реализация инфологических моделей для словарей флективного и жестового языков для работы с данными конструкциями и алгоритм перевода. Получено экспериментальное подтверждение эффективности предложенного подхода на базе украинского языка. Описано підхід до розв’язання проблеми перекладу з вербальної на жестову мову глухих людей. Для забезпечення перекладу побудовано узагальнені граматичні конструкції на основі корпусу речень, що використовуються людьми з вадами слуху при звичайному спілкуванні. Розглянуто практичну реалізацію інфологічних моделей для словників флективної та жестової мов для роботи з даними конструкціями та алгоритм перекладу. Експериментально підтверджено ефективність запропонованого підходу на базі української мови. An approach to solving the problem of translation of verbal languages to sign languages is described. Generalized grammatical constructions are built based on sentence corpus used by deaf people in regular communication. Practical realization of infological models of inflected and sign languages is described. A translation algorithm is developed. The experimental confirmation of the approach is described based on the Ukrainian language. 2014 Article Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги / Ю.В. Крак, А.В. Бармак, С.А. Романишин // Кибернетика и системный анализ. — 2014. — Т. 50, № 1. — С. 130-138. — Бібліогр.: 14 назв. — рос. http://dspace.nbuv.gov.ua/handle/123456789/115769 004.9 ru Кибернетика и системный анализ Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Программно-технические комплексы Программно-технические комплексы |
spellingShingle |
Программно-технические комплексы Программно-технические комплексы Крак, Ю.В. Бармак, А.В. Романишин, С.А. Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги Кибернетика и системный анализ |
description |
Описан подход к решению проблемы перевода с вербального на жестовый язык глухих людей. Для обеспечения перевода построены обобщенные грамматические конструкции на основе корпуса предложений, используемых людьми с недостатками слуха при обычном общении. Рассмотрены практическая реализация инфологических моделей для словарей флективного и жестового языков для работы с данными конструкциями и алгоритм перевода. Получено экспериментальное подтверждение эффективности предложенного подхода на базе украинского языка. |
format |
Article |
author |
Крак, Ю.В. Бармак, А.В. Романишин, С.А. |
author_facet |
Крак, Ю.В. Бармак, А.В. Романишин, С.А. |
author_sort |
Крак, Ю.В. |
title |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
title_short |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
title_full |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
title_fullStr |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
title_full_unstemmed |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
title_sort |
метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2014 |
topic_facet |
Программно-технические комплексы |
url |
http://dspace.nbuv.gov.ua/handle/123456789/115769 |
citation_txt |
Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги / Ю.В. Крак, А.В. Бармак, С.А. Романишин // Кибернетика и системный анализ. — 2014. — Т. 50, № 1. — С. 130-138. — Бібліогр.: 14 назв. — рос. |
series |
Кибернетика и системный анализ |
work_keys_str_mv |
AT krakûv metodobobŝennyhgrammatičeskihkonstrukcijdlâavtomatizirovannogoperevodatekstovojinformaciivžestovyeanalogi AT barmakav metodobobŝennyhgrammatičeskihkonstrukcijdlâavtomatizirovannogoperevodatekstovojinformaciivžestovyeanalogi AT romanišinsa metodobobŝennyhgrammatičeskihkonstrukcijdlâavtomatizirovannogoperevodatekstovojinformaciivžestovyeanalogi |
first_indexed |
2025-07-08T09:20:30Z |
last_indexed |
2025-07-08T09:20:30Z |
_version_ |
1837069952688848896 |
fulltext |
ÓÄÊ 004.9
Þ.Â. ÊÐÀÊ, À.Â. ÁÀÐÌÀÊ, Ñ.À. ÐÎÌÀÍÈØÈÍ
ÌÅÒÎÄ ÎÁÎÁÙÅÍÍÛÕ ÃÐÀÌÌÀÒÈ×ÅÑÊÈÕ ÊÎÍÑÒÐÓÊÖÈÉ
ÄËß ÀÂÒÎÌÀÒÈÇÈÐÎÂÀÍÍÎÃÎ ÏÅÐÅÂÎÄÀ ÒÅÊÑÒÎÂÎÉ
ÈÍÔÎÐÌÀÖÈÈ Â ÆÅÑÒÎÂÛÅ ÀÍÀËÎÃÈ
Àííîòàöèÿ. Îïèñàí ïîäõîä ê ðåøåíèþ ïðîáëåìû ïåðåâîäà ñ âåðáàëüíîãî íà æåñòîâûé
ÿçûê ãëóõèõ ëþäåé. Äëÿ îáåñïå÷åíèÿ ïåðåâîäà ïîñòðîåíû îáîáùåííûå ãðàììàòè÷åñêèå
êîíñòðóêöèè íà îñíîâå êîðïóñà ïðåäëîæåíèé, èñïîëüçóåìûõ ëþäüìè ñ íåäîñòàòêàìè ñëó-
õà ïðè îáû÷íîì îáùåíèè. Ðàññìîòðåíû ïðàêòè÷åñêàÿ ðåàëèçàöèÿ èíôîëîãè÷åñêèõ ìîäå-
ëåé äëÿ ñëîâàðåé ôëåêòèâíîãî è æåñòîâîãî ÿçûêîâ äëÿ ðàáîòû ñ äàííûìè êîíñòðóêöèÿìè
è àëãîðèòì ïåðåâîäà. Ïîëó÷åíî ýêñïåðèìåíòàëüíîå ïîäòâåðæäåíèå ýôôåêòèâíîñòè ïðåä-
ëîæåííîãî ïîäõîäà íà áàçå óêðàèíñêîãî ÿçûêà.
Êëþ÷åâûå ñëîâà: àâòîìàòèçèðîâàííûé ïåðåâîä, òåêñò, æåñòîâûé ÿçûê, èíôîëîãè÷åñêàÿ ìîäåëü.
ÂÂÅÄÅÍÈÅ
 íàñòîÿùåé ðàáîòå ðàññìàòðèâàåòñÿ æåñòîâûé ÿçûê (Æß) — åñòåñòâåííûé
ÿçûê, ïåðåäàþùèé èíôîðìàöèþ ñ ïîìîùüþ äâèæåíèÿ ðóê è ïàëüöåâ, âûðàæå-
íèÿ ëèöà, ïîëîæåíèÿ òóëîâèùà ÷åëîâåêà. Ýòîò ÿçûê èñïîëüçóåòñÿ êàê ñîñòàâ-
íàÿ ÷àñòü äëÿ îáùåíèÿ è ñëóæèò îñíîâíûì êîììóíèêàöèîííûì ñðåäñòâîì äëÿ
130 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1
© Þ.Â. Êðàê, À.Â. Áàðìàê, Ñ.À. Ðîìàíèøèí, 2014
ãëóõèõ ëþäåé [1, 2]. Æåñòîâûå ÿçûêè íå ÿâëÿþòñÿ âèçóàëüíîé èíòåðïðåòàöèåé
îáû÷íûõ ÿçûêîâ, îíè îáëàäàþò ñâîåé ãðàììàòèêîé, ìîãóò èñïîëüçîâàòüñÿ äëÿ
îáñóæäåíèÿ ðàçëè÷íûõ òåì: îò ïðîñòûõ è êîíêðåòíûõ — äî âîçâûøåííûõ
èëè àáñòðàêòíûõ. Ëåêñèêà ðàçãîâîðíîãî Æß åùå íåäîñòàòî÷íî èçó÷åíà, îñî-
áåííî èäèîìàòèêà, ôðàçåîëîãèÿ, ìîðôîëîãèÿ. Àâòîìàòè÷åñêîå ïðèïèñûâàíèå
ðàçãîâîðíîãî Æß âñåì ôîðìàì ñëîâåñíîé è ïèñüìåííîé ðå÷è íåêîððåêòíî. Ðàç-
ãîâîðíûé Æß ãëóõèõ ëþäåé íåâîçìîæíî ðàññìàòðèâàòü â òðàäèöèîííûõ ìîäå-
ëÿõ ëèíãâèñòèêè. Äëÿ èçó÷åíèÿ ìîðôîëîãèè ðàçãîâîðíîé æåñòîâîé ðå÷è áîëåå
ïîäõîäèò îïèñàíèå ïî ïðèíöèïó: îò çíà÷åíèÿ — ê ôîðìå.  ñèëó ýòîãî ïðîáëå-
ìû, âîçíèêàþùèå ïðè ïîñòðîåíèè ñèñòåì àâòîìàòèçèðîâàííîãî ïåðåâîäà ïðîèç-
âîëüíîãî òåêñòà â Æß, çàêëþ÷àþòñÿ â íàõîæäåíèè âçàèìîîäíîçíà÷íûõ ïàð êîí-
ñòðóêöèé, êîòîðûå ïåðåäàþò ñìûñë èíôîðìàöèè. Àâòîìàòèçèðîâàííûé ïåðå-
âîä [3] îòëè÷àåòñÿ îò ìàøèííîãî [4, 5] òåì, ÷òî ïðåäïîëàãàåò ñëåäóþùèå
ôîðìû âçàèìîäåéñòâèÿ ñ ïîëüçîâàòåëåì: ÷àñòè÷íî àâòîìàòèçèðîâàííûé ïåðå-
âîä (èñïîëüçîâàíèå ÷åëîâåêîì-ïåðåâîä÷èêîì êîìïüþòåðíûõ ñëîâàðåé); ñèñòå-
ìû ñ ðàçäåëåíèåì òðóäà, â êîòîðûõ êîìïüþòåð îáó÷åí ïåðåâîäèòü òîëüêî æåñ-
òêî ñòðóêòóðèðîâàííûå ôðàçû (áåç ïîñëåäóþùèõ ïîïðàâîê), à ïåðåâîä ôðàçû
ñ äðóãîé ñòðóêòóðîé âûïîëíÿåò ÷åëîâåê.
Ðàññìîòðèì ñèíòàêñè÷åñêèå îñîáåííîñòè Æß íà ïðèìåðå òðåõ òèïîâûõ
ñòðóêòóð ïðåäëîæåíèé: ñóáúåêò–îáúåêò–ãëàãîë; ñóáúåêò–ãëàãîë–îáúåêò; ãëà-
ãîë–ñóáúåêò–îáúåêò. Ïîäëåæàùåå è ñêàçóåìîå â òàêèõ ïðåäëîæåíèÿõ ñâÿçàíû
ïðåäèêàòèâíî. Ïðåäëîæåíèÿ ñ îäíîé ïðåäèêàòèâíîé ñâÿçüþ íàçîâåì ïðîñòûìè
ïðåäëîæåíèÿìè. Îòìåòèì, ÷òî ïîðÿäîê ñëîâ â ïðåäëîæåíèÿõ ñ îäíîé ïðåäèêà-
òèâíîé ñâÿçüþ â áîëüøèíñòâå ðàçãîâîðíûõ ÿçûêîâ ìèðà îïèñûâàåòñÿ îäíîé èç
òðåõ óêàçàííûõ òèïîâûõ ñòðóêòóð [6]. Â Æß ïðîñòûå ïðåäëîæåíèÿ ñëóæàò
îñíîâíûì ñïîñîáîì êîììóíèêàöèè è äåëÿòñÿ íà ïîâåñòâîâàòåëüíûå, âîïðîñè-
òåëüíûå è ïîáóäèòåëüíûå [7].
Äëÿ ðåàëèçàöèè àâòîìàòèçèðîâàííîãî ïåðåâîäà èñõîäíîé òåêñòîâîé èíôîð-
ìàöèè â Æß ïðåäïîëîæèì, ÷òî âîçìîæíû ñëåäóþùèå ïàðû: ïðåäëîæåíèå íà èñ-
õîäíîì ÿçûêå — àíàëîã íà Æß â âèäå íåêîòîðûõ îáîáùåííûõ êîíñòðóêöèé, ïî-
ñòðîåííûõ, â ÷àñòíîñòè, íà ïðîñòûõ ïðåäëîæåíèÿõ. Åñëè ïðîàíàëèçèðîâàòü íàáî-
ðû ïàð, òî ìîæíî, çàôèêñèðîâàâ ïîðÿäîê ñëåäîâàíèÿ ñëîâ â ïðåäëîæåíèè,
ïîëó÷èòü íåêîòîðóþ îáîáùåííóþ ôîðìó, êîãäà âìåñòî êîíêðåòíûõ ñëîâ â ïðåä-
ëîæåíèè âûïèñàíû íàáîðû ñëîâ, êîòîðûå ìîãóò èñïîëüçîâàòüñÿ (íàõîäèòüñÿ) íà
çàôèêñèðîâàííûõ ìåñòàõ.  ðåçóëüòàòå áóäåò ñôîðìèðîâàí äîñòàòî÷íî íåáîëü-
øîé (îòíîñèòåëüíî îáùåãî êîëè÷åñòâà ïðåäëîæåíèé íåêîòîðîãî ÿçûêà) ñïèñîê
îáîáùåííûõ ãðàììàòè÷åñêèõ êîíñòðóêöèé äëÿ ïåðåâîäà. Òàêèå ãðàììàòè÷åñêèå
êîíñòðóêöèè â äàëüíåéøåì ìîãóò èñïîëüçîâàòüñÿ êàê øàáëîíû è ïðàâèëà â ñèñ-
òåìàõ ìàøèííîãî ïåðåâîäà íà Æß [8–10].
Íå îãðàíè÷èâàÿ îáùíîñòè, ïîêàæåì âîçìîæíîñòè òàêîãî ïîäõîäà íà ðåàëèçà-
öèè ñèñòåìû ïåðåâîäà íà Æß äëÿ ôëåêòèâíûõ ÿçûêîâ, â ÷àñòíîñòè óêðàèíñêîãî.
ÏÎÑÒÀÍÎÂÊÀ ÇÀÄÀ×È
Ñôîðìóëèðóåì çàäà÷ó: ðàçðàáîòàòü è ðåàëèçîâàòü ñèñòåìó àâòîìàòèçèðîâàííî-
ãî ïåðåâîäà ïðåäëîæåíèé íà óêðàèíñêîì ÿçûêå íà ñîîòâåòñòâóþùèå êîíñòðóê-
öèè-ïðåäëîæåíèÿ óêðàèíñêîãî Æß.
Ïðåäëàãàåòñÿ ðåøåíèå ïîñòàâëåííîé çàäà÷è ñî ñëåäóþùèìè îãðàíè÷åíèÿìè:
1) ó÷èòûâàþòñÿ òîëüêî ïðîñòûå ïðåäëîæåíèÿ;
2) ñìûñë Æß îãðàíè÷èâàåòñÿ ôèêñèðîâàííûì ïåðå÷íåì òåì è ñèòóàöèé;
3) ñèñòåìà ïåðåâîäèò (áåç ïîñëåäóþùèõ ïîïðàâîê) òîëüêî îáó÷åííûå, æåñ-
òêî çàäàííûå ñòðóêòóðû ôðàç è ïðåäëîæåíèé è íå èñêàæàåò ñìûñëà;
4) ïîñòîÿííîå ðàñøèðåíèå (îáó÷åíèå) ïåðå÷íÿ ñòðóêòóð ïåðåâîäà.
ÈÍÔÎËÎÃÈ×ÅÑÊÀß ÌÎÄÅËÜ ÑËÎÂÀÐÅÉ ÓÊÐÀÈÍÑÊÎÃÎ È ÆÅÑÒÎÂÎÃÎ ßÇÛÊÎÂ
Äëÿ äîñòèæåíèÿ öåëè ïåðåâîäà íåîáõîäèì ãðàììàòè÷åñêèé ñëîâàðü óêðàèí-
ñêîãî ÿçûêà. Óêðàèíñêèé ÿçûê ôëåêòèâíûé, ò.å. ñèíòåòè÷åñêîãî òèïà, â êîòîðîì
äîìèíèðóåò ñëîâîèçìåíåíèå ñ ïîìîùüþ ôëåêñèé — ôîðìàíòîâ, ñî÷åòàþùèõ íå-
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1 131
ñêîëüêî çíà÷åíèé. Ôëåêòèâíîå ñòðîåíèå ÿçûêà ïðîòèâîïîëîæíî àããëþòèíàòèâíî-
ìó, â êîòîðîì êàæäûé ôîðìàíò èìååò òîëüêî îäíî çíà÷åíèå. Äëÿ ðàçðàáîòêè
ãðàììàòè÷åñêîãî ñëîâàðÿ èñïîëüçóåì òåîðèþ ëåêñèêîãðàôè÷åñêèõ ñèñòåì [11–13].
Ïîñòðîåíèå ãðàììàòè÷åñêîãî ñëîâàðÿ ôëåêòèâíîãî ÿçûêà îïðåäåëÿåòñÿ íà-
ëè÷èåì ôîðìàëüíîé ìîäåëè ñëîâîèçìåíåíèÿ. Ýòî îçíà÷àåò óñòàíîâëåíèå è ôîð-
ìàëèçàöèþ ëèíãâèñòè÷åñêèõ êðèòåðèåâ, ñîãëàñíî êîòîðûì âñå ìíîæåñòâî ñëîâ
ÿçûêà ðàçáèâàåòñÿ íà îïðåäåëåííûå ïîäìíîæåñòâà, âçàèìíîå ïåðåñå÷åíèå êîòî-
ðûõ ïóñòî, à âíóòðè êàæäîãî èç íèõ ñëîâîèçìåíåíèå ïðîèñõîäèò ïî îäèíàêîâûì
ïðàâèëàì. Ïîäìíîæåñòâà ñëîâ ñ òàêèìè ñâîéñòâàìè íàçûâàþòñÿ ñëîâîèçìåíè-
òåëüíûìè ïàðàäèãìàòè÷åñêèìè òèïàìè.
Ïîä ïàðàäèãìàòè÷åñêèìè òèïàìè áóäåì ïîíèìàòü ãðóïïó ëåêñåì, ñëîâîèç-
ìåíèòåëüíàÿ ïàðàäèãìà êîòîðûõ õàðàêòåðèçóåòñÿ îäèíàêîâûì êîëè÷åñòâîì
ãðàììàòè÷åñêèõ ôîðì. Âíóòðè ãðóïïû ñëîâîèçìåíåíèå ïðîèñõîäèò ïî îäíîìó
è òîìó æå (åäèíñòâåííîìó) ïðàâèëó. Óêðàèíñêèé ÿçûê îòíîñèòñÿ ê àíàëèòè-
êî-ñèíòåòè÷åñêîìó òèïó: ñëîâà, ïðèíàäëåæàùèå ê îäíîìó ïàðàäèãìàòè÷åñêîìó
êëàññó, èìåþò îäèíàêîâûå ôëåêñèè â ñîîòâåòñòâóþùèõ ãðàììàòè÷åñêèõ çíà÷å-
íèÿõ è îäèíàêîâûé õàðàêòåð ÷åðåäîâàíèÿ â îñíîâå; ñîîòâåòñòâóþùèå àíàëèòè-
÷åñêèå ôîðìû ñòðîÿòñÿ ïî îäèíàêîâûì ìîäåëÿì èõ îáðàçîâàíèÿ.
Óêðàèíñêîìó ÿçûêó ïðèñóùè ñëåäóþùèå ãðàììàòè÷åñêèå êàòåãîðèè, îïðåäåëÿ-
þùèå ñëîâîèçìåíåíèå: s — ÷èñëî (åäèíñòâåííîå (s1), ìíîæåñòâåííîå (s2)); g —
ðîä (ìóæñêîé (g1), æåíñêèé (g2), ñðåäíèé (g3), ïðåâîñõîäíàÿ ñòåïåíü (g4), ìóæ-
ñêîé èëè ñðåäíèé ðîä äëÿ îäóøåâëåííîãî ïðåäìåòà (g5), æåíñêèé èëè ñðåäíèé ðîä
äëÿ îäóøåâëåííîãî ïðåäìåòà (g6), ìóæñêîé èëè æåíñêèé ðîä äëÿ îäóøåâëåííîãî
ïðåäìåòà (g7), íåèçìåíÿåìàÿ ñëîâàðíàÿ åäèíèöà (g8), ñðàâíèòåëüíàÿ ñòåïåíü (g9);
i — îáîáùåííàÿ êàòåãîðèÿ, âêëþ÷àþùàÿ ïàäåæ, ëèöî, âðåìÿ, ñîñòîÿíèå, ñïîñîá
(èìåíèòåëüíûé (i1), ðîäèòåëüíûé (i2), äàòåëüíûé (i3), âèíèòåëüíûé (i4), òâîðè-
òåëüíûé (i5), ïðåäëîæíûé ( )i6 , çâàòåëüíûé ( )i7 , èíôèíèòèâ (i8), ïåðâîå ëèöî, ïî-
âåëèòåëüíîå íàêëîíåíèå (i9), âòîðîå ëèöî, ïîâåëèòåëüíîå íàêëîíåíèå (i10),
òðåòüå ëèöî, ïîâåëèòåëüíîå íàêëîíåíèå (i11), ïåðâîå ëèöî, áóäóùåå âðåìÿ (i12),
âòîðîå ëèöî, áóäóùåå âðåìÿ ( )i13 , òðåòüå ëèöî, áóäóùåå âðåìÿ (i14), ïåðâîå ëèöî,
íàñòîÿùåå (áóäóùåå) âðåìÿ (i15), âòîðîå ëèöî, íàñòîÿùåå (áóäóùåå) âðåìÿ (i16),
òðåòüå ëèöî, íàñòîÿùåå (áóäóùåå) âðåìÿ (i17), ïåðâîå ëèöî, íàñòîÿùåå âðåìÿ (i18),
âòîðîå ëèöî, íàñòîÿùåå âðåìÿ ( )i19 , òðåòüå ëèöî, íàñòîÿùåå âðåìÿ (i20), äåéñòâè-
òåëüíîå ïðè÷àñòèå, íàñòîÿùåå âðåìÿ ( )i21 , äååïðè÷àñòèå, íàñòîÿùåå âðåìÿ (i22),
ïðîøåäøåå âðåìÿ (i23), äåéñòâèòåëüíîå ïðè÷àñòèå, ïðîøåäøåå âðåìÿ (i24), ñòðà-
äàòåëüíîå ïðè÷àñòèå, ïðîøåäøåå âðåìÿ ( )i25 , áåçëè÷íàÿ ôîðìà, ïðîøåäøåå âðå-
ìÿ (i26), äååïðè÷àñòèå, ïðîøåäøåå âðåìÿ (i27), íåèçìåíÿåìàÿ åäèíèöà (i28)).
Êàæäîå ñëîâî îòíåñåì ê ñëåäóþùèì êëàññàì (÷àñòÿì ðå÷è) ( p): ñóùåñòâè-
òåëüíûå ( p1), ÷èñëèòåëüíûå ïîðÿäêîâûå ( p2), ÷èñëèòåëüíûå êîëè÷åñòâåííûå
( p3), ÷èñëèòåëüíûå ( p4), ÷èñëèòåëüíûå òèïà «äâà» ( p5), ãëàãîëû íåñîâåðøåííî-
ãî è ñîâåðøåííîãî âèäà ( p6), ãëàãîëû ñîâåðøåííîãî âèäà ( p7), ãëàãîëû íåñîâåð-
øåííîãî âèäà ( p8), ïðè÷àñòèÿ ( p9), ïðèëàãàòåëüíûå ( p10), ìåñòîèìåíèÿ ( p11),
ìåñòîèìåíèÿ-ïðèëàãàòåëüíûå (p12), íàðå÷èÿ ( p13), ìåæäîìåòèÿ ( p14), ñîþçû (p15),
÷àñòèöû ( p16), ïðåäëîãè ( p17), ñëîâà ñêàçóåìîãî ( p18), ââîäíûå ñëîâà ( p19),
àááðåâèàòóðû ( p20), ñâÿçêè ( p21), äååïðè÷àñòèÿ ( p22), ëè÷íûå ìåñòîèìåíèÿ ( )p23 ,
ñîþçû è ÷àñòèöû ( p24), íàðå÷èÿ è ÷àñòèöû ( p25), ÷èñëèòåëüíûå ñ ïðåäëîãîì ( p26),
ñóùåñòâèòåëüíûå ñ ïðåäëîãîì ( p27), äååïðè÷àñòèÿ ñîâåðøåííîãî âèäà ( p28), ìåñ-
òîèìåíèÿ ñ ïðåäëîãîì ( p29), äååïðè÷àñòèÿ íåñîâåðøåííîãî âèäà ( p30).
Äëÿ óêðàèíñêîãî ÿçûêà ââåäåì ïàðàäèãìàòè÷åñêèå òèïû (T), ãðàììàòè÷åñ-
êèå êëàññû, ãðàììàòè÷åñêèå êàòåãîðèè (òàáë. 1).
Èñõîäÿ èç òîãî, ÷òî óêðàèíñêèé ÿçûê ôëåêòèâíûé (ãðàììàòè÷åñêèå çíà÷å-
íèÿ ïåðåäàþòñÿ ôëåêñèÿìè), ñëîâà ÿçûêà ìîäåëèðóþòñÿ â âèäå êîìáèíàöèè íåèç-
ìåííîé è ïåðåìåííîé ñîñòàâëÿþùèõ:
x c x f x� ( )& ( ) , (1)
132 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1
ãäå c x( ) — ÷àñòü ëåêñåìû õ, êîòîðàÿ â ïðîöåññå ñëîâîèçìåíåíèÿ îñòàåòñÿ íå-
èçìåííîé (êâàçèîñíîâà), f x( ) — åå ïåðåìåííàÿ ñîñòàâëÿþùàÿ (êâàçèôëåêñèÿ),
& — êîíêàòåíàöèÿ.
Ðåàëèçàöèÿ òàêîé ìîäåëè õðàíåíèÿ ñëîâà èçëèøíå èçáûòî÷íà, ïîñêîëüêó
â óêðàèíñêîì ÿçûêå îêîëî äâóõ ìèëëèîíîâ ñëîâ (âî âñåõ ñëîâîèçìåíåíèÿõ) è òîëü-
êî îêîëî ñòà òûñÿ÷ ñëîâ-èíôèíèòèâîâ, ò.å. âìåñòî ïîëíîãî òåêñòà ñëîâà â òàáëèöå
õðàíèòñÿ íîìåð ñëîâà-èíôèíèòèâà èç ñîîòâåòñòâóþùåãî ìíîæåñòâà èíôèíèòèâîâ,
íîìåð ïîçèöèè â ñëîâå, â êîòîðîé ñëîâî-èíôèíèòèâ íåèçìåííî, è íîìåð ôëåêñèè
(ïåðåìåííîé ÷àñòè ñëîâà) èç ñîîòâåòñòâóþùåãî ìíîæåñòâà.
Òàêèì îáðàçîì, ñëîâà ÿçûêà ïðåäñòàâëÿþòñÿ â âèäå
W W W I I F F k g G s S in Ini i i i� � � � � � �{ { }}: , , , , ,
1 2
, (2)
ãäå Wi — ïàðàìåòðû ñëîâà (i N� �0 1, ,� , N — êîëè÷åñòâî ñëîâ â ñëîâàðå),
F — ìíîæåñòâî âñåõ âîçìîæíûõ îêîí÷àíèé ñëîâ (ôëåêñèé), k — íîìåð ïîçèöèè
â ñëîâå-èíôèíèòèâå, ñ êîòîðîé íà÷èíàåò êîíêàòåíèðîâàòüñÿ ôëåêñèÿ (âîçìîæíû
ñëó÷àè, êîãäà k � 0 äëÿ ñëîâîôîðìû, ïîëíîñòüþ îòëè÷íîé îò èíôèíèòèâà),
G g g� { }1 9, ,� , S s s� { }1 2, , In i i� { }1 28, ,� , I — ìíîæåñòâî ñëîâ-èíôèíèòèâîâ
óêðàèíñêîãî ÿçûêà (äëÿ ãëàãîëîâ — èíôèíèòèâû, äëÿ ñóùåñòâèòåëüíûõ — ñëîâà
â èìåíèòåëüíîì ïàäåæå, åäèíñòâåííîì ÷èñëå è ò.ä.):
I I I word p Pi i� � �{ { }}: ,inf , (3)
ãäå P p p�{ }1 30, ,� , wordinf — ñëîâî-èíôèíèòèâ.
Ôîðìèðîâàíèå ìíîæåñòâ W F I, , ïðîèñõîäèò ñëåäóþùèì îáðàçîì (äëÿ âñåõ
ñëîâ-èíôèíèòèâîâ ÿçûêà):
� k � äëèíà (îáùàÿ ÷àñòü äëÿ ñëîâà-èíôèíèòèâà è âñåõ åãî ñëîâîôîðì);
� äëÿ âñåõ ñëîâîôîðì îïðåäåëÿåì îêîí÷àíèå (îòëè÷àþùàÿñÿ ÷àñòü) è äîáàâ-
ëÿåì åãî ê ìíîæåñòâó F (åñëè òàêîãî îêîí÷àíèÿ â íåì íåò);
� äîáàâëÿåì ñëîâî-èíôèíèòèâ ê ìíîæåñòâó I ;
� ôîðìèðóåì ìíîæåñòâî W ñîãëàñíî (2).
Ïðÿìîé çàäà÷åé äëÿ ìîäåëè (2) ÿâëÿåòñÿ âîñïðîèçâåäåíèå ïîëíîãî òåêñòà
ñëîâà ïî òðåì ïàðàìåòðàì — I F ki i1 2
, , , ðåàëèçóåìîå ñîîòâåòñòâóþùèì
îïåðàòîðîì H:
H
Left I k F k
Left I F k
i i
i i
�
� �
�
�
�
( , )& , ,
( , )& , ,
1 2
1 2
1 0
0 0
(4)
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1 133
Ò à á ë è ö à 1
Ïàðàäèãìà-
òè÷åñêèé
òèï
Ãðàììàòè÷åñêèé
êëàññ
Ãðàììàòè÷åñêàÿ êàòåãîðèÿ,
îïðåäåëÿþùàÿ ñëîâîèçìåíåíèå
Êîëè÷åñòâî
ãðàììàòè÷åñêèõ
çíà÷åíèé
T1 p1 s i i* ( , , )1 7� 14
T 2 p p p p p2 4 9 10 12� � � � ( , , ) * (( , ) * ( , , ))g g g s s i i1 2 3 1 2 1 7� 24
T 3 p p3 11� ( , , )i i1 6� 6
T 4 p5 ( , ) * ( , , )g g i i1 2 1 6� 12
T 5 p p6 8�
i i s i s i s i s8 10 1 9 2 10 2 12 1, ( * ), ( * ), ( * ), ( * ) ,
(( , , ) * ), ,i i s i i12 17 21 22� ,
( * ( , , ) * ),i g g g s23 1 2 3 1
( * ), , , ,i s i i i i23 2 24 25 26 27
26
T 6 p7
i i s i s i s8 10 1 9 2 10 2, ( * ), ( , ), ( , ) ,
(( , , ) * ),i i i s12 13 14
( * ( , , ) * ),i g g g s23 1 2 3 1
( * ), , , ,i s i i i i23 2 24 25 26 27
18
T 0
j
jp
�13
30
� i28 1
ãäå Left Word Length( , ) — ôóíêöèÿ ïîëó÷åíèÿ ïåðâûõ ñèìâîëîâ (Length) èç ñëî-
âà (Word).
Íåêîòîðàÿ ñëîæíîñòü âîçíèêàåò äëÿ îáðàòíîé çàäà÷è (H �1): äëÿ ñóùåñòâóþ-
ùåãî ñëîâà íàéòè òðè ïàðàìåòðà, êîòîðûå åãî îäíîçíà÷íî îïðåäåëÿþò. Ðåàëèçà-
öèÿ îïåðàòîðà (4) äëÿ áàçû äàííûõ â âèäå íåäåòåðìèíèñòñêîé ôóíêöèè ïðèâîäèò
ê òîìó, ÷òî åå íåâîçìîæíî ýôôåêòèâíî ïðîèíäåêñèðîâàòü. Ïîèñê ïî íåèíäåêñè-
ðîâàííîìó ïîëþ äîñòàòî÷íî çàòðàòíûé ïî âðåìåíè. Äëÿ ðåøåíèÿ ýòîé ïðîáëåìû
ïðåäëîæåí ñëåäóþùèé àëãîðèòì. Âõîäíîå ñëîâî ðàçáèâàåòñÿ íà âîçìîæíûå êîì-
áèíàöèè íåèçìåííîé è ïåðåìåííîé ñîñòàâëÿþùèõ, è ïîèñê îñóùåñòâëÿåòñÿ ïî
ïðîèíäåêñèðîâàííûì ïîëÿì òàáëèö-ìíîæåñòâ èíôèíèòèâîâ (I ) è ôëåêñèé (F ):
H
i l Word
i l
LEFT
� �
� �
�
1
0, ( ),
,
(
äëèíà
ïîâòîðÿòü, ïîêà
Head Word i
RIGHT Word l i
, ),
( , );Tail � �
åñëè ñóùåñòâóåò èíôèíèòèâ
è cóùåñòâóåò ôëåêñèÿ , ðàâíàÿ
òî î
I I
F F
i
i
1
2
�
�
,
,Tail
ïðåäåëÿåì
èëè
Êîíåö öèêëà
( , , );I F k
i i
i i1 2
1� �
�
�
�
�
�
�
�
�
�
�
�
�
�
�
(5)
Äëÿ Æß ñòðóêòóðà ñëîâàðÿ â ñâÿçè ñ îòñóòñòâèåì â íåé ñëîâîèçìåíåíèé íåñêîëü-
êî ïðîùå. Èíôîëîãè÷åñêàÿ ìîäåëü óêðàèíñêîãî ÿçûêà è Æß ïðèâåäåíà íà ðèñ. 1.
 áëîêå «Ñëîâàðü óêðàèíñêîãî ÿçûêà» ñîäåðæèòñÿ ìíîæåñòâî ñëîâ óêðàèí-
ñêîãî ÿçûêà (W), â áëîêàõ «Ôëåêñèè» è «Èíôèíèòèâû» — ñîîòâåòñòâåííî ìíîæåñ-
òâà ôëåêñèé (F ) è èíôèíèòèâîâ (I ). Äëÿ êàæäîãî ñëîâà õðàíÿòñÿ ññûëêè íà ãðàì-
ìàòè÷åñêèå êàòåãîðèè, îïðåäåëÿþùèå ñëîâîèçìåíåíèå è ÷àñòü ðå÷è. Ìíîæåñòâî
æåñòîâ íàõîäèòñÿ â áëîêå «Ñëîâàðü æåñòîâ» è ñîäåðæèò ññûëêè íà ñëîâî, êîòîðûì
îáîçíà÷àåòñÿ äàííûé æåñò, è òåìàòèêó, â êîòîðîé îí ÷àùå âñåãî èñïîëüçóåòñÿ.
ÈÍÔÎËÎÃÈ×ÅÑÊÀß ÌÎÄÅËÜ ÎÒÍÎØÅÍÈÉ ÎÁÎÁÙÀÞÙÈÕ
ÊÎÍÑÒÐÓÊÖÈÉ ÄËß ÏÅÐÅÂÎÄÀ
Ðàññìîòðèì òîëüêî ïðîñòûå ïðåäëîæåíèÿ. Ñ÷èòàåì, ÷òî ëþáîå ñëîæíîå ïðåä-
ëîæåíèå ìîæíî ïðåäñòàâèòü êàê êîìïîçèöèþ ïðîñòûõ ïðåäëîæåíèé. Êàê äëÿ
óêðàèíñêîãî ÿçûêà, òàê è äëÿ Æß îãðàíè÷èìñÿ ñëåäóþùèìè òèïàìè ïðîñòûõ
ïðåäëîæåíèé: ïîâåñòâîâàòåëüíûå (óòâåðäèòåëüíûå, âîñêëèöàòåëüíûå è îòðèöà-
òåëüíûå), âîïðîñèòåëüíûå è ïîáóäèòåëüíûå.
134 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1
Ðèñ. 1. Èíôîëîãè÷åñêàÿ ìîäåëü ñëîâàðåé óêðàèíñêîãî è æåñòîâîãî ÿçûêîâ
êîòîðûé íà÷èíàåòñÿ íà Head,
Ïîñëå ñîñòàâëåíèÿ ñëîâàðåé óêðàèíñêîãî è æåñòîâîãî ÿçûêîâ íåîáõîäèìî
ïîñòðîèòü ñîîòâåòñòâèå ìåæäó êîíñòðóêöèÿìè ïðåäëîæåíèé óêðàèíñêîãî ÿçûêà
è Æß. Äëÿ ýòîãî ñôîðìèðîâàíî ìíîæåñòâî ïðåäëîæåíèé, âçÿòûõ èç ïðîãðàì-
ìû-êîìïëåêñà «Óêðàèíñêèé æåñòîâûé ÿçûê» [14], êîòîðàÿ èñïîëüçóåòñÿ â ó÷åá-
íûõ çàâåäåíèÿõ äëÿ ãëóõèõ ëþäåé äëÿ îâëàäåíèÿ æåñòîâîé ðå÷üþ. Ïðåäëîæåíèÿ
â ìîäåëè äàííûõ îáúåäèíåíû â ñòðóêòóðû, ïîëó÷åííûå ïóòåì îáîáùåíèÿ.
Ñòðóêòóðû ïðåäëîæåíèé âìåñòî ñëîâ ñîäåðæàò èõ ïîñëåäîâàòåëüíîñòè, êàæäàÿ
èç êîòîðûõ ìîæåò èñïîëüçîâàòüñÿ ïðè ïîñòðîåíèè ïðåäëîæåíèÿ. Ïîñëåäîâàòåëü-
íîñòè ìîãóò âêëþ÷àòü êàê îòäåëüíûå ñëîâà, òàê è ðàçëè÷íûå ìíîæåñòâà. Íàïðè-
ìåð, ïðåäëîæåíèå «îí èäåò», «îíà èäåò», «âðåìÿ èäåò» îáúåäèíåíû â îäíó ïî-
ñëåäîâàòåëüíîñòü «{îí, îíà, âðåìÿ, êòî, ...} èäåò». Êðîìå òîãî, ïîñëåäîâàòåëüíîñ-
òè ìîãóò ñîäåðæàòü êàòåãîðèè ñëîâîèçìåíåíèÿ ( , , , )p s g i , ïåðåñå÷åíèå êîòîðûõ
îïðåäåëÿåò ìíîæåñòâî ñëîâ.
Ñòðóêòóðû ïðåäëîæåíèé ïðåäñòàâëåíû â âèäå òàáëèö è ñâÿçåé ìåæäó íèìè
(ðèñ. 2).
Ñòðóêòóðû ïðåäëîæåíèé õðàíÿòñÿ â áëîêå «Ñòðóêòóðû ïðåäëîæåíèé». Ýëå-
ìåíòàìè ñòðóêòóð ìîãóò áûòü êàê îòäåëüíûå ñëîâà, òàê è ïîñëåäîâàòåëüíîñòè
ñëîâ. Ïðè ïåðåâîäå âàæíî çíàòü ïîðÿäîê ýëåìåíòîâ ñòðóêòóðû ïðåäëîæåíèÿ
è æåñòîâîãî ïðåäëîæåíèÿ. Äëÿ ñîõðàíåíèÿ ïîðÿäêà ýëåìåíòîâ ñòðóêòóðû ïðåä-
ëîæåíèÿ êàæäûé ýëåìåíò èìååò ïîðÿäêîâûé íîìåð. «Ñòðóêòóðû æåñòîâûõ ïðåä-
ëîæåíèé» òàêæå ìîãóò ñîäåðæàòü æåñòû è ïîñëåäîâàòåëüíîñòè æåñòîâ. Äëÿ îáåñ-
ïå÷åíèÿ ïåðåâîäà íåîáõîäèìî äëÿ âõîäíîãî ïðåäëîæåíèÿ íàéòè ïîäõîäÿùóþ êîí-
ñòðóêöèþ Æß è æåñòû, ñîîòâåòñòâóþùèå êàæäîìó ñëîâó ïðåäëîæåíèÿ.
Ïîñëå çàïîëíåíèÿ áàçû äàííûõ ñòðóêòóðàìè ïðåäëîæåíèé óêðàèíñêîãî ÿçû-
êà áûëè ñîçäàíû ñîîòâåòñòâóþùèå èì ñòðóêòóðû Æß. Äëÿ êàæäîãî ýëåìåíòà
ñòðóêòóðû ïðåäëîæåíèé óêðàèíñêîãî ÿçûêà çàôèêñèðîâàí ñîîòâåòñòâóþùèé ýëå-
ìåíò ñòðóêòóðû æåñòîâûõ ïðåäëîæåíèé. Ýëåìåíòû ñòðóêòóð Æß òàêæå ñîäåðæàò
ïîðÿäêîâûå íîìåðà ýëåìåíòîâ ñòðóêòóð óêðàèíñêîãî ÿçûêà äëÿ îáåñïå÷åíèÿ ñî-
îòâåòñòâèÿ ìåæäó ýëåìåíòàìè.
Èç ìíîæåñòâà ñòðóêòóð ïðåäëîæåíèé ïîëó÷åíî ìíîæåñòâî îáîáùåííûõ êîí-
ñòðóêöèé óêðàèíñêîãî ÿçûêà è Æß, êîòîðûå ñîäåðæàò òîëüêî êàòåãîðèè ñëîâîèç-
ìåíåíèÿ, à íå îòäåëüíûå ñëîâà èëè ìíîæåñòâà ñëîâ. Äëÿ êàæäîãî ýëåìåíòà ñòðóê-
òóðû ïðåäëîæåíèÿ âûäåëåíî ìíîæåñòâî êàòåãîðèè ñëîâîèçìåíåíèÿ ( , , , )p s g i
è ïîðÿäîê äàííîãî ýëåìåíòà â êîíñòðóêöèè. Ñîçäàíèå îáîáùåííûõ êîíñòðóêöèé
ïîçâîëèëî íà îñíîâå àíàëèçà êàòåãîðèé ñëîâîèçìåíåíèÿ ( , , , )p s g i ñëîâ â ïðåäëî-
æåíèè è ïîðÿäêîâîãî íîìåðà ýëåìåíòà ïîëó÷àòü ñîîòâåòñòâóþùóþ åìó ñòðóêòó-
ðó æåñòîâîãî ïðåäëîæåíèÿ. Êðîìå îïðåäåëåíèÿ ñòðóêòóðû ïðåäëîæåíèÿ äëÿ ïå-
ðåâîäà íåîáõîäèìî ñîîòâåòñòâèå ñëîâ æåñòàì.
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1 135
Ðèñ. 2. Ñòðóêòóðû òåêñòîâûõ è æåñòîâûõ ïðåäëîæåíèé
Íà îñíîâå ñîîòâåòñòâèÿ ìåæäó ñòðóêòóðàìè ïðåäëîæåíèé è ñòðóêòóðàìè æåñ-
òîâûõ ïðåäëîæåíèé âûäåëåíî ìíîæåñòâî ñîîòâåòñòâèé «ñëîâî
æåñò» (ðèñ. 3).
Äëÿ àâòîìàòèçèðîâàííîãî ïåðåâîäà òåêñòà ñ óêðàèíñêîãî ÿçûêà íà æåñòîâûé
èñïîëüçóåòñÿ ñëåäóþùàÿ àëãîðèòìè÷åñêàÿ ñõåìà.
1. Ïðåäëîæåíèå ïîñòóïàåò íà âõîä, îïðåäåëÿþòñÿ êàòåãîðèè ñëîâîèçìåíå-
íèÿ äëÿ êàæäîãî ñëîâà ïðåäëîæåíèÿ è îñóùåñòâëÿåòñÿ ïîèñê îáîáùåííîé êîí-
ñòðóêöèè óêðàèíñêîãî ÿçûêà, ñîîòâåòñòâóþùåé äàííîé ñòðóêòóðå.
2. Îñóùåñòâëÿåòñÿ ïîèñê ñîîòâåòñòâèé «ñëîâî
æåñò» äëÿ êàæäîãî ñëîâà
âõîäíîãî ïðåäëîæåíèÿ.
3. Äëÿ îáîáùåííîé êîíñòðóêöèè óêðàèíñêîãî ÿçûêà íàõîäèòñÿ ñîîòâåòñòâóþ-
ùàÿ êîíñòðóêöèÿ Æß, íà îñíîâå ñîîòâåòñòâèÿ «ñëîâî
æåñò» âûâîäèòñÿ ðåçóëüòàò.
4. Ïðè íàëè÷èè íåñêîëüêèõ êîíñòðóêöèé Æß ïðåäëàãàþòñÿ âñå âîçìîæíûå
âàðèàíòû ïåðåâîäà. Åñëè íå íàéäåíî æåñòîâ, îòâå÷àþùèõ îïðåäåëåííûì ñëîâàì
ïðåäëîæåíèÿ, ïåðåâîä âûïîëíÿåòñÿ ÷àñòè÷íî, èñêëþ÷àÿ äàííûå ñëîâà.  òàêîì
ñëó÷àå ïðåäîñòàâëÿåòñÿ âîçìîæíîñòü äîáàâèòü ñîîòâåòñòâèå «ñëîâî
æåñò».
5. Åñëè îáîáùåííîé êîíñòðóêöèè äëÿ ââåäåííîãî ïðåäëîæåíèÿ íå ñóùåñ-
òâóåò, ïðåäïðèíèìàåòñÿ ïîïûòêà ïðîãíîçà ïåðåâîäà íà îñíîâå ( , , , )p s g i è ïîðÿä-
êà ñëîâ ÷àñòè âõîäíîãî ïðåäëîæåíèÿ.  ñëó÷àå êîððåêòíîãî ïåðåâîäà ýòà êîí-
ñòðóêöèÿ äîáàâëÿåòñÿ ê óæå ñóùåñòâóþùèì. Åñëè ïåðåâîä íå óäîâëåòâîðèòåëåí,
ïðåäîñòàâëÿåòñÿ âîçìîæíîñòü äîáàâèòü íîâóþ îáîáùåííóþ êîíñòðóêöèþ ÿçûêà
è ñîîòâåòñòâóþùóþ åé êîíñòðóêöèþ Æß.
ÏÐÀÊÒÈ×ÅÑÊÀß ÐÅÀËÈÇÀÖÈß È ÏÐÎÂÅÐÊÀ ÝÔÔÅÊÒÈÂÍÎÑÒÈ ÒÅÕÍÎËÎÃÈÈ
 ñòðóêòóðó áàçû äàííûõ âíîñèòñÿ ìíîæåñòâî ïðåäëîæåíèé, ïîëó÷åííûõ èç
ïðîãðàììû [14]. Ïðåäïîëàãàåòñÿ, ÷òî îíî ïîêðûâàåò áîëüøîå êîëè÷åñòâî ñè-
òóàöèé, âîçíèêàþùèõ â ïîâñåäíåâíîé æèçíè ãëóõèõ ëþäåé. Äàííîå ìíîæåñò-
âî îáîáùåíî â ñòðóêòóðû ïðåäëîæåíèé, äëÿ êîòîðûõ ïåðåâîä èäåíòè÷åí.
Ñ ïîìîùüþ ñïåöèàëèñòîâ, ïðåïîäàþùèõ Æß, âûïîëíåí ïåðåâîä ñòðóêòóð
ïðåäëîæåíèé íà Æß è ñîçäàíû àíàëîãè÷íûå êîíñòðóêöèè äëÿ Æß (ðèñ. 4).
Ñ èñïîëüçîâàíèåì ñòðóêòóð ïðåäëîæåíèé óêðàèíñêîãî ÿçûêà è ñîîòâåòñòâóþ-
ùèõ èì ïðåäëîæåíèé Æß ñôîðìèðîâàíû îáîáùåííûå êîíñòðóêöèè ïðåäëîæå-
íèé íà îñíîâå êàòåãîðèé ñëîâîèçìåíåíèÿ ( , , , )p s g i óæå ñóùåñòâóþùèõ êîí-
ñòðóêöèé. Îáîáùåííûå êîíñòðóêöèè ïîçâîëèëè îñóùåñòâëÿòü ïåðåâîä íå òîëü-
êî äëÿ ïðåäëîæåíèé, ïîëíîñòüþ ñîîòâåòñòâóþùèõ çàäàííûì êîíñòðóêöèÿì, à è
íà îñíîâå àíàëèçà ñòðóêòóðû êàòåãîðèé ñëîâîèçìåíåíèÿ âõîäÿùåãî ïðåäëîæå-
íèÿ. Êðîìå òîãî, èç ñòðóêòóð ïðåäëîæåíèé óêðàèíñêîãî ÿçûêà è Æß âûäåëåíû
ñîîòíîøåíèÿ ìåæäó ñëîâàìè è æåñòàìè ñ ó÷åòîì òåìàòèêè ïðåäëîæåíèÿ.
 ñëó÷àå íàëè÷èÿ ðàçíûõ âàðèàíòîâ ïåðåâîäà ñëîâà ïåðåâîä÷èêó ïðåäîñòàâëÿåò-
ñÿ âîçìîæíîñòü âûáîðà èç íåñêîëüêèõ âàðèàíòîâ íàèáîëåå êîððåêòíîãî.
136 ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1
Ðèñ. 3. Èíôîëîãè÷åñêàÿ ìîäåëü ñîîòíîøåíèé îáîáùàþùèõ êîíñòðóêöèé äëÿ ïåðåâîäà
Äëÿ ïðîâåðêè ýôôåêòèâíîñòè ðàçðàáîòàííîé òåõíîëîãèè èñïîëüçîâàíî ìíî-
æåñòâî èç 9800 ïðåäëîæåíèé, âçÿòûõ èç ïðîãðàììû èçó÷åíèÿ óêðàèíñêîãî Æß
äëÿ ñïåöèàëèçèðîâàííûõ øêîë. Ïðåäëîæåíèÿ ñîäåðæàò æåñòû èç òåì, ÷àñòî èñ-
ïîëüçóåìûõ ãëóõèìè ëþäüìè äëÿ ïîâñåäíåâíîãî îáùåíèÿ. Â ðåçóëüòàòå ïåðåâî-
äà äàííûõ ïðåäëîæåíèé è èõ àíàëèçà ïîëó÷åíî 293 îáîáùåííûõ êîíñòðóêöèè
ïåðåâîäà. Ïðè òåñòèðîâàíèè Æß íà âûáðàííûõ ïðåäëîæåíèÿõ ïîëó÷åí îäíî-
çíà÷íûé ïåðåâîä áåç èñêàæåíèÿ ñìûñëà â 100% ñëó÷àåâ. Óñïåøíûì òàêæå áûë
ïåðåâîä ñ èñïîëüçîâàíèåì äðóãèõ ïðåäëîæåíèé ñ òåì æå ñëîâàðíûì çàïàñîì.
ÇÀÊËÞ×ÅÍÈÅ
Äëÿ îáåñïå÷åíèÿ àâòîìàòèçèðîâàííîãî ïåðåâîäà ñ óêðàèíñêîãî ÿçûêà íà Æß
ïîñòðîåíû ìîäåëè ñëîâàðåé óêðàèíñêîãî è æåñòîâîãî ÿçûêîâ. Íà èõ îñíîâå
ñîçäàíî ìíîæåñòâî êîíñòðóêöèé äëÿ äâóõ ÿçûêîâ, ïîçâîëÿþùèõ âûïîëíÿòü
ïåðåâîä ôèêñèðîâàííîãî ìíîæåñòâà ïðåäëîæåíèé, èñïîëüçóåìûõ ãëóõèìè
ëþäüìè â ïîâñåäíåâíîé æèçíè. Ïîëó÷åííûå êîíñòðóêöèè îáîáùåíû äëÿ ïåðå-
âîäà ñ ó÷åòîì ñòðóêòóðû êàòåãîðèé ñëîâîèçìåíåíèÿ ýëåìåíòîâ ïðåäëîæåíèé.
Äàëüíåéøèå èññëåäîâàíèÿ íàïðàâëåíû íà ðàçðàáîòêó íà îñíîâå ïðåäëîæåí-
íîé èíôîðìàöèîííîé òåõíîëîãèè ïðèëîæåíèé äëÿ ïåðåâîäà ñ óêðàèíñêîãî ÿçûêà
íà æåñòîâûé ñ èñïîëüçîâàíèåì web-òåõíîëîãèé, îáåñïå÷åíèå âîçìîæíîñòè ðå-
äàêòèðîâàíèÿ ñóùåñòâóþùèõ êîíñòðóêöèé è ñîçäàíèÿ íîâûõ (óïîëíîìî÷åííûìè
ëèöàìè), òåñòèðîâàíèå òåõíîëîãèè áîëüøèì êîëè÷åñòâîì ïðåäëîæåíèé äëÿ âû-
ÿâëåíèÿ íîâûõ ãðàììàòè÷åñêèõ êîíñòðóêöèé è äîáàâëåíèÿ èõ â áàçó äàííûõ,
ñáîð ñòàòèñòèêè ïðèìåíåíèÿ òåõ èëè èíûõ êîíñòðóêöèé äëÿ ïåðåâîäà.
Èññëåäóþòñÿ òàêæå ïðîáëåìû èñïîëüçîâàíèÿ ïðåäëîæåííîãî ïîäõîäà äëÿ
äðóãèõ ÿçûêîâ.
ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ
1. S t o k o e W . C . Sign language structure: An outline of the visual communication systems of the
american deaf // Studies in Linguistics. — 1960. — N 8. — 78 p.
2. Çà é ö å â à à . Ë . Æåñòîâàÿ ðå÷ü. Äàêòèëîëîãèÿ: Ó÷åá. äëÿ ñòóä. âûñø. ó÷åá. çàâåäåíèé. — Ì.:
Ãóìàíèò. èçä. öåíòð ÂËÀÄÎÑ, 2000. — 192 ñ.
3. B o w k e r L . Computer-aided translation technology: a practical introduction. — Ottawa: Univ. of
Ottawa Press, 2002. — 185 p. — http://www.google.com/books?id=ly29-mc6dO0C&printsec=
frontcover&hl=uk#v=onepage&q&f=false.
ISSN 0023-1274. Êèáåðíåòèêà è ñèñòåìíûé àíàëèç, 2014, òîì 50, ¹ 1 137
Ðèñ. 4. Ìîäóëü ñîçäàíèÿ ãðàììàòè÷åñêèõ êîíñòðóêöèé óêðàèíñêîãî è æåñòîâîãî ÿçûêîâ
Ôèëüòð æåñòîâûõ
êîíñòðóêöèé
ïî òåìàòèêå
Ðåäàêòèðîâàíèå
êîíñòðóêöèè óêðàèíñêîãî
ÿçûêà
Ñïèñîê æåñòîâûõ
êîíñòðóêöèé ïî
âûáðàííîé òåìàòèêå
Ðåäàêòèðîâàíèå
êîíñòðóêöèè æåñòîâîãî
ÿçûêà
Âûáîð æåñòà
èç ñïèñêà
4. M a d s e n M . W . The limits of machine translation. — Copenhagen: Center for Language
Technology, Univ. of Copenhagen, 2009. — 116 p.
5. T o m l i n R . S . Basic word order. Fundamental principles. — London: Croom Helm, 1986. —
308 p.
6. À ä à ì þ ê Í . Á . , × å ï ÷ è í à ² . ² . Ñèíòàêñè÷í³ îñîáëèâîñò³ óêðà¿íñüêî¿ æåñòîâî¿ ìîâè: íà
ïðèêëàä³ ïðîñòîãî ðå÷åííÿ // Æåñòîâà ìîâà ³ ñó÷àñí³ñòü. — 2009. — ¹ 4. — Ñ. 170–191.
7. L a v i e A . , D e n k o w s k i M . J . The METEOR metric for automatic evaluation of machine
translation // Machine Transl. — 2009. — 23, Issue 2–3. — P. 105–115.
8. M o r r i s s e y S . Assessing three representation methods for sign language machine translation and
evaluation // Proc. 15th Intern. Conf. Eur. Assoc. for Machine Transl. — Leuven (Belgium), 2011.
— P. 137–144.
9. S t e i n D . , S c h m i d t C . , N e y H . Sign language machine translation overkill // Intern.
Workshop on Spoken Language Translation. — Paris, 2010. — P. 337–344.
10. B a l d a s s a r r i S . , R o y o - S a n t a s F . Trends on human-computer interaction: research,
development, new tools and methods. — London: Springer-Verlag, 2009. — 165 p.
11. Ø è ð î ê î â  . À . Ôåíîìåíîëîã³ÿ ëåêñèêîãðàô³÷íèõ ñèñòåì — Ê.: Íàóê. äóìêà, 2004. —
327 ñ.
12. Ê î ð ï ó ñ í à ë³íãâ³ñòèêà: Ìîíîãðàô³ÿ / Â.À. Øèðîêîâ, Î.Â. Áóãàêîâ, Ò.Î. Ãðÿçíóõ³íà òà ³í. //
Óêð. ìîâíî-³íôîðì. ôîíä ÍÀÍ Óêðà¿íè. — Ê.: Äîâ³ðà, 2005. — 472 ñ.
13. Ë þ á ÷ å í ê î Ò . Ï . Ïðîãðàìíî-òåõíîëîã³÷í³ àñïåêòè ñòâîðåííÿ ãðàìàòè÷íèõ ëåêñèêî-
ãðàô³÷íèõ ñèñòåì // Ïðîáëåìè ïðîãðàìóâàííÿ. — 2007. — ¹ 3. — Ñ. 61–75.
14. Ï ð î ã ð à ì ì à - êîìïëåêñ «Óêðà¿íñüêà æåñòîâà ìîâà». — http://www.mon.gov.ua/education/
average/programs_gluh.
Ïîñòóïèëà 06.08.2013
|