Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основ...
Збережено в:
Дата: | 2021 |
---|---|
Автори: | , , |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2021
|
Назва видання: | Кібернетика та системний аналіз |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/190710 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-190710 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1907102023-06-20T15:30:18Z Представлення, аналіз та видобування знань з неструктурованих природномовних текстів Гогерчак, Г.І. Дарчук, Н.П. Кривий, С.Л. Програмно-технічні комплекси Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основі задач визначення частин мови, пошуку граматичних залежностей та кореферентностей. Наведено приклади використання природномовних баз знань для розв’язання прикладних задач, зокрема для перевірки цілісності тексту, пошуку суперечностей. Приведен обзор средств дескриптивных логик для представления знаний из естественноязычных текстов, классификация дескриптивных логик по конструкторам концептов и ролей, а также описаны основные концепции темпоральных дескриптивных логик. Рассмотрен подход к построению систем анализа естественноязычных текстов на основе задач определения частей речи, поиска грамматических зависимостей и кореферентностей. Приведены примеры использования естественноязычных баз знаний для решения прикладных задач, в частности для проверки целостности текста, поиска противоречий. The article provides an overview of the means of descriptive logics for knowledge representation in natural-language texts. Descriptive logics are classified by constructors of concepts and roles, and the basic concepts of temporal descriptive logics are considered. The approach to construction of systems of the analysis of natural-language text based on problems of parts of speech tagging, dependency parsing, coreference resolution is considered. Examples of using natural-language knowledge bases to solve applied problems, in particular to check the integrity of the text and to reveal contradictions, are provided. 2021 Article Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр. 1019-5262 http://dspace.nbuv.gov.ua/handle/123456789/190710 004.822 uk Кібернетика та системний аналіз Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Програмно-технічні комплекси Програмно-технічні комплекси |
spellingShingle |
Програмно-технічні комплекси Програмно-технічні комплекси Гогерчак, Г.І. Дарчук, Н.П. Кривий, С.Л. Представлення, аналіз та видобування знань з неструктурованих природномовних текстів Кібернетика та системний аналіз |
description |
Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основі задач визначення частин мови, пошуку граматичних залежностей та кореферентностей. Наведено приклади використання природномовних баз знань для розв’язання прикладних задач, зокрема для перевірки цілісності тексту, пошуку суперечностей. |
format |
Article |
author |
Гогерчак, Г.І. Дарчук, Н.П. Кривий, С.Л. |
author_facet |
Гогерчак, Г.І. Дарчук, Н.П. Кривий, С.Л. |
author_sort |
Гогерчак, Г.І. |
title |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
title_short |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
title_full |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
title_fullStr |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
title_full_unstemmed |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
title_sort |
представлення, аналіз та видобування знань з неструктурованих природномовних текстів |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2021 |
topic_facet |
Програмно-технічні комплекси |
url |
http://dspace.nbuv.gov.ua/handle/123456789/190710 |
citation_txt |
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр. |
series |
Кібернетика та системний аналіз |
work_keys_str_mv |
AT gogerčakgí predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív AT darčuknp predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív AT krivijsl predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív |
first_indexed |
2025-07-16T13:46:07Z |
last_indexed |
2025-07-16T13:46:07Z |
_version_ |
1837811439432105984 |
fulltext |
Ã.². ÃÎÃÅÐ×ÀÊ, Í.Ï. ÄÀÐ×ÓÊ, Ñ.Ë. ÊÐÈÂÈÉ
ÓÄÊ 004.822 ÏÐÅÄÑÒÀÂËÅÍÍß, ÀÍÀË²Ç ÒÀ ÂÈÄÎÁÓÂÀÍÍß
ÇÍÀÍÜ Ç ÍÅÑÒÐÓÊÒÓÐÎÂÀÍÈÕ
ÏÐÈÐÎÄÍÎÌÎÂÍÈÕ ÒÅÊÑÒ²Â
Àíîòàö³ÿ. Íàâåäåíî îãëÿä çàñîá³â äåñêðèïòèâíèõ ëîã³ê äëÿ ïðåäñòàâëåííÿ
çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â, êëàñèô³êàö³þ äåñêðèïòèâíèõ ëîã³ê çà êîí-
ñòðóêòîðàìè êîíöåïò³â òà ðîëåé, à òàêîæ îñíîâí³ êîíöåïö³¿ òåìïîðàëüíèõ
äåñêðèïòèâíèõ ëîã³ê. Ðîçãëÿíóòî ï³äõ³ä äî ïîáóäîâè ñèñòåì àíàë³çó ïðèðîä-
íîìîâíèõ òåêñò³â íà îñíîâ³ çàäà÷ âèçíà÷åííÿ ÷àñòèí ìîâè, ïîøóêó ãðàìà-
òè÷íèõ çàëåæíîñòåé òà êîðåôåðåíòíîñòåé. Íàâåäåíî ïðèêëàäè âèêîðèñòàííÿ
ïðèðîäíîìîâíèõ áàç çíàíü äëÿ ðîçâ’ÿçàííÿ ïðèêëàäíèõ çàäà÷, çîêðåìà äëÿ
ïåðåâ³ðêè ö³ë³ñíîñò³ òåêñòó, ïîøóêó ñóïåðå÷íîñòåé.
Êëþ÷îâ³ ñëîâà: äåñêðèïòèâí³ ëîã³êè, áàçè çíàíü, àëãîðèòì ñåìàíòè÷íîãî
òàáëî, âèäîáóâàííÿ çíàíü, îáðîáëåííÿ ïðèðîäíî¿ ìîâè, ñåìàíòè÷íèé àíàë³ç.
ÂÑÒÓÏ
Çàäà÷à îáðîáëåííÿ ïðèðîäíèõ ìîâ ñüîãîäí³ º îäí³ºþ ç îñíîâíèõ ó ãàëóç³ êîì-
ï’þòåðíèõ íàóê. Çäåá³ëüøîãî öå çóìîâëåíî ïðàãíåííÿì ëþäñòâà äî ïîäîëàííÿ
ìîâíèõ áàð’ºð³â, à òàêîæ âåëèêîþ ê³ëüê³ñòþ ïðèêëàäíèõ çàäà÷, ÿê³ ò³ºþ ÷è
³íøîþ ì³ðîþ äîòè÷í³ äî ôîðìàë³çàö³¿ ëþäñüêîãî ìîâëåííÿ. Òàêèìè çàäà÷àìè
º ïîêðàùåííÿ ñôåðè ïîñëóã, çäåøåâëåííÿ ïåâíèõ ïðîöåñ³â ñóñï³ëüíîãî çíà÷åí-
íÿ, ÿê³, â ñâîþ ÷åðãó, ñòèìóëþþòü ðîçâèòîê ìåòîä³â àâòîìàòè÷íîãî ïåðåêëàäó,
ðåôåðóâàííÿ òà àíîòóâàííÿ, ðîçï³çíàâàííÿ (ïåðåòâîðåííÿ â òåêñòîâèé ôîðìàò)
ìîâëåííÿ â ðåæèì³ ðåàëüíîãî ÷àñó, â òîìó ÷èñë³ ïðèðîäíîìîâíèõ êîìàíä, àâ-
òîìàòè÷íîãî ïîøóêó, êîíñòðóþâàííÿ â³äïîâ³äåé íà çàïèòàííÿ, âèÿâëåííÿ òà
êîðåêö³¿ ãðàìàòè÷íèõ ïîìèëîê, ïîáóäîâè ä³àëîãîâèõ ñèñòåì ïðèðîäíîþ ìî-
âîþ, ïåðåâ³ðêè ö³ë³ñíîñò³ òåêñòó, ñåíòèìåíò-àíàë³çó òîùî. Ñó÷àñíà ãàëóçü îá-
ðîáëåííÿ ïðèðîäíèõ ìîâ íàðàõîâóº ïîíàä òðè äåñÿòêè ð³çíèõ çàäà÷. Çíà÷íîþ
ì³ðîþ âîíè º ë³íãâ³ñòè÷íèìè, îñê³ëüêè ïîâ’ÿçàí³ ç âèçíà÷åííÿì ÷àñòèí ìîâè,
ëåìàòèçàö³ºþ, òîêåí³çàö³ºþ òåêñòó, ïîáóäîâîþ ñèíòàêñè÷íèõ äåðåâ çàëåæíîñ-
òåé, ïîøóêîì êîðåôåðåíòíîñòåé, ðîçï³çíàâàííÿì ³ìåíîâàíèõ ñóòíîñòåé,
â³äíîâëåííÿì ñòðóêòóðíî¿ òà ñåìàíòè÷íî¿ íåïîâíîòè ðå÷åííÿ, âèÿâëåííÿì
çâ’ÿçê³â ³ â³äíîøåíü ì³æ ìîâíèìè îäèíèöÿìè òîùî.
Âàæê³ñòü ðîçâ’ÿçàííÿ òàêèõ ïðîáëåì çóìîâëåíà ñêëàäí³ñòþ ïðèðîäíî¿ ìîâè:
áàãàòîçíà÷í³ñòþ, ìåòàôîðè÷í³ñòþ ìîâíîãî çíàêà, íå÷³òêèìè ìíîæèíàìè ìîâíèõ
îäèíèöü, à îòæå, íåìîæëèâ³ñòþ îïèñó çà äîïîìîãîþ ÷³òêîãî íàáîðó äåòåðì³íîâà-
íèõ ïðàâèë. Íàéïîøèðåí³øèì çàñîáîì ðîçâ’ÿçàííÿ âêàçàíèõ çàäà÷ º ìàøèííå íà-
â÷àííÿ, ÿêå äຠçìîãó â àâòîìàòè÷íîìó ðåæèì³ çä³éñíþâàòè ïîøóê çàêîíîì³ðíîñ-
òåé íà îñíîâ³ ïàð âõ³äíèõ òà âèõ³äíèõ äàíèõ, ùî ñêëàäàþòü êîðïóñ íàâ÷àëüíî¿
âèá³ðêè. Ðîçâ’ÿçàííÿ çàäà÷, ÿê³ ìîæíà ÷³òêî ñôîðìóëþâàòè (íàïðèêëàä, ÷àñòèíî-
ìîâíå àíîòóâàííÿ òåêñòó), çàëåæèòü çäåá³ëüøîãî â³ä ñòâîðåííÿ ðîçì³÷åíèõ êîð-
ïóñ³â íåîáõ³äíîãî ³ äîñòàòíüîãî îáñÿãó äëÿ ÿê³ñíîãî íàâ÷àííÿ (íàïðèêëàä, äëÿ
ÿê³ñíîãî ìîðôîëîã³÷íîãî àíîòóâàííÿ äîñòàòíüî ñôîðìóâàòè êîðïóñ îáñÿãîì â îäèí
164 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
© Ã.². Ãîãåð÷àê, Í.Ï. Äàð÷óê, Ñ.Ë. Êðèâèé, 2021
ì³ëüéîí ñëîâîâæèâàíü, à äëÿ ñèíòàêñè÷íîãî ðîçì³÷óâàííÿ — äåñÿòêè ³ ñîòí³
ì³ëüéîí³â ñëîâîâæèâàíü, ùîá çàáåçïå÷èòè äîñòîâ³ðí³ñòü ³ ðåïðåçåíòàòèâí³ñòü ðåçóëü-
òàò³â àíàë³çó). Ïðîòå íå âñ³ çàäà÷³ îáðîáëåííÿ ïðèðîäíèõ ìîâ ïîòðåáóþòü ñòâîðåííÿ
òàêèõ êîðïóñ³â — íà òàê çâàíèõ ïðîì³æíèõ åòàïàõ îïðàöþâàííÿ ìîâíî¿ ³íôîðìàö³¿
ìîæíà çàñòîñîâóâàòè çàñîáè ìàòåìàòè÷íî¿ ëîã³êè òîùî, ùî ïîëåãøóº ïðîöåñ ðîçâ’ÿ-
çàííÿ á³ëüø ñêëàäíèõ çàäà÷ íà îñíîâ³ ðåçóëüòàò³â ðîçâ’ÿçàííÿ ìåíø ñêëàäíèõ, àëå
ãëèáîêî ôîðìàë³çîâàíèõ ³ çàáåçïå÷åíèõ êîðïóñàìè äîñòàòíüîãî îáñÿãó.
Äî òàêèõ çàäà÷, çîêðåìà, íàëåæèòü çàäà÷à âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâ-
íèõ òåêñò³â, ðîçâ’ÿçàííÿ ÿêî¿ â³äêðèâຠøëÿõ äî ïîòóæíîãî àïàðàòó ìàòåìàòè÷íèõ
ëîã³ê äëÿ àíàë³çó òåêñò³â, íàïèñàíèõ óêðà¿íñüêîþ ìîâîþ, òà ðîçâ’ÿçàííÿ ³íøèõ çà-
äà÷, äîòè÷íèõ äî ôîðìàëüíî¿ ëîã³êè. ¯õíÿ îñîáëèâ³ñòü ïîëÿãຠó â³äñóòíîñò³ ôîð-
ìàëüíèõ âèìîã äî ôîðìóëþâàííÿ ïðàâèë ïðåäñòàâëåííÿ ïðèðîäíî¿ ìîâè ó âèãëÿä³
ïåâíèõ ôîðìàëüíèõ ëîã³÷íèõ ñòðóêòóð — ñèñòåìè àêñ³îì áàçè çíàíü. ijéñíî,
ïðåäñòàâëåííÿ äîâ³ëüíîãî òåêñòó â ïîä³áí³é ëîã³÷í³é ñòðóêòóð³ ïîòðåáóº àïàðàòó
ç äîñòàòíüîþ âèðàçíîþ ïîòóæí³ñòþ äëÿ ïðåäñòàâëåííÿ çíàíü íå ò³ëüêè òèïó
ñóá’ºêò – ä³ÿ – îá’ºêò, à é á³ëüø ñêëàäíèõ â³äíîøåíü, óðàõóâàííÿ ÷àñîâèõ, ïðè÷èí-
íî-íàñë³äêîâèõ õàðàêòåðèñòèê òîùî. ³äñóòí³ñòü ÷³òêî¿ ôîðìàëüíî¿ ïîñòàíîâêè
ö³º¿ çàäà÷³ óíåìîæëèâëþº ïîáóäîâó êîðïóñó íàâ÷àëüíî¿ âèá³ðêè äëÿ ¿¿ ðîçâ’ÿçàí-
íÿ. Ç ³íøîãî áîêó, ïîáóäîâà òàêîãî êîðïóñó ó ðàç³ óñï³øíî¿ ôîðìàë³çàö³¿ ñòàíîâè-
òèìå òðóäíîù³ ÷åðåç â³äñóòí³ñòü äæåðåë äëÿ àâòîìàòè÷íîãî çáèðàííÿ ïðèêëàä³â
ðîçâ’ÿçàííÿ çàäà÷³ (ÿê öå ìîæíà çðîáèòè äëÿ çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ìà-
øèííîãî ïåðåêëàäó ÷è ïåðåäáà÷åííÿ íàñòóïíîãî ñëîâà íà áàç³ íàÿâíèõ ñëîâíèê³â,
åíöèêëîïåäè÷íèõ äàíèõ òà òåêñòîâî¿ ³íôîðìàö³¿ â ìåðåæ³ ²íòåðíåò).
Öå çóìîâëþº àêòóàëüí³ñòü äîñë³äæåíü ó ñôåð³ ïîáóäîâè ñèñòåìè àëãîðèòì³â
äëÿ âèÿâëåííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü íà áàç³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îá-
ðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ïîáóäîâè äåðå-
âà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñòåé òà âèÿâëåííÿ ³ìåíîâàíèõ ñóòíîñòåé. Ìà-
òåìàòè÷íîþ îñíîâîþ òàêî¿ ñèñòåìè º òåîð³ÿ áàç çíàíü òà ìàòåìàòè÷íà ëîã³êà.
Ó ñòàòò³ íàâåäåíî òåîðåòè÷í³ îñíîâè ìàòåìàòè÷íî¿ ëîã³êè òà êîìï’þòåðíî¿
ë³íãâ³ñòèêè, à òàêîæ àëãîðèòìè âèäîáóâàííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü
íà îñíîâ³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷
ðîçì³÷åííÿ ÷àñòèí ìîâè, ïîáóäîâè äåðåâà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñ-
òåé. Ðîçãëÿíóòî çàñîáè ïðåäñòàâëåííÿ, àíàë³çó òà âèäîáóâàííÿ çíàíü ç íåñòðóêòó-
ðîâàíèõ ïðèðîäíîìîâíèõ òåêñò³â, ÿê³ ñòàíîâëÿòü òåîðåòè÷íå çíà÷åííÿ ñòàòò³.
Çàïðîïîíîâàíèé ó ñòàòò³ êîìïëåêñ àëãîðèòì³â ìຠ³ ïðàêòè÷íå çàñòîñóâàííÿ
â àâòîìàòèçàö³¿ çàäà÷ ïåðåâ³ðêè òåêñò³â íà íåñóïåðå÷í³ñòü, ö³ë³ñí³ñòü òîùî.
Ïîáóäîâà ïîâíîö³ííîãî êîìïëåêñó äëÿ àíàë³çó ïðèðîäíîìîâíèõ çíàíü âèìà-
ãຠðîçâ’ÿçàííÿ òàêèõ çàäà÷:
� âèçíà÷åííÿ çàñîá³â ôîðìàëüíîãî ïðåäñòàâëåííÿ ïðèðîäíîìîâíèõ çíàíü;
� ïåðåòâîðåííÿ íåñòðóêòóðîâàíîãî ïðèðîäíîìîâíîãî òåêñòó ó ñòðóêòóðîâà-
íèé âèãëÿä;
� ïîáóäîâè àëãîðèòìó âèäîáóâàííÿ çíàíü ç³ ñòðóêòóðîâàíîãî ïðåäñòàâëåííÿ
ïðèðîäíîìîâíèõ òåêñò³â òà ¿õíüîãî çàïèñó â îáðàí³é ôîðìàëüí³é ñèñòåì³;
� çàñòîñóâàííÿ àëãîðèòì³â ìàòåìàòè÷íî¿ ëîã³êè òà òåî𳿠ãðàô³â äî ñèñòåìè
îäåðæàíèõ çíàíü.
1. ÎÑÍÎÂÈ ÒÅÎв¯ ÁÀÇ ÇÍÀÍÜ
Ïîòðåáà îïèñó çíàíü çà äîïîìîãîþ ôîðìàëüíèõ çàñîá³â ñïðè÷èíèëà ïîÿâó íî-
âîãî êëàñó ëîã³ê — äåñêðèïòèâíèõ (îïèñîâèõ). Áàçîâ³ òåîðåòè÷í³ ïîíÿòòÿ
ð³çíèõ êëàñ³â òàêèõ ëîã³ê ðîçãëÿíóòî â [1, 2].
1.1. ѳìåéñòâî ìîâ AL . Íåõàé CN A Am� { }1, ,� òà RN R Rn� { }1, ,� —
ñê³í÷åíí³ íåïîðîæí³ ìíîæèíè ³ìåí êîíöåïò³â (àòîìàðíèõ êîíöåïò³â) òà ðîëåé
(àòîìàðíèõ ðîëåé). Òîä³ ñèíòàêñèñ ëîã³êè AL (attribute language — àòðèáóòèâíà
ìîâà) âèçíà÷àºòüñÿ òàê.
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 165
Îçíà÷åííÿ 1. Ìíîæèíó êîíöåïò³â ëîã³êè AL çàäàþòü ³íäóêòèâíî:
� ñèìâîëè � (óí³âåðñàëüíèé êîíöåïò) òà � (ïîðîæí³é êîíöåïò) º êîíöåïòàìè;
� äîâ³ëüíå ³ì’ÿ êîíöåïòó A CN� º êîíöåïòîì;
� ÿêùî A — ³ì’ÿ êîíöåïòó, òî � A (äîïîâíåííÿ äî A) — êîíöåïò;
� ÿêùî C òà D — êîíöåïòè, òî C D� (ïåðåòèí) — êîíöåïò;
� ÿêùî C — êîíöåïò, à R — àòîìàðíà ðîëü, òî �R.� (îáìåæåíèé êâàíòîð
³ñíóâàííÿ) òà �R C. (îáìåæåííÿ íà çíà÷åííÿ) — êîíöåïòè;
� æîäíèõ ³íøèõ êîíöåïò³â íå ³ñíóº.
Íàâåäåíå îçíà÷åííÿ êîðîòêî ìîæíà çàïèñàòè òàê:
� �| | | | | . | .� � � �A A C D R R C� .
Ñåìàíòèêó ëîã³êè AL çàäàþòü çà äîïîìîãîþ ïîíÿòòÿ ³íòåðïðåòàö³¿.
Îçíà÷åííÿ 2. ²íòåðïðåòàö³ºþ íàçèâàºòüñÿ ïàðà I I I� ( , )
, ùî ñêëàäàºòüñÿ
ç íåïîðîæíüî¿ ìíîæèíè
I (îáëàñòü ³íòåðïðåòàö³¿) òà ôóíêö³¿ I , ÿêà êîæíîìó
àòîìàðíîìó êîíöåïòó ñòàâèòü ó â³äïîâ³äí³ñòü ïåâíó ï³äìíîæèíó îáëàñò³ ³íòåð-
ïðåòàö³¿, à êîæí³é àòîìàðí³é ðîë³ — ï³äìíîæèíó ¿¿ äåêàðòîâîãî êâàäðàòà.
Òàêèì ÷èíîì, íàâåäåí³ îïåðàö³¿ íàä êîíöåïòàìè ìîæíà âèçíà÷èòè ó òàêèé ñïîñ³á:
�
I I�
;
� ��I ;
( ) \� �A AI I I
;
( )C D C DI I I
� � � ;
( . ) | ( , )� � � � �R a b a b RI I I
� { }
;
( . ) | ( , )� � � � �
�R C a b a b R b CI I I I{ }
.
Îçíà÷åííÿ 3. Êîíöåïòè C òà D åêâ³âàëåíòí³ (C D� ), ÿêùî çà äîâ³ëüíî¿ ³íòåð-
ïðåòàö³¿ I ñïðàâäæóºòüñÿ C DI I� . Êîíöåïò C âêëþ÷àºòüñÿ â êîíöåïò D (C D� ),
ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâäæóºòüñÿ C DI I� . Ðîë³ R òà S åêâ³âàëåíòí³
(R S� ), ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâäæóºòüñÿ ( , ) ( , )a b R a b SI I� � � .
Ðîëü R âêëþ÷àºòüñÿ â ðîëü S ( )R S� , ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâ-
äæóºòüñÿ ( , ) ( , )a b R a b SI I�
� .
Ìîâè ç á³ëüø âèðàçíîþ ïîòóæí³ñòþ ìîæíà îòðèìóâàòè ç ìîâè AL äîäàâàí-
íÿì íîâèõ êîíñòðóêòîð³â ó âèçíà÷åííÿ êîíöåïò³â ³ ðîëåé (òàáë. 1).
Òàêèì ÷èíîì, ìîæíà âèçíà÷èòè íèçêó ìîâ çàëåæíî â³ä òîãî, ÿê³ êîíñòðóêòî-
ðè áóäóòü äî íèõ âêëþ÷åí³:
166 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
Ò à á ë è ö ÿ 1. Êîíñòðóêòîðè êîíöåïò³â òà ðîëåé äëÿ ìîâ ñ³ìåéñòâà AL
AL Êîíñòðóêòîð ²íòåðïðåòàö³ÿ
U C D� (îá’ºäíàííÿ) ( )C D C DI I I� � �
E
�R C. (ïîâíèé êâàíòîð
³ñíóâàííÿ)
( . ) | [( , ) ]� � � � � � �R C a b a b R b CI I I I{ }
N � �nR nR, (ê³ëüê³ñí³
îáìåæåííÿ)
( ) | | | ( , ) |� � � � �nR a b a b R nI I I{ { } }
,
( ) | | | ( , ) |� � � � �nR a b a b R nI I I{ { } }
C �C (äîïîâíåííÿ äîâ³ëüíîãî
êîíöåïòó)
( ) \� �C CI I I
Q � �nR C nR C. , . (ÿê³ñí³
îáìåæåííÿ)
( . ) | | | ( , ) |� � � � � � �nR C a b a b R b C nI I I{ { } }
,
( . ) | | | ( , ) |� � � � � � �nR C a b a b R b C nI I I{ { } }
I R�1 (îáåðíåíà ðîëü) ( ) ( , ) | ( , )R b a a b RI I I I� � � � �1 { }
AL :� � � � �� �| | | | | . | .A A C D R R C� ;
ALU := � �| | | | | | . | .� � � �A A C D C D R R C� � ;
ALE := � | | | | | . | .� � � �A A C D R C R C� ;
ALEN :=� | | | | | . | . | |� � � � � �A A C D R C R C nR nR� ;
ALC := � �| | | | | . | .� � � �A C C D R R C� ;
ALCQ := � �| | | | | . | . | . | .� � � � � �A C C D R R C nR C nR C� .
Òåîðåìà 1. Ìàþòü ì³ñöå òàê³ ñï³ââ³äíîøåííÿ:
a) ALC ALUE� ;
á) ALE ALQ� ;
â) ALN ALQ� ;
ã) ALX ALCQ U E N C Q� � �, , , , ,X { } .
Äîâåäåííÿ. Íàâåäåí³ ñï³ââ³äíîøåííÿ âèïëèâàþòü:
à) — ç âëàñòèâîñòåé òåîðåòèêî-ìíîæèííèõ îïåðàö³é;
á) — ç îçíà÷åííÿ ÿê³ñíèõ îáìåæåíü òà ïîâíîãî êâàíòîðà ³ñíóâàííÿ (ä³éñíî,
( . ) ( .� � �R C R Ñ1 ));
â) — ç îçíà÷åííÿ ÿê³ñíèõ òà ê³ëüê³ñíèõ îáìåæåíü (ä³éñíî, ( ) ( .� � �nR nR �),
( ) ( .� � �nR nR �));
ã) — ç îçíà÷åííÿ äîïîâíåííÿ äî êîíöåïòó òà ÿê³ñíèõ îáìåæåíü, äëÿ ÷îãî
äîñòàòíüî äîâåñòè, ùî êîíñòðóêòîðè U E, , N âèðàæàþòüñÿ ÷åðåç C òàQ , ùî âèï-
ëèâຠç à) òà â). �
1.2. Âêëàäåííÿ ëîã³êè ALCQ ó ëîã³êó ïðåäèêàò³â. Îñê³ëüêè ³íòåðïðåòàö³ÿ I
ñòàâèòü êîæíîìó àòîìàðíîìó êîíöåïòó A ó â³äïîâ³äí³ñòü ïåâíó ï³äìíîæèíó îá-
ëàñò³ ³íòåðïðåòàö³¿ A I I�
, òàêîìó êîíöåïòó ìîæíà ïîñòàâèòè ó â³äïîâ³äí³ñòü
îäíîì³ñíèé ïðåäèêàò P xA ( ) íàëåæíîñò³ ³íäèâ³äà x êîíöåïòó A. Àíàëîã³÷íî ìîæ-
íà âèçíà÷èòè äâîì³ñíèé ïðåäèêàò P x yR ( , ) ³ñíóâàííÿ â³äíîøåííÿ R ì³æ
³íäèâ³äàìè x òà y.
Îòæå, êîæíîìó êîíöåïòó C ó â³äïîâ³äí³ñòü ìîæíà ïîñòàâèòè ôîðìóëó
�C x( ) òàêó, ùî äëÿ äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ìíîæèíà åëåìåíò³â
I , ùî çàäî-
âîëüíÿþòü �C x( ), º òî÷íî C I :
�
�
( )x T� ;
�� �( )x F ;
� A Ax P x( ) ( )� ;
� � �C D C Dx x x� ( ) ( ) ( )� � ;
� � �C D C Dx x x� ( ) ( ) ( )� � ;
� �� � �
R C Cx y R x y x. ( ) [ ( , ) ( )];
� �� � � �R C Cx y R x y x. ( ) [ ( , ) ( )];
��
�
� � � � � ��
��
�
�
�nR n n
i j
i jx y y R x y R x y y y( ) , ..., ( , ) ( , )1 1 � ;
�� ! !
�
� � � �
�� �nR n n
i j
i jx y y R x y R x y y y( ) , ..., ( , ) ( , )1 1 1 1�
��
�
�
;
�� �nR C x. ( )
� � � � � � � � �
�
y y R x y R x y y y yn n C C n
i j
1 1 1, ..., ( , ) ( , ) ( ) ( )� �� � i jy��
��
�
�
;
�� �nR C x. ( )
�� � � � � �
! !
�
�y y R x y R x y y yn n C C n
i
1 1 1 1 1, , ( , ) ( , ) ( ) ( )� � �� �
j
i jy y�
�
��
�
�
.
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 167
Òàêå âêëàäåííÿ äຠçìîãó çàñòîñîâóâàòè ìåòîä ðåçîëþö³é äëÿ ïåðåâ³ðêè
âêëþ÷åííÿ ÷è åêâ³âàëåíòíîñò³ êîíöåïò³â. Ïðîòå, ïîïðè ìîæëèâ³ñòü âêëàäåííÿ
äåñêðèïòèâíî¿ ëîã³êè â ëîã³êó ïðåäèêàò³â ïåðøîãî ïîðÿäêó, íåîáõ³äí³ñòü îêðå-
ìîãî àïàðàòó òàêèõ ëîã³ê çóìîâëåíà äåùî ñòèñë³øîþ ôîðìîþ ïîäàííÿ òâåð-
äæåíü, ùî, çîêðåìà, ó âèïàäêó ê³ëüê³ñíèõ òà ÿê³ñíèõ îáìåæåíü íàäຠìîæëèâ³ñòü
âèêîðèñòîâóâàòè åôåêòèâí³ø³ àëãîðèòìè âèâåäåííÿ, í³æ ó ëîã³ö³ ïðåäèêàò³â.
1.3. Ïðåäñòàâëåííÿ çíàíü. Íà áàç³ íàâåäåíèõ âèùå ñèíòàêñèñó òà ñåìàíòèêè
ìîæíà âèçíà÷èòè çàñîáè ïîäàííÿ òâåðäæåíü ùîäî ñï³ââ³äíîøåííÿ êîíöåïò³â ³ ðîëåé.
Îçíà÷åííÿ 4. Òåðì³íîëîã³÷íîþ àêñ³îìîþ íàçèâàºòüñÿ òâåðäæåííÿ âèãëÿäó
C D� , C D� , R S� àáî R S� , äå C D, — êîíöåïòè, à R S, — ðîë³. ²íòåðïðåòàö³ÿ I
çàäîâîëüíÿº òåðì³íîëîã³÷íó àêñ³îìó T , ÿêùî âîíà ³íòåðïðåòóºòüñÿ â í³é ÿê ³ñòèíà.
Ïðè öüîìó ¿¿ íàçèâàþòü ìîäåëëþ àêñ³îìè T .
Òåðì³íîëîã³ÿ (TBox) áàçè çíàíü º ìíîæèíîþ òåðì³íîëîã³÷íèõ àêñ³îì.
Ïðèêëàä 1. Íåõàé
CN � {Êîòÿ÷èé, ʳò, Òèãð, ʳøêà, Êîøåíÿ, Ñòàòü_æ³íî÷à, Òâàðèíà, ³ê � 4}
òà
RN � {ìàº_äèòèíó}
º ìíîæèíàìè àòîìàðíèõ êîíöåïò³â òà àòîìàðíèõ ðîëåé â³äïîâ³äíî. Ðîçãëÿíåìî
ïðîñòèé ïðèêëàä òåðì³íîëî㳿 (TBox) íà îñíîâ³ ï³äìíîæèíè êëàñèô³êàö³¿ òâàðèí:
ʳò � Êîòÿ÷èé;
Òèãð � Êîòÿ÷èé;
ʳøêà � Ñòàòü_æ³íî÷à � ʳò;
Êîòÿ÷èé � Òâàðèíà;
Êîøåíÿ � ʳò � ³ê� 4;
ʳò ��ìàº_äèòèíó.ʳò;
ʳò � �1ìàº_äèòèíó�1 .ʳøêà;
ʳò � �1ìàº_äèòèíó�1 .�Ñòàòü_æ³íî÷à � ʳò.
Ó âêàçàí³é òåðì³íîëî㳿 âèçíà÷åíî ïåâíó ³ºðàðõ³þ àòîìàðíèõ êîíöåïò³â, ùî
â³ääçåðêàëþº íàëåæí³ñòü êîò³â òà òèãð³â äî ðîäèíè êîòÿ÷èõ, ðîäèíè êîòÿ÷èõ äî
êîíöåïòó òâàðèí, âèçíà÷àþòü ê³øêó ÿê êîòà æ³íî÷î¿ ñòàò³, à êîøåíÿ ÿê êîòà â³êîì
ìåíøå ÷îòèðüîõ ðîê³â. Äâà îñòàíí³ îáìåæåííÿ âêàçóþòü, ùî êîòè íàðîäæóþòü
ò³ëüêè êîò³â ³ êîæåí ê³ò ìຠò³ëüêè äâîõ áàòüê³â: ê³øêó òà êîòà (÷îëîâ³÷î¿ ñòàò³).
Îêð³ì îïèñó â³äíîøåíü ì³æ êîíöåïòàìè òà ðîëÿìè, ó áàç³ çíàíü òàêîæ ïî-
âèííà áóòè ³íôîðìàö³ÿ ùîäî îêðåìèõ ôàêò³â òà îêðåìèõ îá’ºêò³â ïðåäìåòíî¿ îá-
ëàñò³ (³íäèâ³ä³â) ó òåðì³íàõ êîíöåïò³â ³ ðîëåé.
Óâåäåìî äîäàòêîâî íîâó ìíîæèíó IN a am� { }1, ..., ³ìåí ³íäèâ³ä³â.
×àñòèíà áàçè çíàíü, ùî ì³ñòèòü ³íôîðìàö³þ ïðî îêðåì³ ³íäèâ³äè, íàçè-
âàºòüñÿ ABox (assertion box) òà ñêëàäàºòüñÿ ç äâîõ òèï³â ôàêò³â:
� a A: (íàëåæí³ñòü ³íäèâ³äà a IN� äî êîíöåïòó A);
� aRb (çâ’ÿçîê äâîõ ³íäèâ³ä³â a b IN, � ðîëëþ R).
Îçíà÷åííÿ 5. ²íòåðïðåòàö³ÿ I íàçèâàºòüñÿ ìîäåëëþ òåðì³íîëî㳿 T , ÿêùî
âîíà º ìîäåëëþ âñ³õ ¿¿ àêñ³îì. ²íòåðïðåòàö³ÿ I íàçèâàºòüñÿ ìîäåëëþ ñèñòåìè
ôàêò³â A, ÿêùî äëÿ äîâ³ëüíèõ ôàêò³â a A: òà aRb ìຠì³ñöå a AI I� òà
( , )a b RI I I� . ×àñòèíà áàçè çíàíü ABox A íàçèâàºòüñÿ âèêîíóâàíîþ (â³äíîñíî
òåðì³íîëî㳿 T ), ÿêùî A ìຠìîäåëü, ÿêà º îäíî÷àñíî ³ ìîäåëëþ T .
1.4. Îñíîâí³ çàäà÷³. Çàäà÷à íàïîâíåííÿ áàçè çíàíü ïîâ’ÿçàíà ç ïåðåâ³ðêîþ
òîãî, ÷è ìຠíîâèé ¿¿ êîíöåïò çì³ñò ó ìåæàõ âæå íàÿâíèõ çâ’ÿçê³â àáî º íàâïàêè
ñóïåðå÷ëèâèì, ÷è âêëþ÷àºòüñÿ â³í â ³íøèé êîíöåïò, ÷è º åêâ³âàëåíòíèì íàÿâíî-
ìó êîíöåïòîâ³ àáî äèç’þíêòíèì ùîäî íüîãî. Ç îãëÿäó íà öå êëþ÷îâèìè çàäà÷àìè
168 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
âèâåäåííÿ äëÿ òåðì³íîëîã³é º:
� âèêîíóâàí³ñòü — êîíöåïò C âèêîíóâàíèé ó òåðì³íîëî㳿 T , ÿêùî ³ñíóº ìî-
äåëü I òåðì³íîëî㳿 T òàêà, ùî C I íåïóñòå;
� ïîãëèíàííÿ — êîíöåïò C ïîãëèíàºòüñÿ êîíöåïòîì D ó òåðì³íîëî㳿 T
( )C D�T , ÿêùî äëÿ êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 T âèêîíóºòüñÿ C DI I� ;
� åêâ³âàëåíòí³ñòü — êîíöåïòè C òà D åêâ³âàëåíòí³ â òåðì³íîëî㳿 T
( )C D�T , ÿêùî äëÿ êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 âèêîíóºòüñÿ C DI I� ;
� äèç’þíêòí³ñòü — êîíöåïòè C òà D äèç’þíêòí³ â òåðì³íîëî㳿 T , ÿêùî äëÿ
êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 âèêîíóºòüñÿ C DI I� ��.
Òåîðåìà 2. Ìàþòü ì³ñöå òàê³ òâåðäæåííÿ:
C — âèêîíóâàíèé " C �T �;
C D C D D C� " �T T T� � ;
C D, — äèç’þíêòèâí³ " �C D� �T ;
C D C D� �T " � — íåâèêîíóâàíèé;
C D C D D C� " � �T � �, — íåâèêîíóâàí³;
C D, — äèç’þíêòèâí³ " C D� — íåâèêîíóâàíèé.
Äîâåäåííÿ öèõ òâåðäæåíü âèïëèâຠç âëàñòèâîñòåé â³äïîâ³äíèõ òåîðåòè-
êî-ìíîæèííèõ îïåðàö³é.
Íàñë³äêîì öèõ òâåðäæåíü º òå, ùî äëÿ ðîçâ’ÿçàííÿ íàâåäåíèõ âèùå ÷îòèðüîõ
çàäà÷ äîñòàòíüî ðîçâ’ÿçàòè çàäà÷ó ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó àáî ïå-
ðåâ³ðêè âêëþ÷åííÿ êîíöåïò³â.
Îçíà÷åííÿ 6. Àëãîðèòì U ðîçâ’ÿçóº ïðîáëåìó âèêîíóâàíîñò³ êîíöåïò³â
ó òåðì³íîëî㳿 T äëÿ äåñêðèïòèâíî¿ ëîã³êè L , ÿêùî âèêîíóþòüñÿ òàê³ óìîâè:
� òåðì³íàëüí³ñòü — äëÿ äîâ³ëüíèõ êîíöåïòó C ³ òåðì³íîëî㳿 T àëãîðèòì U
ãåíåðóº â³äïîâ³äü U C( , )T çà ñê³í÷åííèé ÷àñ;
� êîðåêòí³ñòü — äëÿ äîâ³ëüíèõ C ³ T , ÿêùî C âèêîíóºòüñÿ â òåðì³íîëî㳿 T ,
òî U C( , )T �1;
� ïîâíîòà — äëÿ äîâ³ëüíèõ C ³ T , ÿêùî U C( , )T �1, òî C âèêîíóºòüñÿ
â òåðì³íîëî㳿 T .
1.5. Àëãîðèòì ñåìàíòè÷íîãî òàáëî äëÿ ALCQ ç òåðì³íîëîã³ÿìè. Ðîçãëÿíå-
ìî àëãîðèòì ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó.
Íåõàé íåîáõ³äíî ïåðåâ³ðèòè âèêîíóâàí³ñòü êîíöåïòó C. Ñôîðìóºìî ïî÷àò-
êîâèé ABox A áàçè çíàíü ç ºäèíèì òâåðäæåííÿì x C: .
ßê ï³äãîòîâ÷èé êðîê íîðìàë³çóºìî êîíöåïò C, òîáòî îäåðæèìî åêâ³âàëåí-
òíèé êîíöåïò, â ÿêîìó âñ³ çàïåðå÷åííÿ (äîïîâíåííÿ) ñòîÿòü ò³ëüêè ïåðåä àòîìàð-
íèìè êîíöåïòàìè. Äëÿ öüîãî ìîæíà ñêîðèñòàòèñÿ òîòîæíîñòÿìè:
� �� �( )C D C D� � ; � �� �( )C D C D� � ;
�� � � �R C R C. . ; �� � � �R C R C. . ;
� � � � �nR C n R C. ( ) .1 ; � � � � !nR C n R C. ( ) .1 ; �� �C C .
Íàäàë³ ââàæàòèìåìî, ùî êîíöåïòè íîðìàë³çîâàí³.
Îçíà÷åííÿ 7. ²íäèâ³ä x áëîêóº ³íäèâ³äà y , ÿêùî x º ïðåäêîì y òà äëÿ
äîâ³ëüíîãî êîíöåïòó C ìຠì³ñöå òâåðäæåííÿ y C x C: :� # �A A . ²íäèâ³ä x íà-
çèâàºòüñÿ àêòèâíèì, ÿêùî â³í íå áëîêóºòüñÿ æîäíèì ³íøèì ³íäèâ³äîì.
Íà êîæíîìó êðîö³ àëãîðèòìó çàñòîñîâóºìî äî ABox îäíå ç ïðàâèë, íàâåäåíèõ
ó òàáë. 2. Ïîñë³äîâí³ñòü âèêîíàííÿ ïðàâèë ó öüîìó àëãîðèòì³ äîâ³ëüíà çà âèíÿòêîì
�-ïðàâèëà, ÿêå âèêîíóºòüñÿ ò³ëüêè, ÿêùî æîäíå ³íøå çàñòîñóâàòè íåìîæëèâî.
Àëãîðèòì çàâåðøóº ñâîþ ðîáîòó, ÿêùî äî íàñòóïíîãî ABox íåìîæëèâî çà-
ñòîñóâàòè æîäíîãî ç ïðàâèë, àáî ÿêùî â íüîìó ì³ñòèòüñÿ ñóïåðå÷í³ñòü (íàÿâíèé
ôàêò x :� àáî ôàêòè x A x A: , :� îäíî÷àñíî, àáî äîñÿãíóòî ñóïåðå÷íîñò³ íà �-ïðà-
âèë³). Ïî÷àòêîâèé êîíöåïò âèêîíóâàíèé, ÿêùî ï³ä ÷àñ ðîáîòè àëãîðèòìó òðàï-
ëÿºòüñÿ íåñóïåðå÷ëèâèé ABox, äî ÿêîãî íåìîæëèâî çàñòîñóâàòè æîäíîãî ç ïðà-
âèë. Ó ðåøò³ âèïàäê³â êîíöåïò íåâèêîíóâàíèé.
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 169
Ïðèêëàä 2. Íåõàé ³ñíóº áàçà çíàíü:
CN � {Êîòÿ÷èé, ʳò, Òèãð, ʳøêà, Êîøåíÿ, Ñòàòü_æ³íî÷à, Òâàðèíà, ³ê � 4},
RN � {ìàº_äèòèíó},
ʳò � Êîòÿ÷èé,
Òèãð � Êîòÿ÷èé,
ʳøêà � Ñòàòü_æ³íî÷à � ʳò,
Êîòÿ÷èé � Òâàðèíà,
Êîøåíÿ � ʳò � ³ê� 4,
ʳò �� ìàº_äèòèíó.ʳò,
ʳò � �1ìàº_äèòèíó �1.ʳøêà;
ʳò � �1ìàº_äèòèíó �1.�Ñòàòü_æ³íî÷à � ʳò.
Ðîçãëÿíåìî çàäà÷ó ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó:
ʳò ��� ìàº_äèòèíó �1.�.
Çâåäåìî êîíöåïò äî íîðìàëüíî¿ ôîðìè òà îòðèìàºìî ³í³ö³àëüíèé ABox âèãëÿäó
{x :ʳò �� ìàº_äèòèíó �1.�}.
Çàñòîñóºìî �-ïðàâèëî, ï³ñëÿ ÷îãî îäåðæèìî íîâèé ABox âèãëÿäó
{x : ʳò �� ìàº_äèòèíó �1. � , :x ʳò, x :� ìàº_äèòèíó � �1. }.
Çã³äíî ç T -ïðàâèëîì, çàñòîñîâàíèì äî ôàêòó x :ʳò, îòðèìàºìî ABox
x ʳò ìàº_äèòèíó x ʳò x ìàº_äèòèíó
x
: . , : : . ,
:
�� � � �
�
� �1 1
1
,
ìàº_äèòèíó ʳøêà�
$
%
&
'
(
)
1. ,�
.
170 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
Ò à á ë è ö ÿ 2. Ïðàâèëà àëãîðèòìó ñåìàíòè÷íîãî òàáëî äëÿ ALCQ
Ïðàâèëî Óìîâè çàñòîñóâàííÿ ijÿ
� -ïðàâèëî
x — àêòèâíèé; x C D: ( )� � A ;
x C x D: :* � *A A
A A'� � { }x C x D: , :
�-ïðàâèëî
x — àêòèâíèé; x C D: ( )� � A ;
x C x D: :* � *A A
A A'� � { }x C: , A A' '� � { }x D:
�-ïðàâèëî
x — àêòèâíèé; x R C: .� � A ;
� � � *y xRy y C: :A A
A A'� � { }y C:
T -ïðàâèëî
x — àêòèâíèé; x E: * A ,
äå ��E �T
A A'� � { }x E:
choose-ïðàâèëî
x — àêòèâíèé; x nR C: .� �A ;
xRy y C y C� * � *A A A, : , :
A A A' ' '� � � � �{ } { }y C A y C: , :
�-ïðàâèëî
x — àêòèâíèé; x nR C: .� �A ;
�� y yn1 , ... , [
( [ , : ])� � � � �1 i n xRy y Ci i{ } A
�� � � �i j y yi j[ ]A
]
y yn1 ,... , — íàùàäêè x ;
A A'� �
� �
$
%
+
+
&
+
+
'
(
+
+
)
+
+
xRy y C
xRy y C
y y i j
n n
i j
1 1, :
, :
,
�
�-ïðàâèëî
x — àêòèâíèé; x nR C: .� �A ;
� !y yn1 1, ... , [
( [ , : ])� � � ! �1 1i n xRy y Ci i{ } A
]
ßêùî � � � *i j y yi j[ ]A , òî
�i j, òàêèõ, ùî y yi j� *A ,
A Aij
j ix x�
| , äå A | x xj i
—
ABox, â ÿêîìó âñ³ x j çàì³íåíî íà xi.
²íàêøå — ñóïåðå÷í³ñòü.
Íà îñíîâ³ �-ïðàâèëà îòðèìàºìî ôàêòè
ìàº_äèòèíó �1 ( , ),x y
y:ʳøêà.
Çã³äíî ç �-ïðàâèëîì îäåðæóºìî ôàêò
y:� ,
à îòæå, ïî÷àòêîâèé êîíöåïò íåâèêîíóâàíèé. Öå îçíà÷àº, ùî íå ³ñíóº êîò³â, ùî
íå ìàþòü áàòüê³â.
Ëåìà 1 (òåðì³íàëüí³ñòü). Íå ³ñíóº íåñê³í÷åííî¿ ïîñë³äîâíîñò³ A A0 1, , ... ,
â ÿê³é êîæíèé ABox Ai!1 îäåðæàío ç Ai çà äåÿêèì ïðàâèëîì àëãîðèòìó ñåìàí-
òè÷íîãî òàáëî.
Äîâåäåííÿ. Ðîáîòó àëãîðèòìó ñåìàíòè÷íîãî òàáëî ìîæíà ïðåäñòàâèòè
ó âèãëÿä³ äåðåâà (ðèñ. 1). Âåðøèíàìè öüîãî äåðåâà º ABox , éîãî êîðåíåì —
³í³ö³àëüíèé ABox A0 0 0� { }x C: . Ëèñòêàìè öüîãî äåðåâà º ò³ ABox, äî ÿêèõ íå-
ìîæëèâî çàñòîñóâàòè æîäíîãî ç ïðàâèë, à òàêîæ ò³, ÿê³ ì³ñòÿòü ñóïåðå÷í³ñòü.
Ìàêñèìàëüíà ê³ëüê³ñòü ðåáåð, ùî âèõîäÿòü ç êîæíî¿ âåðøèíè öüîãî äåðåâà, âèç-
íà÷àºòüñÿ �-ïðàâèëîì òà îáìåæåíà êâàäðàòîì çàãàëüíî¿ ê³ëüêîñò³ ³íäèâ³ä³â
ó â³äïîâ³äíîìó ABox. Çàçíà÷èìî, ùî ïîâòîðíå çàñòîñóâàííÿ �-ïðàâèë, ÿê³ º ºäè-
íèì äæåðåëîì íîâèõ ³íäèâ³ä³â ó öüîìó àëãîðèòì³, íåìîæëèâå ÷åðåç ñóïåðå÷í³ñòü
éîãî ðåçóëüòàòó óìîâ³ éîãî âèêîíàííÿ. Òàêèì ÷èíîì, ìàêñèìàëüíà ê³ëüê³ñòü
³íäèâ³ä³â ó âñ³õ ñòâîðåíèõ çà äîïîìîãîþ àëãîðèòìó ABox îáìåæåíà ñóìîþ
ê³ëüêîñòåé ³íäèâ³ä³â â ³í³ö³àëüíîìó ABox òà ÷èñëîâèõ õàðàêòåðèñòèê êîíñòðóê-
òîð³â òèïó � â óñ³õ êîíöåïòàõ ³í³ö³àëüíîãî ABox.
Îòæå, ìàêñèìàëüíà ê³ëüê³ñòü ðåáåð, ùî âèõîäÿòü ç êîæíî¿ âåðøèíè (¿¿ ùå
íàçèâàþòü øèðèíîþ äåðåâà), îáìåæåíà ñóìîþ ê³ëüêîñòåé ³íäèâ³ä³â â ³í³ö³àëüíî-
ìó ABox òà ÷èñëîâèõ õàðàêòåðèñòèê êîíñòðóêòîð³â òèïó �, ùî âèçíà÷àþòüñÿ
âõ³äíèìè äàíèìè àëãîðèòìó.
Ïîáóäóºìî ìíîæèíó ï³äêîíöåïö³â êîíöåïòó C ó òàêèé ñïîñ³á:
Sub ( ) { }� �� ;
Sub ( ) { }� � � ;
Sub A A A CN( ) { },� � ;
Sub C C Sub C( ) { } ( )� � � � ;
Sub C D C D Sub C Sub D( ) { } ( ) ( )� �� � � ;
Sub C D C D Sub C Sub D( ) { } ( ) ( )� �� � � ;
Sub R C R C Sub C( . ) { . } ( )� � � � ;
Sub nR C nR C Sub C( . ) { . } ( )� � � � ;
Sub nR C nR C Sub C( . ) { . } ( )� � � � .
Òîä³ ìíîæèíà êîíöåïò³â êîæíîãî ³íäèâ³äà äîâ³ëüíîãî ABox ï³ä ÷àñ âèêîíàííÿ
àëãîðèòìó íàëåæèòü ìíîæèí³ Sub C Sub E( ) ( )0 � , à îòæå ñê³í÷åííà.
Ç ³íøîãî áîêó, äîâæèíà áóäü-ÿêîãî ëàíöþãà â äåðåâ³ â³ä éîãî êîðåíÿ äî ëèñ-
òêà íå ìîæå ïåðåâèùóâàòè çíà÷åííÿ 2n , n Sub C Sub E� �| ( ) ( ) |0 , à ÿêùî öÿ óìî-
âà íå âèêîíóºòüñÿ, òî ³ñíóâàòèìóòü äâà
³íäèâ³äè ç îäíàêîâèìè êîíöåïòàìè ³
îäèí ç íèõ áëîêóâàòèìå ³íøîãî, ùî çó-
ïèíèòü çðîñòàííÿ äîâæèíè ëàíöþãà.
Îòæå, îñê³ëüêè ê³ëüê³ñòü ðåáåð ç
îäí³º¿ âåðøèíè, äîâæèíà ëàíöþãà â³ä
êîðåíÿ äî ëèñòêà, à òàêîæ êîæåí ABox
ñê³í÷åíí³, òî òàêîãî íåñê³í÷åííîãî
ëàíöþãà ABox íå ³ñíóº. �
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 171
Ðèñ. 1. Ñõåìà àëãîðèòìó ñåìàíòè÷íîãî òàáëî
A0 A1
A3
A2 A4
A5
A7
A6
A8
Ëåìà 2 (êîðåêòí³ñòü). Ñïðàâåäëèâ³ òàê³ òâåðäæåííÿ:
1) êîíöåïò C âèêîíóâàíèé â³äíîñíî T òîä³ ³ ò³ëüêè òîä³, êîëè ABox
A0 0 0� { }x C: âèêîíóâàíèé â³äíîñíî T ;
2) íåõàé A' îäåðæàíèé ç A çà äîïîìîãîþ îäíîãî ç ïðàâèë � , � , T , � àëãîðèò-
ìó. Òîä³, ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî A' òåæ âèêîíóâàíèé â³äíîñíî T ;
3) íåõàé A' òà A' ' îäåðæàí³ ç A çà äîïîìîãîþ îäíîãî ç ïðàâèë � , choose.
Òîä³ ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî A' àáî A' ' òåæ âèêîíóâàí³ â³äíîñíî T ;
4) íåõàé A A A1 2, , ..., k îäåðæàí³ ç A çà äîïîìîãîþ ïðàâèëà � àëãîðèòìó.
Òîä³ ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî ïðèíàéìí³ îäèí ç A A A1 2, , ..., k òåæ
âèêîíóâàíèé â³äíîñíî T .
Äîâåäåííÿ. Òâåðäæåííÿ 1 î÷åâèäíå. Äëÿ äîâåäåííÿ òâåðäæåíü 2 òà 3 ðîçãëÿ-
íåìî êîæíå ïðàâèëî îêðåìî:
� íåõàé A' îäåðæàíèé ç A çà � -ïðàâèëîì. Òîä³ ÿêùî A âèêîíóâàíèé, òî
³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ � -ïðàâèëà x C DI I�( )� . Îòæå, ñïðà-
âåäëèâî x C D x C x DI I I I I I I� � # � � � . Òàêèì ÷èíîì, I — ìîäåëü A';
� íåõàé A' îäåðæàíèé ç A çà �-ïðàâèëîì. Òîä³ ÿêùî A âèêîíóâàíèé, òî ³ñíóº
éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x R C x R yI I I I I� �( . ) , . Îòæå,
äëÿ äîâ³ëüíîãî åëåìåíòà d I�
òàêîãî, ùî x R dI I , ñïðàâåäëèâî d C I� . Àëå öå
ñïðàâåäëèâî ³ äëÿ d yI� , òîìó y CI I� . Òàêèì ÷èíîì, I — ìîäåëü A';
� íåõàé A' îäåðæàíèé ç A çà T -ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé, ³ñíóº
éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ T -ïðàâèëà
I I I IE x E� # � . Òàêèì ÷è-
íîì, I — ìîäåëü A';
� íåõàé A' îäåðæàíèé ç A çà �-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé, ³ñíóº
éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x nR CI I� �( . ) . Îòæå,
x a b a b R b C nI I I� � � � � �{ { } }
: | | ( , ) | . Çâ³äñè âèïëèâàº, ùî ³ñíóþòü ïîïàðíî
ð³çí³ åëåìåíòè d d Cn
I
1, ..., � òàê³, ùî x R dI I
i . Ç ³íøîãî áîêó, äëÿ A' íàÿâí³ ïî-
ïàðíî ð³çí³ y yI
n
I
1 , ..., òàê³, ùî x R y x R y y C y CI I I I I
n
I I I
n
I I
1 1, ..., , , ...,� � . Òàêèì
÷èíîì, I — ìîäåëü A';
� íåõàé A', A' ' îäåðæàí³ ç A çà � -ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé,
³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ � -ïðàâèëà x C DI I� ( )� . Îòæå,
x C D x C x DI I I I I I I� � # � � � . Òàêèì ÷èíîì, I — ìîäåëü àáî A', àáî A' ' ;
� íåõàé A', A' ' îäåðæàí³ ç A çà choose-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâà-
íèé, ³ñíóº éîãî ìîäåëü I . Îòæå, x C x C x C x CI I I I I I I I� � �� # � � � �( ) .
Òàêèì ÷èíîì, I — ìîäåëü àáî A', àáî A' ' ;
� íåõàé A A A1 2, , ..., k îäåðæàí³ ç A çà �-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâà-
íèé, ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x nR CI I� �( . ) . Îòæå,
x a b a b R b C nI I I� � � � � �{ { } }
: | | ( , ) | ) . Îñê³ëüêè çà óìîâîþ ïðàâèëà ³ñíóº
n!1 ³íäèâ³ä, ùî çàäîâîëüíÿº òàêèì ïðàâèëàì, òî äëÿ äåÿêèõ ³íäèâ³ä³â d d1 2, áóäå
ñïðàâåäëèâèì d dI I
1 2� . Íåõàé A j óòâîðåíèé çàì³íîþ d2 íà d1. Îñê³ëüêè ¿õí³
³íòåðïðåòàö³¿ çá³ãàþòüñÿ, I — ìîäåëü A j . �
Ëåìà 3 (ïîâíîòà). Íåñóïåðå÷íèé ABox, äî ÿêîãî íå ìîæíà çàñòîñóâàòè æîä-
íîãî ç ïðàâèë àëãîðèòìó, âèêîíóâàíèé.
Äîâåäåííÿ. Íåõàé A — íåñóïåðå÷íèé ABox, îòðèìàíèé ç A0 , ³ äî íüîãî íå
ìîæíà çàñòîñóâàòè æîäíîãî ç ïðàâèë àëãîðèòìó.
Ïîáóäóºìî ³íòåðïðåòàö³þ I äëÿ A ó òàêèé ñïîñ³á:
I x x: |� �{ }A ;
172 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
A x x C x zI I: | : |� � � �{ } {
A áëîêóº x z C z� � �: A — àêòèâíèé};
R x y xRy xI : ( , ) |� � �{ A — àêòèâíèé}�
�{( , ) |x y z áëîêóº x zRy z� � �A — àêòèâíèé}.
Äî A íå ìîæíà çàñòîñóâàòè T -ïðàâèëî, à îòæå
x x E z zI I I I�
� � �
( [ áëîêóº x z� — àêòèâíèé]).
Ç îçíà÷åííÿ áëîêóâàííÿ z EI I� , òîìó çà ïîáóäîâîþ x EI I� . Çâ³äñè I º ìî-
äåëëþ T .
Ðîçãëÿíåìî ôàêò xRy�A . Çà ïîáóäîâîþ I ìàºìî x R yI I I .
Äëÿ ôàêò³â x C: �A ñêîðèñòàºìîñü ìåòîäîì ìàòåìàòè÷íî¿ ³íäóêö³¿.
Íåîáõ³äíî äîâåñòè òàêå òâåðäæåííÿ:
� � �
�x x C x CI I
[ : ]A .
Ç óðàõóâàííÿì íîðìàë³çîâàíîñò³ êîíöåïò C ïîáóäîâàíî ç êîíöåïò³â �, � , A ,
� A (äå A — àòîìàðíèé) çà äîïîìîãîþ îïåðàòîð³â � �, , , ,� � � .
Òàêîæ çàóâàæèìî, ùî äëÿ áóäü-ÿêîãî íåàêòèâíîãî ³íäèâ³äà x ³ñíóº àêòèâíèé
³íäèâ³ä y , ùî éîãî áëîêóº.
Áàçà ³íäóêö³¿:
�� � � � # � � � �
��x x x x xI I
[ : ] [ : ]A A ;
� � � # � � �
�x x x x xI I I I
[ ] [ : ]� A ;
{ }x x A A x x A x AI I I I� � � # � � �
�
| : [ : ]A A ;
x A x A x A x A x A x AI I I I: ( ) :� � � * � # � � � � # �� � � #A A A' —
ñóïåðå÷íà.
Êðîê ³íäóêö³¿.
Âèïàäîê 1. Íåõàé x D E: � � A. Îñê³ëüêè çàñòîñóâàòè � -ïðàâèëî äî A íå-
ìîæëèâî, ñïðàâäæóºòüñÿ
� �
� � � � �x x D E x D x E z z[ : ( : : ) [� A A A áëîêóº x z� — àêòèâíèé]].
Çà ïîáóäîâîþ ç x D x E: :� � �A A âèïëèâຠx D x EI I� � � .
Ó ïðîòèëåæíîìó âèïàäêó çà îçíà÷åííÿì áëîêóâàííÿ z D E: � � A, à ç àêòèâ-
íîñò³ z âèïëèâàº, ùî z D z E: :� � �A A. Çà ïîáóäîâîþ ³íòåðïðåòàö³¿ îäåðæóºìî
x D x EI I� � � . Îòæå, x D E D EI I I� � � ( )� .
Âèïàäîê 2. Íåõàé x D E: � � A . Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå-
ìîæëèâî, ñïðàâäæóºòüñÿ
� �
� � � � �x x D E x D x E z z[ : ( : : ) [� A A A áëîêóº x z� — àêòèâíèé]].
Çà ïîáóäîâîþ ç x D x E: :� � �A A âèïëèâຠx D x EI I� � � .
Ó ïðîòèëåæíîìó âèïàäêó çà îçíà÷åííÿì áëîêóâàííÿ z D E: � � A , à ç àêòèâ-
íîñò³ z âèïëèâàº, ùî z D z E: :� � �A A . Çà ïîáóäîâîþ ³íòåðïðåòàö³¿ îäåðæóºìî
x D x EI I� � � . Îòæå, x D E D EI I I� � � ( )� .
Âèïàäîê 3. Íåõàé x R D: .� � A. Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå-
ìîæëèâî, ìàºìî
� �
� � �y xRy y D z z[ : [A A áëîêóº x z� — àêòèâíèé]]. (1)
Íåõàé x — àêòèâíèé. Ðîçãëÿíåìî äîâ³ëüíèé y I�
òàêèé, ùî xR yI . Òîä³ çà ïî-
áóäîâîþ xRy� A ³ ç óðàõóâàííÿì (1) ìàºìî y D: � A . Çâ³äñè âèïëèâàº, ùî y D I� .
Íåõàé z — àêòèâíèé ³ áëîêóº x. Âèáåðåìî äîâ³ëüíèé y I�
òàêèé, ùî xR yI .
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 173
Òîä³ çà ïîáóäîâîþ zRy� A ³ ç óðàõóâàííÿì (1) äëÿ àêòèâíîãî z ñïðàâåäëèâî
y D: � A . Çâ³äñè îòðèìóºìî y D I� .
Òàêèì ÷èíîì, x nR D I� �( . ) .
Âèïàäîê 4. Íåõàé x nR D: .� � A. Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå-
ìîæëèâî, ñïðàâäæóºòüñÿ
� � � � � � � � � � �y y i n xRy y D A i j y yn i i i j1 1, ..., [( [ , : ]) [ ]]{ } A
� � z z[ áëîêóº x z� — àêòèâíèé]. (2)
Íåõàé x — àêòèâíèé. Òîä³ ñïðàâåäëèâî xR y y DI
i i
I, � çà ïîáóäîâîþ ³íòåð-
ïðåòàö³¿.
Íåõàé z — àêòèâíèé ³ áëîêóº x. Òîä³ ç óðàõóâàííÿì (2) äëÿ àêòèâíîãî z ñïðà-
âåäëèâî zRy y Di i� �A A, : . Çâ³äñè âèïëèâàº, ùî xR y y DI
i i
I, � çà ïîáóäîâîþ
³íòåðïðåòàö³¿. Îòæå, ³ñíóº n ð³çíèõ åëåìåíò³â ç
I , äëÿ ÿêèõ xR yI
i òà y Di
I� .
Òàêèì ÷èíîì, x nR D I� �( . ) .
Âèïàäîê 5. Íåõàé x mR D: .� � A . Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå-
ìîæëèâî, ñïðàâäæóºòüñÿ
�� � � �!y y i xRy y Dn i i1 1, ..., [ [ , : ]]{ } A
�� z z[ áëîêóº x z� — àêòèâíèé].
Ïåðåòâîðèìî öåé âèðàç â³äïîâ³äíî äî ïðàâèë äå-Ìîðãàíà òà äâî¿ñòîñò³:
� � * � * �y y i xRy y Dn i i1, ..., [ [ : ]A A]
� � z z[ áëîêóº x z� — àêòèâíèé]. (3)
Ïðèïóñòèìî, ùî ³ñíóº n!1 òàêèõ y Di � , ùî x R yI
i � A.
Íåõàé x — àêòèâíèé. Òîä³ äëÿ äîâ³ëüíîãî i ñïðàâåäëèâî y Di : òà xRyi �A,
ùî ñóïåðå÷èòü (3).
Íåõàé z — àêòèâíèé ³ áëîêóº x . Òîä³ äëÿ äîâ³ëüíîãî i ñïðàâåäëèâî
z D x D: :� � �A A òà zRyi � A . Çà îçíà÷åííÿì áëîêóâàííÿ x D z D: :�
�A A ,
îòæå, ìຠì³ñöå z D: � A òà zRyi � A , ùî ñóïåðå÷èòü (3) äëÿ àêòèâíîãî z .
Îòæå, ³ñíóº íå á³ëüøå n ð³çíèõ åëåìåíò³â ç
I , äëÿ ÿêèõ x R yI
i òà y Di
I� .
Òàêèì ÷èíîì, x nR D I� �( . ) . �
Òåîðåìà 3 (ðîçâ’ÿçóâàí³ñòü ALCQ ). Àëãîðèòì ñåìàíòè÷íîãî òàáëî ðîçâ’ÿ-
çóº ïðîáëåìó âèêîíóâàíîñò³ êîíöåïò³â ëîã³êè ALCQ .
Äîâåäåííÿ. Òåðì³íàëüí³ñòü. Ç ëåìè 1 âèïëèâàº, ùî äåðåâî ïîøóêó íå ìàº
íåñê³í÷åííèõ ëàíöþã³â, à îñê³ëüêè ñòóï³íü éîãî ðîçãàëóæåííÿ îáìåæåíèé, äåðå-
âî ïîøóêó ñê³í÷åííå. Îòæå, äëÿ äîâ³ëüíèõ âõ³äíèõ äàíèõ àëãîðèòì ñåìàíòè÷íî-
ãî òàáëî ïîâåðíå â³äïîâ³äü çà ñê³í÷åííèé ÷àñ.
Êîðåêòí³ñòü. ßêùî A0 âèêîíóâàíèé, òî çà ëåìîþ 2 õî÷à á îäèí ç ê³íöåâèõ
ABox A âèêîíóâàíèé. ³í íå ìîæå áóòè ñóïåðå÷íèì, à òîìó º íåñóïåðå÷íèì
ABox, äî ÿêîãî íå ìîæíà çàñòîñóâàòè æîäíîãî ç ïðàâèë. Çà ïîáóäîâîþ àëãîðèòìó
â öüîìó âèïàäêó áóäå îäåðæàíî 1.
Ïîâíîòà. Íåõàé íà âèõîä³ àëãîðèòìó îäåðæàíî 1. Òîä³ ñåðåä éîãî ê³íöåâèõ
ABox ³ñíóº òàêèé A, ùî º íåñóïåðå÷íèì ³ äî íüîãî íå ìîæíà çàñòîñóâàòè æîäíî-
ãî ç ïðàâèë. Çà ëåìîþ 3 A âèêîíóâàíèé. Âî÷åâèäü, A A0 � , îñê³ëüêè àëãîðèòì
ñåìàíòè÷íîãî òàáëî ëèøå äîäຠôàêòè, àëå íå âèëó÷ຠ¿õ. Òàêèì ÷èíîì, A0 òåæ
âèêîíóâàíèé. �
1.6. Òåìïîðàëüí³ äåñêðèïòèâí³ ëîã³êè. Äåñêðèïòèâí³ ëîã³êè íå ìàþòü äîñòàò-
íüî âèðàçíî¿ ïîòóæíîñò³ äëÿ ïðåäñòàâëåííÿ çíàíü ïðî ïîâåä³íêó ³íäèâ³ä³â ó ÷àñ³.
ijéñíî, ÿêùî ðîçãëÿíóòè òâåðäæåííÿ «ß âèêîíóâàâ äîìàøíº çàâäàííÿ â÷îðà, ïðîòå
ñüîãîäí³ í³», òî çà êëàñè÷íîþ äåñêðèïòèâíîþ ëîã³êîþ âîíî ì³ñòèòü äâà ñóïåðå÷íèõ
174 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
ôàêòè: âèêîíóâàâ ( , )x y , � âèêîíóâàâ ( , )x y , õî÷à ñåìàíòè÷íî ö³ ôàêòè ìàëè ì³ñöå
â ð³çíèé ÷àñîâèé ïðîì³æîê, à òîìó ¿õ íå ìîæíà ââàæàòè ñóïåðå÷íèìè.
Ó òàêîìó ðàç³ äîïîì³æíîþ ìàòåìàòè÷íîþ ìîäåëëþ ìîæå áóòè ëîã³êà
ë³í³éíîãî ÷àñó LTL, äëÿ ÿêî¿ ïåðåäáà÷àºòüñÿ íàÿâí³ñòü òåìïîðàëüíèõ îïåðàòîð³â:
� — ó íàñòóïíèé ìîìåíò,�— êîëèñü, � — ó áóäü-ÿêèé ìîìåíò ó ìàéáóòíüîìó
òàU — ïîêè. Ö³ îïåðàòîðè äàþòü çìîãó ðîçøèðèòè êëàñè÷í³ äåñêðèïòèâí³ ëîã³êè
÷àñîâèì âèì³ðîì.
Ðîçãëÿíóòà â [2] êîíöåïö³ÿ ã³áðèäíî¿ ëîã³êè LTLALC äîäຠäî ðîçãëÿíóòèõ
ðàí³øå êîíñòðóêòîð³â êîíöåïò³â ùå äâà òåìïîðàëüí³ (òàáë. 3). Äî òîãî æ ³íòåð-
ïðåòàö³ÿ ôàêò³â ó ö³é ëîã³ö³ îòðèìóº äîäàòêîâèé âèì³ð — ÷àñîâèé.
Çà äîïîìîãîþ âêàçàíèõ êîíñòðóêö³é òâåðäæåííÿ «Äëÿ òîãî ùîá ñòàòè
óñï³øíèì, ïîòð³áíî â÷èòèñÿ» ìîæíà íàâåñòè ó âèãëÿä³ àêñ³îìè
� óñï³øíèé �� óñï³øíèé �� ((� â÷èòèñÿ)U óñï³øíèé).
Àëãîðèòì ñåìàíòè÷íîãî òàáëî äëÿ òåìïîðàëüíèõ äåñêðèïòèâíèõ ëîã³ê ïðåä-
ñòàâëåíî â [3].
2. ÂÈÄÎÁÓÂÀÍÍß ÇÍÀÍÜ Ç ÏÐÈÐÎÄÍÎÌÎÂÍÎÃÎ ÒÅÊÑÒÓ
Çàäà÷à âèÿâëåííÿ â³äêðèòî¿ ³íôîðìàö³¿ (open information extraction) ïîëÿãຠó ïðåä-
ñòàâëåíí³ ïðèðîäíîìîâíîãî òåêñòó â ôîðìàë³çîâàíîìó âèãëÿä³: çàçâè÷àé ó âèãëÿä³
á³íàðíèõ â³äíîøåíü, à òàêîæ â³äíîøåíü á³ëüøèõ ðîçì³ðíîñòåé, ó òåðì³íàõ áàçîâî¿
ìàòåìàòè÷íî¿ ëîã³êè òîùî. ßê³ñíå ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ ñâ³ä÷èëî á ïðî íàÿâí³ñòü
àâòîìàòèçîâàíèõ ìåòîä³â íàïîâíåííÿ áàçè çíàíü ç ïðèðîäíîìîâíèõ äàíèõ, çì³ñò
ÿêèõ ³ ñêëàäàºòüñÿ ç àòîìàðíèõ êîíöåïò³â òà ðîëåé — â³äíîøåíü ì³æ íèìè.
Ñêëàäí³ñòü ö³º¿ çàäà÷³, îêð³ì ñï³ëüíî¿ äëÿ âñ³õ çàäà÷ îáðîáëåííÿ ïðèðîäíî¿
ìîâè ïðîáëåìè íåîäíîçíà÷íîñò³ ìîâëåííÿ ëþäèíè, ïîëÿãຠó òðóäíîùàõ ïðåä-
ñòàâëåííÿ äîâ³ëüíîãî íåñòðóêòóðîâàíîãî òåêñòó ó ôîðìàë³çîâàíîìó âèãëÿä³.
Çíà÷í³ ðåçóëüòàòè íàðàç³ äîñÿãíóòî â îêðåìèõ çâóæåííÿõ ïîñòàíîâêè ö³º¿ çàäà÷³.
Òàê, çàñîáàìè ìàøèííîãî íàâ÷àííÿ äîñÿãàþòüñÿ íåïîãàí³ ðåçóëüòàòè [5] äëÿ çà-
äà÷³ âèÿâëåííÿ â³äíîøåíü, ÿêà çâóæóº ðîçãëÿä äî âèäîáóâàííÿ ç òåêñòó òð³éîê
ñóá’ºêò–ä³ÿ–îá’ºêò äëÿ îáìåæåíîãî ïåðåë³êó äîñòóïíèõ ä³é, à òàêîæ äëÿ çàäà÷³
âèäîáóâàííÿ â³äêðèòî¿ ³íôîðìàö³¿ [6].
Ïðîòå â ïîâíîìó îáñÿç³ öÿ çàäà÷à íå ìຠ÷³òêî ñôîðìóëüîâàíèõ òà çàãàëü-
íîïðèéíÿòèõ ñòàíäàðò³â ðåçóëüòàòó, òîáòî íå âèçíà÷åíî, ÿê³ ñàìå â³äíîøåííÿ
ïîòð³áíî îäåðæàòè òà ÿêèì ÷èíîì âîíè ïîâèíí³ îôîðìëþâàòèñÿ. Íå ñôîðìîâàíî
òàêîæ ñòàíäàðòó îö³íþâàííÿ ìîäåëåé òà êîðïóñ³â ïðèéíÿòíîãî îáñÿãó äëÿ
ÿê³ñíî¿ ïîáóäîâè ìîäåëåé ìàøèííîãî íàâ÷àííÿ, ÿê öå ïðèéíÿòî äëÿ áàãàòüîõ çà-
äà÷ îáðîáëåííÿ ïðèðîäíîìîâíèõ òåêñò³â.
Äîñë³äæåííÿ ïðîáëåìè âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â äëÿ
ïîäàëüøîãî íàïîâíåííÿ íèìè îíòîëîãîïîä³áíèõ ñèñòåì ïðîâîäÿòüñÿ íàðàç³ ÿê
çàðóá³æíèìè [7, 8], òàê ³ â³ò÷èçíÿíèìè [9–13] â÷åíèìè. Çîêðåìà, ñåðåä íàÿâíèõ
àíàëîã³â ñë³ä çàçíà÷èòè ñèñòåìè FRED [7] òà SHELDON [8], ùî çä³éñíþþòü ïî-
áóäîâó OWL-îíòîëîã³é íà îñíîâ³ ïðèðîäíîìîâíèõ òåêñò³â ³ º ó â³äêðèòîìó äîñ-
òóï³. Ïîïðè çàãàëüíå ïðèçíà÷åííÿ öèõ ñèñòåì, ¿õí³ìè îñíîâíèìè íåäîë³êàìè º
â³äñóòí³ñòü ï³äòðèìêè ÷àñîâèõ çâ’ÿçê³â òà íèçüêà ÿê³ñòü ðîáîòè ç íåàíãëîìîâíè-
ìè òåêñòàìè, îñê³ëüêè áóäü-ÿêèé òàêèé òåêñò ïîïåðåäíüî ïåðåêëàäàþòü
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 175
Ò à á ë è ö ÿ 3. Òåìïîðàëüí³ êîíñòðóêòîðè êîíöåïò³â äëÿ ìîâ ñ³ìåéñòâà AL
AL Êîíñòðóêòîð ²íòåðïðåòàö³ÿ
� �Ñ (ó íàñòóïíèé ìîìåíò) ( ) ( , ) | ( , )�Ñ n x n x CI I� ! �{ }1
Until C DU (ïîêè)
( ) {( , ) | [( , )C D t x u t u x DI IU � � � � �
� � � �
�� � �[ ( , ) ]]}t u x C I
àíãë³éñüêîþ çà äîïîìîãîþ àâòîìàòè÷íèõ çàñîá³â, ÷åðåç ùî ÷àñòî âòðà÷àºòüñÿ êî-
ðèñíå çì³ñòîâíå íàâàíòàæåííÿ.
Ðîçãëÿíåìî ï³äõ³ä äî ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ çà äîïîìîãîþ ïðîì³æíèõ
ñòðóêòóðíî-ë³íãâ³ñòè÷íèõ ïðåäñòàâëåíü ïðèðîäíîìîâíîãî òåêñòó, áàçîâ³ çàñàäè
ÿêîãî áóëî ñôîðìóëüîâàíî â [9]. Îñíîâíîþ ìåòîþ öüîãî ï³äõîäó º ïîáóäîâà
ö³ë³ñíî¿ êîíâåºðíî¿ ñèñòåìè âèäîáóâàííÿ çíàíü ç òåêñò³â, ÿêà äຠçìîãó ëåãêî
çä³éñíþâàòè çàì³íó îêðåìèõ ¿¿ êîìïîíåíò³â ç ìåòîþ ³íêîðïîðóâàííÿ äîïîì³æíèõ
ìîäåëåé ìàøèííîãî íàâ÷àííÿ ç êðàùèìè ðåçóëüòàòàìè.
2.1. Çàñîáè ïîáóäîâè ïðîì³æíèõ ë³íãâ³ñòè÷íèõ ñòðóêòóð. Íåñòðóêòóðîâà-
íèé, çâè÷àéíèé òåêñò º ñêëàäíèì äëÿ áåçïîñåðåäíüîãî àëãîðèòì³÷íîãî àíàë³çó
÷åðåç áàãàòîãðàíí³ñòü òà íåîäíîçíà÷í³ñòü ëþäñüêîãî ìîâëåííÿ. Ñàìå òîìó äëÿ
çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè ÷àñòî ïîñëóãîâóþòüñÿ äîäàòêîâèìè, á³ëüø
³íôîðìàòèâíèìè ïîäàííÿìè òåêñòó ó âèãëÿä³ ñòðóêòóð äàíèõ, ÿê³ îáðîáëÿþòü çà
äîïîìîãîþ àëãîðèòì³â. Òàêå ïðåäñòàâëåííÿ òåêñòó íàçèâàòèìåìî ñòðóêòóðíèì.
Ç îãëÿäó íà ïîòóæíèé àïàðàò àëãîðèòì³â íàä ñòðóêòóðàìè íà êøòàëò äåðåâ
òà ãðàô³â ó ïåðåâàæí³é á³ëüøîñò³ ïðåäñòàâëåíü òåêñòó â ð³çíèõ àñïåêòàõ âèêîðèñ-
òîâóþòü àáî äåðåâîâèäíó, àáî ãðàôîâó ñòðóêòóðó. Ðîçãëÿíåìî äåÿê³ ïîøèðåí³
ñòðóêòóðí³ ïðåäñòàâëåííÿ ë³íãâ³ñòè÷íî¿ ³íôîðìàö³¿.
Íàéìåíøîþ çì³ñòîâîþ îäèíèöåþ ìîâè â ñó÷àñíèõ çàñîáàõ ¿¿ îáðîáëåííÿ
º òîêåí — ïîñë³äîâí³ñòü ñèìâîë³â ðå÷åííÿ, ùî ÿâëÿº ñîáîþ ïåâíèé çì³ñò. Çàçâè-
÷àé ðå÷åííÿ ïîä³ëÿþòü íà òîêåíè çà ðîçä³ëþâà÷àìè íà êøòàëò ïóíêòóàö³éíèõ
çíàê³â òà ïðîá³ë³â, ïðîòå ³ñíóþòü é âèíÿòêè. Íàïðèêëàä, âèðàç «i.e.» àíãë³éñüêîþ
îçíà÷ຠ«³íøèìè ñëîâàìè» òà º îäíèì ºäèíèì òîêåíîì.
Êîæåí òîêåí ó ðåçóëüòàò³ ëåêñè÷íîãî àíàë³çó ìîæå ìàòè îäíó ÷è ê³ëüêà õàðàêòå-
ðèñòèê, çîêðåìà, ÷àñòèíó ìîâè, ð³ä, â³äì³íîê òîùî. Çà ñèíòàêñè÷íèì ðîçáîðîì ìîâè
òîêåíè ïîâ’ÿçóþòü îäíå ç îäíèì çà äîïîìîãîþ ñèíòàêñè÷íèõ ãðàìàòè÷íèõ çâ’ÿçê³â.
Îäíå ç íàéá³ëüø çì³ñòîâíèõ ïðåäñòàâëåíü ðå÷åííÿ — öå äåðåâî (â äåÿêèõ
âèïàäêàõ — ãðàô) çàëåæíîñòåé (ðèñ. 2).
Çà òàêèì ñòðóêòóðíèì ïðåäñòàâëåííÿì òåêñòîâà ³íôîðìàö³ÿ ìຠâèãëÿä äåðå-
âà, âåðøèíàìè ÿêîãî º òîêåíè (íàéìåíø³ ñèíòàêñè÷íî çíà÷óù³ îäèíèö³ ðå÷åííÿ),
êîðåíåì º ïðèñóäîê (çàçâè÷àé 䳺ñëîâî, â îêðåìèõ âèïàäêàõ — ³ìåííèê, ïðè-
ñë³âíèê ÷è ïðèêìåòíèê), à ðåáðà ïîçíà÷àþòü çàëåæí³ñòü îäíèõ òîêåí³â â³ä ³íøèõ.
Ïðèêëàä 3. Ó íàâåäåíîìó íà ðèñ. 2 ïðèêëàä³ òîêåí «ïîâ³äîìëåííÿ» ïîâ’ÿçà-
íèé ç òîêåíîì «çàïèñóþòü», ÿêèé º êîðåíåì äåðåâà, çàëåæí³ñòþ obj (îá’ºêò), à òî-
êåí «çàì³íþþ÷è» — çàëåæí³ñòþ advcl (ïðèñë³âíèêîâèé çâîðîò).
Öåé óí³âåðñàëüíèé ôîðìàò äåðåâ çàëåæíîñòåé äëÿ ð³çíèõ ïðèðîäíèõ ìîâ çà-
ïðîïîíîâàíî ó [14]. Äëÿ ïîð³âíÿííÿ ÿêîñò³ (â³äïîâ³äíîñò³ åòàëîíó) ð³çíèõ
ï³äõîä³â äî ïîáóäîâè òàêîãî äåðåâà âèêîðèñòîâóþòü äâ³ ìåòðèêè: UAS òà LAS.
Îçíà÷åííÿ 8. Îö³íêà íåïîçíà÷åíîãî ïðèºäíàííÿ (UAS) — öå â³äñîòêîâå
â³äíîøåííÿ òîêåí³â, ùî ìàþòü êîðåêòíî âèçíà÷åíîãî ïðåäêà. Îö³íêà ïîçíà÷åíî-
ãî ïðèºäíàííÿ (LAS) — öå â³äñîòêîâå â³äíîøåííÿ òîêåí³â, ùî ìàþòü êîðåêòíî
âèçíà÷åíîãî ïðåäêà òà êîðåêòíó ïîçíà÷êó.
Íàðàç³ íàéêðàù³ çíà÷åííÿ íàâåäåíèõ âèùå ìåòðèê äåìîíñòðóº ìîäåëü Label
Attention Layer + HPSG + XLNet, çàïðîïîíîâàíà â [15]. Öÿ ìîäåëü òàêîæ áàçóºòüñÿ
íà íåéðîìåðåæåâîìó ï³äõîä³ òà äîñÿãຠUAS 97.33 % ³ LAS 96.29 % äëÿ
àíãë³éñüêî¿ ìîâè. Ïðîòå íà îñòàíí³õ íàóêîâèõ êîíôåðåíö³ÿõ îñíîâíó óâàãó
ïðèä³ëåíî ïîáóäîâ³ ºäèíèõ ìîäåëåé ñèíòàêñè÷íîãî ðîçáîðó äëÿ âåëèêî¿ ê³ëüêîñò³
ìîâ. Òàê, ìîäåëü HIT-SCIR [16] äຠçìîãó äîñÿãòè LAS ó 92 %, 88 % òà 87 % äëÿ
ðîñ³éñüêî¿, óêðà¿íñüêî¿ òà àíãë³éñüêî¿ ìîâ â³äïîâ³äíî.
176 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
Ðèñ. 2. Äåðåâî çàëåæíîñòåé ðå÷åííÿ (ôîðìàò Universal Dependencies)
²ñíóþòü é ³íø³ ôîðìàòè ïðåäñòàâëåííÿ
äåðåâ ñèíòàêñè÷íèõ çàëåæíîñòåé, çîêðåìà
íàâåäåíèé íà ðèñ. 3 ç [17].
Íàÿâí³ñòü ê³ëüêîõ ìîäåëåé, ÿê³ áóäó-
þòü ïîä³áí³ ïðåäñòàâëåííÿ ðå÷åííÿ ó âèã-
ëÿä³ äåðåâ, à òàêîæ ð³çíèõ ôîðìàò³â ïðåä-
ñòàâëåíü îäíîãî ðå÷åííÿ äຠçìîãó âèêîðèñ-
òîâóâàòè äëÿ äåðåâ àëãîðèòìè âèÿâëåííÿ
ïîòåíö³éíèõ ïîìèëîê ó ïðåäñòàâëåííÿõ òà
¿õíüî¿ êîðåêö³¿.
Çàçíà÷èìî, ùî äåðåâà çàëåæíîñòåé äå-
ìîíñòðóþòü ãðàô³÷íî ëèøå çâ’ÿçêè â ìåæàõ îäíîãî ðå÷åííÿ, à ñï³ââ³äíîøåííÿ
ì³æ ñóòíîñòÿìè â ð³çíèõ ðå÷åííÿõ çàëèøàþòüñÿ íåâ³äîìèìè. Äëÿ ¿õíüîãî ïðåä-
ñòàâëåííÿ âèêîðèñòîâóþòü ³íøó ñòðóêòóðó — ãðóïè êîðåôåðåíòíîñòåé (ðèñ. 4).
Ìíîæèíà êîðåôåðåíòíèõ ñë³â òà ñëîâîñïîëó÷åíü çàçâè÷àé ìຠâèãëÿä ë³ñó —
ìíîæèíè äåðåâ, êîæíå ç ÿêèõ ïîçíà÷ຠìíîæèíó êîðåôåðåíòíèõ âóçë³â. Äóãà êî-
ðåôåðåíòíîñò³ çàçâè÷àé ñïðÿìîâóºòüñÿ äî íàéá³ëüø êîíêðåòíîãî ïîçíà÷åííÿ
îá’ºêòà ðåàëüíîãî ñâ³òó.
Ïîð³âíÿííÿ ï³äõîä³â äî ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ çä³éñíþþòü çà äîïîìîãîþ ñå-
ðåäíüîãî àðèôìåòè÷íîãî òðüîõ ìåòðèê: MUC, B 3 òà CEAF�4 .
 îö³íö³ MUC [18] âðàõîâóºòüñÿ íàéìåíøà ê³ëüê³ñòü äóã ì³æ ñóòíîñòÿìè,
ÿê³ ïîòð³áíî äîäàòè àáî âèëó÷èòè, ùîá ç îäåðæàíîãî ðåçóëüòàòó îòðèìàòè åòà-
ëîííèé:
MUC
S p S
S
i iS T
S T i
i
i
�
�
�
�
�
,
,
| | | ( ) |
| | 1
,
äå T — ìíîæèíà åòàëîííèõ ãðóï êîðåôåðåíòíèõ ñóòíîñòåé, p S( ) — ê³ëüê³ñòü
ãðóï êîðåôåðåíòíèõ ñóòíîñòåé ó ðåçóëüòàò³, ùî â³äïîâ³äàþòü åòàëîíí³é ãðóï³ S .
Ìåòðèêà B 3 [19] áàçóºòüñÿ íà ïîð³âíÿíí³ ðîçì³ð³â â³äïîâ³äíèõ ãðóï êîðåôå-
ðåíòíîñò³:
B
M
G P
P
m m
mm M
prec
3 1
�
�
�
,
| |
,
B
M
G P
G
m m
mm M
rec
3 1
�
�
�
,
| |
,
B
B B
B B
3
3 3
3 3
2
�
!
prec rec
prec rec
,
äå M — ìíîæèíà ñóòíîñòåé, Gm — åòàëîííà ãðóïà, äî ÿêî¿ íàëåæèòü
ñóòí³ñòü m , Pm — ãðóïà ðåçóëüòàòó, äî ÿêî¿ íàëåæèòü ñóòí³ñòü m.
Ìåòðèêó CEAF�4 îá÷èñëþþòü ñïåö³àë³çîâàíèì àëãîðèòìîì ïîð³âíÿííÿ, çà-
ïðîïîíîâàíèì ó [21].
Íàðàç³ íàéêðàù³ ïîêàçíèêè äëÿ ö³º¿ çàäà÷³ äåìîíñòðóþòü ìîäèô³êàö³¿ ìîäåë³
BERT [22], ÿêà áàçóºòüñÿ íà ìàøèííîìó íàâ÷àíí³ (ìîäåëü ðîçðîáëåíà êîìàíäîþ
Google AI Language). Ìîäåëü BERT ïðîïîíóº ñï³ëüíèé ï³äõ³ä äî ïîäàííÿ ïðèðîä-
íîìîâíî¿ ³íôîðìàö³¿ äëÿ ñóêóïíîñò³ çàäà÷ îáðîáëåííÿ òåêñò³â òà çàïðîâàäæóº âðà-
õóâàííÿ ë³âî- òà ïðàâîá³÷íîãî êîíòåêñòó ñëîâà, íà â³äì³íó â³ä îáðîáëåííÿ òåêñòó
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 177
Ðèñ. 3. Äåðåâî çàëåæíîñòåé ðå÷åííÿ (ôîð-
ìàò mova.info)
Ðèñ. 4. ˳ñ êîðåôåðåíòíîñòåé äëÿ ðå÷åííÿ óêðà¿íñüêîþ ìîâîþ
çë³âà íàïðàâî ÷è ñïðàâà íàë³âî ó ïîïåðåäí³õ åôåêòèâíèõ ìîäåëÿõ. Êðàùèé ðåçóëüòàò
ñåðåäíüîãî F1� 80.2 äîñÿãຠìîäåëü ìàøèííîãî íàâ÷àííÿ, çàïðîïîíîâàíà â [20].
2.2. Âèäîáóâàííÿ çíàíü ç³ ñòðóêòóðíîãî ïîäàííÿ ïðèðîäíîìîâíîãî òåê-
ñòó. Äåÿê³ ï³äõîäè äî àíàë³çó ïðèðîäíî¿ ìîâè äëÿ âèäîáóâàííÿ çíàíü ïðåäñòàâ-
ëåí³ â [9, 12, 13]. Ðîçãëÿíåìî îñíîâí³ ïðàâèëà âèäîáóâàííÿ ôàêò³â òà àêñ³îì íà
îñíîâ³ äåðåâà óí³âåðñàëüíèõ çàëåæíîñòåé.
Äåðåâî óí³âåðñàëüíèõ çàëåæíîñòåé (äèâ. ðèñ. 2) íàäຠâàæëèâ³ âõ³äí³ äàí³
äëÿ àëãîðèòì³â âèäîáóâàííÿ çíàíü çà ôîðìàòîì ñâ ïîáóäîâè. Òàê, îñê³ëüêè íà-
âåäåí³ â íüîìó çàëåæíîñò³ ïîçíà÷àþòü íå ñóòî ñèíòàêñè÷í³, à é ñåìàíòèêî-ñèí-
òàêñè÷í³ çâ’ÿçêè ³ â³äíîøåííÿ, äåÿê³ ïðàâèëà âèäîáóâàííÿ çíàíü íà îñíîâ³ ö³º¿
ñòðóêòóðè º òðèâ³àëüíèìè.
Ïðîòå äåðåâîâèäíà ñòðóêòóðà ïîäàííÿ ³íôîðìàö³¿ â äåðåâ³ óí³âåðñàëüíèõ çà-
ëåæíîñòåé äåùî ïîã³ðøóº çàñîáè îáðîáëåííÿ ó âèïàäêàõ íàÿâíîñò³ ñóðÿäíèõ òî-
êåí³â. Àáè ïåðåòâîðèòè äåðåâîâèäíó ñòðóêòóðó ó ãðàôîâó, ÿêà çðó÷í³øà äëÿ îá-
ðîáëåííÿ, âèêîðèñòîâóþòü àëãîðèòì ðîçøèðåííÿ çàëåæíîñòåé. Ïåðåòâîðåííÿ áà-
çîâîãî äåðåâà çàëåæíîñòåé ó ðîçøèðåíèé ãðàô çàëåæíîñòåé ïîòðåáóº, çîêðåìà,
ðîçâ’ÿçàííÿ òàêèõ ïðîáëåì:
� â³äíîâëåííÿ ñë³â, ÿêèõ ó òåêñò³ íåìàº, àëå ¿õíÿ íàÿâí³ñòü ìàºòüñÿ íà óâàç³,
øëÿõîì ñòâîðåííÿ ô³êòèâíèõ òîêåí³â;
� ïîøèðåííÿ çâ’ÿçê³â (îá’ºêò³â, ñóá’ºêò³â, îçíà÷åíü) ÷åðåç êîí’þíêö³þ;
� ïîøèðåííÿ ñóá’ºêò³â íà ï³äïîðÿäêîâàí³ ä³ºñëîâà ñêëàäíîãî ïðåäèêàòà;
� îáðîáëåííÿ ï³äðÿäíîãî ðå÷åííÿ, ùî óòî÷íþº ïåâíèé îá’ºêò, ÿê 䳿, âèêîíà-
íî¿ öèì îá’ºêòîì (ìîæå ïðèçâîäèòè äî óòâîðåííÿ öèêë³â);
� äîäàâàííÿ äîïîì³æíîãî ñëîâà â íàçâó çàëåæíîñò³.
Äåðåâî òà ãðàô çàëåæíîñòåé íàâåäåí³ íà ðèñ. 5 ³ 6 â³äïîâ³äíî.
Òàêèé ãðàô ìîæå ì³ñòèòè ìíîæèíó êîðåíåâèõ òîêåí³â (íà ðèñ. 6 ¿õ äâà,
îñê³ëüêè êîð³íü ïî÷àòêîâîãî äåðåâà çàëåæíîñòåé «ëîâëÿòü» ìຠñóðÿäíèé ç íèì
òîêåí «õàð÷óþòüñÿ»). ²íø³ òîêåíè ìîæóòü ìàòè á³ëüø í³æ îäíîãî ïðåäêà (íà-
ïðèêëàä, òîêåí «ùóð³â» º íàùàäêîì òàêîæ ³ òîêåíà «ëîâëÿòü» â íàñë³äîê ïîøè-
ðåííÿ öüîãî çâ’ÿçêó ÷åðåç ñóðÿäíèé éîìó òîêåí «ìèøåé»).
Íà îñíîâ³ ðîçøèðåíîãî ãðàôó çàëåæíîñòåé çä³éñíþþòü àíàë³ç ùîäî íàÿâíîñò³
àêñ³îì òà ôàêò³â. Ðîçãëÿíåìî äåê³ëüêà áàçîâèõ ïðàâèë âèäîáóâàííÿ çíàíü òàêîãî òèïó.
ßêùî êîðåíåì äåðåâà çàëåæíîñòåé º 䳺ñëîâî, äëÿ ÿêîãî íàÿâí³ äóãè obj òà
subj, ìîæíà çãåíåðóâàòè ôàêò äëÿ ABox âèãëÿäó x R xsubj root obj, äå xsubj — ³ì’ÿ
³íäèâ³äà, ùî â³äïîâ³äຠòîêåíó ç çàëåæí³ñòþ subj, xobj — ³ì’ÿ ³íäèâ³äà, ùî
â³äïîâ³äຠòîêåíó ç çàëåæí³ñòþ obj, Rroot — ³ì’ÿ ðîë³, ùî â³äïîâ³äຠêîðåíþ ðå-
÷åííÿ. Òàêîæ êîæåí ³íäèâ³ä ïîâ’ÿçóºòüñÿ ç â³äïîâ³äíèì éîìó êîíöåïòîì çà äîïî-
ìîãîþ ôàêòó x Aword word: .
178 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
Ðèñ. 5. Áàçîâå äåðåâî çàëåæíîñòåé
Ðèñ. 6. Ðîçøèðåííÿ äåðåâà çàëåæíîñòåé
Öå ïðàâèëî óñêëàäíþºòüñÿ, ÿêùî îá’ºêò³â ÷è ñóá’ºêò³â á³ëüø í³æ îäèí. Íå-
õàé S — ìíîæèíà òîêåí³â-ñóá’ºêò³â, O — ìíîæèíà òîêåí³â-îá’ºêò³â. Òîä³ ABox
áàçè çíàíü ïîïîâíþºòüñÿ ôàêòàìè ç ìíîæèíè { }rootx R x s S o Os o | ,� � � � .
Àíàëîã³÷íî äæåðåëîì ôàêò³â º äóãè obl, ÿê³ ïîçíà÷àþòü äîäàòîê. Ó òàêèõ âè-
ïàäêàõ á³ëüø âèðàçíèì áóäå çáåðåæåííÿ ïîâ’ÿçàíèõ öèì òèïîì çàëåæíîñòåé òî-
êåí³â ÿê äîäàòêîâî¿ õàðàêòåðèñòèêè ðîë³, ùî ïîòðåáóº ï³äòðèìêè áàãàòîì³ñíèõ
ðîëåé â³äïîâ³äíèìè äåñêðèïòèâíèìè ëîã³êàìè.
Îòðèìàòè ôàêòè ç ðîçøèðåíîãî ãðàôó çàëåæíîñòåé ñêëàäí³øå äëÿ ìîäèô³êà-
òîð³â: amod (ïðèêìåòíèêîâèé), nmod (³ìåííèêîâèé), compound (÷àñòèíà ö³ëîãî),
flat (÷àñòèíè ³ìåí, äàò òîùî). Äæåðåëîì àêñ³îì âêëþ÷åííÿ º ðå÷åííÿ ç ³ìåííèêà-
ìè òà ïðèêìåòíèêàìè, ÿê³ ÿâëÿþòü ñîáîþ êîðåí³ äåðåâ çàëåæíîñòåé.
Òàê, äëÿ ðå÷åííÿ, íàâåäåíîãî íà ðèñ. 7, ìîæíà ñôîðìóâàòè òàêó áàçó çíàíü:
CN � {ê³ò, âèëîâ, âèëîâ_ìèøåé, õàçÿ¿í, ñâ³éñüêèé, âëàñíèé};
RN � {çàéìàòèñÿ, ïîêëàäàòèñÿ_íà};
IN x x xñâ³éñüêèé_ê³ò âèëîâ ìèøåé âëàñíèé õàçÿ¿í� { , , }_ _ ;
T � { _ }âèëîâ ìèøåé âèëîâ� ;
A � { ,_x çàéìàòèñÿ xñâ³éñüêèé_ê³ò âèëîâ ìèøåé
x ïîêëàäàòèñÿ íà xñâ³éñüêèé_ê³ò âëàñíèé õàçÿ¿í_ }_ .
ϳñëÿ âèäîáóâàííÿ çíàíü ³ç îêðåìèõ ðå÷åíü âèíèêຠïèòàííÿ ùîäî îá’ºäíàí-
íÿ ôàêò³â â ºäèíó ïîâ’ÿçàíó áàçó çíàíü. Äëÿ öüîãî êîæíîìó ³íäèâ³äó ñòàâèòüñÿ
ó â³äïîâ³äí³ñòü òîêåí ç óñ³ìà éîãî ìîäèô³êàòîðàìè (amod, nmod, compound, flat
òîùî). Çðåøòîþ âñ³ ³íäèâ³äè ç îäíàêîâèìè ì³òêàìè îòîòîæíþþòüñÿ, ÿê é
³íäèâ³äè, ì³òêè ÿêèõ ïîâ’ÿçàí³ êîðåôåðåíòíèìè çâ’ÿçêàìè. Ðåøòà êîðåôåðåíòíèõ
çâ’ÿçê³â ïîçíà÷àþòü àêñ³îìè òîòîæíîñò³ A Aparent_ coref child_ coref� .
Äëÿ ÿê³ñíî¿ ïîáóäîâè áàç çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â íåîáõ³äí³ ðîçøè-
ðåííÿ ³ ñïåöèô³êàö³ÿ ïðàâèë âèâåäåííÿ çíàíü ç ðîçøèðåíîãî äåðåâà çàëåæíîñòåé,
ó òîìó ÷èñë³ âèäîáóâàííÿ òà ôîðìàë³çàö³ÿ òåìïîðàëüíèõ õàðàêòåðèñòèê, ðîçâ’ÿ-
çàííÿ ïðîáëåìè ïðîïóùåíèõ òîêåí³â, íàÿâí³ñòü ÿêèõ ïåðåäáà÷àºòüñÿ â ðå÷åíí³,
çíÿòòÿ íåîäíîçíà÷íîñòåé ó ìîäèô³êàòîðàõ ñóðÿäíèõ òîêåí³â òà ïîïîâíåííÿ áàçè
çíàíü äîäàòêîâèìè àêñ³îìàìè, âèëó÷åíèìè ç ³íøèõ äæåðåë. ßê òàê³ äæåðåëà, çîê-
ðåìà, ìîæíà ðîçãëÿíóòè òåçàóðóñè òà òëóìà÷í³ ñëîâíèêè.
Îçíà÷åííÿ 9. Òåçàóðóñ — öå ñåìàíòè÷íèé ñëîâíèê ïåâíî¿ ïðèðîäíî¿ ìîâè,
â ÿêîìó ñëîâà ïîâ’ÿçàí³ ì³æ ñîáîþ ëåêñèêî-ñåìàíòè÷íèìè â³äíîøåííÿìè (íà-
ïðèêëàä, â³äíîøåííÿìè ð³ä–âèä, ÷àñòèíà–ö³ëå, ñèíîí³ì³ºþ, êîðåëÿö³ºþ,
àñîö³àö³ºþ òîùî) [23]. Òëóìà÷íèé ñëîâíèê — öå ñëîâíèê, ùî ïîäຠëåêñèêî-ôðà-
çåîëîã³÷íèé ñêëàä ìîâè ç ïîÿñíåííÿì çíà÷åííÿ, ãðàìàòè÷íèõ òà ñòèë³ñòè÷íèõ
îñîáëèâîñòåé óæèâàííÿ éîãî îäèíèöü.
Çàïðîïîíîâàíèé ï³äõ³ä äî âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â äàº
çìîãó ïîïîâíþâàòè áàçó çíàíü äëÿ áóäü-ÿêî¿ ìîâè, âèêîðèñòîâóþ÷è â³äïîâ³äí³
ìîäåë³ äëÿ ðîçâ’ÿçàííÿ çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, àíàë³çó çàëåæíîñòåé,
ïîøóêó êîðåôåðåíòíîñòåé òîùî (ðèñ. 8). Òàêîæ ïîä³áíèé ï³äõ³ä äຠçìîãó ïîêðà-
ùóâàòè ðåçóëüòàò ðîáîòè ïðîñòîþ çàì³íîþ ìîäåëåé ìàøèííîãî íàâ÷àííÿ äëÿ
ï³äçàäà÷ ³íøèìè, ç êðàùèìè ïîêàçíèêàìè.
Îñê³ëüêè äëÿ ðîçâ’ÿçàííÿ äåÿêèõ çàäà÷ (àíàë³ç çàëåæíîñòåé òà ðîçì³÷óâàííÿ
÷àñòèí ìîâè) ³ñíóº áàãàòî ð³çíîìàí³òíèõ ìîäåëåé, ¿õí³ ðåçóëüòàòè ìîæíà ïîºäíó-
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 179
Ðèñ. 7. Ðîçøèðåíèé ãðàô çàëåæíîñòåé
âàòè, ùîá ïîêðàùèòè ÿê³ñòü âõ³äíèõ äàíèõ äëÿ àëãîðèòìó âèäîáóâàííÿ çíàíü,
çîêðåìà, çà äîïîìîãîþ òåî𳿠ãðàô³â òà àëãîðèòì³â íàä äåðåâàìè.
ϳäõ³ä òåñòóâàâñÿ ç âèêîðèñòàííÿì òðüîõ ìîâ: àíãë³éñüêî¿, óêðà¿íñüêî¿ òà
ðîñ³éñüêî¿. Íàðàç³ äëÿ ðîñ³éñüêî¿ ìîâè íàÿâíèé êîðïóñ êîðåôåðåíòíîñòåé, ïðîòå
â³äñóòí³ ó â³ëüíîìó äîñòóï³ ìîäåë³ ìàøèííîãî íàâ÷àííÿ äëÿ ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³.
Äëÿ óêðà¿íñüêî¿ ìîâè â³äñóòí³é ó â³ëüíîìó äîñòóï³ òàêîæ ³ êîðïóñ êîðåôåðåíòíîñ-
òåé. Äëÿ ïîâíîö³ííî¿ ðîáîòè ñèñòåìè íåîáõ³äíî ïîáóäîâàòè ÿê³ñí³ ìîäåë³ ïîøóêó
êîðåôåðåíòíîñòåé äëÿ âêàçàíèõ ìîâ íà îñíîâ³ êðàùèõ ðåçóëüòàò³â ðîçâ’ÿçàííÿ çàäà÷³
äëÿ àíãëîìîâíèõ òåêñò³â.
3. ÀÍÀË²Ç ßʲÑÍÈÕ ÕÀÐÀÊÒÅÐÈÑÒÈÊ ÒÅÊÑÒÓ ÇÀ ÄÎÏÎÌÎÃÎÞ ÁÀÇ ÇÍÀÍÜ
Ïîáóäîâàíà íà îñíîâ³ çàïðîïîíîâàíîãî ï³äõîäó ïðèðîäíîìîâíà áàçà çíàíü äàº
çìîãó ðîçâ’ÿçóâàòè íèçêó çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè ÿê çà äîïîìîãîþ
àëãîðèòì³â òà ìåòîä³â äåñêðèïòèâíèõ ëîã³ê ð³çíîãî ð³âíÿ, òàê ³ àíàë³çóþ÷è ¿¿
ïðåäñòàâëåííÿ ç âèêîðèñòàííÿì àïàðàòó òåî𳿠ãðàô³â. ßê ïðèêëàä òèïîâèõ çà-
äà÷, ÿê³ ìîæíà ðîçâ’ÿçóâàòè çà äîïîìîãîþ òàêèõ ñèñòåì çíàíü, íàâåäåìî, çîê-
ðåìà, ðîçï³çíàâàííÿ êîìàíä, ïåðåâ³ðêó ö³ë³ñíîñò³ òåêñòó, ïîøóê ñóïåðå÷íîñ-
òåé, ïîáóäîâó íà îñíîâ³ áàçè çíàíü ä³àëîãîâî¿ ñèñòåìè äëÿ â³äïîâ³äåé íà çàïè-
òàííÿ êîðèñòóâà÷à, ïåðåâ³ðêó â³äïîâ³äíîñò³ òâåðäæåííÿ ïîäàíîìó òåêñòó òîùî.
ßêùî ðîçãëÿíóòè ïðåäñòàâëåííÿ áàçè çíàíü, ïîáóäîâàíî¿ íà îñíîâ³ ïðèðîäíî-
ìîâíîãî òåêñòó, ó âèãëÿä³ ãðàôó, äå êîíöåïòè çâ’ÿçàí³ ðåáðàìè ó ðàç³ ó÷àñò³ â îäí³é
ðîë³ ¿õí³õ ³íäèâ³ä³â ÷è íàÿâíîñò³ ì³æ íèìè ³ºðàðõ³÷íèõ çâ’ÿçê³â, çàäà÷à ïåðåâ³ðêè
òåêñòó íà ö³ë³ñí³ñòü çâîäèòüñÿ äî çàäà÷³ ïåðåâ³ðêè ãðàôó íà k-ðåáåðíó çâ’ÿçí³ñòü.
Îçíà÷åííÿ 10. Ãðàô G E V� ( , ) íàçèâàºòüñÿ k-ðåáåðíî çâ’ÿçíèì, ÿêùî äëÿ
äîâ³ëüíî¿ ï³äìíîæèíè ðåáåð X E� ïîòóæíîñò³ | |X k� ãðàô G E X V' � ( \ , )
º çâ’ÿçíèì.
Çàäà÷³ ïîøóêó ñóïåðå÷íîñòåé òà ïåðåâ³ðêè â³äïîâ³äíîñò³ òåêñò³â º ïðÿìèìè
íàñë³äêàìè àëãîðèòìó ñåìàíòè÷íîãî òàáëî äëÿ äåñêðèïòèâíèõ ëîã³ê.
Òàê, íà ðèñ. 9 íàâåäåíî íàéïðîñò³øèé ïðèêëàä íåö³ë³ñíîãî òåêñòó. Éîìó
â³äïîâ³äຠãðàô³÷íå çîáðàæåííÿ ôàêò³â òà àêñ³îì äåñêðèïòèâíî¿ ëîã³êè (äèâ. ðèñ. 9, à)
òà â³äïîâ³äíèé ãðàô çâ’ÿçàíèõ êîíöåïò³â (äèâ. ðèñ. 9, á). Ãðàô ìຠäâ³ êîìïîíåíòè
çâ’ÿçíîñò³, ÿê³ â³äïîâ³äàþòü çîîëîã³÷í³é òà êîìï’þòåðí³é òåìàòèö³. Òàêèì ÷èíîì,
ìîæíà çðîáèòè âèñíîâîê ùîäî äâîõ çì³ñòîâíèõ ë³í³é ó â³äïîâ³äíîìó ïðèðîäíîìîâíî-
ìó òåêñò³, à îòæå, ùîäî éîãî íåö³ë³ñíîñò³.
180 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
Ò
Å
Ê
Ñ
Ò
Àíàë³ç
ñèíòàêñè÷íèõ
çàëåæíîñòåé
Ðîçì³÷óâàííÿ
÷àñòèí
ìîâè
Çàñîáè
ïîêðàùåííÿ
ðåçóëüòàòó
Çàñîáè
ïîêðàùåííÿ
ðåçóëüòàòó
Àëãîðèòìè
ðîçøèðåííÿ
çàëåæíîñòåé
Òåçàóðóñè
Ñëîâíèêè
Àëãîðèòì
âèäîáóâàííÿ
çíàíü
Áàçà
çíàíü
Àëãîðèòìè
òåìïîðàëüíèõ
äåñêðèïòèâíèõ
ëîã³ê
Àëãîðèòìè
òåî𳿠ãðàô³â
Ðîçï³çíàâàííÿ êîìàíä
Ïîøóê ñóïåðå÷íîñòåé
Ïîáóäîâà â³äïîâ³äåé
Ïåðåâ³ðêà ö³ë³ñíîñò³
òåêñòó
Ðèñ. 8. Ñõåìà àíàë³çó òåêñòîâî¿ ³íôîðìàö³¿ íà îñíîâ³ áàç çíàíü
ÂÈÑÍÎÂÊÈ
Ó ðåçóëüòàò³ ðîçâ’ÿçàííÿ ïðîáëåì îáðîáëåííÿ ïðèðîäíèõ ìîâ òà ïðåäñòàâëåííÿ
íåñòðóêòóðîâàíèõ òåêñò³â ó âèãëÿä³ ãðàôîâèõ ÷è äåðåâîâèäíèõ ñòðóêòóð íàðàç³
ìîæíà îòðèìàòè ÿê³ñí³ âõ³äí³ äàí³ äëÿ çàäà÷³ íàïîâíåííÿ áàç çíàíü ôàêòàìè
ç òåêñò³â ïðèðîäíî¿ ìîâè. Öå äຠïîøòîâõ äî ïîáóäîâè ñèñòåì àëãîðèòì³â äëÿ
âèÿâëåííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü íà áàç³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îá-
ðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ïîáóäîâè äå-
ðåâà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñòåé òà âèÿâëåííÿ ³ìåíîâàíèõ ñóòíîñòåé.
Ó ñòàòò³ ðîçãëÿíóòî òåîðåòè÷í³ îñíîâè äåñêðèïòèâíèõ ëîã³ê ALCQ , ÿê³ ñëó-
ãóþòü ìîâîþ ôîðìàëüíîãî çàïèñó ïðèðîäíîìîâíèõ çíàíü, íàâåäåíî áàçîâ³ çàñà-
äè êîìï’þòåðíî¿ ë³íãâ³ñòèêè äëÿ ïåðåòâîðåííÿ íåñòðóêòóðîâàíîãî ïðèðîäíîìîâ-
íîãî òåêñòó ó ñòðóêòóðîâàíèé âèãëÿä. Çàïðîïîíîâàíî ï³äõ³ä äî âèäîáóâàííÿ
çíàíü ç³ ñòðóêòóðîâàíîãî ïîäàííÿ ïðèðîäíîìîâíèõ òåêñò³â òà ¿õíüîãî çàïèñó çà-
ñîáàìè ìîâè ëîã³êè ALCQ . Ðîçãëÿíóòî çàñòîñóâàííÿ àëãîðèòì³â ëîã³ê ALCQ òà
òåî𳿠ãðàô³â äëÿ àíàë³çó äîáóòèõ ïðèðîäíîìîâíèõ çíàíü ùîäî ö³ë³ñíîñò³ òà íà-
ÿâíîñò³ ñóïåðå÷íîñòåé.
Íàâåäåíèé ï³äõ³ä äî âèäîáóâàííÿ çíàíü ç ë³íãâ³ñòè÷íî¿ ³íôîðìàö³¿, äîáóòî¿
ç òåêñòó íà îñíîâ³ çàäà÷ àíàë³çó çàëåæíîñòåé, êîðåôåðåíòíîñòåé òà ÷àñòèí ìîâè,
äຠçìîãó çä³éñíþâàòè àíàë³ç çíàíü äîâ³ëüíî¿ ìîâè çà óìîâè ÿê³ñíîãî ðîçâ’ÿçàííÿ
äëÿ íå¿ â³äïîâ³äíèõ ë³íãâ³ñòè÷íèõ çàäà÷. Ïîêðàùåííÿ çàïðîïîíîâàíîãî ï³äõîäó
ìîæëèâå çà ðàõóíîê ðîçøèðåííÿ ³ ñïåöèô³êàö³¿ ïðàâèë âèâåäåííÿ çíàíü ç ðîçøè-
ðåíîãî äåðåâà çàëåæíîñòåé, â òîìó ÷èñë³ âèäîáóâàííÿ òà ôîðìàë³çàö³¿ òåìïîðàëü-
íèõ, ëîêàòèâíèõ, êàóçàëüíèõ õàðàêòåðèñòèê, ðîçâ’ÿçàííÿ ïðîáëåìè ïðîïóùåíèõ
òîêåí³â, íàÿâí³ñòü ÿêèõ ïåðåäáà÷åíî â ðå÷åíí³, çíÿòòÿ íåîäíîçíà÷íîñòåé ó ìî-
äèô³êàòîðàõ ñóðÿäíèõ òîêåí³â òà ïîïîâíåííÿ áàçè çíàíü äîäàòêîâèìè àêñ³îìàìè,
âèëó÷åíèìè ç òåçàóðóñ³â, òëóìà÷íèõ ñëîâíèê³â òîùî.
ÑÏÈÑÎÊ Ë²ÒÅÐÀÒÓÐÈ
1. Baader F., Calvanese D., McGuinness D., Nardi D., Patel-Schneider P. The description logic
handbook. Cambridge University Press, 2007. 578 p.
2. Êðèâèé Ñ.Ë., Ãîãåð÷àê Ã.². Ëîã³êà â ìàòåìàòèö³ ³ ³íôîðìàòèö³. Ïðàö³ ïåðøî¿ óêðà¿íñüêî¿ êîíôå-
ðåíö³¿ «Ëîã³êà òà ¿¿ çàñòîñóâàííÿ» (Êè¿â, 26–28 ëèñòîïàäà 2019 ð.). Êè¿â: ÀÂÀÍÏÎÑÒ-ÏÐÈÌ,
2019. Ñ. 47–55.
3. Lutz C., Wolter F., Zakharyaschev M. Temporal description logics: A survey. Proc. of the 15th
International Symposium on Temporal Representation and Reasoning (Montreal, Canada, June
16–18, 2008). IEEE Computer Society, 2008. P. 3–14. https://doi.org/10.1109/TIME.2008.14.
4. Lutz C., Sturm H., Wolter F., Zakharyaschev M. Tableaux for temporal description logic with constant
domains. Proc. of First International Joint Conference, IJCAR 2001: Automated Reasoning (Sienna,
Italy, June 18–22, 2001). Springer, 2001. P. 121–136. https://doi.org/10.1007/3-540-45744-5_10.
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 181
Ðèñ. 9. Áàçà äàíèõ òà ¿¿ ãðàôîâå ïðåäñòàâëåííÿ
à á
Òâàðèíà
Ùóð
ʳò
Ìåðåæà²íòåðíåò
²íòåðíåò Ìåðåæà
Ìèøà
ÙóðÌèøàʳò
Ëîâèòè Õàð÷óâàòèñÿ
Òâàðèíà
5. Lai S., Leung K. S., Leung Y. SUNNYNLP at SemEval-2018 Task 10: A Support-Vector-Machine-based
method for detecting semantic difference using taxonomy and word embedding features. Proc. of The 12th
International Workshop on Semantic Evaluation (New Orleans, USA, June 5–6, 2018). 2018.
P. 741–746. http://doi.org/10.18653/v1/S18-1118.
6. Zhan J., Zhao H. Span model for open information extraction on accurate corpus. Proc. of the AAAI
Conference on Artificial Intelligence. 2020. Vol. 34, Iss. 5. P. 9523–9530. https://doi.org/10.1609/
aaai.v34i05.6497.
7. Gangemi A., Presutti V., Reforgiato Recupero D., Nuzzolese A., Draicchio F., Mongiovi M.
Semantic Web machine reading with FRED. Semantic Web. 2017. Vol. 8, Iss. 6. P. 873–893.
https://doi.org/10.3233/SW-160240.
8. Reforgiato Recupero D., Nuzzolese A., Consoli S., Presutti V., Mongiovi M., Peroni S. Extracting
knowledge from text using SHELDON, a Semantic Holistic framEwork for LinkeD ONtology data.
Proc. of the 24th International Conference on World Wide Web (WWW’15 Companion) (Florence,
Italy, May 2015). Association for Computing Machinery, 2015. P. 235–238. https://doi.org/10.1145/
2740908.2742842.
9. Hoherchak H. Knowledge bases and description logics applications to natural language texts analysis.
Problems in Programming. 2020. N 2–3. P. 259–269. https://doi.org/10.15407/pp2020.02-03.259.
10. Êðèâèé Ñ.Ë., Äàð÷óê Í.Ï., Ïðîâîòàð Î.². Îíòîëîãîïîä³áí³ ñèñòåìè àíàë³çó ïðèðîäíîìîâíèõ
òåêñò³â. Ïðîáëåìè ïðîãðàìóâàííÿ. 2018. ¹ 2–3. Ñ. 132–139.
11. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Ïåòðåíêî Í.Ã. Çíàíèå-îðèåíòèðîâàííûå èíôîðìàöèîííûå ñèñòå-
ìû ñ îáðàáîòêîé åñòåñòâåííî-ÿçûêîâûõ îáúåêòîâ: îñíîâû ìåòîäîëîãèè è àðõèòåêòóðíî-ñòðóê-
òóðíàÿ îðãàíèçàöèÿ. ÓÑèÌ. 2009. ¹ 3. Ñ. 42–55.
12. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Ïåòðåíêî Í.Ã. Îá àâòîìàòèçàöèè ïðîöåññà èçâëå÷åíèÿ çíàíèé èç
åñòåñòâåííî-ÿçûêîâûõ òåêñòîâ. Natural and Artificial Intelligence Intern. Book Series. Inteligent
Processing. Sofia: ITHEA, 2012. N 9. P. 44–52.
13. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Áèáèêîâ Ä.Ñ. Îáðàáîòêà ïðåäëîæåíèé åñòåñòâåííîãî ÿçûêà ñ èñ-
ïîëüçîâàíèåì ñëîâàðåé è ÷àñòîòû ïîÿâëåíèÿ ñëîâ. Natural and Artificial Intelligence Intern.
Book Series. Inteligent Processing. Sofia: ITHEA, 2010. N 9. P. 44–52.
14. McDonald R., Nivre J., Quirmbach-Brundage Y., Goldberg Y., Das D., Ganchev K., Hall K., Petrov S.,
Zhang H., T��ackstr��om O., Bedini C., Castell� N.B., Lee J. Universal dependency annotation for
multilingual parsing. Proc. of the 51st Annual Meeting of the Association for Computational
Linguistics (Sofia, Bulgaria, August 4–9, 2013). Association for Computational Linguistics, 2013.
(Vol. 2: Short Papers) P. 92–97.
15. Mrini K., Dernoncourt F., Bui T., Chang W., Nakashole N. Rethinking self-attention: An
interpretable self-attentive encoder-decoder parser. Findings of the Association for Computational
Linguistics: EMNLP 2020. Association for Computational Linguistics, 2020. P. 731–742.
http://doi.org/10.18653/v1/2020.findings-emnlp.65.
16. Che W., Lui Y, Wang Y., Zheng B., Liu T. Towards better UD parsing: Deep contextualized word
embeddings, ensemble, and treebank concatenation. Proc. of the CoNLL 2018 Shared Task:
Multilingual Parsing from Raw Text to Universal Dependencies (Brussels, Belgium, October 31 –
November 1, 2018). Association for Computational Linguistics, 2018. P. 55–64. http:// doi.org/
10.18653/v1/K18-2005.
17. Äàð÷óê Í. Àâòîìàòè÷íèé ñèíòàêñè÷íèé àíàë³ç òåêñò³â êîðïóñó óêðà¿íñüêî¿ ìîâè. Óêðà¿íñüêå
ìîâîçíàâñòâî. 2013. ¹ 43. Ñ. 11–19.
18. Vilain M., Burger J., Aberdeen J., Connolly D., Hirschman L. A model-theoretic coreference scoring
scheme. Proc. of the 6th Message Understanding Conference (MUC-6) (Maryland, USA, November 6–8,
1995). Association for Computational Linguistics, 1995. P. 45–52. https://doi.org/10.3115/
1072399.1072405.
19. Stoyanov V., Gilbert N., Cardie C., Riloff E. Conundrums in noun phrase coreference resolution:
Making sense of the state-of-the-art. Proc. of the Joint Conference of the 47th Annual Meeting of the
Association for Computational Linguistics and the 4th International Joint Conference on Natural
Language Processing (Singapore, August 2–7, 2009). Association for Computational Linguistics,
2009. P. 656–664. http://doi.org/10.3115/1690219.1690238.
20. Luo X. On coreference resolution performance metrics. Proc. of the Conference on Human Language
Technology and Empirical Methods in Natural Language Processing, HLT ’05 (Vancouver, Canada,
October, 2005). Association for Computational Linguistics, 2005. P. 25–32. http://doi.org/10.3115/
1220575.1220579.
182 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3
21. Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for
language understanding. Proc. of the 2019 Conference of the North American Chapter of the Association
for Computational Linguistics: Human Language Technologies (Minneapolis, USA, June 2–7, 2019).
Association for Computational Linguistics, 2019. Vol. 1 (Long and Short Papers). P. 4171–4186.
http://dx.doi.org/10.18653/v1/N19-1423.
22. Xu L., Choi J.D. Revealing the myth of higher-order inference in coreference resolution. Proc. of the
2020 Conference on Empirical Methods in Natural Language Processing (EMNLP) (online, November
16–20, 2020). Association for Computational Linguistics, 2020. P. 8527–8533. http://dx.doi.org/
10.18653/v1/2020.emnlp-main.686.
23. Ëóêàøåâè÷ Í.Â. Òåçàóðóñû â çàäà÷àõ èíôîðìàöèîííîãî ïîèñêà. Ìîñêâà: Èçä-âî Ìîñê. óí-òà,
2011. 512 ñ.
Íàä³éøëà äî ðåäàêö³¿ 10.11.2020
Ã.È. Ãîãåð÷àê, Í.Ï. Äàð÷óê, Ñ.Ë. Êðûâûé
ÏÐÅÄÑÒÀÂËÅÍÈÅ, ÀÍÀËÈÇ È ÈÇÂËÅ×ÅÍÈÅ ÇÍÀÍÈÉ ÈÇ ÍÅÑÒÐÓÊÒÓÐÈÐÎÂÀÍÍÛÕ
ÅÑÒÅÑÒÂÅÍÍÎßÇÛ×ÍÛÕ ÒÅÊÑÒÎÂ
Àííîòàöèÿ. Ïðèâåäåí îáçîð ñðåäñòâ äåñêðèïòèâíûõ ëîãèê äëÿ ïðåäñòàâëå-
íèÿ çíàíèé èç åñòåñòâåííîÿçû÷íûõ òåêñòîâ, êëàññèôèêàöèÿ äåñêðèïòèâíûõ
ëîãèê ïî êîíñòðóêòîðàì êîíöåïòîâ è ðîëåé, à òàêæå îïèñàíû îñíîâíûå
êîíöåïöèè òåìïîðàëüíûõ äåñêðèïòèâíûõ ëîãèê. Ðàññìîòðåí ïîäõîä ê ïî-
ñòðîåíèþ ñèñòåì àíàëèçà åñòåñòâåííîÿçû÷íûõ òåêñòîâ íà îñíîâå çàäà÷
îïðåäåëåíèÿ ÷àñòåé ðå÷è, ïîèñêà ãðàììàòè÷åñêèõ çàâèñèìîñòåé è êîðåôå-
ðåíòíîñòåé. Ïðèâåäåíû ïðèìåðû èñïîëüçîâàíèÿ åñòåñòâåííîÿçû÷íûõ áàç
çíàíèé äëÿ ðåøåíèÿ ïðèêëàäíûõ çàäà÷, â ÷àñòíîñòè äëÿ ïðîâåðêè öåëîñ-
òíîñòè òåêñòà, ïîèñêà ïðîòèâîðå÷èé.
Êëþ÷åâûå ñëîâà: äåñêðèïòèâíûå ëîãèêè, áàçû çíàíèé, àëãîðèòì ñåìàíòè-
÷åñêîãî òàáëî, èçâëå÷åíèå çíàíèé, îáðàáîòêà åñòåñòâåííîãî ÿçûêà, ñåìàíòè-
÷åñêèé àíàëèç.
H. Hoherchak, N. Darchuk, S. Kryvyi
REPRESENTATION, ANALYSIS AND EXTRACTION OF KNOWLEDGE
FROM UNSTRUCTURED NATURAL LANGUAGE TEXTS
Abstract. The article provides an overview of the means of descriptive logics
for knowledge representation in natural-language texts. Descriptive logics are
classified by constructors of concepts and roles, and the basic concepts of
temporal descriptive logics are considered. The approach to construction
of systems of the analysis of natural-language text based on problems of parts of
speech tagging, dependency parsing, coreference resolution is considered.
Examples of using natural-language knowledge bases to solve applied problems,
in particular to check the integrity of the text and to reveal contradictions, are
provided.
Keywords: description logics, knowledge bases, tableau algorithm, knowledge
extraction, natural language processing, semantic analysis.
Ãîãåð÷àê Ãðèãîð³é ²âàíîâè÷,
àñï³ðàíò Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà Øåâ÷åíêà,
e-mail: gogerchak@gmail.com.
Äàð÷óê Íàòàëÿ Ïåòð³âíà,
äîêòîð ô³ëîë. íàóê, ïðîôåñîð, ïðîôåñîð Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà
Øåâ÷åíêà, e-mail: NataliaDarchuk@gmail.com.
Êðèâèé Ñåðã³é Ëóê’ÿíîâè÷,
äîêòîð ô³ç.-ìàò. íàóê, ïðîôåñîð, ïðîôåñîð Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà
Øåâ÷åíêà, e-mail: sl.krivoi@gmail.com.
ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 183
|