Представлення, аналіз та видобування знань з неструктурованих природномовних текстів

Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основ...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2021
Автори: Гогерчак, Г.І., Дарчук, Н.П., Кривий, С.Л.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут кібернетики ім. В.М. Глушкова НАН України 2021
Назва видання:Кібернетика та системний аналіз
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/190710
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-190710
record_format dspace
spelling irk-123456789-1907102023-06-20T15:30:18Z Представлення, аналіз та видобування знань з неструктурованих природномовних текстів Гогерчак, Г.І. Дарчук, Н.П. Кривий, С.Л. Програмно-технічні комплекси Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основі задач визначення частин мови, пошуку граматичних залежностей та кореферентностей. Наведено приклади використання природномовних баз знань для розв’язання прикладних задач, зокрема для перевірки цілісності тексту, пошуку суперечностей. Приведен обзор средств дескриптивных логик для представления знаний из естественноязычных текстов, классификация дескриптивных логик по конструкторам концептов и ролей, а также описаны основные концепции темпоральных дескриптивных логик. Рассмотрен подход к построению систем анализа естественноязычных текстов на основе задач определения частей речи, поиска грамматических зависимостей и кореферентностей. Приведены примеры использования естественноязычных баз знаний для решения прикладных задач, в частности для проверки целостности текста, поиска противоречий. The article provides an overview of the means of descriptive logics for knowledge representation in natural-language texts. Descriptive logics are classified by constructors of concepts and roles, and the basic concepts of temporal descriptive logics are considered. The approach to construction of systems of the analysis of natural-language text based on problems of parts of speech tagging, dependency parsing, coreference resolution is considered. Examples of using natural-language knowledge bases to solve applied problems, in particular to check the integrity of the text and to reveal contradictions, are provided. 2021 Article Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр. 1019-5262 http://dspace.nbuv.gov.ua/handle/123456789/190710 004.822 uk Кібернетика та системний аналіз Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Програмно-технічні комплекси
Програмно-технічні комплекси
spellingShingle Програмно-технічні комплекси
Програмно-технічні комплекси
Гогерчак, Г.І.
Дарчук, Н.П.
Кривий, С.Л.
Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
Кібернетика та системний аналіз
description Наведено огляд засобів дескриптивних логік для представлення знань з природномовних текстів, класифікацію дескриптивних логік за конструкторами концептів та ролей, а також основні концепції темпоральних дескриптивних логік. Розглянуто підхід до побудови систем аналізу природномовних текстів на основі задач визначення частин мови, пошуку граматичних залежностей та кореферентностей. Наведено приклади використання природномовних баз знань для розв’язання прикладних задач, зокрема для перевірки цілісності тексту, пошуку суперечностей.
format Article
author Гогерчак, Г.І.
Дарчук, Н.П.
Кривий, С.Л.
author_facet Гогерчак, Г.І.
Дарчук, Н.П.
Кривий, С.Л.
author_sort Гогерчак, Г.І.
title Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
title_short Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
title_full Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
title_fullStr Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
title_full_unstemmed Представлення, аналіз та видобування знань з неструктурованих природномовних текстів
title_sort представлення, аналіз та видобування знань з неструктурованих природномовних текстів
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2021
topic_facet Програмно-технічні комплекси
url http://dspace.nbuv.gov.ua/handle/123456789/190710
citation_txt Представлення, аналіз та видобування знань з неструктурованих природномовних текстів / Г.І. Гогерчак, Н.П. Дарчук, С.Л. Кривий // Кібернетика та системний аналіз. — 2021. — Т. 57, № 3. — С. 164–183. — Бібліогр.: 23 назв. — укр.
series Кібернетика та системний аналіз
work_keys_str_mv AT gogerčakgí predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív
AT darčuknp predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív
AT krivijsl predstavlennâanalíztavidobuvannâznanʹznestrukturovanihprirodnomovnihtekstív
first_indexed 2025-07-16T13:46:07Z
last_indexed 2025-07-16T13:46:07Z
_version_ 1837811439432105984
fulltext Ã.². ÃÎÃÅÐ×ÀÊ, Í.Ï. ÄÀÐ×ÓÊ, Ñ.Ë. ÊÐÈÂÈÉ ÓÄÊ 004.822 ÏÐÅÄÑÒÀÂËÅÍÍß, ÀÍÀË²Ç ÒÀ ÂÈÄÎÁÓÂÀÍÍß ÇÍÀÍÜ Ç ÍÅÑÒÐÓÊÒÓÐÎÂÀÍÈÕ ÏÐÈÐÎÄÍÎÌÎÂÍÈÕ ÒÅÊÑҲ Àíîòàö³ÿ. Íàâåäåíî îãëÿä çàñîá³â äåñêðèïòèâíèõ ëîã³ê äëÿ ïðåäñòàâëåííÿ çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â, êëàñèô³êàö³þ äåñêðèïòèâíèõ ëîã³ê çà êîí- ñòðóêòîðàìè êîíöåïò³â òà ðîëåé, à òàêîæ îñíîâí³ êîíöåïö³¿ òåìïîðàëüíèõ äåñêðèïòèâíèõ ëîã³ê. Ðîçãëÿíóòî ï³äõ³ä äî ïîáóäîâè ñèñòåì àíàë³çó ïðèðîä- íîìîâíèõ òåêñò³â íà îñíîâ³ çàäà÷ âèçíà÷åííÿ ÷àñòèí ìîâè, ïîøóêó ãðàìà- òè÷íèõ çàëåæíîñòåé òà êîðåôåðåíòíîñòåé. Íàâåäåíî ïðèêëàäè âèêîðèñòàííÿ ïðèðîäíîìîâíèõ áàç çíàíü äëÿ ðîçâ’ÿçàííÿ ïðèêëàäíèõ çàäà÷, çîêðåìà äëÿ ïåðåâ³ðêè ö³ë³ñíîñò³ òåêñòó, ïîøóêó ñóïåðå÷íîñòåé. Êëþ÷îâ³ ñëîâà: äåñêðèïòèâí³ ëîã³êè, áàçè çíàíü, àëãîðèòì ñåìàíòè÷íîãî òàáëî, âèäîáóâàííÿ çíàíü, îáðîáëåííÿ ïðèðîäíî¿ ìîâè, ñåìàíòè÷íèé àíàë³ç. ÂÑÒÓÏ Çàäà÷à îáðîáëåííÿ ïðèðîäíèõ ìîâ ñüîãîäí³ º îäí³ºþ ç îñíîâíèõ ó ãàëóç³ êîì- ï’þòåðíèõ íàóê. Çäåá³ëüøîãî öå çóìîâëåíî ïðàãíåííÿì ëþäñòâà äî ïîäîëàííÿ ìîâíèõ áàð’ºð³â, à òàêîæ âåëèêîþ ê³ëüê³ñòþ ïðèêëàäíèõ çàäà÷, ÿê³ ò³ºþ ÷è ³íøîþ ì³ðîþ äîòè÷í³ äî ôîðìàë³çàö³¿ ëþäñüêîãî ìîâëåííÿ. Òàêèìè çàäà÷àìè º ïîêðàùåííÿ ñôåðè ïîñëóã, çäåøåâëåííÿ ïåâíèõ ïðîöåñ³â ñóñï³ëüíîãî çíà÷åí- íÿ, ÿê³, â ñâîþ ÷åðãó, ñòèìóëþþòü ðîçâèòîê ìåòîä³â àâòîìàòè÷íîãî ïåðåêëàäó, ðåôåðóâàííÿ òà àíîòóâàííÿ, ðîçï³çíàâàííÿ (ïåðåòâîðåííÿ â òåêñòîâèé ôîðìàò) ìîâëåííÿ â ðåæèì³ ðåàëüíîãî ÷àñó, â òîìó ÷èñë³ ïðèðîäíîìîâíèõ êîìàíä, àâ- òîìàòè÷íîãî ïîøóêó, êîíñòðóþâàííÿ â³äïîâ³äåé íà çàïèòàííÿ, âèÿâëåííÿ òà êîðåêö³¿ ãðàìàòè÷íèõ ïîìèëîê, ïîáóäîâè ä³àëîãîâèõ ñèñòåì ïðèðîäíîþ ìî- âîþ, ïåðåâ³ðêè ö³ë³ñíîñò³ òåêñòó, ñåíòèìåíò-àíàë³çó òîùî. Ñó÷àñíà ãàëóçü îá- ðîáëåííÿ ïðèðîäíèõ ìîâ íàðàõîâóº ïîíàä òðè äåñÿòêè ð³çíèõ çàäà÷. Çíà÷íîþ ì³ðîþ âîíè º ë³íãâ³ñòè÷íèìè, îñê³ëüêè ïîâ’ÿçàí³ ç âèçíà÷åííÿì ÷àñòèí ìîâè, ëåìàòèçàö³ºþ, òîêåí³çàö³ºþ òåêñòó, ïîáóäîâîþ ñèíòàêñè÷íèõ äåðåâ çàëåæíîñ- òåé, ïîøóêîì êîðåôåðåíòíîñòåé, ðîçï³çíàâàííÿì ³ìåíîâàíèõ ñóòíîñòåé, â³äíîâëåííÿì ñòðóêòóðíî¿ òà ñåìàíòè÷íî¿ íåïîâíîòè ðå÷åííÿ, âèÿâëåííÿì çâ’ÿçê³â ³ â³äíîøåíü ì³æ ìîâíèìè îäèíèöÿìè òîùî. Âàæê³ñòü ðîçâ’ÿçàííÿ òàêèõ ïðîáëåì çóìîâëåíà ñêëàäí³ñòþ ïðèðîäíî¿ ìîâè: áàãàòîçíà÷í³ñòþ, ìåòàôîðè÷í³ñòþ ìîâíîãî çíàêà, íå÷³òêèìè ìíîæèíàìè ìîâíèõ îäèíèöü, à îòæå, íåìîæëèâ³ñòþ îïèñó çà äîïîìîãîþ ÷³òêîãî íàáîðó äåòåðì³íîâà- íèõ ïðàâèë. Íàéïîøèðåí³øèì çàñîáîì ðîçâ’ÿçàííÿ âêàçàíèõ çàäà÷ º ìàøèííå íà- â÷àííÿ, ÿêå äຠçìîãó â àâòîìàòè÷íîìó ðåæèì³ çä³éñíþâàòè ïîøóê çàêîíîì³ðíîñ- òåé íà îñíîâ³ ïàð âõ³äíèõ òà âèõ³äíèõ äàíèõ, ùî ñêëàäàþòü êîðïóñ íàâ÷àëüíî¿ âèá³ðêè. Ðîçâ’ÿçàííÿ çàäà÷, ÿê³ ìîæíà ÷³òêî ñôîðìóëþâàòè (íàïðèêëàä, ÷àñòèíî- ìîâíå àíîòóâàííÿ òåêñòó), çàëåæèòü çäåá³ëüøîãî â³ä ñòâîðåííÿ ðîçì³÷åíèõ êîð- ïóñ³â íåîáõ³äíîãî ³ äîñòàòíüîãî îáñÿãó äëÿ ÿê³ñíîãî íàâ÷àííÿ (íàïðèêëàä, äëÿ ÿê³ñíîãî ìîðôîëîã³÷íîãî àíîòóâàííÿ äîñòàòíüî ñôîðìóâàòè êîðïóñ îáñÿãîì â îäèí 164 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 © Ã.². Ãîãåð÷àê, Í.Ï. Äàð÷óê, Ñ.Ë. Êðèâèé, 2021 ì³ëüéîí ñëîâîâæèâàíü, à äëÿ ñèíòàêñè÷íîãî ðîçì³÷óâàííÿ — äåñÿòêè ³ ñîòí³ ì³ëüéîí³â ñëîâîâæèâàíü, ùîá çàáåçïå÷èòè äîñòîâ³ðí³ñòü ³ ðåïðåçåíòàòèâí³ñòü ðåçóëü- òàò³â àíàë³çó). Ïðîòå íå âñ³ çàäà÷³ îáðîáëåííÿ ïðèðîäíèõ ìîâ ïîòðåáóþòü ñòâîðåííÿ òàêèõ êîðïóñ³â — íà òàê çâàíèõ ïðîì³æíèõ åòàïàõ îïðàöþâàííÿ ìîâíî¿ ³íôîðìàö³¿ ìîæíà çàñòîñîâóâàòè çàñîáè ìàòåìàòè÷íî¿ ëîã³êè òîùî, ùî ïîëåãøóº ïðîöåñ ðîçâ’ÿ- çàííÿ á³ëüø ñêëàäíèõ çàäà÷ íà îñíîâ³ ðåçóëüòàò³â ðîçâ’ÿçàííÿ ìåíø ñêëàäíèõ, àëå ãëèáîêî ôîðìàë³çîâàíèõ ³ çàáåçïå÷åíèõ êîðïóñàìè äîñòàòíüîãî îáñÿãó. Äî òàêèõ çàäà÷, çîêðåìà, íàëåæèòü çàäà÷à âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâ- íèõ òåêñò³â, ðîçâ’ÿçàííÿ ÿêî¿ â³äêðèâຠøëÿõ äî ïîòóæíîãî àïàðàòó ìàòåìàòè÷íèõ ëîã³ê äëÿ àíàë³çó òåêñò³â, íàïèñàíèõ óêðà¿íñüêîþ ìîâîþ, òà ðîçâ’ÿçàííÿ ³íøèõ çà- äà÷, äîòè÷íèõ äî ôîðìàëüíî¿ ëîã³êè. ¯õíÿ îñîáëèâ³ñòü ïîëÿãຠó â³äñóòíîñò³ ôîð- ìàëüíèõ âèìîã äî ôîðìóëþâàííÿ ïðàâèë ïðåäñòàâëåííÿ ïðèðîäíî¿ ìîâè ó âèãëÿä³ ïåâíèõ ôîðìàëüíèõ ëîã³÷íèõ ñòðóêòóð — ñèñòåìè àêñ³îì áàçè çíàíü. ijéñíî, ïðåäñòàâëåííÿ äîâ³ëüíîãî òåêñòó â ïîä³áí³é ëîã³÷í³é ñòðóêòóð³ ïîòðåáóº àïàðàòó ç äîñòàòíüîþ âèðàçíîþ ïîòóæí³ñòþ äëÿ ïðåäñòàâëåííÿ çíàíü íå ò³ëüêè òèïó ñóá’ºêò – ä³ÿ – îá’ºêò, à é á³ëüø ñêëàäíèõ â³äíîøåíü, óðàõóâàííÿ ÷àñîâèõ, ïðè÷èí- íî-íàñë³äêîâèõ õàðàêòåðèñòèê òîùî. ³äñóòí³ñòü ÷³òêî¿ ôîðìàëüíî¿ ïîñòàíîâêè ö³º¿ çàäà÷³ óíåìîæëèâëþº ïîáóäîâó êîðïóñó íàâ÷àëüíî¿ âèá³ðêè äëÿ ¿¿ ðîçâ’ÿçàí- íÿ. Ç ³íøîãî áîêó, ïîáóäîâà òàêîãî êîðïóñó ó ðàç³ óñï³øíî¿ ôîðìàë³çàö³¿ ñòàíîâè- òèìå òðóäíîù³ ÷åðåç â³äñóòí³ñòü äæåðåë äëÿ àâòîìàòè÷íîãî çáèðàííÿ ïðèêëàä³â ðîçâ’ÿçàííÿ çàäà÷³ (ÿê öå ìîæíà çðîáèòè äëÿ çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ìà- øèííîãî ïåðåêëàäó ÷è ïåðåäáà÷åííÿ íàñòóïíîãî ñëîâà íà áàç³ íàÿâíèõ ñëîâíèê³â, åíöèêëîïåäè÷íèõ äàíèõ òà òåêñòîâî¿ ³íôîðìàö³¿ â ìåðåæ³ ²íòåðíåò). Öå çóìîâëþº àêòóàëüí³ñòü äîñë³äæåíü ó ñôåð³ ïîáóäîâè ñèñòåìè àëãîðèòì³â äëÿ âèÿâëåííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü íà áàç³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îá- ðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ïîáóäîâè äåðå- âà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñòåé òà âèÿâëåííÿ ³ìåíîâàíèõ ñóòíîñòåé. Ìà- òåìàòè÷íîþ îñíîâîþ òàêî¿ ñèñòåìè º òåîð³ÿ áàç çíàíü òà ìàòåìàòè÷íà ëîã³êà. Ó ñòàòò³ íàâåäåíî òåîðåòè÷í³ îñíîâè ìàòåìàòè÷íî¿ ëîã³êè òà êîìï’þòåðíî¿ ë³íãâ³ñòèêè, à òàêîæ àëãîðèòìè âèäîáóâàííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü íà îñíîâ³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷ ðîçì³÷åííÿ ÷àñòèí ìîâè, ïîáóäîâè äåðåâà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñ- òåé. Ðîçãëÿíóòî çàñîáè ïðåäñòàâëåííÿ, àíàë³çó òà âèäîáóâàííÿ çíàíü ç íåñòðóêòó- ðîâàíèõ ïðèðîäíîìîâíèõ òåêñò³â, ÿê³ ñòàíîâëÿòü òåîðåòè÷íå çíà÷åííÿ ñòàòò³. Çàïðîïîíîâàíèé ó ñòàòò³ êîìïëåêñ àëãîðèòì³â ìຠ³ ïðàêòè÷íå çàñòîñóâàííÿ â àâòîìàòèçàö³¿ çàäà÷ ïåðåâ³ðêè òåêñò³â íà íåñóïåðå÷í³ñòü, ö³ë³ñí³ñòü òîùî. Ïîáóäîâà ïîâíîö³ííîãî êîìïëåêñó äëÿ àíàë³çó ïðèðîäíîìîâíèõ çíàíü âèìà- ãຠðîçâ’ÿçàííÿ òàêèõ çàäà÷: � âèçíà÷åííÿ çàñîá³â ôîðìàëüíîãî ïðåäñòàâëåííÿ ïðèðîäíîìîâíèõ çíàíü; � ïåðåòâîðåííÿ íåñòðóêòóðîâàíîãî ïðèðîäíîìîâíîãî òåêñòó ó ñòðóêòóðîâà- íèé âèãëÿä; � ïîáóäîâè àëãîðèòìó âèäîáóâàííÿ çíàíü ç³ ñòðóêòóðîâàíîãî ïðåäñòàâëåííÿ ïðèðîäíîìîâíèõ òåêñò³â òà ¿õíüîãî çàïèñó â îáðàí³é ôîðìàëüí³é ñèñòåì³; � çàñòîñóâàííÿ àëãîðèòì³â ìàòåìàòè÷íî¿ ëîã³êè òà òåî𳿠ãðàô³â äî ñèñòåìè îäåðæàíèõ çíàíü. 1. ÎÑÍÎÂÈ ÒÅÎв¯ ÁÀÇ ÇÍÀÍÜ Ïîòðåáà îïèñó çíàíü çà äîïîìîãîþ ôîðìàëüíèõ çàñîá³â ñïðè÷èíèëà ïîÿâó íî- âîãî êëàñó ëîã³ê — äåñêðèïòèâíèõ (îïèñîâèõ). Áàçîâ³ òåîðåòè÷í³ ïîíÿòòÿ ð³çíèõ êëàñ³â òàêèõ ëîã³ê ðîçãëÿíóòî â [1, 2]. 1.1. ѳìåéñòâî ìîâ AL . Íåõàé CN A Am� { }1, ,� òà RN R Rn� { }1, ,� — ñê³í÷åíí³ íåïîðîæí³ ìíîæèíè ³ìåí êîíöåïò³â (àòîìàðíèõ êîíöåïò³â) òà ðîëåé (àòîìàðíèõ ðîëåé). Òîä³ ñèíòàêñèñ ëîã³êè AL (attribute language — àòðèáóòèâíà ìîâà) âèçíà÷àºòüñÿ òàê. ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 165 Îçíà÷åííÿ 1. Ìíîæèíó êîíöåïò³â ëîã³êè AL çàäàþòü ³íäóêòèâíî: � ñèìâîëè � (óí³âåðñàëüíèé êîíöåïò) òà � (ïîðîæí³é êîíöåïò) º êîíöåïòàìè; � äîâ³ëüíå ³ì’ÿ êîíöåïòó A CN� º êîíöåïòîì; � ÿêùî A — ³ì’ÿ êîíöåïòó, òî � A (äîïîâíåííÿ äî A) — êîíöåïò; � ÿêùî C òà D — êîíöåïòè, òî C D� (ïåðåòèí) — êîíöåïò; � ÿêùî C — êîíöåïò, à R — àòîìàðíà ðîëü, òî �R.� (îáìåæåíèé êâàíòîð ³ñíóâàííÿ) òà �R C. (îáìåæåííÿ íà çíà÷åííÿ) — êîíöåïòè; � æîäíèõ ³íøèõ êîíöåïò³â íå ³ñíóº. Íàâåäåíå îçíà÷åííÿ êîðîòêî ìîæíà çàïèñàòè òàê: � �| | | | | . | .� � � �A A C D R R C� . Ñåìàíòèêó ëîã³êè AL çàäàþòü çà äîïîìîãîþ ïîíÿòòÿ ³íòåðïðåòàö³¿. Îçíà÷åííÿ 2. ²íòåðïðåòàö³ºþ íàçèâàºòüñÿ ïàðà I I I� ( , ) , ùî ñêëàäàºòüñÿ ç íåïîðîæíüî¿ ìíîæèíè I (îáëàñòü ³íòåðïðåòàö³¿) òà ôóíêö³¿ I , ÿêà êîæíîìó àòîìàðíîìó êîíöåïòó ñòàâèòü ó â³äïîâ³äí³ñòü ïåâíó ï³äìíîæèíó îáëàñò³ ³íòåð- ïðåòàö³¿, à êîæí³é àòîìàðí³é ðîë³ — ï³äìíîæèíó ¿¿ äåêàðòîâîãî êâàäðàòà. Òàêèì ÷èíîì, íàâåäåí³ îïåðàö³¿ íàä êîíöåïòàìè ìîæíà âèçíà÷èòè ó òàêèé ñïîñ³á: � I I� ; � ��I ; ( ) \� �A AI I I ; ( )C D C DI I I � � � ; ( . ) | ( , )� � � � �R a b a b RI I I � { } ; ( . ) | ( , )� � � � � �R C a b a b R b CI I I I{ } . Îçíà÷åííÿ 3. Êîíöåïòè C òà D åêâ³âàëåíòí³ (C D� ), ÿêùî çà äîâ³ëüíî¿ ³íòåð- ïðåòàö³¿ I ñïðàâäæóºòüñÿ C DI I� . Êîíöåïò C âêëþ÷àºòüñÿ â êîíöåïò D (C D� ), ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâäæóºòüñÿ C DI I� . Ðîë³ R òà S åêâ³âàëåíòí³ (R S� ), ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâäæóºòüñÿ ( , ) ( , )a b R a b SI I� � � . Ðîëü R âêëþ÷àºòüñÿ â ðîëü S ( )R S� , ÿêùî çà äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ñïðàâ- äæóºòüñÿ ( , ) ( , )a b R a b SI I� � . Ìîâè ç á³ëüø âèðàçíîþ ïîòóæí³ñòþ ìîæíà îòðèìóâàòè ç ìîâè AL äîäàâàí- íÿì íîâèõ êîíñòðóêòîð³â ó âèçíà÷åííÿ êîíöåïò³â ³ ðîëåé (òàáë. 1). Òàêèì ÷èíîì, ìîæíà âèçíà÷èòè íèçêó ìîâ çàëåæíî â³ä òîãî, ÿê³ êîíñòðóêòî- ðè áóäóòü äî íèõ âêëþ÷åí³: 166 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 Ò à á ë è ö ÿ 1. Êîíñòðóêòîðè êîíöåïò³â òà ðîëåé äëÿ ìîâ ñ³ìåéñòâà AL AL Êîíñòðóêòîð ²íòåðïðåòàö³ÿ U C D� (îá’ºäíàííÿ) ( )C D C DI I I� � � E �R C. (ïîâíèé êâàíòîð ³ñíóâàííÿ) ( . ) | [( , ) ]� � � � � � �R C a b a b R b CI I I I{ } N � �nR nR, (ê³ëüê³ñí³ îáìåæåííÿ) ( ) | | | ( , ) |� � � � �nR a b a b R nI I I{ { } } , ( ) | | | ( , ) |� � � � �nR a b a b R nI I I{ { } } C �C (äîïîâíåííÿ äîâ³ëüíîãî êîíöåïòó) ( ) \� �C CI I I Q � �nR C nR C. , . (ÿê³ñí³ îáìåæåííÿ) ( . ) | | | ( , ) |� � � � � � �nR C a b a b R b C nI I I{ { } } , ( . ) | | | ( , ) |� � � � � � �nR C a b a b R b C nI I I{ { } } I R�1 (îáåðíåíà ðîëü) ( ) ( , ) | ( , )R b a a b RI I I I� � � � �1 { } AL :� � � � �� �| | | | | . | .A A C D R R C� ; ALU := � �| | | | | | . | .� � � �A A C D C D R R C� � ; ALE := � | | | | | . | .� � � �A A C D R C R C� ; ALEN :=� | | | | | . | . | |� � � � � �A A C D R C R C nR nR� ; ALC := � �| | | | | . | .� � � �A C C D R R C� ; ALCQ := � �| | | | | . | . | . | .� � � � � �A C C D R R C nR C nR C� . Òåîðåìà 1. Ìàþòü ì³ñöå òàê³ ñï³ââ³äíîøåííÿ: a) ALC ALUE� ; á) ALE ALQ� ; â) ALN ALQ� ; ã) ALX ALCQ U E N C Q� � �, , , , ,X { } . Äîâåäåííÿ. Íàâåäåí³ ñï³ââ³äíîøåííÿ âèïëèâàþòü: à) — ç âëàñòèâîñòåé òåîðåòèêî-ìíîæèííèõ îïåðàö³é; á) — ç îçíà÷åííÿ ÿê³ñíèõ îáìåæåíü òà ïîâíîãî êâàíòîðà ³ñíóâàííÿ (ä³éñíî, ( . ) ( .� � �R C R Ñ1 )); â) — ç îçíà÷åííÿ ÿê³ñíèõ òà ê³ëüê³ñíèõ îáìåæåíü (ä³éñíî, ( ) ( .� � �nR nR �), ( ) ( .� � �nR nR �)); ã) — ç îçíà÷åííÿ äîïîâíåííÿ äî êîíöåïòó òà ÿê³ñíèõ îáìåæåíü, äëÿ ÷îãî äîñòàòíüî äîâåñòè, ùî êîíñòðóêòîðè U E, , N âèðàæàþòüñÿ ÷åðåç C òàQ , ùî âèï- ëèâຠç à) òà â). � 1.2. Âêëàäåííÿ ëîã³êè ALCQ ó ëîã³êó ïðåäèêàò³â. Îñê³ëüêè ³íòåðïðåòàö³ÿ I ñòàâèòü êîæíîìó àòîìàðíîìó êîíöåïòó A ó â³äïîâ³äí³ñòü ïåâíó ï³äìíîæèíó îá- ëàñò³ ³íòåðïðåòàö³¿ A I I� , òàêîìó êîíöåïòó ìîæíà ïîñòàâèòè ó â³äïîâ³äí³ñòü îäíîì³ñíèé ïðåäèêàò P xA ( ) íàëåæíîñò³ ³íäèâ³äà x êîíöåïòó A. Àíàëîã³÷íî ìîæ- íà âèçíà÷èòè äâîì³ñíèé ïðåäèêàò P x yR ( , ) ³ñíóâàííÿ â³äíîøåííÿ R ì³æ ³íäèâ³äàìè x òà y. Îòæå, êîæíîìó êîíöåïòó C ó â³äïîâ³äí³ñòü ìîæíà ïîñòàâèòè ôîðìóëó �C x( ) òàêó, ùî äëÿ äîâ³ëüíî¿ ³íòåðïðåòàö³¿ I ìíîæèíà åëåìåíò³â I , ùî çàäî- âîëüíÿþòü �C x( ), º òî÷íî C I : � � ( )x T� ; �� �( )x F ; � A Ax P x( ) ( )� ; � � �C D C Dx x x� ( ) ( ) ( )� � ; � � �C D C Dx x x� ( ) ( ) ( )� � ; � �� � � R C Cx y R x y x. ( ) [ ( , ) ( )]; � �� � � �R C Cx y R x y x. ( ) [ ( , ) ( )]; �� � � � � � � �� �� � � �nR n n i j i jx y y R x y R x y y y( ) , ..., ( , ) ( , )1 1 � ; �� ! ! � � � � � �� �nR n n i j i jx y y R x y R x y y y( ) , ..., ( , ) ( , )1 1 1 1� �� � � ; �� �nR C x. ( ) � � � � � � � � � � y y R x y R x y y y yn n C C n i j 1 1 1, ..., ( , ) ( , ) ( ) ( )� �� � i jy�� �� � � ; �� �nR C x. ( ) �� � � � � � ! ! � �y y R x y R x y y yn n C C n i 1 1 1 1 1, , ( , ) ( , ) ( ) ( )� � �� � j i jy y� � �� � � . ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 167 Òàêå âêëàäåííÿ äຠçìîãó çàñòîñîâóâàòè ìåòîä ðåçîëþö³é äëÿ ïåðåâ³ðêè âêëþ÷åííÿ ÷è åêâ³âàëåíòíîñò³ êîíöåïò³â. Ïðîòå, ïîïðè ìîæëèâ³ñòü âêëàäåííÿ äåñêðèïòèâíî¿ ëîã³êè â ëîã³êó ïðåäèêàò³â ïåðøîãî ïîðÿäêó, íåîáõ³äí³ñòü îêðå- ìîãî àïàðàòó òàêèõ ëîã³ê çóìîâëåíà äåùî ñòèñë³øîþ ôîðìîþ ïîäàííÿ òâåð- äæåíü, ùî, çîêðåìà, ó âèïàäêó ê³ëüê³ñíèõ òà ÿê³ñíèõ îáìåæåíü íàäຠìîæëèâ³ñòü âèêîðèñòîâóâàòè åôåêòèâí³ø³ àëãîðèòìè âèâåäåííÿ, í³æ ó ëîã³ö³ ïðåäèêàò³â. 1.3. Ïðåäñòàâëåííÿ çíàíü. Íà áàç³ íàâåäåíèõ âèùå ñèíòàêñèñó òà ñåìàíòèêè ìîæíà âèçíà÷èòè çàñîáè ïîäàííÿ òâåðäæåíü ùîäî ñï³ââ³äíîøåííÿ êîíöåïò³â ³ ðîëåé. Îçíà÷åííÿ 4. Òåðì³íîëîã³÷íîþ àêñ³îìîþ íàçèâàºòüñÿ òâåðäæåííÿ âèãëÿäó C D� , C D� , R S� àáî R S� , äå C D, — êîíöåïòè, à R S, — ðîë³. ²íòåðïðåòàö³ÿ I çàäîâîëüíÿº òåðì³íîëîã³÷íó àêñ³îìó T , ÿêùî âîíà ³íòåðïðåòóºòüñÿ â í³é ÿê ³ñòèíà. Ïðè öüîìó ¿¿ íàçèâàþòü ìîäåëëþ àêñ³îìè T . Òåðì³íîëîã³ÿ (TBox) áàçè çíàíü º ìíîæèíîþ òåðì³íîëîã³÷íèõ àêñ³îì. Ïðèêëàä 1. Íåõàé CN � {Êîòÿ÷èé, ʳò, Òèãð, ʳøêà, Êîøåíÿ, Ñòàòü_æ³íî÷à, Òâàðèíà, ³ê � 4} òà RN � {ìàº_äèòèíó} º ìíîæèíàìè àòîìàðíèõ êîíöåïò³â òà àòîìàðíèõ ðîëåé â³äïîâ³äíî. Ðîçãëÿíåìî ïðîñòèé ïðèêëàä òåðì³íîëî㳿 (TBox) íà îñíîâ³ ï³äìíîæèíè êëàñèô³êàö³¿ òâàðèí: ʳò � Êîòÿ÷èé; Òèãð � Êîòÿ÷èé; ʳøêà � Ñòàòü_æ³íî÷à � ʳò; Êîòÿ÷èé � Òâàðèíà; Êîøåíÿ � ʳò � ³ê� 4; ʳò ��ìàº_äèòèíó.ʳò; ʳò � �1ìàº_äèòèíó�1 .ʳøêà; ʳò � �1ìàº_äèòèíó�1 .�Ñòàòü_æ³íî÷à � ʳò. Ó âêàçàí³é òåðì³íîëî㳿 âèçíà÷åíî ïåâíó ³ºðàðõ³þ àòîìàðíèõ êîíöåïò³â, ùî â³ääçåðêàëþº íàëåæí³ñòü êîò³â òà òèãð³â äî ðîäèíè êîòÿ÷èõ, ðîäèíè êîòÿ÷èõ äî êîíöåïòó òâàðèí, âèçíà÷àþòü ê³øêó ÿê êîòà æ³íî÷î¿ ñòàò³, à êîøåíÿ ÿê êîòà â³êîì ìåíøå ÷îòèðüîõ ðîê³â. Äâà îñòàíí³ îáìåæåííÿ âêàçóþòü, ùî êîòè íàðîäæóþòü ò³ëüêè êîò³â ³ êîæåí ê³ò ìຠò³ëüêè äâîõ áàòüê³â: ê³øêó òà êîòà (÷îëîâ³÷î¿ ñòàò³). Îêð³ì îïèñó â³äíîøåíü ì³æ êîíöåïòàìè òà ðîëÿìè, ó áàç³ çíàíü òàêîæ ïî- âèííà áóòè ³íôîðìàö³ÿ ùîäî îêðåìèõ ôàêò³â òà îêðåìèõ îá’ºêò³â ïðåäìåòíî¿ îá- ëàñò³ (³íäèâ³ä³â) ó òåðì³íàõ êîíöåïò³â ³ ðîëåé. Óâåäåìî äîäàòêîâî íîâó ìíîæèíó IN a am� { }1, ..., ³ìåí ³íäèâ³ä³â. ×àñòèíà áàçè çíàíü, ùî ì³ñòèòü ³íôîðìàö³þ ïðî îêðåì³ ³íäèâ³äè, íàçè- âàºòüñÿ ABox (assertion box) òà ñêëàäàºòüñÿ ç äâîõ òèï³â ôàêò³â: � a A: (íàëåæí³ñòü ³íäèâ³äà a IN� äî êîíöåïòó A); � aRb (çâ’ÿçîê äâîõ ³íäèâ³ä³â a b IN, � ðîëëþ R). Îçíà÷åííÿ 5. ²íòåðïðåòàö³ÿ I íàçèâàºòüñÿ ìîäåëëþ òåðì³íîëî㳿 T , ÿêùî âîíà º ìîäåëëþ âñ³õ ¿¿ àêñ³îì. ²íòåðïðåòàö³ÿ I íàçèâàºòüñÿ ìîäåëëþ ñèñòåìè ôàêò³â A, ÿêùî äëÿ äîâ³ëüíèõ ôàêò³â a A: òà aRb ìຠì³ñöå a AI I� òà ( , )a b RI I I� . ×àñòèíà áàçè çíàíü ABox A íàçèâàºòüñÿ âèêîíóâàíîþ (â³äíîñíî òåðì³íîëî㳿 T ), ÿêùî A ìຠìîäåëü, ÿêà º îäíî÷àñíî ³ ìîäåëëþ T . 1.4. Îñíîâí³ çàäà÷³. Çàäà÷à íàïîâíåííÿ áàçè çíàíü ïîâ’ÿçàíà ç ïåðåâ³ðêîþ òîãî, ÷è ìຠíîâèé ¿¿ êîíöåïò çì³ñò ó ìåæàõ âæå íàÿâíèõ çâ’ÿçê³â àáî º íàâïàêè ñóïåðå÷ëèâèì, ÷è âêëþ÷àºòüñÿ â³í â ³íøèé êîíöåïò, ÷è º åêâ³âàëåíòíèì íàÿâíî- ìó êîíöåïòîâ³ àáî äèç’þíêòíèì ùîäî íüîãî. Ç îãëÿäó íà öå êëþ÷îâèìè çàäà÷àìè 168 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 âèâåäåííÿ äëÿ òåðì³íîëîã³é º: � âèêîíóâàí³ñòü — êîíöåïò C âèêîíóâàíèé ó òåðì³íîëî㳿 T , ÿêùî ³ñíóº ìî- äåëü I òåðì³íîëî㳿 T òàêà, ùî C I íåïóñòå; � ïîãëèíàííÿ — êîíöåïò C ïîãëèíàºòüñÿ êîíöåïòîì D ó òåðì³íîëî㳿 T ( )C D�T , ÿêùî äëÿ êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 T âèêîíóºòüñÿ C DI I� ; � åêâ³âàëåíòí³ñòü — êîíöåïòè C òà D åêâ³âàëåíòí³ â òåðì³íîëî㳿 T ( )C D�T , ÿêùî äëÿ êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 âèêîíóºòüñÿ C DI I� ; � äèç’þíêòí³ñòü — êîíöåïòè C òà D äèç’þíêòí³ â òåðì³íîëî㳿 T , ÿêùî äëÿ êîæíî¿ ìîäåë³ I òåðì³íîëî㳿 âèêîíóºòüñÿ C DI I� ��. Òåîðåìà 2. Ìàþòü ì³ñöå òàê³ òâåðäæåííÿ: C — âèêîíóâàíèé " C �T �; C D C D D C� " �T T T� � ; C D, — äèç’þíêòèâí³ " �C D� �T ; C D C D� �T " � — íåâèêîíóâàíèé; C D C D D C� " � �T � �, — íåâèêîíóâàí³; C D, — äèç’þíêòèâí³ " C D� — íåâèêîíóâàíèé. Äîâåäåííÿ öèõ òâåðäæåíü âèïëèâຠç âëàñòèâîñòåé â³äïîâ³äíèõ òåîðåòè- êî-ìíîæèííèõ îïåðàö³é. Íàñë³äêîì öèõ òâåðäæåíü º òå, ùî äëÿ ðîçâ’ÿçàííÿ íàâåäåíèõ âèùå ÷îòèðüîõ çàäà÷ äîñòàòíüî ðîçâ’ÿçàòè çàäà÷ó ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó àáî ïå- ðåâ³ðêè âêëþ÷åííÿ êîíöåïò³â. Îçíà÷åííÿ 6. Àëãîðèòì U ðîçâ’ÿçóº ïðîáëåìó âèêîíóâàíîñò³ êîíöåïò³â ó òåðì³íîëî㳿 T äëÿ äåñêðèïòèâíî¿ ëîã³êè L , ÿêùî âèêîíóþòüñÿ òàê³ óìîâè: � òåðì³íàëüí³ñòü — äëÿ äîâ³ëüíèõ êîíöåïòó C ³ òåðì³íîëî㳿 T àëãîðèòì U ãåíåðóº â³äïîâ³äü U C( , )T çà ñê³í÷åííèé ÷àñ; � êîðåêòí³ñòü — äëÿ äîâ³ëüíèõ C ³ T , ÿêùî C âèêîíóºòüñÿ â òåðì³íîëî㳿 T , òî U C( , )T �1; � ïîâíîòà — äëÿ äîâ³ëüíèõ C ³ T , ÿêùî U C( , )T �1, òî C âèêîíóºòüñÿ â òåðì³íîëî㳿 T . 1.5. Àëãîðèòì ñåìàíòè÷íîãî òàáëî äëÿ ALCQ ç òåðì³íîëîã³ÿìè. Ðîçãëÿíå- ìî àëãîðèòì ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó. Íåõàé íåîáõ³äíî ïåðåâ³ðèòè âèêîíóâàí³ñòü êîíöåïòó C. Ñôîðìóºìî ïî÷àò- êîâèé ABox A áàçè çíàíü ç ºäèíèì òâåðäæåííÿì x C: . ßê ï³äãîòîâ÷èé êðîê íîðìàë³çóºìî êîíöåïò C, òîáòî îäåðæèìî åêâ³âàëåí- òíèé êîíöåïò, â ÿêîìó âñ³ çàïåðå÷åííÿ (äîïîâíåííÿ) ñòîÿòü ò³ëüêè ïåðåä àòîìàð- íèìè êîíöåïòàìè. Äëÿ öüîãî ìîæíà ñêîðèñòàòèñÿ òîòîæíîñòÿìè: � �� �( )C D C D� � ; � �� �( )C D C D� � ; �� � � �R C R C. . ; �� � � �R C R C. . ; � � � � �nR C n R C. ( ) .1 ; � � � � !nR C n R C. ( ) .1 ; �� �C C . Íàäàë³ ââàæàòèìåìî, ùî êîíöåïòè íîðìàë³çîâàí³. Îçíà÷åííÿ 7. ²íäèâ³ä x áëîêóº ³íäèâ³äà y , ÿêùî x º ïðåäêîì y òà äëÿ äîâ³ëüíîãî êîíöåïòó C ìຠì³ñöå òâåðäæåííÿ y C x C: :� # �A A . ²íäèâ³ä x íà- çèâàºòüñÿ àêòèâíèì, ÿêùî â³í íå áëîêóºòüñÿ æîäíèì ³íøèì ³íäèâ³äîì. Íà êîæíîìó êðîö³ àëãîðèòìó çàñòîñîâóºìî äî ABox îäíå ç ïðàâèë, íàâåäåíèõ ó òàáë. 2. Ïîñë³äîâí³ñòü âèêîíàííÿ ïðàâèë ó öüîìó àëãîðèòì³ äîâ³ëüíà çà âèíÿòêîì �-ïðàâèëà, ÿêå âèêîíóºòüñÿ ò³ëüêè, ÿêùî æîäíå ³íøå çàñòîñóâàòè íåìîæëèâî. Àëãîðèòì çàâåðøóº ñâîþ ðîáîòó, ÿêùî äî íàñòóïíîãî ABox íåìîæëèâî çà- ñòîñóâàòè æîäíîãî ç ïðàâèë, àáî ÿêùî â íüîìó ì³ñòèòüñÿ ñóïåðå÷í³ñòü (íàÿâíèé ôàêò x :� àáî ôàêòè x A x A: , :� îäíî÷àñíî, àáî äîñÿãíóòî ñóïåðå÷íîñò³ íà �-ïðà- âèë³). Ïî÷àòêîâèé êîíöåïò âèêîíóâàíèé, ÿêùî ï³ä ÷àñ ðîáîòè àëãîðèòìó òðàï- ëÿºòüñÿ íåñóïåðå÷ëèâèé ABox, äî ÿêîãî íåìîæëèâî çàñòîñóâàòè æîäíîãî ç ïðà- âèë. Ó ðåøò³ âèïàäê³â êîíöåïò íåâèêîíóâàíèé. ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 169 Ïðèêëàä 2. Íåõàé ³ñíóº áàçà çíàíü: CN � {Êîòÿ÷èé, ʳò, Òèãð, ʳøêà, Êîøåíÿ, Ñòàòü_æ³íî÷à, Òâàðèíà, ³ê � 4}, RN � {ìàº_äèòèíó}, ʳò � Êîòÿ÷èé, Òèãð � Êîòÿ÷èé, ʳøêà � Ñòàòü_æ³íî÷à � ʳò, Êîòÿ÷èé � Òâàðèíà, Êîøåíÿ � ʳò � ³ê� 4, ʳò �� ìàº_äèòèíó.ʳò, ʳò � �1ìàº_äèòèíó �1.ʳøêà; ʳò � �1ìàº_äèòèíó �1.�Ñòàòü_æ³íî÷à � ʳò. Ðîçãëÿíåìî çàäà÷ó ïåðåâ³ðêè âèêîíóâàíîñò³ êîíöåïòó: ʳò ��� ìàº_äèòèíó �1.�. Çâåäåìî êîíöåïò äî íîðìàëüíî¿ ôîðìè òà îòðèìàºìî ³í³ö³àëüíèé ABox âèãëÿäó {x :ʳò �� ìàº_äèòèíó �1.�}. Çàñòîñóºìî �-ïðàâèëî, ï³ñëÿ ÷îãî îäåðæèìî íîâèé ABox âèãëÿäó {x : ʳò �� ìàº_äèòèíó �1. � , :x ʳò, x :� ìàº_äèòèíó � �1. }. Çã³äíî ç T -ïðàâèëîì, çàñòîñîâàíèì äî ôàêòó x :ʳò, îòðèìàºìî ABox x ʳò ìàº_äèòèíó x ʳò x ìàº_äèòèíó x : . , : : . , : �� � � � � � �1 1 1 , ìàº_äèòèíó ʳøêà� $ % & ' ( ) 1. ,� . 170 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 Ò à á ë è ö ÿ 2. Ïðàâèëà àëãîðèòìó ñåìàíòè÷íîãî òàáëî äëÿ ALCQ Ïðàâèëî Óìîâè çàñòîñóâàííÿ ijÿ � -ïðàâèëî x — àêòèâíèé; x C D: ( )� � A ; x C x D: :* � *A A A A'� � { }x C x D: , : �-ïðàâèëî x — àêòèâíèé; x C D: ( )� � A ; x C x D: :* � *A A A A'� � { }x C: , A A' '� � { }x D: �-ïðàâèëî x — àêòèâíèé; x R C: .� � A ; � � � *y xRy y C: :A A A A'� � { }y C: T -ïðàâèëî x — àêòèâíèé; x E: * A , äå ��E �T A A'� � { }x E: choose-ïðàâèëî x — àêòèâíèé; x nR C: .� �A ; xRy y C y C� * � *A A A, : , : A A A' ' '� � � � �{ } { }y C A y C: , : �-ïðàâèëî x — àêòèâíèé; x nR C: .� �A ; �� y yn1 , ... , [ ( [ , : ])� � � � �1 i n xRy y Ci i{ } A �� � � �i j y yi j[ ]A ] y yn1 ,... , — íàùàäêè x ; A A'� � � � $ % + + & + + ' ( + + ) + + xRy y C xRy y C y y i j n n i j 1 1, : , : , � �-ïðàâèëî x — àêòèâíèé; x nR C: .� �A ; � !y yn1 1, ... , [ ( [ , : ])� � � ! �1 1i n xRy y Ci i{ } A ] ßêùî � � � *i j y yi j[ ]A , òî �i j, òàêèõ, ùî y yi j� *A , A Aij j ix x� | , äå A | x xj i — ABox, â ÿêîìó âñ³ x j çàì³íåíî íà xi. ²íàêøå — ñóïåðå÷í³ñòü. Íà îñíîâ³ �-ïðàâèëà îòðèìàºìî ôàêòè ìàº_äèòèíó �1 ( , ),x y y:ʳøêà. Çã³äíî ç �-ïðàâèëîì îäåðæóºìî ôàêò y:� , à îòæå, ïî÷àòêîâèé êîíöåïò íåâèêîíóâàíèé. Öå îçíà÷àº, ùî íå ³ñíóº êîò³â, ùî íå ìàþòü áàòüê³â. Ëåìà 1 (òåðì³íàëüí³ñòü). Íå ³ñíóº íåñê³í÷åííî¿ ïîñë³äîâíîñò³ A A0 1, , ... , â ÿê³é êîæíèé ABox Ai!1 îäåðæàío ç Ai çà äåÿêèì ïðàâèëîì àëãîðèòìó ñåìàí- òè÷íîãî òàáëî. Äîâåäåííÿ. Ðîáîòó àëãîðèòìó ñåìàíòè÷íîãî òàáëî ìîæíà ïðåäñòàâèòè ó âèãëÿä³ äåðåâà (ðèñ. 1). Âåðøèíàìè öüîãî äåðåâà º ABox , éîãî êîðåíåì — ³í³ö³àëüíèé ABox A0 0 0� { }x C: . Ëèñòêàìè öüîãî äåðåâà º ò³ ABox, äî ÿêèõ íå- ìîæëèâî çàñòîñóâàòè æîäíîãî ç ïðàâèë, à òàêîæ ò³, ÿê³ ì³ñòÿòü ñóïåðå÷í³ñòü. Ìàêñèìàëüíà ê³ëüê³ñòü ðåáåð, ùî âèõîäÿòü ç êîæíî¿ âåðøèíè öüîãî äåðåâà, âèç- íà÷àºòüñÿ �-ïðàâèëîì òà îáìåæåíà êâàäðàòîì çàãàëüíî¿ ê³ëüêîñò³ ³íäèâ³ä³â ó â³äïîâ³äíîìó ABox. Çàçíà÷èìî, ùî ïîâòîðíå çàñòîñóâàííÿ �-ïðàâèë, ÿê³ º ºäè- íèì äæåðåëîì íîâèõ ³íäèâ³ä³â ó öüîìó àëãîðèòì³, íåìîæëèâå ÷åðåç ñóïåðå÷í³ñòü éîãî ðåçóëüòàòó óìîâ³ éîãî âèêîíàííÿ. Òàêèì ÷èíîì, ìàêñèìàëüíà ê³ëüê³ñòü ³íäèâ³ä³â ó âñ³õ ñòâîðåíèõ çà äîïîìîãîþ àëãîðèòìó ABox îáìåæåíà ñóìîþ ê³ëüêîñòåé ³íäèâ³ä³â â ³í³ö³àëüíîìó ABox òà ÷èñëîâèõ õàðàêòåðèñòèê êîíñòðóê- òîð³â òèïó � â óñ³õ êîíöåïòàõ ³í³ö³àëüíîãî ABox. Îòæå, ìàêñèìàëüíà ê³ëüê³ñòü ðåáåð, ùî âèõîäÿòü ç êîæíî¿ âåðøèíè (¿¿ ùå íàçèâàþòü øèðèíîþ äåðåâà), îáìåæåíà ñóìîþ ê³ëüêîñòåé ³íäèâ³ä³â â ³í³ö³àëüíî- ìó ABox òà ÷èñëîâèõ õàðàêòåðèñòèê êîíñòðóêòîð³â òèïó �, ùî âèçíà÷àþòüñÿ âõ³äíèìè äàíèìè àëãîðèòìó. Ïîáóäóºìî ìíîæèíó ï³äêîíöåïö³â êîíöåïòó C ó òàêèé ñïîñ³á: Sub ( ) { }� �� ; Sub ( ) { }� � � ; Sub A A A CN( ) { },� � ; Sub C C Sub C( ) { } ( )� � � � ; Sub C D C D Sub C Sub D( ) { } ( ) ( )� �� � � ; Sub C D C D Sub C Sub D( ) { } ( ) ( )� �� � � ; Sub R C R C Sub C( . ) { . } ( )� � � � ; Sub nR C nR C Sub C( . ) { . } ( )� � � � ; Sub nR C nR C Sub C( . ) { . } ( )� � � � . Òîä³ ìíîæèíà êîíöåïò³â êîæíîãî ³íäèâ³äà äîâ³ëüíîãî ABox ï³ä ÷àñ âèêîíàííÿ àëãîðèòìó íàëåæèòü ìíîæèí³ Sub C Sub E( ) ( )0 � , à îòæå ñê³í÷åííà. Ç ³íøîãî áîêó, äîâæèíà áóäü-ÿêîãî ëàíöþãà â äåðåâ³ â³ä éîãî êîðåíÿ äî ëèñ- òêà íå ìîæå ïåðåâèùóâàòè çíà÷åííÿ 2n , n Sub C Sub E� �| ( ) ( ) |0 , à ÿêùî öÿ óìî- âà íå âèêîíóºòüñÿ, òî ³ñíóâàòèìóòü äâà ³íäèâ³äè ç îäíàêîâèìè êîíöåïòàìè ³ îäèí ç íèõ áëîêóâàòèìå ³íøîãî, ùî çó- ïèíèòü çðîñòàííÿ äîâæèíè ëàíöþãà. Îòæå, îñê³ëüêè ê³ëüê³ñòü ðåáåð ç îäí³º¿ âåðøèíè, äîâæèíà ëàíöþãà â³ä êîðåíÿ äî ëèñòêà, à òàêîæ êîæåí ABox ñê³í÷åíí³, òî òàêîãî íåñê³í÷åííîãî ëàíöþãà ABox íå ³ñíóº. � ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 171 Ðèñ. 1. Ñõåìà àëãîðèòìó ñåìàíòè÷íîãî òàáëî A0 A1 A3 A2 A4 A5 A7 A6 A8 Ëåìà 2 (êîðåêòí³ñòü). Ñïðàâåäëèâ³ òàê³ òâåðäæåííÿ: 1) êîíöåïò C âèêîíóâàíèé â³äíîñíî T òîä³ ³ ò³ëüêè òîä³, êîëè ABox A0 0 0� { }x C: âèêîíóâàíèé â³äíîñíî T ; 2) íåõàé A' îäåðæàíèé ç A çà äîïîìîãîþ îäíîãî ç ïðàâèë � , � , T , � àëãîðèò- ìó. Òîä³, ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî A' òåæ âèêîíóâàíèé â³äíîñíî T ; 3) íåõàé A' òà A' ' îäåðæàí³ ç A çà äîïîìîãîþ îäíîãî ç ïðàâèë � , choose. Òîä³ ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî A' àáî A' ' òåæ âèêîíóâàí³ â³äíîñíî T ; 4) íåõàé A A A1 2, , ..., k îäåðæàí³ ç A çà äîïîìîãîþ ïðàâèëà � àëãîðèòìó. Òîä³ ÿêùî A âèêîíóâàíèé â³äíîñíî T , òî ïðèíàéìí³ îäèí ç A A A1 2, , ..., k òåæ âèêîíóâàíèé â³äíîñíî T . Äîâåäåííÿ. Òâåðäæåííÿ 1 î÷åâèäíå. Äëÿ äîâåäåííÿ òâåðäæåíü 2 òà 3 ðîçãëÿ- íåìî êîæíå ïðàâèëî îêðåìî: � íåõàé A' îäåðæàíèé ç A çà � -ïðàâèëîì. Òîä³ ÿêùî A âèêîíóâàíèé, òî ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ � -ïðàâèëà x C DI I�( )� . Îòæå, ñïðà- âåäëèâî x C D x C x DI I I I I I I� � # � � � . Òàêèì ÷èíîì, I — ìîäåëü A'; � íåõàé A' îäåðæàíèé ç A çà �-ïðàâèëîì. Òîä³ ÿêùî A âèêîíóâàíèé, òî ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x R C x R yI I I I I� �( . ) , . Îòæå, äëÿ äîâ³ëüíîãî åëåìåíòà d I� òàêîãî, ùî x R dI I , ñïðàâåäëèâî d C I� . Àëå öå ñïðàâåäëèâî ³ äëÿ d yI� , òîìó y CI I� . Òàêèì ÷èíîì, I — ìîäåëü A'; � íåõàé A' îäåðæàíèé ç A çà T -ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé, ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ T -ïðàâèëà I I I IE x E� # � . Òàêèì ÷è- íîì, I — ìîäåëü A'; � íåõàé A' îäåðæàíèé ç A çà �-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé, ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x nR CI I� �( . ) . Îòæå, x a b a b R b C nI I I� � � � � �{ { } } : | | ( , ) | . Çâ³äñè âèïëèâàº, ùî ³ñíóþòü ïîïàðíî ð³çí³ åëåìåíòè d d Cn I 1, ..., � òàê³, ùî x R dI I i . Ç ³íøîãî áîêó, äëÿ A' íàÿâí³ ïî- ïàðíî ð³çí³ y yI n I 1 , ..., òàê³, ùî x R y x R y y C y CI I I I I n I I I n I I 1 1, ..., , , ...,� � . Òàêèì ÷èíîì, I — ìîäåëü A'; � íåõàé A', A' ' îäåðæàí³ ç A çà � -ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâàíèé, ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ � -ïðàâèëà x C DI I� ( )� . Îòæå, x C D x C x DI I I I I I I� � # � � � . Òàêèì ÷èíîì, I — ìîäåëü àáî A', àáî A' ' ; � íåõàé A', A' ' îäåðæàí³ ç A çà choose-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâà- íèé, ³ñíóº éîãî ìîäåëü I . Îòæå, x C x C x C x CI I I I I I I I� � �� # � � � �( ) . Òàêèì ÷èíîì, I — ìîäåëü àáî A', àáî A' ' ; � íåõàé A A A1 2, , ..., k îäåðæàí³ ç A çà �-ïðàâèëîì. Òîä³, ÿêùî A âèêîíóâà- íèé, ³ñíóº éîãî ìîäåëü I . Çà óìîâîþ âèêîíàííÿ �-ïðàâèëà x nR CI I� �( . ) . Îòæå, x a b a b R b C nI I I� � � � � �{ { } } : | | ( , ) | ) . Îñê³ëüêè çà óìîâîþ ïðàâèëà ³ñíóº n!1 ³íäèâ³ä, ùî çàäîâîëüíÿº òàêèì ïðàâèëàì, òî äëÿ äåÿêèõ ³íäèâ³ä³â d d1 2, áóäå ñïðàâåäëèâèì d dI I 1 2� . Íåõàé A j óòâîðåíèé çàì³íîþ d2 íà d1. Îñê³ëüêè ¿õí³ ³íòåðïðåòàö³¿ çá³ãàþòüñÿ, I — ìîäåëü A j . � Ëåìà 3 (ïîâíîòà). Íåñóïåðå÷íèé ABox, äî ÿêîãî íå ìîæíà çàñòîñóâàòè æîä- íîãî ç ïðàâèë àëãîðèòìó, âèêîíóâàíèé. Äîâåäåííÿ. Íåõàé A — íåñóïåðå÷íèé ABox, îòðèìàíèé ç A0 , ³ äî íüîãî íå ìîæíà çàñòîñóâàòè æîäíîãî ç ïðàâèë àëãîðèòìó. Ïîáóäóºìî ³íòåðïðåòàö³þ I äëÿ A ó òàêèé ñïîñ³á: I x x: |� �{ }A ; 172 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 A x x C x zI I: | : |� � � �{ } { A áëîêóº x z C z� � �: A — àêòèâíèé}; R x y xRy xI : ( , ) |� � �{ A — àêòèâíèé}� �{( , ) |x y z áëîêóº x zRy z� � �A — àêòèâíèé}. Äî A íå ìîæíà çàñòîñóâàòè T -ïðàâèëî, à îòæå x x E z zI I I I� � � � ( [ áëîêóº x z� — àêòèâíèé]). Ç îçíà÷åííÿ áëîêóâàííÿ z EI I� , òîìó çà ïîáóäîâîþ x EI I� . Çâ³äñè I º ìî- äåëëþ T . Ðîçãëÿíåìî ôàêò xRy�A . Çà ïîáóäîâîþ I ìàºìî x R yI I I . Äëÿ ôàêò³â x C: �A ñêîðèñòàºìîñü ìåòîäîì ìàòåìàòè÷íî¿ ³íäóêö³¿. Íåîáõ³äíî äîâåñòè òàêå òâåðäæåííÿ: � � � �x x C x CI I [ : ]A . Ç óðàõóâàííÿì íîðìàë³çîâàíîñò³ êîíöåïò C ïîáóäîâàíî ç êîíöåïò³â �, � , A , � A (äå A — àòîìàðíèé) çà äîïîìîãîþ îïåðàòîð³â � �, , , ,� � � . Òàêîæ çàóâàæèìî, ùî äëÿ áóäü-ÿêîãî íåàêòèâíîãî ³íäèâ³äà x ³ñíóº àêòèâíèé ³íäèâ³ä y , ùî éîãî áëîêóº. Áàçà ³íäóêö³¿: �� � � � # � � � � ��x x x x xI I [ : ] [ : ]A A ; � � � # � � � �x x x x xI I I I [ ] [ : ]� A ; { }x x A A x x A x AI I I I� � � # � � � � | : [ : ]A A ; x A x A x A x A x A x AI I I I: ( ) :� � � * � # � � � � # �� � � #A A A' — ñóïåðå÷íà. Êðîê ³íäóêö³¿. Âèïàäîê 1. Íåõàé x D E: � � A. Îñê³ëüêè çàñòîñóâàòè � -ïðàâèëî äî A íå- ìîæëèâî, ñïðàâäæóºòüñÿ � � � � � � �x x D E x D x E z z[ : ( : : ) [� A A A áëîêóº x z� — àêòèâíèé]]. Çà ïîáóäîâîþ ç x D x E: :� � �A A âèïëèâຠx D x EI I� � � . Ó ïðîòèëåæíîìó âèïàäêó çà îçíà÷åííÿì áëîêóâàííÿ z D E: � � A, à ç àêòèâ- íîñò³ z âèïëèâàº, ùî z D z E: :� � �A A. Çà ïîáóäîâîþ ³íòåðïðåòàö³¿ îäåðæóºìî x D x EI I� � � . Îòæå, x D E D EI I I� � � ( )� . Âèïàäîê 2. Íåõàé x D E: � � A . Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå- ìîæëèâî, ñïðàâäæóºòüñÿ � � � � � � �x x D E x D x E z z[ : ( : : ) [� A A A áëîêóº x z� — àêòèâíèé]]. Çà ïîáóäîâîþ ç x D x E: :� � �A A âèïëèâຠx D x EI I� � � . Ó ïðîòèëåæíîìó âèïàäêó çà îçíà÷åííÿì áëîêóâàííÿ z D E: � � A , à ç àêòèâ- íîñò³ z âèïëèâàº, ùî z D z E: :� � �A A . Çà ïîáóäîâîþ ³íòåðïðåòàö³¿ îäåðæóºìî x D x EI I� � � . Îòæå, x D E D EI I I� � � ( )� . Âèïàäîê 3. Íåõàé x R D: .� � A. Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå- ìîæëèâî, ìàºìî � � � � �y xRy y D z z[ : [A A áëîêóº x z� — àêòèâíèé]]. (1) Íåõàé x — àêòèâíèé. Ðîçãëÿíåìî äîâ³ëüíèé y I� òàêèé, ùî xR yI . Òîä³ çà ïî- áóäîâîþ xRy� A ³ ç óðàõóâàííÿì (1) ìàºìî y D: � A . Çâ³äñè âèïëèâàº, ùî y D I� . Íåõàé z — àêòèâíèé ³ áëîêóº x. Âèáåðåìî äîâ³ëüíèé y I� òàêèé, ùî xR yI . ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 173 Òîä³ çà ïîáóäîâîþ zRy� A ³ ç óðàõóâàííÿì (1) äëÿ àêòèâíîãî z ñïðàâåäëèâî y D: � A . Çâ³äñè îòðèìóºìî y D I� . Òàêèì ÷èíîì, x nR D I� �( . ) . Âèïàäîê 4. Íåõàé x nR D: .� � A. Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå- ìîæëèâî, ñïðàâäæóºòüñÿ � � � � � � � � � � �y y i n xRy y D A i j y yn i i i j1 1, ..., [( [ , : ]) [ ]]{ } A � � z z[ áëîêóº x z� — àêòèâíèé]. (2) Íåõàé x — àêòèâíèé. Òîä³ ñïðàâåäëèâî xR y y DI i i I, � çà ïîáóäîâîþ ³íòåð- ïðåòàö³¿. Íåõàé z — àêòèâíèé ³ áëîêóº x. Òîä³ ç óðàõóâàííÿì (2) äëÿ àêòèâíîãî z ñïðà- âåäëèâî zRy y Di i� �A A, : . Çâ³äñè âèïëèâàº, ùî xR y y DI i i I, � çà ïîáóäîâîþ ³íòåðïðåòàö³¿. Îòæå, ³ñíóº n ð³çíèõ åëåìåíò³â ç I , äëÿ ÿêèõ xR yI i òà y Di I� . Òàêèì ÷èíîì, x nR D I� �( . ) . Âèïàäîê 5. Íåõàé x mR D: .� � A . Îñê³ëüêè çàñòîñóâàòè �-ïðàâèëî äî A íå- ìîæëèâî, ñïðàâäæóºòüñÿ �� � � �!y y i xRy y Dn i i1 1, ..., [ [ , : ]]{ } A �� z z[ áëîêóº x z� — àêòèâíèé]. Ïåðåòâîðèìî öåé âèðàç â³äïîâ³äíî äî ïðàâèë äå-Ìîðãàíà òà äâî¿ñòîñò³: � � * � * �y y i xRy y Dn i i1, ..., [ [ : ]A A] � � z z[ áëîêóº x z� — àêòèâíèé]. (3) Ïðèïóñòèìî, ùî ³ñíóº n!1 òàêèõ y Di � , ùî x R yI i � A. Íåõàé x — àêòèâíèé. Òîä³ äëÿ äîâ³ëüíîãî i ñïðàâåäëèâî y Di : òà xRyi �A, ùî ñóïåðå÷èòü (3). Íåõàé z — àêòèâíèé ³ áëîêóº x . Òîä³ äëÿ äîâ³ëüíîãî i ñïðàâåäëèâî z D x D: :� � �A A òà zRyi � A . Çà îçíà÷åííÿì áëîêóâàííÿ x D z D: :� �A A , îòæå, ìຠì³ñöå z D: � A òà zRyi � A , ùî ñóïåðå÷èòü (3) äëÿ àêòèâíîãî z . Îòæå, ³ñíóº íå á³ëüøå n ð³çíèõ åëåìåíò³â ç I , äëÿ ÿêèõ x R yI i òà y Di I� . Òàêèì ÷èíîì, x nR D I� �( . ) . � Òåîðåìà 3 (ðîçâ’ÿçóâàí³ñòü ALCQ ). Àëãîðèòì ñåìàíòè÷íîãî òàáëî ðîçâ’ÿ- çóº ïðîáëåìó âèêîíóâàíîñò³ êîíöåïò³â ëîã³êè ALCQ . Äîâåäåííÿ. Òåðì³íàëüí³ñòü. Ç ëåìè 1 âèïëèâàº, ùî äåðåâî ïîøóêó íå ìຠíåñê³í÷åííèõ ëàíöþã³â, à îñê³ëüêè ñòóï³íü éîãî ðîçãàëóæåííÿ îáìåæåíèé, äåðå- âî ïîøóêó ñê³í÷åííå. Îòæå, äëÿ äîâ³ëüíèõ âõ³äíèõ äàíèõ àëãîðèòì ñåìàíòè÷íî- ãî òàáëî ïîâåðíå â³äïîâ³äü çà ñê³í÷åííèé ÷àñ. Êîðåêòí³ñòü. ßêùî A0 âèêîíóâàíèé, òî çà ëåìîþ 2 õî÷à á îäèí ç ê³íöåâèõ ABox A âèêîíóâàíèé. ³í íå ìîæå áóòè ñóïåðå÷íèì, à òîìó º íåñóïåðå÷íèì ABox, äî ÿêîãî íå ìîæíà çàñòîñóâàòè æîäíîãî ç ïðàâèë. Çà ïîáóäîâîþ àëãîðèòìó â öüîìó âèïàäêó áóäå îäåðæàíî 1. Ïîâíîòà. Íåõàé íà âèõîä³ àëãîðèòìó îäåðæàíî 1. Òîä³ ñåðåä éîãî ê³íöåâèõ ABox ³ñíóº òàêèé A, ùî º íåñóïåðå÷íèì ³ äî íüîãî íå ìîæíà çàñòîñóâàòè æîäíî- ãî ç ïðàâèë. Çà ëåìîþ 3 A âèêîíóâàíèé. Âî÷åâèäü, A A0 � , îñê³ëüêè àëãîðèòì ñåìàíòè÷íîãî òàáëî ëèøå äîäຠôàêòè, àëå íå âèëó÷ຠ¿õ. Òàêèì ÷èíîì, A0 òåæ âèêîíóâàíèé. � 1.6. Òåìïîðàëüí³ äåñêðèïòèâí³ ëîã³êè. Äåñêðèïòèâí³ ëîã³êè íå ìàþòü äîñòàò- íüî âèðàçíî¿ ïîòóæíîñò³ äëÿ ïðåäñòàâëåííÿ çíàíü ïðî ïîâåä³íêó ³íäèâ³ä³â ó ÷àñ³. ijéñíî, ÿêùî ðîçãëÿíóòè òâåðäæåííÿ «ß âèêîíóâàâ äîìàøíº çàâäàííÿ â÷îðà, ïðîòå ñüîãîäí³ í³», òî çà êëàñè÷íîþ äåñêðèïòèâíîþ ëîã³êîþ âîíî ì³ñòèòü äâà ñóïåðå÷íèõ 174 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 ôàêòè: âèêîíóâàâ ( , )x y , � âèêîíóâàâ ( , )x y , õî÷à ñåìàíòè÷íî ö³ ôàêòè ìàëè ì³ñöå â ð³çíèé ÷àñîâèé ïðîì³æîê, à òîìó ¿õ íå ìîæíà ââàæàòè ñóïåðå÷íèìè. Ó òàêîìó ðàç³ äîïîì³æíîþ ìàòåìàòè÷íîþ ìîäåëëþ ìîæå áóòè ëîã³êà ë³í³éíîãî ÷àñó LTL, äëÿ ÿêî¿ ïåðåäáà÷àºòüñÿ íàÿâí³ñòü òåìïîðàëüíèõ îïåðàòîð³â: � — ó íàñòóïíèé ìîìåíò,�— êîëèñü, � — ó áóäü-ÿêèé ìîìåíò ó ìàéáóòíüîìó òàU — ïîêè. Ö³ îïåðàòîðè äàþòü çìîãó ðîçøèðèòè êëàñè÷í³ äåñêðèïòèâí³ ëîã³êè ÷àñîâèì âèì³ðîì. Ðîçãëÿíóòà â [2] êîíöåïö³ÿ ã³áðèäíî¿ ëîã³êè LTLALC äîäຠäî ðîçãëÿíóòèõ ðàí³øå êîíñòðóêòîð³â êîíöåïò³â ùå äâà òåìïîðàëüí³ (òàáë. 3). Äî òîãî æ ³íòåð- ïðåòàö³ÿ ôàêò³â ó ö³é ëîã³ö³ îòðèìóº äîäàòêîâèé âèì³ð — ÷àñîâèé. Çà äîïîìîãîþ âêàçàíèõ êîíñòðóêö³é òâåðäæåííÿ «Äëÿ òîãî ùîá ñòàòè óñï³øíèì, ïîòð³áíî â÷èòèñÿ» ìîæíà íàâåñòè ó âèãëÿä³ àêñ³îìè � óñï³øíèé �� óñï³øíèé �� ((� â÷èòèñÿ)U óñï³øíèé). Àëãîðèòì ñåìàíòè÷íîãî òàáëî äëÿ òåìïîðàëüíèõ äåñêðèïòèâíèõ ëîã³ê ïðåä- ñòàâëåíî â [3]. 2. ÂÈÄÎÁÓÂÀÍÍß ÇÍÀÍÜ Ç ÏÐÈÐÎÄÍÎÌÎÂÍÎÃÎ ÒÅÊÑÒÓ Çàäà÷à âèÿâëåííÿ â³äêðèòî¿ ³íôîðìàö³¿ (open information extraction) ïîëÿãຠó ïðåä- ñòàâëåíí³ ïðèðîäíîìîâíîãî òåêñòó â ôîðìàë³çîâàíîìó âèãëÿä³: çàçâè÷àé ó âèãëÿä³ á³íàðíèõ â³äíîøåíü, à òàêîæ â³äíîøåíü á³ëüøèõ ðîçì³ðíîñòåé, ó òåðì³íàõ áàçîâî¿ ìàòåìàòè÷íî¿ ëîã³êè òîùî. ßê³ñíå ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ ñâ³ä÷èëî á ïðî íàÿâí³ñòü àâòîìàòèçîâàíèõ ìåòîä³â íàïîâíåííÿ áàçè çíàíü ç ïðèðîäíîìîâíèõ äàíèõ, çì³ñò ÿêèõ ³ ñêëàäàºòüñÿ ç àòîìàðíèõ êîíöåïò³â òà ðîëåé — â³äíîøåíü ì³æ íèìè. Ñêëàäí³ñòü ö³º¿ çàäà÷³, îêð³ì ñï³ëüíî¿ äëÿ âñ³õ çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè ïðîáëåìè íåîäíîçíà÷íîñò³ ìîâëåííÿ ëþäèíè, ïîëÿãຠó òðóäíîùàõ ïðåä- ñòàâëåííÿ äîâ³ëüíîãî íåñòðóêòóðîâàíîãî òåêñòó ó ôîðìàë³çîâàíîìó âèãëÿä³. Çíà÷í³ ðåçóëüòàòè íàðàç³ äîñÿãíóòî â îêðåìèõ çâóæåííÿõ ïîñòàíîâêè ö³º¿ çàäà÷³. Òàê, çàñîáàìè ìàøèííîãî íàâ÷àííÿ äîñÿãàþòüñÿ íåïîãàí³ ðåçóëüòàòè [5] äëÿ çà- äà÷³ âèÿâëåííÿ â³äíîøåíü, ÿêà çâóæóº ðîçãëÿä äî âèäîáóâàííÿ ç òåêñòó òð³éîê ñóá’ºêò–ä³ÿ–îá’ºêò äëÿ îáìåæåíîãî ïåðåë³êó äîñòóïíèõ ä³é, à òàêîæ äëÿ çàäà÷³ âèäîáóâàííÿ â³äêðèòî¿ ³íôîðìàö³¿ [6]. Ïðîòå â ïîâíîìó îáñÿç³ öÿ çàäà÷à íå ìຠ÷³òêî ñôîðìóëüîâàíèõ òà çàãàëü- íîïðèéíÿòèõ ñòàíäàðò³â ðåçóëüòàòó, òîáòî íå âèçíà÷åíî, ÿê³ ñàìå â³äíîøåííÿ ïîòð³áíî îäåðæàòè òà ÿêèì ÷èíîì âîíè ïîâèíí³ îôîðìëþâàòèñÿ. Íå ñôîðìîâàíî òàêîæ ñòàíäàðòó îö³íþâàííÿ ìîäåëåé òà êîðïóñ³â ïðèéíÿòíîãî îáñÿãó äëÿ ÿê³ñíî¿ ïîáóäîâè ìîäåëåé ìàøèííîãî íàâ÷àííÿ, ÿê öå ïðèéíÿòî äëÿ áàãàòüîõ çà- äà÷ îáðîáëåííÿ ïðèðîäíîìîâíèõ òåêñò³â. Äîñë³äæåííÿ ïðîáëåìè âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â äëÿ ïîäàëüøîãî íàïîâíåííÿ íèìè îíòîëîãîïîä³áíèõ ñèñòåì ïðîâîäÿòüñÿ íàðàç³ ÿê çàðóá³æíèìè [7, 8], òàê ³ â³ò÷èçíÿíèìè [9–13] â÷åíèìè. Çîêðåìà, ñåðåä íàÿâíèõ àíàëîã³â ñë³ä çàçíà÷èòè ñèñòåìè FRED [7] òà SHELDON [8], ùî çä³éñíþþòü ïî- áóäîâó OWL-îíòîëîã³é íà îñíîâ³ ïðèðîäíîìîâíèõ òåêñò³â ³ º ó â³äêðèòîìó äîñ- òóï³. Ïîïðè çàãàëüíå ïðèçíà÷åííÿ öèõ ñèñòåì, ¿õí³ìè îñíîâíèìè íåäîë³êàìè º â³äñóòí³ñòü ï³äòðèìêè ÷àñîâèõ çâ’ÿçê³â òà íèçüêà ÿê³ñòü ðîáîòè ç íåàíãëîìîâíè- ìè òåêñòàìè, îñê³ëüêè áóäü-ÿêèé òàêèé òåêñò ïîïåðåäíüî ïåðåêëàäàþòü ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 175 Ò à á ë è ö ÿ 3. Òåìïîðàëüí³ êîíñòðóêòîðè êîíöåïò³â äëÿ ìîâ ñ³ìåéñòâà AL AL Êîíñòðóêòîð ²íòåðïðåòàö³ÿ � �Ñ (ó íàñòóïíèé ìîìåíò) ( ) ( , ) | ( , )�Ñ n x n x CI I� ! �{ }1 Until C DU (ïîêè) ( ) {( , ) | [( , )C D t x u t u x DI IU � � � � � � � � � �� � �[ ( , ) ]]}t u x C I àíãë³éñüêîþ çà äîïîìîãîþ àâòîìàòè÷íèõ çàñîá³â, ÷åðåç ùî ÷àñòî âòðà÷àºòüñÿ êî- ðèñíå çì³ñòîâíå íàâàíòàæåííÿ. Ðîçãëÿíåìî ï³äõ³ä äî ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ çà äîïîìîãîþ ïðîì³æíèõ ñòðóêòóðíî-ë³íãâ³ñòè÷íèõ ïðåäñòàâëåíü ïðèðîäíîìîâíîãî òåêñòó, áàçîâ³ çàñàäè ÿêîãî áóëî ñôîðìóëüîâàíî â [9]. Îñíîâíîþ ìåòîþ öüîãî ï³äõîäó º ïîáóäîâà ö³ë³ñíî¿ êîíâåºðíî¿ ñèñòåìè âèäîáóâàííÿ çíàíü ç òåêñò³â, ÿêà äຠçìîãó ëåãêî çä³éñíþâàòè çàì³íó îêðåìèõ ¿¿ êîìïîíåíò³â ç ìåòîþ ³íêîðïîðóâàííÿ äîïîì³æíèõ ìîäåëåé ìàøèííîãî íàâ÷àííÿ ç êðàùèìè ðåçóëüòàòàìè. 2.1. Çàñîáè ïîáóäîâè ïðîì³æíèõ ë³íãâ³ñòè÷íèõ ñòðóêòóð. Íåñòðóêòóðîâà- íèé, çâè÷àéíèé òåêñò º ñêëàäíèì äëÿ áåçïîñåðåäíüîãî àëãîðèòì³÷íîãî àíàë³çó ÷åðåç áàãàòîãðàíí³ñòü òà íåîäíîçíà÷í³ñòü ëþäñüêîãî ìîâëåííÿ. Ñàìå òîìó äëÿ çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè ÷àñòî ïîñëóãîâóþòüñÿ äîäàòêîâèìè, á³ëüø ³íôîðìàòèâíèìè ïîäàííÿìè òåêñòó ó âèãëÿä³ ñòðóêòóð äàíèõ, ÿê³ îáðîáëÿþòü çà äîïîìîãîþ àëãîðèòì³â. Òàêå ïðåäñòàâëåííÿ òåêñòó íàçèâàòèìåìî ñòðóêòóðíèì. Ç îãëÿäó íà ïîòóæíèé àïàðàò àëãîðèòì³â íàä ñòðóêòóðàìè íà êøòàëò äåðåâ òà ãðàô³â ó ïåðåâàæí³é á³ëüøîñò³ ïðåäñòàâëåíü òåêñòó â ð³çíèõ àñïåêòàõ âèêîðèñ- òîâóþòü àáî äåðåâîâèäíó, àáî ãðàôîâó ñòðóêòóðó. Ðîçãëÿíåìî äåÿê³ ïîøèðåí³ ñòðóêòóðí³ ïðåäñòàâëåííÿ ë³íãâ³ñòè÷íî¿ ³íôîðìàö³¿. Íàéìåíøîþ çì³ñòîâîþ îäèíèöåþ ìîâè â ñó÷àñíèõ çàñîáàõ ¿¿ îáðîáëåííÿ º òîêåí — ïîñë³äîâí³ñòü ñèìâîë³â ðå÷åííÿ, ùî ÿâëÿº ñîáîþ ïåâíèé çì³ñò. Çàçâè- ÷àé ðå÷åííÿ ïîä³ëÿþòü íà òîêåíè çà ðîçä³ëþâà÷àìè íà êøòàëò ïóíêòóàö³éíèõ çíàê³â òà ïðîá³ë³â, ïðîòå ³ñíóþòü é âèíÿòêè. Íàïðèêëàä, âèðàç «i.e.» àíãë³éñüêîþ îçíà÷ຠ«³íøèìè ñëîâàìè» òà º îäíèì ºäèíèì òîêåíîì. Êîæåí òîêåí ó ðåçóëüòàò³ ëåêñè÷íîãî àíàë³çó ìîæå ìàòè îäíó ÷è ê³ëüêà õàðàêòå- ðèñòèê, çîêðåìà, ÷àñòèíó ìîâè, ð³ä, â³äì³íîê òîùî. Çà ñèíòàêñè÷íèì ðîçáîðîì ìîâè òîêåíè ïîâ’ÿçóþòü îäíå ç îäíèì çà äîïîìîãîþ ñèíòàêñè÷íèõ ãðàìàòè÷íèõ çâ’ÿçê³â. Îäíå ç íàéá³ëüø çì³ñòîâíèõ ïðåäñòàâëåíü ðå÷åííÿ — öå äåðåâî (â äåÿêèõ âèïàäêàõ — ãðàô) çàëåæíîñòåé (ðèñ. 2). Çà òàêèì ñòðóêòóðíèì ïðåäñòàâëåííÿì òåêñòîâà ³íôîðìàö³ÿ ìຠâèãëÿä äåðå- âà, âåðøèíàìè ÿêîãî º òîêåíè (íàéìåíø³ ñèíòàêñè÷íî çíà÷óù³ îäèíèö³ ðå÷åííÿ), êîðåíåì º ïðèñóäîê (çàçâè÷àé 䳺ñëîâî, â îêðåìèõ âèïàäêàõ — ³ìåííèê, ïðè- ñë³âíèê ÷è ïðèêìåòíèê), à ðåáðà ïîçíà÷àþòü çàëåæí³ñòü îäíèõ òîêåí³â â³ä ³íøèõ. Ïðèêëàä 3. Ó íàâåäåíîìó íà ðèñ. 2 ïðèêëàä³ òîêåí «ïîâ³äîìëåííÿ» ïîâ’ÿçà- íèé ç òîêåíîì «çàïèñóþòü», ÿêèé º êîðåíåì äåðåâà, çàëåæí³ñòþ obj (îá’ºêò), à òî- êåí «çàì³íþþ÷è» — çàëåæí³ñòþ advcl (ïðèñë³âíèêîâèé çâîðîò). Öåé óí³âåðñàëüíèé ôîðìàò äåðåâ çàëåæíîñòåé äëÿ ð³çíèõ ïðèðîäíèõ ìîâ çà- ïðîïîíîâàíî ó [14]. Äëÿ ïîð³âíÿííÿ ÿêîñò³ (â³äïîâ³äíîñò³ åòàëîíó) ð³çíèõ ï³äõîä³â äî ïîáóäîâè òàêîãî äåðåâà âèêîðèñòîâóþòü äâ³ ìåòðèêè: UAS òà LAS. Îçíà÷åííÿ 8. Îö³íêà íåïîçíà÷åíîãî ïðèºäíàííÿ (UAS) — öå â³äñîòêîâå â³äíîøåííÿ òîêåí³â, ùî ìàþòü êîðåêòíî âèçíà÷åíîãî ïðåäêà. Îö³íêà ïîçíà÷åíî- ãî ïðèºäíàííÿ (LAS) — öå â³äñîòêîâå â³äíîøåííÿ òîêåí³â, ùî ìàþòü êîðåêòíî âèçíà÷åíîãî ïðåäêà òà êîðåêòíó ïîçíà÷êó. Íàðàç³ íàéêðàù³ çíà÷åííÿ íàâåäåíèõ âèùå ìåòðèê äåìîíñòðóº ìîäåëü Label Attention Layer + HPSG + XLNet, çàïðîïîíîâàíà â [15]. Öÿ ìîäåëü òàêîæ áàçóºòüñÿ íà íåéðîìåðåæåâîìó ï³äõîä³ òà äîñÿãຠUAS 97.33 % ³ LAS 96.29 % äëÿ àíãë³éñüêî¿ ìîâè. Ïðîòå íà îñòàíí³õ íàóêîâèõ êîíôåðåíö³ÿõ îñíîâíó óâàãó ïðèä³ëåíî ïîáóäîâ³ ºäèíèõ ìîäåëåé ñèíòàêñè÷íîãî ðîçáîðó äëÿ âåëèêî¿ ê³ëüêîñò³ ìîâ. Òàê, ìîäåëü HIT-SCIR [16] äຠçìîãó äîñÿãòè LAS ó 92 %, 88 % òà 87 % äëÿ ðîñ³éñüêî¿, óêðà¿íñüêî¿ òà àíãë³éñüêî¿ ìîâ â³äïîâ³äíî. 176 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 Ðèñ. 2. Äåðåâî çàëåæíîñòåé ðå÷åííÿ (ôîðìàò Universal Dependencies) ²ñíóþòü é ³íø³ ôîðìàòè ïðåäñòàâëåííÿ äåðåâ ñèíòàêñè÷íèõ çàëåæíîñòåé, çîêðåìà íàâåäåíèé íà ðèñ. 3 ç [17]. Íàÿâí³ñòü ê³ëüêîõ ìîäåëåé, ÿê³ áóäó- þòü ïîä³áí³ ïðåäñòàâëåííÿ ðå÷åííÿ ó âèã- ëÿä³ äåðåâ, à òàêîæ ð³çíèõ ôîðìàò³â ïðåä- ñòàâëåíü îäíîãî ðå÷åííÿ äຠçìîãó âèêîðèñ- òîâóâàòè äëÿ äåðåâ àëãîðèòìè âèÿâëåííÿ ïîòåíö³éíèõ ïîìèëîê ó ïðåäñòàâëåííÿõ òà ¿õíüî¿ êîðåêö³¿. Çàçíà÷èìî, ùî äåðåâà çàëåæíîñòåé äå- ìîíñòðóþòü ãðàô³÷íî ëèøå çâ’ÿçêè â ìåæàõ îäíîãî ðå÷åííÿ, à ñï³ââ³äíîøåííÿ ì³æ ñóòíîñòÿìè â ð³çíèõ ðå÷åííÿõ çàëèøàþòüñÿ íåâ³äîìèìè. Äëÿ ¿õíüîãî ïðåä- ñòàâëåííÿ âèêîðèñòîâóþòü ³íøó ñòðóêòóðó — ãðóïè êîðåôåðåíòíîñòåé (ðèñ. 4). Ìíîæèíà êîðåôåðåíòíèõ ñë³â òà ñëîâîñïîëó÷åíü çàçâè÷àé ìຠâèãëÿä ë³ñó — ìíîæèíè äåðåâ, êîæíå ç ÿêèõ ïîçíà÷ຠìíîæèíó êîðåôåðåíòíèõ âóçë³â. Äóãà êî- ðåôåðåíòíîñò³ çàçâè÷àé ñïðÿìîâóºòüñÿ äî íàéá³ëüø êîíêðåòíîãî ïîçíà÷åííÿ îá’ºêòà ðåàëüíîãî ñâ³òó. Ïîð³âíÿííÿ ï³äõîä³â äî ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³ çä³éñíþþòü çà äîïîìîãîþ ñå- ðåäíüîãî àðèôìåòè÷íîãî òðüîõ ìåòðèê: MUC, B 3 òà CEAF�4 .  îö³íö³ MUC [18] âðàõîâóºòüñÿ íàéìåíøà ê³ëüê³ñòü äóã ì³æ ñóòíîñòÿìè, ÿê³ ïîòð³áíî äîäàòè àáî âèëó÷èòè, ùîá ç îäåðæàíîãî ðåçóëüòàòó îòðèìàòè åòà- ëîííèé: MUC S p S S i iS T S T i i i � � � � � , , | | | ( ) | | | 1 , äå T — ìíîæèíà åòàëîííèõ ãðóï êîðåôåðåíòíèõ ñóòíîñòåé, p S( ) — ê³ëüê³ñòü ãðóï êîðåôåðåíòíèõ ñóòíîñòåé ó ðåçóëüòàò³, ùî â³äïîâ³äàþòü åòàëîíí³é ãðóï³ S . Ìåòðèêà B 3 [19] áàçóºòüñÿ íà ïîð³âíÿíí³ ðîçì³ð³â â³äïîâ³äíèõ ãðóï êîðåôå- ðåíòíîñò³: B M G P P m m mm M prec 3 1 � � � , | | , B M G P G m m mm M rec 3 1 � � � , | | , B B B B B 3 3 3 3 3 2 � ! prec rec prec rec , äå M — ìíîæèíà ñóòíîñòåé, Gm — åòàëîííà ãðóïà, äî ÿêî¿ íàëåæèòü ñóòí³ñòü m , Pm — ãðóïà ðåçóëüòàòó, äî ÿêî¿ íàëåæèòü ñóòí³ñòü m. Ìåòðèêó CEAF�4 îá÷èñëþþòü ñïåö³àë³çîâàíèì àëãîðèòìîì ïîð³âíÿííÿ, çà- ïðîïîíîâàíèì ó [21]. Íàðàç³ íàéêðàù³ ïîêàçíèêè äëÿ ö³º¿ çàäà÷³ äåìîíñòðóþòü ìîäèô³êàö³¿ ìîäåë³ BERT [22], ÿêà áàçóºòüñÿ íà ìàøèííîìó íàâ÷àíí³ (ìîäåëü ðîçðîáëåíà êîìàíäîþ Google AI Language). Ìîäåëü BERT ïðîïîíóº ñï³ëüíèé ï³äõ³ä äî ïîäàííÿ ïðèðîä- íîìîâíî¿ ³íôîðìàö³¿ äëÿ ñóêóïíîñò³ çàäà÷ îáðîáëåííÿ òåêñò³â òà çàïðîâàäæóº âðà- õóâàííÿ ë³âî- òà ïðàâîá³÷íîãî êîíòåêñòó ñëîâà, íà â³äì³íó â³ä îáðîáëåííÿ òåêñòó ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 177 Ðèñ. 3. Äåðåâî çàëåæíîñòåé ðå÷åííÿ (ôîð- ìàò mova.info) Ðèñ. 4. ˳ñ êîðåôåðåíòíîñòåé äëÿ ðå÷åííÿ óêðà¿íñüêîþ ìîâîþ çë³âà íàïðàâî ÷è ñïðàâà íàë³âî ó ïîïåðåäí³õ åôåêòèâíèõ ìîäåëÿõ. Êðàùèé ðåçóëüòàò ñåðåäíüîãî F1� 80.2 äîñÿãຠìîäåëü ìàøèííîãî íàâ÷àííÿ, çàïðîïîíîâàíà â [20]. 2.2. Âèäîáóâàííÿ çíàíü ç³ ñòðóêòóðíîãî ïîäàííÿ ïðèðîäíîìîâíîãî òåê- ñòó. Äåÿê³ ï³äõîäè äî àíàë³çó ïðèðîäíî¿ ìîâè äëÿ âèäîáóâàííÿ çíàíü ïðåäñòàâ- ëåí³ â [9, 12, 13]. Ðîçãëÿíåìî îñíîâí³ ïðàâèëà âèäîáóâàííÿ ôàêò³â òà àêñ³îì íà îñíîâ³ äåðåâà óí³âåðñàëüíèõ çàëåæíîñòåé. Äåðåâî óí³âåðñàëüíèõ çàëåæíîñòåé (äèâ. ðèñ. 2) íàäຠâàæëèâ³ âõ³äí³ äàí³ äëÿ àëãîðèòì³â âèäîáóâàííÿ çíàíü çà ôîðìàòîì ñâ ïîáóäîâè. Òàê, îñê³ëüêè íà- âåäåí³ â íüîìó çàëåæíîñò³ ïîçíà÷àþòü íå ñóòî ñèíòàêñè÷í³, à é ñåìàíòèêî-ñèí- òàêñè÷í³ çâ’ÿçêè ³ â³äíîøåííÿ, äåÿê³ ïðàâèëà âèäîáóâàííÿ çíàíü íà îñíîâ³ ö³º¿ ñòðóêòóðè º òðèâ³àëüíèìè. Ïðîòå äåðåâîâèäíà ñòðóêòóðà ïîäàííÿ ³íôîðìàö³¿ â äåðåâ³ óí³âåðñàëüíèõ çà- ëåæíîñòåé äåùî ïîã³ðøóº çàñîáè îáðîáëåííÿ ó âèïàäêàõ íàÿâíîñò³ ñóðÿäíèõ òî- êåí³â. Àáè ïåðåòâîðèòè äåðåâîâèäíó ñòðóêòóðó ó ãðàôîâó, ÿêà çðó÷í³øà äëÿ îá- ðîáëåííÿ, âèêîðèñòîâóþòü àëãîðèòì ðîçøèðåííÿ çàëåæíîñòåé. Ïåðåòâîðåííÿ áà- çîâîãî äåðåâà çàëåæíîñòåé ó ðîçøèðåíèé ãðàô çàëåæíîñòåé ïîòðåáóº, çîêðåìà, ðîçâ’ÿçàííÿ òàêèõ ïðîáëåì: � â³äíîâëåííÿ ñë³â, ÿêèõ ó òåêñò³ íåìàº, àëå ¿õíÿ íàÿâí³ñòü ìàºòüñÿ íà óâàç³, øëÿõîì ñòâîðåííÿ ô³êòèâíèõ òîêåí³â; � ïîøèðåííÿ çâ’ÿçê³â (îá’ºêò³â, ñóá’ºêò³â, îçíà÷åíü) ÷åðåç êîí’þíêö³þ; � ïîøèðåííÿ ñóá’ºêò³â íà ï³äïîðÿäêîâàí³ ä³ºñëîâà ñêëàäíîãî ïðåäèêàòà; � îáðîáëåííÿ ï³äðÿäíîãî ðå÷åííÿ, ùî óòî÷íþº ïåâíèé îá’ºêò, ÿê 䳿, âèêîíà- íî¿ öèì îá’ºêòîì (ìîæå ïðèçâîäèòè äî óòâîðåííÿ öèêë³â); � äîäàâàííÿ äîïîì³æíîãî ñëîâà â íàçâó çàëåæíîñò³. Äåðåâî òà ãðàô çàëåæíîñòåé íàâåäåí³ íà ðèñ. 5 ³ 6 â³äïîâ³äíî. Òàêèé ãðàô ìîæå ì³ñòèòè ìíîæèíó êîðåíåâèõ òîêåí³â (íà ðèñ. 6 ¿õ äâà, îñê³ëüêè êîð³íü ïî÷àòêîâîãî äåðåâà çàëåæíîñòåé «ëîâëÿòü» ìຠñóðÿäíèé ç íèì òîêåí «õàð÷óþòüñÿ»). ²íø³ òîêåíè ìîæóòü ìàòè á³ëüø í³æ îäíîãî ïðåäêà (íà- ïðèêëàä, òîêåí «ùóð³â» º íàùàäêîì òàêîæ ³ òîêåíà «ëîâëÿòü» â íàñë³äîê ïîøè- ðåííÿ öüîãî çâ’ÿçêó ÷åðåç ñóðÿäíèé éîìó òîêåí «ìèøåé»). Íà îñíîâ³ ðîçøèðåíîãî ãðàôó çàëåæíîñòåé çä³éñíþþòü àíàë³ç ùîäî íàÿâíîñò³ àêñ³îì òà ôàêò³â. Ðîçãëÿíåìî äåê³ëüêà áàçîâèõ ïðàâèë âèäîáóâàííÿ çíàíü òàêîãî òèïó. ßêùî êîðåíåì äåðåâà çàëåæíîñòåé º 䳺ñëîâî, äëÿ ÿêîãî íàÿâí³ äóãè obj òà subj, ìîæíà çãåíåðóâàòè ôàêò äëÿ ABox âèãëÿäó x R xsubj root obj, äå xsubj — ³ì’ÿ ³íäèâ³äà, ùî â³äïîâ³äຠòîêåíó ç çàëåæí³ñòþ subj, xobj — ³ì’ÿ ³íäèâ³äà, ùî â³äïîâ³äຠòîêåíó ç çàëåæí³ñòþ obj, Rroot — ³ì’ÿ ðîë³, ùî â³äïîâ³äຠêîðåíþ ðå- ÷åííÿ. Òàêîæ êîæåí ³íäèâ³ä ïîâ’ÿçóºòüñÿ ç â³äïîâ³äíèì éîìó êîíöåïòîì çà äîïî- ìîãîþ ôàêòó x Aword word: . 178 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 Ðèñ. 5. Áàçîâå äåðåâî çàëåæíîñòåé Ðèñ. 6. Ðîçøèðåííÿ äåðåâà çàëåæíîñòåé Öå ïðàâèëî óñêëàäíþºòüñÿ, ÿêùî îá’ºêò³â ÷è ñóá’ºêò³â á³ëüø í³æ îäèí. Íå- õàé S — ìíîæèíà òîêåí³â-ñóá’ºêò³â, O — ìíîæèíà òîêåí³â-îá’ºêò³â. Òîä³ ABox áàçè çíàíü ïîïîâíþºòüñÿ ôàêòàìè ç ìíîæèíè { }rootx R x s S o Os o | ,� � � � . Àíàëîã³÷íî äæåðåëîì ôàêò³â º äóãè obl, ÿê³ ïîçíà÷àþòü äîäàòîê. Ó òàêèõ âè- ïàäêàõ á³ëüø âèðàçíèì áóäå çáåðåæåííÿ ïîâ’ÿçàíèõ öèì òèïîì çàëåæíîñòåé òî- êåí³â ÿê äîäàòêîâî¿ õàðàêòåðèñòèêè ðîë³, ùî ïîòðåáóº ï³äòðèìêè áàãàòîì³ñíèõ ðîëåé â³äïîâ³äíèìè äåñêðèïòèâíèìè ëîã³êàìè. Îòðèìàòè ôàêòè ç ðîçøèðåíîãî ãðàôó çàëåæíîñòåé ñêëàäí³øå äëÿ ìîäèô³êà- òîð³â: amod (ïðèêìåòíèêîâèé), nmod (³ìåííèêîâèé), compound (÷àñòèíà ö³ëîãî), flat (÷àñòèíè ³ìåí, äàò òîùî). Äæåðåëîì àêñ³îì âêëþ÷åííÿ º ðå÷åííÿ ç ³ìåííèêà- ìè òà ïðèêìåòíèêàìè, ÿê³ ÿâëÿþòü ñîáîþ êîðåí³ äåðåâ çàëåæíîñòåé. Òàê, äëÿ ðå÷åííÿ, íàâåäåíîãî íà ðèñ. 7, ìîæíà ñôîðìóâàòè òàêó áàçó çíàíü: CN � {ê³ò, âèëîâ, âèëîâ_ìèøåé, õàçÿ¿í, ñâ³éñüêèé, âëàñíèé}; RN � {çàéìàòèñÿ, ïîêëàäàòèñÿ_íà}; IN x x xñâ³éñüêèé_ê³ò âèëîâ ìèøåé âëàñíèé õàçÿ¿í� { , , }_ _ ; T � { _ }âèëîâ ìèøåé âèëîâ� ; A � { ,_x çàéìàòèñÿ xñâ³éñüêèé_ê³ò âèëîâ ìèøåé x ïîêëàäàòèñÿ íà xñâ³éñüêèé_ê³ò âëàñíèé õàçÿ¿í_ }_ . ϳñëÿ âèäîáóâàííÿ çíàíü ³ç îêðåìèõ ðå÷åíü âèíèêຠïèòàííÿ ùîäî îá’ºäíàí- íÿ ôàêò³â â ºäèíó ïîâ’ÿçàíó áàçó çíàíü. Äëÿ öüîãî êîæíîìó ³íäèâ³äó ñòàâèòüñÿ ó â³äïîâ³äí³ñòü òîêåí ç óñ³ìà éîãî ìîäèô³êàòîðàìè (amod, nmod, compound, flat òîùî). Çðåøòîþ âñ³ ³íäèâ³äè ç îäíàêîâèìè ì³òêàìè îòîòîæíþþòüñÿ, ÿê é ³íäèâ³äè, ì³òêè ÿêèõ ïîâ’ÿçàí³ êîðåôåðåíòíèìè çâ’ÿçêàìè. Ðåøòà êîðåôåðåíòíèõ çâ’ÿçê³â ïîçíà÷àþòü àêñ³îìè òîòîæíîñò³ A Aparent_ coref child_ coref� . Äëÿ ÿê³ñíî¿ ïîáóäîâè áàç çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â íåîáõ³äí³ ðîçøè- ðåííÿ ³ ñïåöèô³êàö³ÿ ïðàâèë âèâåäåííÿ çíàíü ç ðîçøèðåíîãî äåðåâà çàëåæíîñòåé, ó òîìó ÷èñë³ âèäîáóâàííÿ òà ôîðìàë³çàö³ÿ òåìïîðàëüíèõ õàðàêòåðèñòèê, ðîçâ’ÿ- çàííÿ ïðîáëåìè ïðîïóùåíèõ òîêåí³â, íàÿâí³ñòü ÿêèõ ïåðåäáà÷àºòüñÿ â ðå÷åíí³, çíÿòòÿ íåîäíîçíà÷íîñòåé ó ìîäèô³êàòîðàõ ñóðÿäíèõ òîêåí³â òà ïîïîâíåííÿ áàçè çíàíü äîäàòêîâèìè àêñ³îìàìè, âèëó÷åíèìè ç ³íøèõ äæåðåë. ßê òàê³ äæåðåëà, çîê- ðåìà, ìîæíà ðîçãëÿíóòè òåçàóðóñè òà òëóìà÷í³ ñëîâíèêè. Îçíà÷åííÿ 9. Òåçàóðóñ — öå ñåìàíòè÷íèé ñëîâíèê ïåâíî¿ ïðèðîäíî¿ ìîâè, â ÿêîìó ñëîâà ïîâ’ÿçàí³ ì³æ ñîáîþ ëåêñèêî-ñåìàíòè÷íèìè â³äíîøåííÿìè (íà- ïðèêëàä, â³äíîøåííÿìè ð³ä–âèä, ÷àñòèíà–ö³ëå, ñèíîí³ì³ºþ, êîðåëÿö³ºþ, àñîö³àö³ºþ òîùî) [23]. Òëóìà÷íèé ñëîâíèê — öå ñëîâíèê, ùî ïîäຠëåêñèêî-ôðà- çåîëîã³÷íèé ñêëàä ìîâè ç ïîÿñíåííÿì çíà÷åííÿ, ãðàìàòè÷íèõ òà ñòèë³ñòè÷íèõ îñîáëèâîñòåé óæèâàííÿ éîãî îäèíèöü. Çàïðîïîíîâàíèé ï³äõ³ä äî âèäîáóâàííÿ çíàíü ç ïðèðîäíîìîâíèõ òåêñò³â äຠçìîãó ïîïîâíþâàòè áàçó çíàíü äëÿ áóäü-ÿêî¿ ìîâè, âèêîðèñòîâóþ÷è â³äïîâ³äí³ ìîäåë³ äëÿ ðîçâ’ÿçàííÿ çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, àíàë³çó çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñòåé òîùî (ðèñ. 8). Òàêîæ ïîä³áíèé ï³äõ³ä äຠçìîãó ïîêðà- ùóâàòè ðåçóëüòàò ðîáîòè ïðîñòîþ çàì³íîþ ìîäåëåé ìàøèííîãî íàâ÷àííÿ äëÿ ï³äçàäà÷ ³íøèìè, ç êðàùèìè ïîêàçíèêàìè. Îñê³ëüêè äëÿ ðîçâ’ÿçàííÿ äåÿêèõ çàäà÷ (àíàë³ç çàëåæíîñòåé òà ðîçì³÷óâàííÿ ÷àñòèí ìîâè) ³ñíóº áàãàòî ð³çíîìàí³òíèõ ìîäåëåé, ¿õí³ ðåçóëüòàòè ìîæíà ïîºäíó- ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 179 Ðèñ. 7. Ðîçøèðåíèé ãðàô çàëåæíîñòåé âàòè, ùîá ïîêðàùèòè ÿê³ñòü âõ³äíèõ äàíèõ äëÿ àëãîðèòìó âèäîáóâàííÿ çíàíü, çîêðåìà, çà äîïîìîãîþ òåî𳿠ãðàô³â òà àëãîðèòì³â íàä äåðåâàìè. ϳäõ³ä òåñòóâàâñÿ ç âèêîðèñòàííÿì òðüîõ ìîâ: àíãë³éñüêî¿, óêðà¿íñüêî¿ òà ðîñ³éñüêî¿. Íàðàç³ äëÿ ðîñ³éñüêî¿ ìîâè íàÿâíèé êîðïóñ êîðåôåðåíòíîñòåé, ïðîòå â³äñóòí³ ó â³ëüíîìó äîñòóï³ ìîäåë³ ìàøèííîãî íàâ÷àííÿ äëÿ ðîçâ’ÿçàííÿ ö³º¿ çàäà÷³. Äëÿ óêðà¿íñüêî¿ ìîâè â³äñóòí³é ó â³ëüíîìó äîñòóï³ òàêîæ ³ êîðïóñ êîðåôåðåíòíîñ- òåé. Äëÿ ïîâíîö³ííî¿ ðîáîòè ñèñòåìè íåîáõ³äíî ïîáóäîâàòè ÿê³ñí³ ìîäåë³ ïîøóêó êîðåôåðåíòíîñòåé äëÿ âêàçàíèõ ìîâ íà îñíîâ³ êðàùèõ ðåçóëüòàò³â ðîçâ’ÿçàííÿ çàäà÷³ äëÿ àíãëîìîâíèõ òåêñò³â. 3. ÀÍÀË²Ç ßʲÑÍÈÕ ÕÀÐÀÊÒÅÐÈÑÒÈÊ ÒÅÊÑÒÓ ÇÀ ÄÎÏÎÌÎÃÎÞ ÁÀÇ ÇÍÀÍÜ Ïîáóäîâàíà íà îñíîâ³ çàïðîïîíîâàíîãî ï³äõîäó ïðèðîäíîìîâíà áàçà çíàíü äຠçìîãó ðîçâ’ÿçóâàòè íèçêó çàäà÷ îáðîáëåííÿ ïðèðîäíî¿ ìîâè ÿê çà äîïîìîãîþ àëãîðèòì³â òà ìåòîä³â äåñêðèïòèâíèõ ëîã³ê ð³çíîãî ð³âíÿ, òàê ³ àíàë³çóþ÷è ¿¿ ïðåäñòàâëåííÿ ç âèêîðèñòàííÿì àïàðàòó òåî𳿠ãðàô³â. ßê ïðèêëàä òèïîâèõ çà- äà÷, ÿê³ ìîæíà ðîçâ’ÿçóâàòè çà äîïîìîãîþ òàêèõ ñèñòåì çíàíü, íàâåäåìî, çîê- ðåìà, ðîçï³çíàâàííÿ êîìàíä, ïåðåâ³ðêó ö³ë³ñíîñò³ òåêñòó, ïîøóê ñóïåðå÷íîñ- òåé, ïîáóäîâó íà îñíîâ³ áàçè çíàíü ä³àëîãîâî¿ ñèñòåìè äëÿ â³äïîâ³äåé íà çàïè- òàííÿ êîðèñòóâà÷à, ïåðåâ³ðêó â³äïîâ³äíîñò³ òâåðäæåííÿ ïîäàíîìó òåêñòó òîùî. ßêùî ðîçãëÿíóòè ïðåäñòàâëåííÿ áàçè çíàíü, ïîáóäîâàíî¿ íà îñíîâ³ ïðèðîäíî- ìîâíîãî òåêñòó, ó âèãëÿä³ ãðàôó, äå êîíöåïòè çâ’ÿçàí³ ðåáðàìè ó ðàç³ ó÷àñò³ â îäí³é ðîë³ ¿õí³õ ³íäèâ³ä³â ÷è íàÿâíîñò³ ì³æ íèìè ³ºðàðõ³÷íèõ çâ’ÿçê³â, çàäà÷à ïåðåâ³ðêè òåêñòó íà ö³ë³ñí³ñòü çâîäèòüñÿ äî çàäà÷³ ïåðåâ³ðêè ãðàôó íà k-ðåáåðíó çâ’ÿçí³ñòü. Îçíà÷åííÿ 10. Ãðàô G E V� ( , ) íàçèâàºòüñÿ k-ðåáåðíî çâ’ÿçíèì, ÿêùî äëÿ äîâ³ëüíî¿ ï³äìíîæèíè ðåáåð X E� ïîòóæíîñò³ | |X k� ãðàô G E X V' � ( \ , ) º çâ’ÿçíèì. Çàäà÷³ ïîøóêó ñóïåðå÷íîñòåé òà ïåðåâ³ðêè â³äïîâ³äíîñò³ òåêñò³â º ïðÿìèìè íàñë³äêàìè àëãîðèòìó ñåìàíòè÷íîãî òàáëî äëÿ äåñêðèïòèâíèõ ëîã³ê. Òàê, íà ðèñ. 9 íàâåäåíî íàéïðîñò³øèé ïðèêëàä íåö³ë³ñíîãî òåêñòó. Éîìó â³äïîâ³äຠãðàô³÷íå çîáðàæåííÿ ôàêò³â òà àêñ³îì äåñêðèïòèâíî¿ ëîã³êè (äèâ. ðèñ. 9, à) òà â³äïîâ³äíèé ãðàô çâ’ÿçàíèõ êîíöåïò³â (äèâ. ðèñ. 9, á). Ãðàô ìຠäâ³ êîìïîíåíòè çâ’ÿçíîñò³, ÿê³ â³äïîâ³äàþòü çîîëîã³÷í³é òà êîìï’þòåðí³é òåìàòèö³. Òàêèì ÷èíîì, ìîæíà çðîáèòè âèñíîâîê ùîäî äâîõ çì³ñòîâíèõ ë³í³é ó â³äïîâ³äíîìó ïðèðîäíîìîâíî- ìó òåêñò³, à îòæå, ùîäî éîãî íåö³ë³ñíîñò³. 180 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 Ò Å Ê Ñ Ò Àíàë³ç ñèíòàêñè÷íèõ çàëåæíîñòåé Ðîçì³÷óâàííÿ ÷àñòèí ìîâè Çàñîáè ïîêðàùåííÿ ðåçóëüòàòó Çàñîáè ïîêðàùåííÿ ðåçóëüòàòó Àëãîðèòìè ðîçøèðåííÿ çàëåæíîñòåé Òåçàóðóñè Ñëîâíèêè Àëãîðèòì âèäîáóâàííÿ çíàíü Áàçà çíàíü Àëãîðèòìè òåìïîðàëüíèõ äåñêðèïòèâíèõ ëîã³ê Àëãîðèòìè òåî𳿠ãðàô³â Ðîçï³çíàâàííÿ êîìàíä Ïîøóê ñóïåðå÷íîñòåé Ïîáóäîâà â³äïîâ³äåé Ïåðåâ³ðêà ö³ë³ñíîñò³ òåêñòó Ðèñ. 8. Ñõåìà àíàë³çó òåêñòîâî¿ ³íôîðìàö³¿ íà îñíîâ³ áàç çíàíü ÂÈÑÍÎÂÊÈ Ó ðåçóëüòàò³ ðîçâ’ÿçàííÿ ïðîáëåì îáðîáëåííÿ ïðèðîäíèõ ìîâ òà ïðåäñòàâëåííÿ íåñòðóêòóðîâàíèõ òåêñò³â ó âèãëÿä³ ãðàôîâèõ ÷è äåðåâîâèäíèõ ñòðóêòóð íàðàç³ ìîæíà îòðèìàòè ÿê³ñí³ âõ³äí³ äàí³ äëÿ çàäà÷³ íàïîâíåííÿ áàç çíàíü ôàêòàìè ç òåêñò³â ïðèðîäíî¿ ìîâè. Öå äຠïîøòîâõ äî ïîáóäîâè ñèñòåì àëãîðèòì³â äëÿ âèÿâëåííÿ òà àíàë³çó ïðèðîäíîìîâíèõ çíàíü íà áàç³ ÿê³ñíî ðîçâ’ÿçàíèõ çàäà÷ îá- ðîáëåííÿ ïðèðîäíî¿ ìîâè, çîêðåìà çàäà÷ ðîçì³÷óâàííÿ ÷àñòèí ìîâè, ïîáóäîâè äå- ðåâà çàëåæíîñòåé, ïîøóêó êîðåôåðåíòíîñòåé òà âèÿâëåííÿ ³ìåíîâàíèõ ñóòíîñòåé. Ó ñòàòò³ ðîçãëÿíóòî òåîðåòè÷í³ îñíîâè äåñêðèïòèâíèõ ëîã³ê ALCQ , ÿê³ ñëó- ãóþòü ìîâîþ ôîðìàëüíîãî çàïèñó ïðèðîäíîìîâíèõ çíàíü, íàâåäåíî áàçîâ³ çàñà- äè êîìï’þòåðíî¿ ë³íãâ³ñòèêè äëÿ ïåðåòâîðåííÿ íåñòðóêòóðîâàíîãî ïðèðîäíîìîâ- íîãî òåêñòó ó ñòðóêòóðîâàíèé âèãëÿä. Çàïðîïîíîâàíî ï³äõ³ä äî âèäîáóâàííÿ çíàíü ç³ ñòðóêòóðîâàíîãî ïîäàííÿ ïðèðîäíîìîâíèõ òåêñò³â òà ¿õíüîãî çàïèñó çà- ñîáàìè ìîâè ëîã³êè ALCQ . Ðîçãëÿíóòî çàñòîñóâàííÿ àëãîðèòì³â ëîã³ê ALCQ òà òåî𳿠ãðàô³â äëÿ àíàë³çó äîáóòèõ ïðèðîäíîìîâíèõ çíàíü ùîäî ö³ë³ñíîñò³ òà íà- ÿâíîñò³ ñóïåðå÷íîñòåé. Íàâåäåíèé ï³äõ³ä äî âèäîáóâàííÿ çíàíü ç ë³íãâ³ñòè÷íî¿ ³íôîðìàö³¿, äîáóòî¿ ç òåêñòó íà îñíîâ³ çàäà÷ àíàë³çó çàëåæíîñòåé, êîðåôåðåíòíîñòåé òà ÷àñòèí ìîâè, äຠçìîãó çä³éñíþâàòè àíàë³ç çíàíü äîâ³ëüíî¿ ìîâè çà óìîâè ÿê³ñíîãî ðîçâ’ÿçàííÿ äëÿ íå¿ â³äïîâ³äíèõ ë³íãâ³ñòè÷íèõ çàäà÷. Ïîêðàùåííÿ çàïðîïîíîâàíîãî ï³äõîäó ìîæëèâå çà ðàõóíîê ðîçøèðåííÿ ³ ñïåöèô³êàö³¿ ïðàâèë âèâåäåííÿ çíàíü ç ðîçøè- ðåíîãî äåðåâà çàëåæíîñòåé, â òîìó ÷èñë³ âèäîáóâàííÿ òà ôîðìàë³çàö³¿ òåìïîðàëü- íèõ, ëîêàòèâíèõ, êàóçàëüíèõ õàðàêòåðèñòèê, ðîçâ’ÿçàííÿ ïðîáëåìè ïðîïóùåíèõ òîêåí³â, íàÿâí³ñòü ÿêèõ ïåðåäáà÷åíî â ðå÷åíí³, çíÿòòÿ íåîäíîçíà÷íîñòåé ó ìî- äèô³êàòîðàõ ñóðÿäíèõ òîêåí³â òà ïîïîâíåííÿ áàçè çíàíü äîäàòêîâèìè àêñ³îìàìè, âèëó÷åíèìè ç òåçàóðóñ³â, òëóìà÷íèõ ñëîâíèê³â òîùî. ÑÏÈÑÎÊ Ë²ÒÅÐÀÒÓÐÈ 1. Baader F., Calvanese D., McGuinness D., Nardi D., Patel-Schneider P. The description logic handbook. Cambridge University Press, 2007. 578 p. 2. Êðèâèé Ñ.Ë., Ãîãåð÷àê Ã.². Ëîã³êà â ìàòåìàòèö³ ³ ³íôîðìàòèö³. Ïðàö³ ïåðøî¿ óêðà¿íñüêî¿ êîíôå- ðåíö³¿ «Ëîã³êà òà ¿¿ çàñòîñóâàííÿ» (Êè¿â, 26–28 ëèñòîïàäà 2019 ð.). Êè¿â: ÀÂÀÍÏÎÑÒ-ÏÐÈÌ, 2019. Ñ. 47–55. 3. Lutz C., Wolter F., Zakharyaschev M. Temporal description logics: A survey. Proc. of the 15th International Symposium on Temporal Representation and Reasoning (Montreal, Canada, June 16–18, 2008). IEEE Computer Society, 2008. P. 3–14. https://doi.org/10.1109/TIME.2008.14. 4. Lutz C., Sturm H., Wolter F., Zakharyaschev M. Tableaux for temporal description logic with constant domains. Proc. of First International Joint Conference, IJCAR 2001: Automated Reasoning (Sienna, Italy, June 18–22, 2001). Springer, 2001. P. 121–136. https://doi.org/10.1007/3-540-45744-5_10. ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 181 Ðèñ. 9. Áàçà äàíèõ òà ¿¿ ãðàôîâå ïðåäñòàâëåííÿ à á Òâàðèíà Ùóð ʳò Ìåðåæà²íòåðíåò ²íòåðíåò Ìåðåæà Ìèøà ÙóðÌèøàʳò Ëîâèòè Õàð÷óâàòèñÿ Òâàðèíà 5. Lai S., Leung K. S., Leung Y. SUNNYNLP at SemEval-2018 Task 10: A Support-Vector-Machine-based method for detecting semantic difference using taxonomy and word embedding features. Proc. of The 12th International Workshop on Semantic Evaluation (New Orleans, USA, June 5–6, 2018). 2018. P. 741–746. http://doi.org/10.18653/v1/S18-1118. 6. Zhan J., Zhao H. Span model for open information extraction on accurate corpus. Proc. of the AAAI Conference on Artificial Intelligence. 2020. Vol. 34, Iss. 5. P. 9523–9530. https://doi.org/10.1609/ aaai.v34i05.6497. 7. Gangemi A., Presutti V., Reforgiato Recupero D., Nuzzolese A., Draicchio F., Mongiovi M. Semantic Web machine reading with FRED. Semantic Web. 2017. Vol. 8, Iss. 6. P. 873–893. https://doi.org/10.3233/SW-160240. 8. Reforgiato Recupero D., Nuzzolese A., Consoli S., Presutti V., Mongiovi M., Peroni S. Extracting knowledge from text using SHELDON, a Semantic Holistic framEwork for LinkeD ONtology data. Proc. of the 24th International Conference on World Wide Web (WWW’15 Companion) (Florence, Italy, May 2015). Association for Computing Machinery, 2015. P. 235–238. https://doi.org/10.1145/ 2740908.2742842. 9. Hoherchak H. Knowledge bases and description logics applications to natural language texts analysis. Problems in Programming. 2020. N 2–3. P. 259–269. https://doi.org/10.15407/pp2020.02-03.259. 10. Êðèâèé Ñ.Ë., Äàð÷óê Í.Ï., Ïðîâîòàð Î.². Îíòîëîãîïîä³áí³ ñèñòåìè àíàë³çó ïðèðîäíîìîâíèõ òåêñò³â. Ïðîáëåìè ïðîãðàìóâàííÿ. 2018. ¹ 2–3. Ñ. 132–139. 11. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Ïåòðåíêî Í.Ã. Çíàíèå-îðèåíòèðîâàííûå èíôîðìàöèîííûå ñèñòå- ìû ñ îáðàáîòêîé åñòåñòâåííî-ÿçûêîâûõ îáúåêòîâ: îñíîâû ìåòîäîëîãèè è àðõèòåêòóðíî-ñòðóê- òóðíàÿ îðãàíèçàöèÿ. ÓÑèÌ. 2009. ¹ 3. Ñ. 42–55. 12. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Ïåòðåíêî Í.Ã. Îá àâòîìàòèçàöèè ïðîöåññà èçâëå÷åíèÿ çíàíèé èç åñòåñòâåííî-ÿçûêîâûõ òåêñòîâ. Natural and Artificial Intelligence Intern. Book Series. Inteligent Processing. Sofia: ITHEA, 2012. N 9. P. 44–52. 13. Ïàëàãèí À.Â., Êðûâûé Ñ.Ë., Áèáèêîâ Ä.Ñ. Îáðàáîòêà ïðåäëîæåíèé åñòåñòâåííîãî ÿçûêà ñ èñ- ïîëüçîâàíèåì ñëîâàðåé è ÷àñòîòû ïîÿâëåíèÿ ñëîâ. Natural and Artificial Intelligence Intern. Book Series. Inteligent Processing. Sofia: ITHEA, 2010. N 9. P. 44–52. 14. McDonald R., Nivre J., Quirmbach-Brundage Y., Goldberg Y., Das D., Ganchev K., Hall K., Petrov S., Zhang H., T��ackstr��om O., Bedini C., Castell� N.B., Lee J. Universal dependency annotation for multilingual parsing. Proc. of the 51st Annual Meeting of the Association for Computational Linguistics (Sofia, Bulgaria, August 4–9, 2013). Association for Computational Linguistics, 2013. (Vol. 2: Short Papers) P. 92–97. 15. Mrini K., Dernoncourt F., Bui T., Chang W., Nakashole N. Rethinking self-attention: An interpretable self-attentive encoder-decoder parser. Findings of the Association for Computational Linguistics: EMNLP 2020. Association for Computational Linguistics, 2020. P. 731–742. http://doi.org/10.18653/v1/2020.findings-emnlp.65. 16. Che W., Lui Y, Wang Y., Zheng B., Liu T. Towards better UD parsing: Deep contextualized word embeddings, ensemble, and treebank concatenation. Proc. of the CoNLL 2018 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies (Brussels, Belgium, October 31 – November 1, 2018). Association for Computational Linguistics, 2018. P. 55–64. http:// doi.org/ 10.18653/v1/K18-2005. 17. Äàð÷óê Í. Àâòîìàòè÷íèé ñèíòàêñè÷íèé àíàë³ç òåêñò³â êîðïóñó óêðà¿íñüêî¿ ìîâè. Óêðà¿íñüêå ìîâîçíàâñòâî. 2013. ¹ 43. Ñ. 11–19. 18. Vilain M., Burger J., Aberdeen J., Connolly D., Hirschman L. A model-theoretic coreference scoring scheme. Proc. of the 6th Message Understanding Conference (MUC-6) (Maryland, USA, November 6–8, 1995). Association for Computational Linguistics, 1995. P. 45–52. https://doi.org/10.3115/ 1072399.1072405. 19. Stoyanov V., Gilbert N., Cardie C., Riloff E. Conundrums in noun phrase coreference resolution: Making sense of the state-of-the-art. Proc. of the Joint Conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4th International Joint Conference on Natural Language Processing (Singapore, August 2–7, 2009). Association for Computational Linguistics, 2009. P. 656–664. http://doi.org/10.3115/1690219.1690238. 20. Luo X. On coreference resolution performance metrics. Proc. of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing, HLT ’05 (Vancouver, Canada, October, 2005). Association for Computational Linguistics, 2005. P. 25–32. http://doi.org/10.3115/ 1220575.1220579. 182 ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 21. Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for language understanding. Proc. of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Minneapolis, USA, June 2–7, 2019). Association for Computational Linguistics, 2019. Vol. 1 (Long and Short Papers). P. 4171–4186. http://dx.doi.org/10.18653/v1/N19-1423. 22. Xu L., Choi J.D. Revealing the myth of higher-order inference in coreference resolution. Proc. of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP) (online, November 16–20, 2020). Association for Computational Linguistics, 2020. P. 8527–8533. http://dx.doi.org/ 10.18653/v1/2020.emnlp-main.686. 23. Ëóêàøåâè÷ Í.Â. Òåçàóðóñû â çàäà÷àõ èíôîðìàöèîííîãî ïîèñêà. Ìîñêâà: Èçä-âî Ìîñê. óí-òà, 2011. 512 ñ. Íàä³éøëà äî ðåäàêö³¿ 10.11.2020 Ã.È. Ãîãåð÷àê, Í.Ï. Äàð÷óê, Ñ.Ë. Êðûâûé ÏÐÅÄÑÒÀÂËÅÍÈÅ, ÀÍÀËÈÇ È ÈÇÂËÅ×ÅÍÈÅ ÇÍÀÍÈÉ ÈÇ ÍÅÑÒÐÓÊÒÓÐÈÐÎÂÀÍÍÛÕ ÅÑÒÅÑÒÂÅÍÍÎßÇÛ×ÍÛÕ ÒÅÊÑÒΠÀííîòàöèÿ. Ïðèâåäåí îáçîð ñðåäñòâ äåñêðèïòèâíûõ ëîãèê äëÿ ïðåäñòàâëå- íèÿ çíàíèé èç åñòåñòâåííîÿçû÷íûõ òåêñòîâ, êëàññèôèêàöèÿ äåñêðèïòèâíûõ ëîãèê ïî êîíñòðóêòîðàì êîíöåïòîâ è ðîëåé, à òàêæå îïèñàíû îñíîâíûå êîíöåïöèè òåìïîðàëüíûõ äåñêðèïòèâíûõ ëîãèê. Ðàññìîòðåí ïîäõîä ê ïî- ñòðîåíèþ ñèñòåì àíàëèçà åñòåñòâåííîÿçû÷íûõ òåêñòîâ íà îñíîâå çàäà÷ îïðåäåëåíèÿ ÷àñòåé ðå÷è, ïîèñêà ãðàììàòè÷åñêèõ çàâèñèìîñòåé è êîðåôå- ðåíòíîñòåé. Ïðèâåäåíû ïðèìåðû èñïîëüçîâàíèÿ åñòåñòâåííîÿçû÷íûõ áàç çíàíèé äëÿ ðåøåíèÿ ïðèêëàäíûõ çàäà÷, â ÷àñòíîñòè äëÿ ïðîâåðêè öåëîñ- òíîñòè òåêñòà, ïîèñêà ïðîòèâîðå÷èé. Êëþ÷åâûå ñëîâà: äåñêðèïòèâíûå ëîãèêè, áàçû çíàíèé, àëãîðèòì ñåìàíòè- ÷åñêîãî òàáëî, èçâëå÷åíèå çíàíèé, îáðàáîòêà åñòåñòâåííîãî ÿçûêà, ñåìàíòè- ÷åñêèé àíàëèç. H. Hoherchak, N. Darchuk, S. Kryvyi REPRESENTATION, ANALYSIS AND EXTRACTION OF KNOWLEDGE FROM UNSTRUCTURED NATURAL LANGUAGE TEXTS Abstract. The article provides an overview of the means of descriptive logics for knowledge representation in natural-language texts. Descriptive logics are classified by constructors of concepts and roles, and the basic concepts of temporal descriptive logics are considered. The approach to construction of systems of the analysis of natural-language text based on problems of parts of speech tagging, dependency parsing, coreference resolution is considered. Examples of using natural-language knowledge bases to solve applied problems, in particular to check the integrity of the text and to reveal contradictions, are provided. Keywords: description logics, knowledge bases, tableau algorithm, knowledge extraction, natural language processing, semantic analysis. Ãîãåð÷àê Ãðèãîð³é ²âàíîâè÷, àñï³ðàíò Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà Øåâ÷åíêà, e-mail: gogerchak@gmail.com. Äàð÷óê Íàòàëÿ Ïåòð³âíà, äîêòîð ô³ëîë. íàóê, ïðîôåñîð, ïðîôåñîð Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà Øåâ÷åíêà, e-mail: NataliaDarchuk@gmail.com. Êðèâèé Ñåðã³é Ëóê’ÿíîâè÷, äîêòîð ô³ç.-ìàò. íàóê, ïðîôåñîð, ïðîôåñîð Êè¿âñüêîãî íàö³îíàëüíîãî óí³âåðñèòåòó ³ìåí³ Òàðàñà Øåâ÷åíêà, e-mail: sl.krivoi@gmail.com. ISSN 1019-5262. ʳáåðíåòèêà òà ñèñòåìíèé àíàë³ç, 2021, òîì 57, ¹ 3 183