К вопросу разработки инструментального комплекса онтологического назначения

Предлагаются методологические основы проектирования инструментального комплекса онтологического назначения, предназначенного для реализации интегрированной информационной технологии автоматизированного построения онтологий предметных областей. Полученные результаты ориентированы на повышение эффекти...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2012
Hauptverfasser: Палагин, А.В., Петренко, Н.Г., Величко, В.Ю., Малахов, К.С., Тихонов, Ю.Л.
Sprache:Russian
Veröffentlicht: Інститут програмних систем НАН України 2012
Schriftenreihe:Проблеми програмування
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/86614
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:К вопросу разработки инструментального комплекса онтологического назначения / А.В. Палагин, Н.Г. Петренко, В.Ю. Величко, К.С. Малахов, Ю.Л. Тихонов // Проблеми програмування. — 2012. — № 2-3. — С. 289-298. — Бібліогр.: 22 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-86614
record_format dspace
spelling irk-123456789-866142017-11-23T19:52:20Z К вопросу разработки инструментального комплекса онтологического назначения Палагин, А.В. Петренко, Н.Г. Величко, В.Ю. Малахов, К.С. Тихонов, Ю.Л. Моделі та засоби систем баз даних і знань Предлагаются методологические основы проектирования инструментального комплекса онтологического назначения, предназначенного для реализации интегрированной информационной технологии автоматизированного построения онтологий предметных областей. Полученные результаты ориентированы на повышение эффективности анализа и понимания естественно-языковых текстов, построения баз знаний предметных областей (в первую очередь в научно-технической сфере) и проведения междисциплинарных научных исследований в совокупности с решением сложных прикладных задач. The given work describes methodological principles of design instrumental complex of ontological purpose. Instrumental complex intends for the implementation of the integrated information technologies automated build of domain ontologies. Results focus on enhancing the effectiveness of the automatic analysis and understanding of natural-language texts, building of knowledge description of subject areas (primarily in the area of science and technology) and for interdisciplinary research in conjunction with the solution of complex problems. 2012 К вопросу разработки инструментального комплекса онтологического назначения / А.В. Палагин, Н.Г. Петренко, В.Ю. Величко, К.С. Малахов, Ю.Л. Тихонов // Проблеми програмування. — 2012. — № 2-3. — С. 289-298. — Бібліогр.: 22 назв. — рос. 1727-4907 http://dspace.nbuv.gov.ua/handle/123456789/86614 004.2: 004.3 ru Проблеми програмування Інститут програмних систем НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Моделі та засоби систем баз даних і знань
Моделі та засоби систем баз даних і знань
spellingShingle Моделі та засоби систем баз даних і знань
Моделі та засоби систем баз даних і знань
Палагин, А.В.
Петренко, Н.Г.
Величко, В.Ю.
Малахов, К.С.
Тихонов, Ю.Л.
К вопросу разработки инструментального комплекса онтологического назначения
Проблеми програмування
description Предлагаются методологические основы проектирования инструментального комплекса онтологического назначения, предназначенного для реализации интегрированной информационной технологии автоматизированного построения онтологий предметных областей. Полученные результаты ориентированы на повышение эффективности анализа и понимания естественно-языковых текстов, построения баз знаний предметных областей (в первую очередь в научно-технической сфере) и проведения междисциплинарных научных исследований в совокупности с решением сложных прикладных задач.
author Палагин, А.В.
Петренко, Н.Г.
Величко, В.Ю.
Малахов, К.С.
Тихонов, Ю.Л.
author_facet Палагин, А.В.
Петренко, Н.Г.
Величко, В.Ю.
Малахов, К.С.
Тихонов, Ю.Л.
author_sort Палагин, А.В.
title К вопросу разработки инструментального комплекса онтологического назначения
title_short К вопросу разработки инструментального комплекса онтологического назначения
title_full К вопросу разработки инструментального комплекса онтологического назначения
title_fullStr К вопросу разработки инструментального комплекса онтологического назначения
title_full_unstemmed К вопросу разработки инструментального комплекса онтологического назначения
title_sort к вопросу разработки инструментального комплекса онтологического назначения
publisher Інститут програмних систем НАН України
publishDate 2012
topic_facet Моделі та засоби систем баз даних і знань
url http://dspace.nbuv.gov.ua/handle/123456789/86614
citation_txt К вопросу разработки инструментального комплекса онтологического назначения / А.В. Палагин, Н.Г. Петренко, В.Ю. Величко, К.С. Малахов, Ю.Л. Тихонов // Проблеми програмування. — 2012. — № 2-3. — С. 289-298. — Бібліогр.: 22 назв. — рос.
series Проблеми програмування
work_keys_str_mv AT palaginav kvoprosurazrabotkiinstrumentalʹnogokompleksaontologičeskogonaznačeniâ
AT petrenkong kvoprosurazrabotkiinstrumentalʹnogokompleksaontologičeskogonaznačeniâ
AT veličkovû kvoprosurazrabotkiinstrumentalʹnogokompleksaontologičeskogonaznačeniâ
AT malahovks kvoprosurazrabotkiinstrumentalʹnogokompleksaontologičeskogonaznačeniâ
AT tihonovûl kvoprosurazrabotkiinstrumentalʹnogokompleksaontologičeskogonaznačeniâ
first_indexed 2025-07-06T14:06:37Z
last_indexed 2025-07-06T14:06:37Z
_version_ 1836906758799360000
fulltext Моделі та засоби систем баз даних і знань УДК 004.2: 004.3 К ВОПРОСУ РАЗРАБОТКИ ИНСТРУМЕНТАЛЬНОГО КОМПЛЕКСА ОНТОЛОГИЧЕСКОГО НАЗНАЧЕНИЯ А.В. Палагин, Н.Г. Петренко, В.Ю. Величко, К.C. Малахов, Ю.Л. Тихонов Институт кибернетики им. В.М. Глушкова НАН Украины, Киев-187, МСП, 03680, проспект Академика Глушкова, 40, e-mail: palagin_a@ukr.net, факс: +38044 526 3348 Предлагаются методологические основы проектирования инструментального комплекса онтологического назначения, предназначенного для реализации интегрированной информационной технологии автоматизированного построения онтологий предметных областей. Полученные результаты ориентированы на повышение эффективности анализа и понимания естественно- языковых текстов, построения баз знаний предметных областей (в первую очередь в научно-технической сфере) и проведения междисциплинарных научных исследований в совокупности с решением сложных прикладных задач. The given work describes methodological principles of design instrumental complex of ontological purpose. Instrumental complex intends for the implementation of the integrated information technologies automated build of domain ontologies. Results focus on enhancing the effectiveness of the automatic analysis and understanding of natural-language texts, building of knowledge description of subject areas (primarily in the area of science and technology) and for interdisciplinary research in conjunction with the solution of complex problems. Введение Уровень развития интеллектуальных информационных технологий в значительной мере влияет на эффективность процессов, происходящих в экономической, научно-технической, образовательной и других сферах деятельности человеческого общества. Процессы глобальной информатизации мирового сообщества ориентированы, прежде всего, на построение знание-ориентированного общества и носят все более ярко выраженный междисциплинарный и трансдисциплинарный характер. Несомненным лидером при этом являются технологии инженерии знаний, в том числе ее новое направление – онтологический инжиниринг. Эти технологии реализуют процессы управления знаниями (Knowledge Management) и успехи в этом направлении во многом определяются уровнем интеллектуализации и эффективности компьютерных систем [1–6]. В настоящее время наметилась тенденция к активизации научных исследований на стыке разных предметных дисциплин, в том числе построение знание-ориентированных информационных систем, разработка методов онтологического анализа естественно-языковых объектов (ЕЯО) с целью извлечения из них знаний, прикладных аспектов применения онтологий, в частности при разработке электронных учебных курсов, метаонтологий, систем исследования интеграции знаний в трансдисциплинарных областях и др. Актуальность указанной тематики на современном этапе развития Computer Science обосновывается следующим образом. Во-первых, большая часть знаний, накопленных за все время развития человеческого общества, содержится в ЕЯО, представленных в текстовой форме. Кроме того, ежедневный прирост новой текстовой информации (где явным лидером является сеть Интернет) привел к тому, что полностью обработать эти текстовые источники знаний, а также получить релевантную запросу пользователя информацию, в компьютерных системах (КС) существующими методами стало практически невозможным. Это приводит к безвозвратной потере части новой информации или ее получение со значительным опозданием, когда она может потерять свою актуальность. Таким образом, задача разработки методологии, принципов и механизмов построения КС с обработкой предметно-ориентированных знаний, представленных в форме естественно- языковых текстов, и на их основе создания инструментальных средств автоматизированного построения баз знаний предметных областей (ПдО), имеет важное теоретическое и прикладное значение. Во-вторых, к описанной выше информационной проблеме следует отнести и лингвистическую проблему, когда не хватает производительности существующих персональных компьютеров для полной (программной) обработки поступающей текстовой информации различного характера. Задача сегодняшнего этапа – максимальное приближение к практическому внедрению существующих теоретических основ искусственного интеллекта, их дополнение новыми теоретическими разработками с учетом последних достижений инженерной практики с последующим учетом перспективных тенденций и особенностей новых микроэлектронных компонентов вычислительной техники. В связи с изложенным выше актуальность исследований обосновывается необходимостью развития и разработки эффективных формализованных методик архитектурно-структурной организации и проектирования, которые позволят не только проектировать компьютерные системы с обработкой общеязыковых и предметных знаний, но и автоматизировать процесс построения баз знаний предметных областей на основе обработки больших объемов текстовой информации, создавая электронные коллекции баз знаний предметных дисциплин и на их основе проводя сложные междисциплинарные научные исследования. 289 ©А.В. Палагин, Н.Г. Петренко, В.Ю. Величко, К.С. Малахов, Ю.Л. Тихонов, 2012 ISSN 1727-4907. Проблеми програмування. 2012. № 2-3. Спеціальний випуск mailto:palagin_a@ukr.net Формальні методи програмування Постановка задачи Необходимо разработать методологию проектирования и архитектуру программно-аппаратного комплекса средств реализации интегрированной информационной технологии (ИнИТ) автоматизированного построения онтологий предметных областей, названного инструментальным комплексом онтологического назначения (ИКОН), информационную и функциональную модели всех процессов, в совокупности составляющих указанную технологию. Общетеоретические основы проектирования аппаратных средств (или онтолого-управляемых информационных систем с обработкой предметно-ориентированных знаний) описаны в [6]. Модель проектируемой ИнИТ, состоящей из ряда информационных технологий (ИТ) (процессов) и направленной на решение задачи автоматизированного построения онтологий в произвольных (в научно- технической сфере) предметных областях, можно представить следующей системой >Λ=< ,,, XAPS , (1) где: { } nipP i ,1, == – множество процессов, реализующих ИнИТ; { } nmmjAA j == ,,1, – множество алгоритмов, реализующих множество п оцессов ≥ р { }ip , в совокупности составляющих последовательность информационных технологий и интегрированную информационную технологию в целом. Причем может быть несколько алгоритмов, реализующих некоторый процесс p ; i X – множество сущностей, описывающих заданную ПдО и участвующих в реализации алгоритмов { }jA ; Λ – обобщенная архитектура программно-аппаратных средств, участвующих в реализации ИнИТ. Обобщенная архитектура инструментального комплекса ИКОН о (2) и проектиру методом [6]. Здесь: – подсистема программного уровня управления множеством процессов в соответствии с О- модель Блок-схема Ω-архитектуры показана на рис. 1. писывается тройкой >ΩΛΩ=<Ω СУИ ,, ется в соответствии с онто-логическим (О) И – подсистема информационного ресурса; Ω Λ подсистема программно-аппаратных средств, реализующих ИнИТ; СУΩ – { }ip ю [6]. ΛИΩ СУΩ Рис. 1. Блок-схема Ω-архитектуры ИКОН В соответс вии с [2] ИКОН остоит из трех подсистем и представляет собой интеграцию разного рода информационных ресурсов (ИР), программно-аппаратных средств обработки и программного уровня управления основными и подготовительными процессами, которые, взаимодействуя между собой, реализуют совокупность алгоритмов автоматизированного итер т с ационного построения понятийных структур предметных знаний, я и/иих накоплени ли системной интеграции. Подсистема ИΩ “Информационный ресурс” включает блоки формирования лингвистического корпуса текстов, баз данных языковых структур и библиотек понятийных структур. Первый компонент представляет собой различные источники текстовой информации, поступающей на обработку в систему. 290 Моделі та засоби систем баз даних і знань Второй компонент представляет собой различные базы данных обработки языковых структур, часть из которых формируется (наполняется данными) в процессе обработки текстовых документов (ТД), а другая – формируется до процесса построения онтологии предметной области (О ПдО) и, по сути, является электронной коллекцией (ЭлК) различных толко ых слов ей. Третий компонент предс авляет собой совоку но ть библиотек понятийных структур разного уровня представления (от наборов терминов и понятий до высокоинтегрированной онтологической структуры междисципл в ар т п с инарных знаний) и является результатом реализа го знаниям, осуществляет общее управление процессом реализации связанных информационных техноло я т решение о степени их завершённости (и в случае необход а ции некоторо проекта (проектирования онтологии ПдО). Подсистема Λ “Программно-аппаратные средства” включает блоки обработки языковых и понятийных структур и управляющую графическую оболочку (УГО). Последняя во взаимодействии с инженером по гий. Подсистема управления СУΩ осуществляет подготовку и реализацию процедур предварительного этапа проектировани , а на протяжении всего процесса осуществляет контроль и проверку результатов выполнения этапов проектирования, принимае имости – повторении некоторых из них). Итак, общая задача является составной и включает следующие подзадачи: 1) разработать функциональную модель интегрированной информационной технологии; 2) разработать информационную модель множеств процессов P, составляющих ИнИТ; 3) разработать подсистему программных средств Λ , реализующих множество алгоритмов А; при решении общей задачи учитывать критерии эффективности О-метода, в частности, уровень автоматизации построения 4) онтологической базы знаний ПдО и ограничение реального времени Инфо ого построения онтологий предметных областей. На ней приняты следующие обознач ска в различных источниках текстовых документов (ТД), релевантных к заданной предме ожен возврат к блоку 1 для поиска соответствующей текстов значности возможен возврат к блоку 2 для по о-логического представления и интеграции онтологических структур в онтолог документов (сеть Интернет, монографии, научно-технические статьи, электро ПдО; библиотеки онтологий предметных областей, базы данных терминов, понятий и ТД предметных областей. получения результата. рмационная модель ИнИТ На рис. 2 показана блок-схема интегрированной информационной технологии (или информационной модели) автоматизированн ения: 1 – технология пои тной области (ПдО); 2 – технология автоматического лингвистического анализа ТД, описывающих заданную ПдО. В случае разрешения грамматической омонимии возм ой информации в лингвистических словарях; 3 – технология извлечения из множества ТД онтолого-информационных структур и их хранение в соответствующих базах данных. В случае разрешения лексической неодно строения дополнительных синтактико-семантических структур; 4 – технология формальн ическую базу знаний ПдО; 5 – технология обработки и управления данными и знаниями большого объема; 6 – источники текстовых нные коллекции ТД и др.); 7 – лингвистический корпус текстов (ЛКТ), описывающий заданную 8 – синтаксические и поверхностно-семантические структуры ТД; 9 – множество онтолого-информационных структур как результат обработки ТД; 10 – онтологическая база знаний заданной ПдО, множества терминов и понятий ПдО; 11 – Рис. 2. Блок-схема интегрированной информационной технологии Далее, в процессе разработки ИнИТ выполняется декомпозиция общей информационной модели на ее составляющие информационные модели, соответствующие отдельным ИТ, т. е. формируется иерархическая структу в процессов а 2 (рис. 2) – технологии автомат ра соответствии с методикой проектирования онтологии [3]. В качестве примера рассмотрим информационную модель блок ического лингвистического анализа ЕЯО, описывающих заданную ПдО. Архитектура современных знание-ориентированных информационных систем (ЗОИС) с естественно- языковым представлением и обработкой знаний включает онтологическую составляющую, которую в общем 291 Формальні методи програмування виде можно интерпретировать как концептуальную базу знаний. Такая база знаний представляется в виде ориентированного графа, вершинами которого являются объекты, описывающие концепты, а дугами – множество концептуальных отношений, связывающих между собой концепты. Другой важной особенностью указанной архитектуры является разделение и отдельная обработка семантики первой и второй ступени [7], что в общем случае означает разделение внутриязыкового и внеязыкового процессинга [8] и переход к формально- логичес ь (и соответствующую информационную технологию) обработки ЕЯО в формальную кому представлению исходного текста. Указанные особенности архитектуры современных ЗОИС трансформируют традиционную модел модель следующего вида 1 2, , , , , ,F T W SS O S I=< > (3) где ставляющих лингвистический корпус текстов; ваю х ; м тических структур второй ступени, описывающих множество процессов, T – множество обрабатываемых ЕЯТ, со W – множество словоформ, входящих в T ; 1 – множество синтактико-семантических структур первой ступени, описы щи TSS O – множество онтологических структур, отображающих множества W и 1SS в 2S ; 2S – множество се ан зафиксированных в T ; I – множество информационно-кодовых представлений е ность естественно-языковых текстов, характеризующихся стилями деловог -те см ет эффективному отображению функциональных операто Множество онтологических структур в идеале представляет языково-онтологическую картину мира [7, 9]. текста удобно использовать, в частности, онтолог ед вле I. Т, средствами интерпретации которых являются о) блока 3 на рис. 2. Функц епринятых стандартных методол ия различн ысл вкладывается в названия функци в 2S . Опишем объ кты формальной модели. Множество T представляет совокуп о и научно хнического характера. Цепочка W → 1SS в классическом понимании представляет грамматический анализ ЕЯТ. В отличие от традиционных линейного и сильнокодированного методов анализа здесь использован ешанный метод анализа. Суть его состоит в том, что в лексикографической базе данных полное множество W представлено в таблицах двух типов: таблицами лексем с соответствующими морфологическими, синтаксическими и семантическими характеристиками и таблицами флексий для всех полнозначных, изменяющихся частей речи. При этом алгоритмы формирования парадигмы лексем просты: в таблицах лексики указаны основы лексем и соответствующие коды для выбора записей из таблиц флексий. Нефлексийные изменения учитываются соответствующими алгоритмами анализа согласования и управления синтаксических связей. Описанная структура грамматического анализа однозначно соответству ров на программно-аппаратный уровень реализации. O Множество 1SS формируется и интерпретируется итерационно программой синтактико- семантического анализа. Основной операцией этого анализа является распознавание синтаксических и семантических отношений, связывающих слова текста. Разрешение семантической неоднозначности осуществляется путём обращения к множеству онтологических структур O . На основе построенных деревьев разбора фраз строится категориальная сеть, представляющая собой семантическое пространство 2S текста. В качестве компьютерного представления такого пространства ический граф информационно-кодовых пр ста ний Цепочки преобразования информации T →W → 1SS и O → 2S → I , по сути, представляют (соответственно) базовые процедуры анализа и понимания ЕЯ программные средства блока 2 и (частичн иональная модель ИнИТ Для проектирования функциональных моделей (функционального моделирования) программного обеспечения и различного рода информационных технологий известно ряд общ огий и языков функционального моделирования, таких как IDEF, DFD, UML. IDEF – методологии семейства ICAM (Integrated Computer-Aided Manufacturing) для решения задач моделирования сложных систем, позволяют отображать и анализировать функциональные модели сложных систем в различных аспектах. При этом широта и глубина обследования процессов в системе определяется самим разработчиком, что позволяет не перегружать создаваемую модель излишними данными. Набор стандартов IDEF промышленного моделирования включает ряд стандартов, таких как: IDEF0, IDEF1x, IDEF3 и других, основанных на графических нотациях, и применяемых для разработки, поддержки больших и сложных промышленных инженерных проектов [10]. По отдельности эти нотации предназначены для создан ых моделей, таких как “функциональная модель”, “информационная модель” и “модель процессов”. Метод функционального моделирования IDEF0 предназначен для формализации и описания процессов, в котором рассматриваются логические отношения между объектами. В соответствии со стандартом IDEF0 описание выглядит как общий процесс с входами, выходами, управлением и механизмом, который постепенно детализируется до необходимого уровня. Для описания того, какой см ональных блоко и стрелок используются словари описания [11 – 13]. 292 http://ru.wikipedia.org/w/index.php?title=ICAM&action=edit&redlink=1 http://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5 http://ru.wikipedia.org/wiki/%D0%A1%D0%BB%D0%BE%D0%B6%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0 Моделі та засоби систем баз даних і знань В настоящее время диаграммы структурного системного анализа IDEF-SADT продолжают использоваться для построения и детального анализа функциональной модели существующих на предприятии бизнес-процессов, а также для разработки новых бизнес-процессов. Основной недостаток данной методологии связан с ляется графическое моделирование информационных систем путем построе го потока данных н т к одная модель предста и послужили основой для включения соответствующих средств в унифиц м преимуществ и недостатков SADT (IDEF) и DFD методов. В UML есть три основных вида мо l). х сущностей, в елены многие новые перспек мание все преимущества языка UML, на его основе была спроект й набор диаграмм трёх видов: ания (рис. 3); 4); щие границы и контекст моделируемой предметной области на начальных этапах проекти онцептуальную модель системы для её последующей детализации в форме логических ть исходную документацию для взаимодействия разработчиков системы с её заказчиками и пользовател отсутствием явных средств для объектно-ориентированного представления моделей сложных систем. Основой DFD-методологии яв ния диаграмм потоков данных. Модель системы в контексте DFD представляется в виде некоторой информационной структуры, основными компонентами которой являются различные потоки данных, которые переносят информацию от одной подсистемы к другой. Каждая из подсистем выполняет определенные преобразования входно и передает результаты обработки информации в виде потоков данных для других подсистем. Информационная модель системы строится как еко орая иерархическая схема, в основе оторой находится так называемая контекстная диаграмма. На диаграмме декомпозиции исх вляется в виде моделей подсистем соответствующих процессов преобразования данных. Основной недостаток этой методологии также связан с отсутствием явных средств для объектно- ориентированного представления моделей сложных систем, а также для представления сложных алгоритмов обработки данных [14]. Поскольку на диаграммах DFD не указываются характеристики времени выполнения отдельных процессов и передачи данных между процессами, то модели систем, реализующих синхронную обработку данных, не могут быть адекватно представлены в нотации DFD. Все эти особенности ограничили возможности ее широкого применения ированный язык моделирования. UML (англ. Unified Modeling Language – унифицированный язык моделирования) – язык графического описания для объектного моделирования в области разработки программного обеспечения [15]. UML является широко используемым стандартом де-факто объектно-ориентированного визуального языка моделирования. Он разрабатывался с учето делей [16, 17]: • статическая модель (static model); • динамическая модель (dynamic mode • физическая модель (physical model) Статическая модель описывает элементы системы и их взаимоотношения (классы, атрибуты, операторы). Одной из реализаций статической модели является диаграмма классов (class diagram). Динамическая модель описывает поведение системы, например, изменение программных сущностей (software entities) во время выполнения приложения. К динамическим моделям относятся: диаграмма прецедентов, также: вариантов использования, сценариев использования (use case diagram); диаграмма активности, также деятельности (activity diagram). Физическая модель отображает неизменяемую структуру программны в частности файлов исходного кода, библиотек, исполняемых файлов, и отношений между ними. В настоящее время разработаны средства визуального программирования на осно е UML, обеспечивающие интеграцию, включая прямую и обратную генерацию кода программ, с наиболее распространенными языками и средами программирования, такими как Java, C++, C#, Visual Basic, Object Pascal/Delphi. Поскольку при разработке языка UML были приняты во внимание многие передовые идеи и методы, можно ожидать, что на очередные версии языка UML также окажут влияние и другие перспективные технологии и концепции. Кроме того, на основе языка UML могут быть опред тивные методы. Язык UML может быть расширен без переопределения его ядра. UML технологии стали основой для разработки и реализации во многих инструментальных средствах: в средствах визуального и имитационного моделирования, а также в CASE-средствах самого различного целевого назначения. Более того, заложенные в языке UML потенциальные возможности могут быть использованы не только для объектно-ориентированного моделирования систем, но и для представления знаний в интеллектуальных системах, которыми, по существу, являются перспективные сложные программно- технологические комплексы. Принимая во вни ирована функциональная модель ИнИТ. Функциональная модель ИнИТ представляет собо • диаграмма вариантов использов • диаграмма активности (рис. • диаграмма классов (рис. 5). Целями разработки диаграммы вариантов использования являются: 1. Определить об рования системы. 2. Сформулировать общие требования к функциональному поведению проектируемой системы. 3. Разработать исходную к и физических моделей. 4. Подготови ями. Суть данной диаграммы состоит в следующем: проектируемая система представляется в виде 293 http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D0%B3%D0%BB%D0%B8%D0%B9%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA http://ru.wikipedia.org/wiki/%D0%AF%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F http://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%B7%D1%83%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F http://ru.wikipedia.org/w/index.php?title=%D0%9E%D0%B1%D1%8A%D0%B5%D0%BA%D1%82%D0%BD%D0%BE%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5&action=edit&redlink=1 http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D0%B5%D1%81%D0%BF%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D1%8F Формальні методи програмування множества сущностей или акторов (actor), взаимодействующих с системой с помощью так называемых вариантов использования. При этом актором или действующим лицом называется любая сущность, взаимодействующая с системой извне. Это может быть человек, техническое устройство, программа или любая другая система, которая может служить источником воздействия на моделируемую систему. В свою очередь, вариант использования служит для описания сервисов, которые система предоставляет актору. Рис. 3. UML-диаграмма вариантов использования ИнИТ (ИКОН) 294 Моделі та засоби систем баз даних і знань Рис. 4. UML-диаграмма активности ИнИТ (ИКОН) С помощью диаграммы активности (рис. 4) можно изучать поведение системы с использованием моделей потока данных и потока управления. Диаграмма активности отображает некоторый алгоритм, описывающий жизненный цикл объекта, состояния которого могут меняться. Диаграмма активности отличается от блок-схемы, которая описывает лишь шаги алгоритма. Диаграмма активности имеет более широкую нотацию. Например, на ней можно указывать состояния объектов. Диаграмма классов описывает структуру объектов ИнИТ: их индивидуальность, отношения с другими объектами, атрибуты, функции и процедуры. Модель классов создает контекст для диаграмм состояний и взаимод реализ нилищами и фейс для доступа к внешней библиотеке KonspektLib, реализующей функции лингвистического анализа. ействия. На рис. 5 показан фрагмент UML-диаграмма классов ИнИТ: – класс ArchiveSearch ует технологию обработки и управления хра данных знаний; – класс GraphEditor реализует технологию формально-логического представления и интеграции онтологических структур; – класс ControlGraphicShell реализует управляющую графическую оболочку, которая осуществляет общее управление процессом реализации связанных информационных технологий; – интер Рис. 5. Фрагмент UML-диаграммы классов ИнИТ мы программных средств и програм ы и функции управления множеством процессов, реализующих ИнИТ (ИКОН нвер Подсистема программных средств систеОпишем некоторые программные модули, входящие в под много уровня управления множеством процессов, реализующих ИнИТ. Программный модуль “Управляющая графическая оболочка” [18]. В состав программно-аппаратных средств ИнИТ (ИКОН) входит Управляющая графическая оболочка (УГО), в которую включены процедур ). Графический интерфейс УГО. Проектирование графического интерфейса УГО осуществлялось в соответствии с общепринятыми рекомендациями построения графического интерфейса пользователя (ГПИ) [19, 20]. Рассмотрим основные элементы главного окна УГО и их назначение (рис. 6). Меню запуска прикладных программ и модулей, которые реализуют информационные технологии проектирования онтологий ПдО и системной интеграции междисциплинарных знаний. Доступны следующие модули и программы: модуль лингвистического анализа естественно-языковых текстов; модуль визуального проектирования онтологий, модуль ко тации OWL (Ontology Web Language); модуль системной интеграции онтологий; модуль системы поиска; модуль архива терминов; вызов редактора Protégé для построения и редактирования онтологий. Структурная схема УГО ИнИТ (ИКОН) показана на рис. 7. На нём приняты такие сокращения: GUI – Graphical User Interface, XML – Extensible Markup Language, МВП – модуль визуального проектирования. УГО 295 Формальні методи програмування взаимодействует с подсистемой Естественный Интеллект (ЕИ), осуществляет общее управление процессом реализации связанных информационных технологий. Рис. 6. Элементы ГПИ главного окна УГО ИКОН Рис. 7. Структурная схема О ИнИТ (ИКОН) УГО выполняет следующие функции: – во взаимодействи УГ и с инженером по знаниям осуществляет предварительное наполнение среды материа и проектирования онтологии ПдО и системной интеграции лами электронных коллекций энциклопедических, толковых словарей и тезаурусов, описывающих домен предметных знаний; – обеспечивает запуск и последовательность исполнения прикладных программ, реализующих составные информационные технологи 296 Моделі та засоби систем баз даних і знань междис технологии является автоматизированное построение тезаурус последовательностей, так и отдельных прикладных програм еспечивает интерфейс с подсистемой ЕИ; мационными ресурса циплинарных знаний (примером составной ов ПдО для поисковой системы); – отображает ход процесса проектирования; – содержит позиции меню для запуска, как м, используемых в процессе проектирования; – об – индицирует сообщения о текущем состоянии проекта, его наполнении инфор ми; – обеспечивает обмен информацией между прикладными программами и базами данных. Программная реализация ИКОН была выполнена с использованием концепции Model-View-Controller (MVC) – “Модель-Представление-Контроллер” – основная цель применения этой концепции состоит в разделении бизнес-логики (модели) от её визуализации (представления, вида) [21, 22]. MVC – схема использования нескольких шаблонов проектирования с помощью которых модель данных приложения, пользовательский интерфейс и взаимодействие с пользователем разделены на три отдельных компонента так, что модификация одного из компонентов оказывает минимальное воздействие на остальные. (Model). Модель предоставляет знания: данные и методы работы с этими данными, реагиру симо от визуального представления, а также создавать несколько различных представлений для одной модели. На рис. 8 представлена реализация концепции MVC в модуле поиска ТД в Internet ИнИТ (ИКОН). Концепция MVC позволяет разделить данные, представление и обработку действий пользователя на три отдельных компонента: • Модель ет на запросы, изменяя своё состояние. Она не содержит информации, как эти знания можно визуализировать; • Представление, вид (View). Отвечает за отображение информации (визуализация). Часто в качестве представления выступает форма (окно) с графическими элементами; • Контроллер (Controller). Обеспечивает связь между пользователем и системой: контролирует ввод данных пользователем и использует модель и представление для реализации необходимой реакции. Важно отметить, что как представление, так и контроллер зависят от модели. Однако модель не зависит ни от представления, ни от контроллера. Тем самым достигается назначение такого разделения: оно позволяет строить модель незави Рис. 8. Реализация концепции MVC в модуле поиска ТД в Internet ИнИТ (ИКОН) ты в исходны ller); ые действия (actions), которые выполняются на предста у на базовую модель; имер, нажатие на кнопку. Это действие определ Перечислим этапы реализации концепции MVC в модуле поиска ТД в Internet ИнИТ (ИКОН). Объек модель, вид и контроллер инициализированы, тогда: • Вид (View) регистрируется в качестве слушателя (listener) на модели (Model). Любые изменения х данных модели немедленно приведут к уведомлению (notification) на изменение, которое получает вид. Еще раз следует обратить внимание на то, что модель независима от вида и контроллера (Contro • Контроллер связан с видом. Это означает, что люб влении (виде), будут вызывать зарегистрированный метод слушателя в классе контроллера; • Контроллер получает ссылк • Вид распознаёт взаимодействие пользователя с ГПИ, напр яет вызов метода слушателя; • Вид вызывает соответствующий метод контроллера; 297 Формальні методи програмування • Контроллер осуществляет доступ к модели, возможно, обновляя её с учётом действий пользователя; • Если модель была изменена, она уведомляет вид, об изменениях. Программная реализация ИКОН выполнена с использованием платформы Java Swing Framework. В отличие от других платформ, она не только предоставляет интерфейс разработки на основе шаблона MVC, но и сама реализована на его основе. Представлением является класс – наследник класса Frame. Вследствие организации событийной модели Java на интерфейсах, контроллер представляет собой набор анонимных отки соответствующих событий. Как и остальные платформы, Swing предоставляет разработку ической либо графической форме. Они определяют содержание последующих этапов научных исследований, равно как и анализ эффективности применения комплекса при решени конкретных прикладных задач. классов обраб модели программисту. Выводы В работе предложена методология проектирования и архитектура программных средств реализации ИнИТ автоматизированного построения онтологий предметных областей. Разработаны информационная и функциональная модели всех процессов, в совокупности составляющих ИнИТ. Приведено подробное описание подсистемы программных средств ИКОН, в частности УГО. Проанализированы технологии моделирования (IDEF, DFD, UML) и проектирования (MVC) сложных систем. Приведены UML-диаграммы, описывающие функциональную модель ИнИТ (ИКОН). За рамками разработки ИКОН остались проблемы восприятия информации, представленной в аналит и 1. Палагин А.В. Архитектура онтолого-управляемых компьютерных систем // Кибернетика и системный анализ. – 2006 – № 2. – С. 111–124. 2. Палагин А.В., Крывый С.Л., Петренко Н.Г. Знание-ориентированные информационные системы с обработкой естественно-языковых объектов: основы методологии и архитектурно-структурная организация // УСиМ. – 2009. – № 3. – С. 42–55. 3. Палагин А.В., Петренко Н.Г. Системно-онтологический анализ предметной области // УСиМ. – 2009. – № 4. – С. 3–14. 4. Палагин А.В., Крывый С.Л., Петренко Н.Г., Величко В.Ю. Знание-ориентированные информационные системы с обработкой естественно-языковых объектов: онтологический подход // УСиМ. – 2010. – № 4, 5. – С. 3–14. 5. Палагин А.В., Яковлев Ю.С. Системная интеграция средств компьютерной техники. – Винница: УНІВЕРСУМ, 2005. – 680 с. 6. Палагин А.В., Крывый С.Л., Петренко Н.Г. Онтологические методы и средства обработки предметных знаний. – Луганск: изд-во ВНУ им. В. Даля, 2012. – 323 с. 7. Палагін О.В., Петренко М.Г. Модель категоріального рівня мовно-онтологічної картини світу // Математичні машини і системи. – 2006. – № 3. – С. 91–104. 8. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. – М.: Наука, 1989. – 191 с. 9. Палагин А.В. Организация и функции "языковой" картины мира в смысловой интерпретации ЕЯ-сообщений // Information Theories and Application. – 2000. – Vol. 7, N 4. – P. 155–163. 10. Ang C.L., Khoo L.P., Gay R.K.L. IDEF: a comprehensive modelling methodology for development of manufacturing enterprise system // International J. of Production Research. – 1999. – N 37 (17). aterials Laboratory, Wright-Patterson Air Force Base,11. US Air Force, ICAM Architecture. Part II, Functional Modeling Manual (IDEF0) // M OH, 1981. – Vol. IV. 12. Черемных С.В., Семёнов И.О., Ручкин В.С. Структурный анализ систем: IDEF-технологии. – М.: Финансы и статистика, 2003. – 208 с. 13. Function modeling method IDEF0. Режим доступа: http://www.idef.com/IDEF0.htm. 14. Леоненков А.В. Объектно-ориентированный анализ и проектирование с использованием UML и IBM Ration 06. – 320 с. al Rose Интернет- 17. , хитектуры университет информационных технологий - ИНТУИТ.ру // БИНОМ. Лаборатория знаний. – 20 , 15. Marshall C. Enterprise Modelling with UML, Addison-Wesley, Reading, MA 2000. 16. Booch G., Rumbaugh J., Jacobson I. The Unified Modeling Language User Guide, Addison-Wesley, Reading, MA, 1999. Quatrani T. Visual Modeling with Rational Rose and UML, Addison-Wesley, Reading, MA 1998. 18. Палагин А.В., Величко В.Ю., Петренко Н.Г., Малахов К.С. К вопросу разработки онтолого-управляемой ар интеллектуальной программной системы // Н ук. жур. “Вісник Східноукраїнского національного університету імені Володимираа Даля” м. Луганськ. – 2011.– № 13 (167). – С. 179–184. 19. Mac OS X Human Interface Guidelines. Режим доступа: http://developer.apple.com/library/mac/#documentation/UserExperience/ Conceptual/AppleHIGuidelines/Intro/Intro.html. 20. Windows User Experience Interaction Guidelines. Режим доступа: http://msdn.microsoft.com/en-us/library/windows/desktop/ aa511258.aspx. 21. m/technetwork/articles/javase/mvc-136693.htmlJava SE Application Design With MVC. Режим доступа: http://www.oracle.co . 22. pplications Programming in Smalltalk-80(TM): How to use Model-View-Controller (MVC). Режим доступа: http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html A . 298 http://www.oracle.com/technetwork/articles/javase/mvc-136693.html http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html http://st-www.cs.illinois.edu/users/smarch/st-docs/mvc.html УДК 004.2: 004.3 К ВОПРОСУ РАЗРАБОТКИ ИНСТРУМЕНТАЛЬНОГО КОМПЛЕКСА ОНТОЛОГИЧЕСКОГО НАЗНАЧЕНИЯ