Формування та аналіз семантичних параметрів в інформаційній технології

Gespeichert in:
Bibliographische Detailangaben
Datum:2009
1. Verfasser: Олешко, Т.І.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України 2009
Schriftenreihe:Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/27769
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Формування та аналіз семантичних параметрів в інформаційній технології / Т.І. Олешко // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 50. — С. 93-101. — Бібліогр.: 2 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-27769
record_format dspace
spelling irk-123456789-277692011-10-18T12:12:01Z Формування та аналіз семантичних параметрів в інформаційній технології Олешко, Т.І. 2009 Article Формування та аналіз семантичних параметрів в інформаційній технології / Т.І. Олешко // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 50. — С. 93-101. — Бібліогр.: 2 назв. — укр. XXXX-0067 http://dspace.nbuv.gov.ua/handle/123456789/27769 683.03 uk Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
format Article
author Олешко, Т.І.
spellingShingle Олешко, Т.І.
Формування та аналіз семантичних параметрів в інформаційній технології
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
author_facet Олешко, Т.І.
author_sort Олешко, Т.І.
title Формування та аналіз семантичних параметрів в інформаційній технології
title_short Формування та аналіз семантичних параметрів в інформаційній технології
title_full Формування та аналіз семантичних параметрів в інформаційній технології
title_fullStr Формування та аналіз семантичних параметрів в інформаційній технології
title_full_unstemmed Формування та аналіз семантичних параметрів в інформаційній технології
title_sort формування та аналіз семантичних параметрів в інформаційній технології
publisher Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
publishDate 2009
url http://dspace.nbuv.gov.ua/handle/123456789/27769
citation_txt Формування та аналіз семантичних параметрів в інформаційній технології / Т.І. Олешко // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2009. — Вип. 50. — С. 93-101. — Бібліогр.: 2 назв. — укр.
series Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
work_keys_str_mv AT oleškotí formuvannâtaanalízsemantičnihparametrívvínformacíjníjtehnologíí
first_indexed 2025-07-02T22:20:33Z
last_indexed 2025-07-02T22:20:33Z
_version_ 1836575446846668800
fulltext Mechanical Properties of Hafnium Inorganic Materials. 2006. Vol. 42. No. 6. pp. 617-621. © Pleiades Publishing. Inc.. 2006. Поступила 26.01.2009р. УДК 683.03 Т.І.Олешко ФОРМУВАННЯ ТА АНАЛІЗ СЕМАНТИЧНИХ ПАРАМЕТРІВ В ІНФОРМАЦІЙНІЙ ТЕХНОЛОГІЇ Інформаційні засоби та інформаційна технологія в цілому, яка включає інформаційну систему, в першу чергу орієнтована на роботу з семантичними способами представлення досліджуваних систем чи процесів . У зв'язку з цим необхідно детально розглянути основні семантичні характеристики таких структур. До таких характеристик відносяться: семантична суперечність, семантичні конфлікти, семантична надмірність та семантичні відхилення [1]. Розглянемо більш детально кожну з цих характеристик. Наведені характеристики є актуальними тільки в тому випадку, коли в рамках інформаційної технології використовуються не тільки формальні моделі, що відображають систему та її функціонування, а й семантичний опис поточного образу системи. Очевидно. що користуватися повним описом всього образу системи не доцільно, оскільки в випадку складної системи такий опис буде занадто громіздким. Тому семантичний образ ( 8 0 ) повинен описувати лише вибрані фрагменти або систему в цілому на різних рівнях узагальнення відображення. Рівень узагальнення опису образу будемо визначати через міру деталізації опису цього образу і позначати 8 0 а . Міру деталізації будемо враховувати наступним чином. Якщо опис образу 80 складається з елементарних синтаксичних елементів, то рівень деталізації опису образу 80 є найвищим, будемо записувати це в формі 80(ё1) = т а х . До елементарних семантичних елементів будемо відносити ті слова з словника С , які позначають базові компоненти предметної області. Фрагменти опису 80 можуть представляти собою певні підсистеми і такі підсистеми можуть позначатися окремими словами. Тоді відповідні слова будемо відносити до групи слів, що є похідними базових слів стовпця СЕ. Будемо позначати базові слова символом 8 1 (1), тоді похідними словами будуть слова 8 і ( т ) , де т - кількість слів, що використовуються для опису підсистеми у вигляді образу 80 і. В цьому випадку © Т.І.Олешко 93 Б0І =< БД1),..,Бк(1) >= Б,(к). Опис деякого фрагменту системи Б0] може використовувати не базові слова, які позначають окремі фрагменти підсистеми, що входять в склад системи, образ якої описується. В цьому випадку такий опис будемо позначати через Б,.(т,п) =< Бі(1),...,Б,.(п),...,Бт(1) > . Якщо таких фрагментів в описі БО образу Б, більше ніж два, то відповідний образ запишеться в вигляді співвідношення: Б,.(т,п,...,к) =< Б1 (1),...,Б,.(п),...,(к),...,Бт(1) > . Окремі описи Б, ( т ) можна характеризувати деякими функціями наступним чином. Кожне слово Б, має певне інтерпретаційне розширення і (Б,) , яке описується мовою користувача. На такому інтерпретаційному розширенні визначається тим чи іншим чином оцінка відповідного слова Б, (1). Таку оцінку будемо записувати у вигляді Б, (а :1). У випадку похідних слів такий запис буде виглядати наступним чином: Б,(а : т, п,. . . ,к). Будь- який образ у вигляді семантичного опису можна представити у вигляді похідного слова певного порядку. Таким чином можна використовувати позначення Б0І і Б, ( т ) як еквівалентні. Порядок похідного слова будемо визначати кількістю ієрархічних включень, що використовуються в описі Б,. Наприклад, нехай похідне слово Б, має порядок 3. Це означає, що в описі Б, або Б, ( т , п) використовується трьохрівневе входження похідних слів нижчих порядків. Це можна записати наступним чином: Б3(т,п) =< Б,(1),...,Б,(п,к),...,Бт(1) >= =< Б.(1),...,Біу(к),...,Б,и+я)(к),...,Бт(1) >= =< Б1(1) Бііе (1),..., Бте+к )(1),..., Б, ( , + я ) е (1),..., Б, ( і + п ) ( е + к ) (1),..., Б т (1) > . Похідне слово вищого порядку будемо записувати в наступному вигляді: Б](т, п) = Б і ( т ,п(к ) ) . Очевидно, що така форма запису може поширюватися на похідні слова довільного порядку. Таким чином, слово першого порядку представляє собою образ Б0І, який описується базовими словами, що мають початкові інтерпретаційні розширення. Приймемо наступні вихідні твердження. Аксіома 1. Будь-яке словосполучення Б І, що відображає фрагмент образу БО і, має семантичну значущість, меншу ніж сума семантичних значень окремих слів або рівну сумі семантичних значень окремих слів. В останньому випадку мова може йти тільки про фрагмент тексту, в якому проводиться перелік окремих елементів чи об'єктів. Такі випадки не будуть розглядатися. В даній ситуації виникає задача обчислення семантичної значущості фраз, речень і абзаців, які містять текстовий образ 94 відповідного фрагмента предметної області інтерпретації. Для цього необхідно розглянути більш детально спосіб визначення семантичної значущості окремих слів. Семантична значущість окремого слова визначається в області власного інтерпретаційного розширення, яке представляє собою оригінальний опис фрагменту відповідної предметної області. Тому необхідно визначити метрику в середовищі інтерпретаційних розширень І (х і). Прикладом найпростішої метрики є кількість слів, що використовуються в даному інтерпретаційному розширенні І (х і) = а( х) = ті. Більш складним прикладом встановлення метрики на множині слів інтерпретаційного розширення є встановлення частоти використання окремого слова, що використовується в інтерпретаційних розширеннях інших слів семантичного словника. Тоді така частота буде числовою характеристикою окремою слова хі, яке описується в списку використовуваних слів БШ . В такому списку по складеному семантичному словнику визначаються відповідні величини частот Лі для кожного слова а з інтерпретаційних описів I (X). В цьому випадку кожне І(х і) може бути представлено в вигляді дискретної послідовності І(хі) =< Л1(а1),Л2(а2),...,Лт(ат) >. Тому залишається визначити функцію р(х і) на цій сукупності елементів. Прикладом такої функції може бути залежність наступного вигляду: Таке визначення семантичної значущості слів, що описують образи БОі в предметній області, дозволяє в процесі функціонування системи змінювати міру семантичної значущості окремих слів хі за рахунок зміни частоти використання слів х і в інтерпретаційних розширеннях ](хі). Така зміна відбувається за рахунок розширень в Сх, яке приводить до появи нових х* і, відповідно, ](х*) та, як наслідок, до зміни величин АІ окремих а в ](х*). Наведена вище функція а(х) є найменш чутлива до змін хі в ](х*), оскільки представляє собою обчислення середнього значення хі для всіх а з ](х*). Очевидно, що можна побудувати функції для <у(хі) = р(Лі,аі) більш чутливі до змін в СЕ. Це приводить до того, що можна всю семантичну частину інформаційної системи зробити більш динамічною при виникненні семантичних відхилень, які автоматично приводять до формування нових х в Сх. Функція а(хі) суттєво ускладнюється навіть у випадку використання її у вигляді (1), якщо у склад х*) входять слова х' з С . В процесі (1) 95 функціонування системи такі випадки є не тільки можливими, але й неминучими, оскільки в більшості випадків семантичні розширення відбуваються на основі використання понять і термінів, що сформовані при початковому складанні словника СЕ і, відповідно, словників ЗРО,. Тоді функція (1) запишеться наступним чином: ст'( ХІ ) = р( хі) = І Л І / /• І Л V і=1 / т1 +... + І Л V і=1 / т. що представляє собою суму середніх значень семантичних значущостей оригінальних складових Л з і(х і) та середніх значень складових, що запозичені з семантичного словника С . Наведене співвідношення можна записати в більш інтегральній формі, якій відповідає наступне співвідношення: ( ( т Л Л ( ( тк Л Л х,-) = ] І Ц Л , І/ . + І Л / т і V і=1 +... + І Л V і=1 / т. У п. (2) Наступною семантично значимою компонентою для текстового опису є фраза у/,(х1,...,хк). В якості проміжної граматичної конструкції приймемо речення Я , яке може складатися з однієї або кількох фраз Я = фг(у1,...,ут). Опис всього образу будемо представляти у вигляді одного абзацу тексту або БОі = ¥і (Я1,..., Ят). Оскільки інформаційна технологія формується як деяка формалізована система [2], то можна ввести систему правил у, які описують допустимі способи формування фраз, що можна записати в наступному вигляді: [ ( х п ) & ( Y l , . . . , ї к ) ] X 1 1 , . . . , х і к ) , . . . , У п ( x n l , . . . , х л ) . Створення такої системи правил у вигляді детермінованих співвідношень є допустимим завдяки тому, що предметна область, для якої вони створюються, є обмеженою і достатньо точно визначеною своїми функціональними можливостями. Аналогічно можна створити систему правил побудови речень з окремих фраз: { [ У і ( ^ і ^ . ^ х і к ) , . . . ,У, ( X k 1 , . . . , Х,т ) ] & ( ^ l , . . . , ^ т ) } ^ Я і ^ і — Ут ] . Виходячи з аналізу предметної області, відповідні умови можна сформувати для формування цілих образів текстового опису, які вище називались образами ОБі фрагментів предметної області. При дослідженні семантичних закономірностей обмежимося правилами формування фраз у = {ух,...,уп}. Приймемо. що речення можуть складатися з сукупності фраз, сполучення яких в межах речення будемо проводити виходячи з умови семантичного узгодження. Розглянемо основні семантичні закономірності в межах однієї фрази. 96 Оскільки опис предметної області є нормалізованим і представляє собою текстовий опис у вигляді технічної документації, то кількість правил формування фраз зведено до мінімуму. Це означає, що кількість слів різних граматичних типів є обмеженою у порівнянні з текстами інших типів, наприклад, з технічною літературою і тим більше в порівнянні з текстами художньої літератури. Розглянемо метод оцінки семантичної значущості фрази, яка складається з певної кількості слів. Кожне слово АІ, що використовується в і ( х і), має певним чином визначену семантичну значущість а або Я Д а ) . Два слова хі і хі, що відносяться до одного граматичного типу, якими можуть служити іменники, дієслова, прикметники і т.п., описуються інтерпретаційними розширеннями і (х і ) і і ( х і ) . Такі розширення можуть в ідеальному випадку використовувати абсолютно різні слова мови інтерпретації або має місце: У ( Л є і (х і )МЛ у є ](xj))[ЛІ*ЛІ]. Практично ідеальна ситуація або взагалі не існує в області і(хі) або її існування є окремим випадком. Найчастіше має місце ситуація, коли області і ( х ) і і ( х і ) частково перекриваються. Приймемо наступну аксіому. Аксіома 2. Послідовність використання слів одного граматичного типу визначається величиною їх семантичної значущості. Прикладом правила, що ґрунтується на цій аксіомі, може бути наступна граматична функція, що запишеться в вигляді: У,(хі, X ) = [ с т ( X ) > X ) ] ^ V [ х і , X ] . Такі правила формуються наступними способами: формується початковий текст технічного опису предметної області для кожного фрагменту, по сформульованому тексту будуються правила формування фраз V ; формуються правила у, формування фраз, що описують технічний текст предметної області і по цих правилах складається опис фрагментів опису у вигляді окремих образів 80 , формуються аксіоми, які приймаються як вихідні положення або принципи, на базі яких формуються правила побудови фраз, на основі таким чином сформованих правил будується текстовий опис фрагментів предметної області інтерпретації. Формально наведені правила записуються у вигляді наступних співвідношень: ^ С Х — X ) , . . . , ¥ к ( х і ^ х і ) ] ^ Ї2,...,Гк ) [Уі,...,УІ ] ^ X1,..., X ) ,... , Vm (хі , . . . , X ) ] И^. .^А; ] ^ [ Гі (х, хі),...,ук (xl, х ) ] x l , . . . , хп ) , . . . , V ( х і , . . . , X ) . 97 Очевидно, що способи формування правил можуть представляти собою синтез наведених вище способів. Ці способи використовуються в першу чергу для початкового формування текстових образів Б0 предметної області. В процесі функціонування телекомунікаційних систем можуть виводитись нові правила формування окремих фраз текстового опису. В даному випадку такі правила формуються на основі семантичних параметрів, які є спільними для всіх слів, що визначаються словником С . До цього часу в якості такого параметра розглядалась семантична значущість або семантична вага окремого слова. При збільшенні кількості таких семантичних параметрів існує можливість збільшити кількість правил побудови фраз, кількість способів їх формування і, відповідно, виникає необхідність формулювати нові аксіоми, що відображають роль нового семантичного параметра. Введемо такий семантичний параметр як міра семантичної оригінальності слова, яке визначається в словнику С . Розглянемо наступне визначення цього параметра. Визначення. Міра семантичної оригінальності слова х,, яку будемо позначати /и(х ,) , визначається як кількість слів в описі інтерпретаційного розширення ] (х і ) , які вже визначені в словнику С . Міра семантичної оригінальності слова х , є максимальною, якщо в і ( х і) не існує ні одного хі з С . Міра оригінальності зменшується прямо пропорційно до збільшення кількості слів з С при формування опису і ( х , ) . Міра семантичної оригінальності визначається в діапазоні [0, 1] відповідно з наступним співвідношенням: ґ \ л т ц ( х.) = 1 , п де т - кількість слів з Сх в ](х і ) , п - загальна кількість слів в і(х і ) . Завдяки параметру /и(х і) існує можливість характеризувати окремі фрази мірою деталізації опису образу БО і або Б, ( т ) , який відповідна фаза описує. Цей параметр використовується при формуванні правил побудови речень, які складаються з ряду фраз. В рамках даного підходу існує можливість зв'язати з семантикою такий параметр як час. Суть цього параметра полягає в наступному. В процесі функціонування системи можуть формуватися нові слова, які представляють собою наступне по відношенню до системи: позначення того чи іншого узагальнення, яке доцільно використовувати при описі поточного функціонування системи, позначення нових процесів, які виникають в системі як результат розширення її функціональних можливостей чи процесів, що виникають в 98 системі в процесі її еволюції, слова, що позначають новий базовий елемент системи, який вводиться в систему при її модифікації. Введемо наступне визначення, що стосується часових аспектів, що пов'язуються з семантикою. Визначення. Семантичною координатою часу інформаційної системи будемо вважати умовно проведену вісь вздовж списку слів в словнику Сх. Початком відліку семантичного часу т будемо вважати точку на координаті часу, яка відповідає останньому по порядку слову в стовпці Сх, яке впроваджене як базове. Всі слова, які появляються в системі в процесі її функціонування, послідовно дописуються в список слів словника СЕ, продовжуючи умовну вісь часу новою точкою відліку. В цьому випадку семантичний інтервал часу, який проіснувала система протягом деякого фізичного інтервалу часу Аґ І, вимірюється кількістю нових слів, які появилися в системі, а точніше в текстових образах системи чи просто в семантичних та інформаційних компонентах системи. Будемо говорити, що т(дБ) є семантичним часом існування системи. Отже, якщо протягом певного часу функціонування системи остання обходиться тільки набором базових слів, а нові слова не з' являються, то будемо говорити, що така система в семантичному сенсі або часі не функціонує. Очевидно, що з кожним новим словом, що появляється в словнику СЕ, появляється новий інтервал часу семантичного функціонування системи. Величину семантичних інтервалів функціонування системи або інформаційної компоненти системи будемо визначати як різницю між семантичною оригінальністю поточного слова і попереднього слова, які з'являються в словнику СЕ. Величини семантичних інтервалів Ат(бБ) будемо формально описувати співвідношенням: т(ЗБі) = ц( хі) -ц( хі-і), де /и(хі-1) - міра семантичної оригінальності, що визначалась при попередньому розширенні словника СЕ, ц(хі) - міра оригінальності поточного семантичного розширення. Завдяки параметру Аті(8$і) можна встановити зв'язок між параметром ц(хі) і семантичним часом. А через параметр ц(хі) можна встановити зв'язок з параметром ст(хі). З метою більшого відображення семантичного часу розглянемо поняття швидкості зміни семантичного часу. Введемо уявлення про ознаки еволюційного розвитку системи. В кожний поточний момент система в цілому володіє певною сумарною семантичною значимістю, яка визначається по ефективному словнику Сх, яку можна обчислити по співвідношенню: 99 < = ( С ) = £<( х,.). І=і Крім того, в рамках інформаційних засобів телекомунікаційних систем існують описи образів БО, фрагментів предметної області, до якої відноситься система, що описуються співвідношеннями, побудованими на основі використання співвідношення (2), яке можна записати т п , = і , = і де <х(^,) обчислюється за допомогою співвідношення: ( п Л п 7(^1) = I X < ( х ) I & ( х ) - X ( < ( X )) ° 7 ( Х + і ) . В цьому випадку ознака еволюційного розвитку системи запишеться у вигляді співвідношення: [П(Б)], = { [ < ( Б ) ] , + і - [ 7 ( Б ) ] , } / [ Д Г , . ( ^ ) ] , . (3) Для кожної окремої реалізації телекомунікаційної системи на основі ознаки п(Б) можна встановити критерій здійснення еволюційного кроку, який задається у вигляді певного граничного значення для п(Б) . Таким чином можна записати наступне: К. (П) = (п(Б) - П - і ( Б ) ) - А , (4) де Ас - деяка гранична константа, що визначає величину зміни критерія еволюційного розвитку не менше, ніж на задану константу Ас. На змістовному рівні ц(Б) означає, що завдяки збільшенню семантичної значущості всієї системи, яка обумовлена введенням нових слів, що можуть позначати нові поняття, та яка не включає семантичну значущість самого словника С по відношенню до величини зміни оригінальності слів, які вводяться, або до величини семантичного часу системи, здійснюється прогресивний розвиток системи Б в цілому. Якщо такий прогресивний розвиток, що обчислюється у відповідності з співвідношенням (3), більший деякої заданої константи Ас , то має місце один крок еволюційного процесу в системі Б . Будемо позначати процес еволюційного розвитку системи у вигляді послідовності: Пі(Ке, Б) К , Б) ^ . . . ^ПтК, Б ) . Швидкість зміни семантичного часу в системі будемо визначати співвідношенням: V(Дт) = [ п ( К е , Б) - п + і ( К е , Б)] / Дґ,, де Дґ, - інтервал фізичного часу функціонування системи, протягом якого відбулася зміна рівня розвитку системи, в даному випадку еволюційного і00 розвитку системи рівна п ( К є , 8) = п ( К е , 8 ) - п + 1 ( К є , 8 ) . Якщо Дт не міняється, то це означає, що в рамках системи не відбувається розвитку. 1.Емельянов В.В.,Курейчик В.В.,Курейчик В.М. Теория и практика єволюционного моделирования.- М.:Физматгиз, 2003. 2.Олешко Т.І.Дослідження взаємозв'язку між інформаційною моделлю та базами даних, що входять в склад інформаційної технології. Захист інформації - 2005. Спецвипуск, с.30-35. Поступила 28.01.2009р. УДК 683.03 Б.В.Дурняк, Ю.М.Коростиль, Г.А.Максименко, В.И.Сабат ОСОБЕННОСТИ ФОРМИРОВАНИЯ КОМПОНЕНТ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ СИСТЕМ МОНИТОРИНГА Одной из главных компонент систем обобщённого мониторинга или расширенной системы мониторинга (ОСМ) является информационная модель социальных объектов (СО), а также и других компонент, которые используются в системе ОСМ. Особенностью такой информационной модели является способ её представления. Очевидно, что информационная модель, как и любая другая модель описывает определённые объекты. В соответствии с классическими представлениями о модели [1], последняя должна не только описывать моделируемый объект, но и моделировать процессы, которые происходят в объекте в процессе его функционирования. Одной из важных особенностей рассматриваемой информационной модели является способ описания объекта моделирования, который представляет собой составление текста описания на естественном языке. Поэтому, в дальнейшем будем под информационной моделью подразумевать текстовую информационную модель (ТИМ). Как принято, при составлении описания модели, будем её текстовое описание формировать в виде некоторой семантической иерархической структуры. Это означает, что в первую очередь будет формироваться самое общее описание моделируемого объекта. После этого описания будет размещаться описание более детальное с точки зрения их семантических значений. Этот процесс соблюдения иерархических уровней описания будет продолжаться до тех пор, пока в текстовом виде не окажутся описанными все детали и элементы моделируемого объекта, которые определяют точность или адекватность его моделирования. В этом описании отдельные уровни иерархии будут разделяться условными разделами, которые могут иметь своё отдельное текстовое описание, а элементы одного © Б.В.Дурняк, Ю.М.Коростиль, Г.А.Максименко, В.И.Сабат 101