Інформаційний підхід до аналізу структурного рівня мовної організації
Пропонується новий підхід до аналізу структурного рівня мовної організації, який спирається на структурно-функціональні особливості зорового тракту людини; це зумовлює нове бачення синтаксису, який подає формальне визначення базової семантико-синтаксичної структури як основи формування довільного по...
Збережено в:
Дата: | 2010 |
---|---|
Автор: | |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2010
|
Назва видання: | Штучний інтелект |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/58358 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Інформаційний підхід до аналізу структурного рівня мовної організації / Ю.І. Кисленко // Штучний інтелект. — 2010. — № 4. — С. 90-101. — Бібліогр.: 18 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-58358 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-583582014-03-23T03:01:57Z Інформаційний підхід до аналізу структурного рівня мовної організації Кисленко, Ю.І. Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск Пропонується новий підхід до аналізу структурного рівня мовної організації, який спирається на структурно-функціональні особливості зорового тракту людини; це зумовлює нове бачення синтаксису, який подає формальне визначення базової семантико-синтаксичної структури як основи формування довільного повідомлення, суперечливе розмежування «просте – складне» речення замінює чіткою дихотомією «монопредикатне – поліпредикатне» повідомлення, знімає проблему словосполучення та приводить всі наші знання стосовно мовної організації до чіткої системи. Предлагается новый подход к анализу структурного уровня организации языка, который базируется на структурно-функциональных особенностях нейронной организации зрительного тракта человека; это обусловливает новое видение синтаксиса, который представляет формальное определение базовой семантико-синтаксической структуры как основания формирования произвольного сообщения, противоречивое разбиение предложений на простые/сложные заменяет более четкой дихотомией «монопредикатное/полипредикатное» сообщение, снимает проблему словосочетания и приводит все наши знания относительно организации языка в стройную систему. The new approach offered to the analysis of structural level of language organization which is based on the structure-functional features of neuron organization of visual channel of man; it stipulates new vision of syntax which basic presents formal determination of base semantical-sintax structure as grounds of forming of arbitrary report, the contradictory breaking up of sentences on simple/complicated ones replaces by more clear dichotomy a «monopredicative/polipredicative» report, takes off the problem of combination of words and brings all our knowledges over in relation to organization of language in the orderly system. 2010 Article Інформаційний підхід до аналізу структурного рівня мовної організації / Ю.І. Кисленко // Штучний інтелект. — 2010. — № 4. — С. 90-101. — Бібліогр.: 18 назв. — укр. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/58358 004.934:007:811 uk Штучний інтелект Інститут проблем штучного інтелекту МОН України та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск |
spellingShingle |
Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск Кисленко, Ю.І. Інформаційний підхід до аналізу структурного рівня мовної організації Штучний інтелект |
description |
Пропонується новий підхід до аналізу структурного рівня мовної організації, який спирається на структурно-функціональні особливості зорового тракту людини; це зумовлює нове бачення синтаксису, який подає формальне визначення базової семантико-синтаксичної структури як основи формування довільного повідомлення, суперечливе розмежування «просте – складне» речення замінює чіткою дихотомією «монопредикатне – поліпредикатне» повідомлення, знімає проблему словосполучення та приводить всі наші знання стосовно мовної організації до чіткої системи. |
format |
Article |
author |
Кисленко, Ю.І. |
author_facet |
Кисленко, Ю.І. |
author_sort |
Кисленко, Ю.І. |
title |
Інформаційний підхід до аналізу структурного рівня мовної організації |
title_short |
Інформаційний підхід до аналізу структурного рівня мовної організації |
title_full |
Інформаційний підхід до аналізу структурного рівня мовної організації |
title_fullStr |
Інформаційний підхід до аналізу структурного рівня мовної організації |
title_full_unstemmed |
Інформаційний підхід до аналізу структурного рівня мовної організації |
title_sort |
інформаційний підхід до аналізу структурного рівня мовної організації |
publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
publishDate |
2010 |
topic_facet |
Интеллектуальные речевые технологии. Компьютерная обработка естественно-языковых текстов и семантический поиск |
url |
http://dspace.nbuv.gov.ua/handle/123456789/58358 |
citation_txt |
Інформаційний підхід до аналізу структурного рівня мовної організації / Ю.І. Кисленко // Штучний інтелект. — 2010. — № 4. — С. 90-101. — Бібліогр.: 18 назв. — укр. |
series |
Штучний інтелект |
work_keys_str_mv |
AT kislenkoûí ínformacíjnijpídhíddoanalízustrukturnogorívnâmovnoíorganízacíí |
first_indexed |
2025-07-05T09:33:35Z |
last_indexed |
2025-07-05T09:33:35Z |
_version_ |
1836798984817999872 |
fulltext |
«Искусственный интеллект» 4’2010 90
3К
УДК 004.934:007:811
Ю.І. Кисленко
Національний технічний університет «Київський політехнічний інститут»,
м. Київ, Україна
Інформаційний підхід до аналізу
структурного рівня мовної організації
Пропонується новий підхід до аналізу структурного рівня мовної організації, який спирається на струк-
турно-функціональні особливості зорового тракту людини; це зумовлює нове бачення синтаксису,
який подає формальне визначення базової семантико-синтаксичної структури як основи формування
довільного повідомлення, суперечливе розмежування «просте – складне» речення замінює чіткою
дихотомією «монопредикатне – поліпредикатне» повідомлення, знімає проблему словосполучення та
приводить всі наші знання стосовно мовної організації до чіткої системи.
Вступ
Бурхливий розвиток інформаційних технологій, починаючи з середини ХХ сто-
річчя і до сьогодення, не обійшов стороною і найбільш важливі та привабливі наукові
напрями дослідження інтелектуальної діяльності людини, зокрема ті, що пов’язані з
різними аспектами моделювання мовленнєвої діяльності. Весь кластер інформаційних
технологій, пов’язаних з моделюванням певних виявів багатогранної та різноаспект-
ної мовленнєвої діяльності людини, визначимо як природно-мовні інформаційні
технології (ПМ-технології). На жаль, всупереч нашим надіям та сподіванням, а також
всупереч тенденції «прогресивного прискорення» розвитку історії людства, а отже, і
технічного прогресу (Б.Ф. Поршнєв [1]), реальні досягнення на шляху створення цих
технологій не дуже обнадійливі.
Можемо подати перелік сучасних ПМ-технологій, що тим чи іншим чином
намагаються моделювати окремі сторони мовленнєвої діяльності людини. Цей клас
складають: системи інформаційного пошуку в INTERNET, інформаційно-пошукові
системи різної орієнтації, експертні системи, системи автоматичного перекладу, системи
опрацювання (синтез/аналіз) текстової інформації, системи опрацювання (синтез/
аналіз) мовленнєвої інформації, системи «розуміння» мовного повідомлення тощо.
Перелік завершують природно-мовний інтерфейс та системи подання і накопичення
знань, які свого часу були презентовані як пріоритетні напрями програми створення
комп’ютерів п’ятого покоління (стосовно функціонального рівня), проте які, на жаль,
так і не реалізовані ще й досі. Саме останні два напрями і будуть найбільш цікавими
для нас, бо концентрують в собі всі вузлові проблеми попередніх: перший з них – це
узагальнена система опрацювання ПМ-матеріалу, тоді як другий – визначає ПМ-базу
знань, де формується модель середовища, в якому живе людина. Сукупність обох
напрямів, власне, і визначає інформаційне ядро всіх технологій, орієнтованих на
опрацювання природно-мовної інформації.
Всі перелічені технології тим чи іншим чином пов’язані з моделюванням мов-
леннєвої поведінки людини – однієї з найбільш складних форм її інтелектуальної
діяльності. Мовленнєва діяльність, у загальному випадку, спирається на дві складові,
що визначають як наші знання стосовно мовної організації (умовно цю складову визна-
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 91
3К
чаємо як мовну компетенцію, що постає основою формування лінгвістичного процесо-
ра – ЛП), так і знання стосовно довкілля (що представлені у нашій пам’яті (БЗ) у вигляді
моделі світу). Будь-які прояви мовленнєвої діяльності людини (синтез чи аналіз мов-
ного повідомлення) обов’язково актуалізуються лише за умови діалектичної єдності
та взаємодії ЛП і БЗ; цілком природно, що і інформаційне забезпечення відповідних
технологій також повинне спиратися на взаємодію ЛП та БЗ.
Витоки парадигми класичної лінгвістики
В роботах автора [2], [3], присвячених питанням моделювання мовленнєвої
діяльності та розбудови відповідних інформаційних технологій, дається прискіпли-
вий аналіз як самого об’єкта дослідження (мовленнєвої діяльності людини), так і
сучасних технологій опрацювання символьної інформації. Висновок досить невтіш-
ний: з одного боку, об’єкт дослідження – мовленнєва діяльність людини – занадто
складний для розуміння дослідником, а з іншого – наші сучасні уявлення про мовну
організацію, що презентуються класичною лінгвістикою, ще значним чином не від-
повідають реаліям нашої мовної організації.
В цьому плані дуже симптоматичною вбачається оцінка досягнень класичної
лінгвістики, що озвучена М.В. Перцовим в «Першому московському лінгвістичному
альманасі»: «Класична лінгвістика зробила лише досить незначний внесок у справу
створення сучасних інформаційних ПМ-технологій» [4]). Тож, мабуть, і півстолітній
«ювілей» (50 – 60 років) негативного досвіду моделювання мовленнєвої діяльності
засвідчує, що класична лінгвістика ще не дійшла достатнього рівня розуміння інфор-
маційних процесів, які зумовлюють і супроводжують мовленнєву діяльність людини;
це змушує нас більш критично поглянути на її надбання і оцінити їх відповідним
чином.
Окрім цього, на думку автора, є ще одна принципова вада сучасних ПМ-техно-
логій, яка ніяким чином не виходить поки що на рівень свого вирішення. Йдеться
про те, що мовленнєва діяльність людини актуалізується індивідуальною мовною
системою (ІМС) кожного носія мови (Л.В. Щерба [5]), яка спирається, з одного боку,
на знання щодо особливостей мовної організації (на свідомому чи підсвідомому
рівні), а з іншого – на знання стосовно узагальненої моделі середовища, в якому
живе, працює і спілкується людина; знання ці часто подаються у формі мовного
матеріалу. ІМС забезпечує актуалізацію мовленнєвої діяльності людини як в режимах
синтезу (мовлення), так і аналізу (розуміння) мовного повідомлення (усного чи пись-
мового, звичайно). Для нас важливим буде зауваження Л.В. Щерби, що це – процеси
одного рівня складності і для їх розуміння обов’язковим є звернення до рівня нейро-
психології людини.
Важлива також думка В.А. Звєгінцева, що мова має надскладну організацію,
яка може бути проаналізована лише з позицій триєдності мислення, мови та зов-
нішнього світу [6]. Власне, пророчою постає думка Б.Ю. Городецького [7], що однією з
найважливіших функцій мови є організація та подання знань і без урахування інфор-
маційних процесів, що супроводжують мовленнєву діяльність і відбуваються на ней-
ронному рівні, ми можемо обходитися лише до певного часу. Мабуть, саме і настав
той час, коли для розуміння мовленнєвої діяльності нам не вистачає знань як стосовно
інформаційних процесів, так і стосовно структурно-функціональної організації нейрон-
них структур, які, власне, і актуалізують ці процеси. Такий підхід, що спирається
на аналіз інформаційних процесів, які супроводжують мовленнєву діяльність
Кисленко Ю.І.
«Искусственный интеллект» 4’2010 92
3К
людини, ми і визначатимемо надалі як інформаційний. Цей підхід, власне, і постає
як закономірний етап подальшого розвитку та поглиблення наших знань стосовно
мовної організації.
Ретельний аналіз здобутків класичної лінгвістики в плані аналізу структурної
організації мовного матеріалу (ММ) виконано автором в роботі [3]. Нижче, на рис. 1
(права частина), подані найбільш критичні зауваження визнаних авторитетів стосовно
поточного стану наших знань щодо мовної організації. По-перше, впадає в очі відсут-
ність системності в наших знаннях стосовно мовної організації та ієрархії структурних
одиниць; по-друге, дуже важливим вбачається зауваження Л.І. Астахової (Дніпро-
петровський державний університет) [8] стосовно суперечливої дихотомії «просте –
складне речення», що не задовольняє багатьом вимогам практики і вже заперечуєть-
ся багатьма фахівцями; по-третє, тут озвучена кардинальна пропозиція про перегляд
(переоцінку) самого об’єкта дослідження синтаксису. З урахуванням також інших
проблемних питань (статус словосполучення, наявність на сьогоднішній день близько
300 визначень простого речення, відсутність чіткої системи в наших знаннях стосовно
структурного рівня організації ММ) важливо прискіпливо оцінити сучасну парадигму
наших знань стосовно мовної організації та простежити витоки формування сучасної
класичної лінгвістики.
Картина становлення та формування класичної лінгвістики з урахуванням най-
важливіших її особливостей практично випливає з аналізу рис. 1, де зіставляється
сучасна лінгвістична парадигма з інформаційним підходом (ретельно це питання ана-
лізується в роботі [3]). Тут ми акцентуємо увагу лише на найважливіших положен-
нях. Ще раз наголошуємо, що аналіз, власне, виконується з узагальнених позицій
мовленнєвої діяльності людини і спирається на обидві складові функціонування ІМС –
синтез та аналіз мовного повідомлення.
Цілком природно, що витоки наших знань стосовно мовної організації беруть
початок з аналізу структурної організації мовного матеріалу множини текстів.
Перше кваліфіковане дослідження структурного рівня організації мови виконане
було ченцями монастиря в «полях під Парижем» і презентоване граматикою Пор-
Рояля, що стала еталоном знань стосовно мовної організації для всієї Європи майже
на сто років. Ченці відразу ж відчули складність мовної організації, відзначивши рекур-
сивний характер організації мовного матеріалу (це – плюс!), але водночас як елемент
рекурсії ввели невизначений структурний елемент – словосполучення (це – великий
мінус, з яким не знаємо, як впоратися ще й досі!).
Але що важливо підкреслити – дослідники працювали з великими обсягами гото-
вих текстів, кожен з яких виступав кінцевим продуктом потужної інтелектуальної
діяльності конкретного автора або групи авторів. Тобто витоки класичної лінгвістики
криються в глибинах текстового океану, і всі сучасні граматики побудовані прак-
тично за результатами аналізу готових текстів. А де ж синтез, де знання про основні
закони формування мовного матеріалу?
Коли ж врахувати визнаний факт, що головна функція мови – комунікативна, а
мова, власне, – це універсальна (символьна) схема відтворення наших знань, отриманих
на сенсорному (образному) рівні, то напрошується напрочуд чіткий та прозорий висно-
вок: невже структурно-функціональний рівень організації наших систем сприйняття
довкілля не впливає на структурну організацію кінцевого продукту нашої мовленнєвої
діяльності – мовного матеріалу? Особливо це стосується нейронної організації нашого
зорового тракту, через який людина сприймає та опрацьовує близько 80 – 90 відсотків
інформації, що накопичується та зберігається в пам’яті людини. Поступово такий
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 93
3К
підхід автора, що формувався спочатку на суто евристичному (інтуїтивному) рівні,
знайшов підтримку на шляху дослідження онтогенезу мови у дитини (фундаментальні
дослідження О.М. Гвоздєва [11]), а згодом здобув вже потужну підтримку з боку нейро-
фізіологічних досліджень структурно-функціонального рівня організації зорового
тракту людини. Головна теза такого підходу, що структурна організація мовного
матеріалу є похідною від структурно-функціонального рівня нейроорганізації
зорового тракту людини, аргументовано викладена в роботі автора [9].
Урахування лише небагатьох найбільш важливих, давно відомих та загальновиз-
наних властивостей окремих складових зорового тракту людини дозволило значним
чином зкорегувати наші знання щодо структурного рівня організації мови і привести
їх до стрункої системи – власне запропонувати інший підхід до аналізу структури мов-
ного повідомлення. Такий інформаційний підхід, орієнтований певним чином на ураху-
вання особливостей процедури синтезу мовного повідомлення людиною, і зумовлює
нове бачення структурного рівня організації мовного матеріалу, тобто продукує новий
синтаксис – граматику синтезу – на противагу класичній лінгвістиці, яку можемо
вважати граматикою аналізу.
Інформаційний підхід до аналізу мовної організації
Результати такого підходу до структурного рівня організації мовного матеріалу
презентуються рис. 1 (ліва його сторона) та оприлюднені в матеріалах робіт [9] та [10].
З нейрофізіологічних позицій аналізу структурно-функціонального рівня зорового
тракту формально визначено поняття та обсяг окремої ситуації як елемента сприй-
няття довкілля людиною на образному рівні.
Вербалізація (трансляція на мовний рівень) окремої ситуації реалізується єди-
ним стандартним синтаксичним штампом – базовою семантико-синтаксичною
структурою (БССС), що отримує однозначне визначення на формальному, вербаль-
ному та графічному рівнях. Формальне визначення та використання цієї синтаксичної
одиниці дозволило автору замінити усталене суперечливе розмежування сучасних
граматик просте – складне речення значно більш чіткою дихотомією монопреди-
катне – поліпрекдикатне повідомлення. Тож структурний рівень організації мовного
матеріалу уявляється досить стрункою системою, що спирається на єдиний стандарт-
ний синтаксичний шаблон – базову структуру SBO. Власне це і визначає новий під-
хід до аналізу структурного рівня організації мовного матеріалу, що спирається, певним
чином, на особливості синтезу вербалізованої форми окремої ситуації реального або
віртуального світів.
Модель спочатку оприлюднена була в роботі «Системна організація мови» [11],
більш розширений варіант з урахуванням уже певних особливостей опрацювання
зорової інформації та інтеграції інформації образного і символьного рівнів поданий в
роботі «Архітектура мови» [12], в роботі «Нейрофізіологічне підґрунтя структурної
організації мовного матеріалу» [9] вже певним чином зіставляються формалізми запро-
понованого підходу до структурного рівня організації ММ з особливостями опрацю-
вання інформації образного рівня, що дозволило, у свою чергу, прокласти далі місток
від мислення до знання (робота «Від думки до знання» [10]). Головні здобутки інформа-
ційного підходу порівняно з аналізом особливостей класичної лінгвістики представ-
лені на рис. 1; найважливіші штрихи обох підходів поєднані тут з метою кращого їх
зіставлення.
Кисленко Ю.І.
«Искусственный интеллект» 4’2010 94
3К
Рисунок 1 – Порівняльна характеристика інформаційного підходу
та класичної лінгвістики
Текст
Теза:
через мову
пізнаємо
д
Теза:
через людину
пізнаємо мову
Сенсорний
рівень
сприйняття
інформації
ЛП БЗ
Інформаційний підхід Класична
лінгвістика
Середо-
вище
Сенсорний рівень опрацювання
інформації
(граматика синтезу повідомлення)
Тексти як застиглі пам’ятники мовної
діяльності
(граматика аналізу повідомлення)
Досягнення інформаційного підходу Невирішені проблеми сучасної лінгвістики
1. На сенсорному рівні вдається формально
визначити поняття ситуації; тоді структурна
організація мови постає похідною від нейронного
рівня організації зорового тракту.
1. Мова – це система взаємопов’язаних
одиниць різних рівнів, де мало розумного,
логічного порядку. Уїтні, Ф. де Соссюр.
2. Подано формальне визначення базової
семантико-синтаксичної структури (БССС) як
єдиного уніфікованого синтаксичного шаблону
опису довільної ситуації.
2. Мовознавство є не експериментально-
теоретичною (заснованою на масовій обробці
емпіричного матеріалу), а переважно описово-
спекулятивною наукою. Р.Г. Піотровський.
3. Все структурне розмаїття організації мовного
матеріалу визначається на монопредикатному
(трансформації БССС) або поліпредикатному
(схеми поєднання структур БССС) рівнях.
3. Багаторічна критика положень формальної
граматики підготувала суспільну психологію
до заперечення існуючої теорії речення.
Важливо чітко визначити об’єкт синтаксичних
досліджень. Л.І. Астахова.
4. Вирішується проблема словосполучення; тоді
довільний текст може бути поданий у вигляді
рекурсивно-організованої структури, де
елементом рекурсії постає БССС.
4. Всі сучасні знання відносно організації мови
не вдається розглядати з позицій єдиної
несуперечливої системи. Граматика-70.
5. Визнання БССС основою структурної
організації мовного матеріалу дозволяє звести всі
накопичені знання до чіткої системи.
5. До цього часу лишається невирішеною
проблема словосполучення, а разом з нею і
проблема рекурсивної організації мовного
матеріалу. Граматика Пор-Рояля.
Структурна
організація
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 95
3К
Визначення ситуації
На рівні сприйняття та опрацювання образної (зорової) інформації вдалося
формально визначити поняття ситуації як одиниці сприйняття довкілля на сенсор-
ному рівні.
Ситуація – це фрагмент зорової складової довкілля, що попадає виключно на
центральну ямку нашої ретини. Особливість цього фрагмента в тому, що він охо-
плює не більше десяти (7 – 8) складових, які опрацьовуються одночасно з виділен-
ням у подальшому на рівні зорової кори головного мозку (КГМ) множини прикмет
цих складових та визначенням їх міри. Коли дійсність існує в триєдності часу,
простору та дії, то і наші сенсорні системи для адекватного відтворення світу також
повинні виокремлювати дію з урахуванням її атрибутів та визначенням їх міри
(Семір Зекі [13]). Окрема ситуація окреслена тут ще на образному рівні (метамова з
посиланням на О.О. Кришталя [14]).
Базова структура як вербалізована форма опису ситуації
Трансляція окремої ситуації з образного рівня на символьний (перехід з рівня
метамови на мову природну) реалізується вже ІМС з урахуванням нашої мовної
компетенції за допомогою єдиного стандартного структурного штампа – БССС.
Важливо тут підкреслити, що трансляція з образного рівня на символьний охоплює
всі складові, що визначені на сенсорному рівні, тобто вербалізації підлягають всі
елементи ситуації (об’єкти, суб’єкти, дія), кожен з яких актуалізований, у загальному
випадку, на атрибутивному рівні з визначенням їх міри. Власне, аналіз особливостей
переходу від образного до символьного рівня і дозволив нам синтезувати формальне
визначення базової семантико-синтаксичної структури як узагальненого синтаксичного
штампа опису довільної ситуації. Цей синтаксичний штамп – БССС – визначений на
вербальному, графічному та формальному рівнях.
Змістовний рівень визначення БССС. Базова семантико-синтаксична струк-
тура (синтаксичний блок SBO – за нашою нотацією) – це двоскладова монопредикатна
схема опису довільної ситуації реального або віртуального світу, всі складові якої
актуалізовані виключно на атрибутивному рівні.
Графічний рівень визначення БССС. Графічний «портрет» БССС відтво-
рюється на рис. 2. Ретельний аналіз структури SBO презентовано роботами [11], [12];
тут вкажемо лише найважливіші особливості. Перша складова (активний суб’єкт
Subj) через відношення Ro пов’язана з n-актантним предикатом Р – узагальненою
характеристикою дії, актуалізованою предикатором Pred на множині актантів. Одна
частина актантів (що пов’язана з ядром Pred через предикативні відношення R1,
R2,…,RК), залежить від конкретного предикатора, тоді як інша (що пов’язана з ядром
відношеннями r1, r2,…, rm) буде узагальненою характеристикою всієї ситуації і
визначатиметься як обставини актуалізації ситуації (сірконстанти – за Л. Теньєром [15]).
У загальному випадку, кількість актантів n = к + m не перевищує семи-восьми ком-
понент. Кожна із складових може бути актуалізована на атрибутивному рівні, що
включає як, власне, атрибути складових Attr(Obj) або Attr(Mov), так і значення їх
міри Attr(Attr). Досвід майже десятирічного спілкування зі студентською аудиторією
засвідчує, що саме графічна інтерпретація БССС (яка поєднує в собі особливості де-
ревовидних структур та безпосередньо складових) найефективніше сприймається та
запам’ятовується студентами.
Кисленко Ю.І.
«Искусственный интеллект» 4’2010 96
3К
Рисунок 2 – Базова семантико-синтаксична структура
Subj – суб’єкт базової структури, P – предикат, Pred – предикатор (ядро
базової структури, актуалізоване дієсловом), R0 – головне відношення
структури – «мати предикат», R1, R2,…, Rn, – предикативні відношення,
r1, r2,…, rm – ситуаційні відношення (сірконстанти), де 1 < n + m < 8
Формальний рівень визначення БССС. На формальному рівні синтаксичний
шаблон БССС подається з урахуванням нотації бульової алгебри. Кожна складова
ситуації Subj, Obj, Mov визначається своїм іменем, множиною прикмет Attr(Obj) або
Attr(Mov) відповідно, які, у свою чергу, можуть мати певну міру Attr(Attr). Тому
опис окремої складової розпочинати слід з формування атрибутивного рівня. Варіанти
подання інформативних прикмет (з урахуванням їх пре/постпозиції відносно імені)
можуть бути узагальнені наступним чином. Для атрибутивного рівня опису об’єк-
та/суб’єкта матимемо варіанти
Attr(Obj) = Attr(Obj) / Attr (Attr) * Attr(Obj) / Attr(Obj) * Attr (Attr), (1)
тоді як для відтворення атрибутивного рівня опису дії аналогічним чином матимемо
Attr(Mov) = Attr(Mov) / Attr (Attr)*Attr(Mov) / Attr(Mov)*Attr (Attr). (2)
Варіанти опису атрибутивного рівня (1), (2) подані з урахуванням поки що
однієї прикмети; у загальному випадку треба враховувати можливість одночасного
використання кількох прикмет; це враховується відповідною нотацією ATTR(Obj) та
ATTR(Mov). Тоді узагальнені варіанти опису складових на множині прикмет можуть
бути подані наступним чином
OBJ = Obj / ATTR(Obj) * Obj / Obj * ATTR(Obj) /
ATTR(ATTR) * ATTR(Obj) * Obj / (3)
ATTR(Obj) * ATTR(ATTR) * Obj /
Obj * ATTR(ATTR) * ATTR(Obj) /
Obj * ATTR(Obj) * ATTR(ATTR) ,
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 97
3К
MOV = Mov / ATTR(Mov) * Mov / Mov * ATTR(Mov) /
ATTR(ATTR) * ATTR(Mov) * Mov / (4)
ATTR(Mov) * ATTR(ATTR) * Mov /
Mov * ATTR(ATTR) * ATTR(Mov) /
Mov * ATTR(Mov) * ATTR(ATTR) .
Після цього вже з урахуванням формалізмів (1 – 4) можемо подати узагальнену
схему опису окремої ситуації, тобто визначити базову семантико-синтаксичну струк-
туру SBO. Особливість такого подання синтаксичної структури у тому, що це – уза-
гальнена схема вербалізації довільної ситуації, яка актуалізована на узагальнених
варіантах опису окремих її складових:
SBO =
SUBJ – PRED – (Ri * OBJi, i=1,n) – (rj * OBJj, j=1,m), где
SUBJ/OBJ = Obj / ATTR(Obj) * Obj / Obj * ATTR(Obj) /
ATTR(ATTR)*ATTR(Obj)*Obj /ATTR(Obj)*ATTR(ATTR)*Obj /
Obj*ATTR(ATTR)*ATTR(Obj) / Obj*ATTR(Obj)*ATTR(ATTR) ,
PRED = Mov / ATTR(Mov) * Mov / Mov * ATTR(Mov) / (5)
ATTR(ATTR)*ATTR(Mov)*Mov/ATTR(Mov)*ATTR(ATTR)*Mov /
Mov*ATTR(ATTR)*ATTR(Mov)/Mov*ATTR(Mov)*ATTR(ATTR),
1 <i <7, 1<j<7, 1<i+j<7.
Відмінність БССС від простого речення
Важливо тепер підкреслити відмінність поняття базової семантико-синтаксичної
структури SBO від концепції простого речення, що склалася в класичній лінгвістиці.
По-перше, БССС – це похідна від структурно-функціонального рівня нейро-
організації нашого зорового тракту, тоді як структура простого речення визначається
як середньостатистична похідна від узагальнення структурної організації окремого
мовного повідомлення, що випливає з аналізу множини вибірок на значних обсягах
текстів.
По-друге, елементами такої структури у загальному випадку виступатимуть
повні описи складових з урахуванням їх імен, прикмет та міри цих прикмет (атри-
бутивний рівень відтворення складових), тоді як складовими простого речення по-
стають або слова, або словосполучення – лінгвістична категорія, що не має чіткого
статусу ще й досі.
По-третє, БССС постає як узагальнена схема відтворення довільної ситуації
довкілля, тоді як аналіз структурної організації простого речення (для всіх граматик
сучасних, без винятку) починається від опису найпростіших ситуацій і йде до
складних, намагаючись у подальшому охопити всі варіанти ускладнення. Це, мабуть,
одна з найвразливіших вад сучасних граматик, бо, маючи у своєму арсеналі близько
трьохсот визначень простого речення на даний момент, сучасні граматики так і не
змогли вийти на достойний рівень узагальнення структури окремого повідомлення.
А справа тут у тому, що лише сама БССС з урахуванням тільки одного компонента
атрибутивного рівня може бути актуалізована (для флективних мов) близько сорока
мільярдами (40 х 109) варіантів. Проте, йдучи від аналізу найпростіших схем опису
ситуацій до складних, класична лінгвістика так і не змогла вийти на достойний
рівень структурного узагальнення, бо тоне в цьому проклятті багатовимірності. У на-
шому ж випадку (інформаційний підхід) ми йдемо у протилежному напрямі: визна-
Кисленко Ю.І.
«Искусственный интеллект» 4’2010 98
3К
чивши відразу ж узагальнену схему опису довільної ситуації, будь-яку іншу ми вже
розглядатимемо як певний варіант загальної схеми.
Отже, базова семантико-синтаксична структура як узагальнений синтаксичний
штамп опису довільної ситуації постає центральним поняттям (ядром) інформацій-
ного підходу і визначає, власне, структурний рівень організації довільного пові-
домлення, а отже – і всього мовного матеріалу.
Монопредикатний рівень повідомлення
Далі, як кажуть, все дуже просто – є монопредикатний та поліпредикатний
рівні організації мовного матеріалу. Колись Ф. де Соссюр стосовно структурної
організації нашої мови висловився теж дуже лаконічно: синтаксис – це дуже просто;
можливо, в його уяві все й було саме так, проте цю «простоту» ні він, ні його учні
так і не змогли актуалізувати в текстах і донести до читача.
Монопредикатний рівень – це цілий пласт структурного рівня організації
мовного матеріалу, що не виходить за межі одного предиката, тобто, не перевищує
обсягу базової структури; по суті – це певні варіанти трансформування БССС, де
відсутні окремі складові (явище згортки окремих елементів структури, що однозна-
чно сприймаються як мовцем, так і реципієнтом). Згортатися можуть практично всі
складові базової структури (як окремо – суб’єкт, об’єкт, предикатор, так і в певних
комбінаціях). Багато в чому явище згортки виступає підґрунтям формування полі-
предикатного рівня організації повідомлення, бо на монопредикатному рівні такі
конструкції в чистому вигляді зустрічаються не дуже часто. Досить ретельно моно-
предикатний рівень презентовано у монографіях автора [11], [12]; це десь близько
трьох десятків трансформацій базової структури.
Поліпредикатний рівень організації повідомлення
Коли монопредикатний рівень формальної моделі ще більш-менш збігається з
межами простого речення класичної лінгвістики (не виходячи на рівень ускладнення),
то поліпредикатна інтерпретація структур ММ значно відрізняється від категорії склад-
ного речення сучасних граматик. Більш ретельний аналіз поліпредикатного рівня
формування ММ читач знайде знову ж таки в роботах [11], [12], а тут лише проана-
лізуємо головні відмінності інформаційного підходу стосовно класичної лінгвістики.
Поліпредикатну інтерпретацію отримують: речення з однорідними членами
речення (подібний підхід до аналізу цього явища знаходимо ще у «Структурному
синтаксисі» Л. Теньєра [16]); різні схеми ускладнення предикатора; різної довжини
ланцюжки родового відмінку, що фіксують множину статичних відношень; окрему,
досить компактну групу формують явища субстантивації, адвербіалізації, ад’єктивації,
що практично збігаються з особливостями організації складнопідрядного речення.
До поліпредикатного рівня входять практично всі конструкції, які до цього часу
визначалися як словосполучення [11], [12]. Важливо тут підкреслити лише одну
особливість: коли окрема складова середовища на образному рівні сприймалася люди-
ною як певна цілісність оболонки, множини прикмет та їх міри, то для адекватного
відтворення цієї цілісності на мовному рівні обов’язковою умовою постає структурна
єдність мовних засобів (N * Attr(N) * Attr(Attr)), яка постає апріорі умовою повного
опису складової і не вважатиметься словосполученням (за винятком хіба що ідіома-
тичних словосполучень).
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 99
3К
Ри
су
но
к
3
–
Д
ек
ом
по
зи
ці
я
мо
вн
ог
о
по
ві
до
мл
ен
ня
за
б
аз
ов
им
и
ст
ру
кт
ур
ам
и
Кисленко Ю.І.
«Искусственный интеллект» 4’2010 100
3К
Сукупність структур моно/поліпредикатного рівнів охоплює всі різновиди
структурного оформлення довільного повідомлення ММ; звідси матимемо дуже
потужний конструктивний висновок: весь ММ практично є похідною від єдиної
базової семантико-синтаксичної структури. Підтвердженням цього факту є значний
обсяг проаналізованих конкретних повідомлень реальних текстів, що засвідчують
рекурсивну схему організації ММ, де елементом рекурсії постає єдиний синтаксич-
ний штамп – базова семантико-синтаксична структура SBO. В роботі [17] презенто-
вана була процедура декомпозиції довільного текста. Рис. 3 подає на графічному рівні
результат аналізу оригінального тексту Ф.М. Достоєвського з «Ідіота» за базовими
структурами. Знаючи стиль письменника, можемо засвідчити компетентно, що, дійсно,
довільний мовний матеріал (повідомлення будь-якої складності) розбивається за син-
таксичними структурами одного кшталту. Ось відповідь на питання, чому людина
так впевнено опановує і користується мовою – дитина вже у віці двох-трьох років
ефективно опановує стандартну схему синтаксичнго оформлення довільного повідом-
лення (А.Н. Гвоздєв [18]) і впевнено користується нею (на підсвідомому рівні,
мабуть більше) протягом всього свідомого життя, часом її трансформуючи трохи або
поєднуючи в одному повідомленні кілька таких структур. Проте можливість актуа-
лізації лише однієї такої структури аж сорока мільярдами варіантів з урахуванням
допоміжних варіантів видозмін на моно/поліпредикатному рівнях дійсно забезпечує
нам неповторну гнучкість та ефективність мовної організації.
Висновки
Інформаційний підхід дозволив поглянути на надбання сучасної класичної
лінгвістики (здобуті на шляху прискіпливого аналізу величезних обсягів мовного
матеріалу) через призму структурно-функціональної організації нейронного тракту
системи сприйняття та опрацювання зорової інформації, що, врешті-решт, і визначає
багато в чому структурні особливості вербалізованої форми подання наших знань.
Поєднання здобутків класичної лінгвістики з результатами дослідження нейронної
організації зорового тракту виявилося плідною основою для корегування наших знань
стосовно структурної організації ММ, а отже – і для нового бачення синтаксису
мови, де вже чітко окреслено поняття ситуації; подано формальне визначення опису
довільної ситуації у вигляді стандартного синтаксичного штампа БССС (на вербаль-
ному, графічному та формальному рівнях); проаналізовані можливі різновиди трансфор-
мування цієї структури (монопредикатний рівень) та вказані схеми їх взаємозв’язку
(поліпредикатний рівень організації ММ). У загальному випадку довільний ММ
подається у вигляді рекурсивної організації, де елементом рекурсії буде БССС, а
не аморфна та невизначена категорія словосполучення.
Окрім цього, запропонований підхід постає продуктивною основою моделювання
мовленнєвої діяльності людини, а отже – і формування інформаційних ПМ-технологій,
бо, з одного боку, на формальний рівень він переводить знання про мовну організацію,
що забезпечує можливість створення лінгвістичного процесора, а з іншого – постає ос-
новою створення ПМ-бази знань, де формується узагальнена модель зовнішнього сере-
довища. Обидві ці складові, формуючись та розвиваючись в діалектичній єдності і
працюючи одна на одну, власне, і складають індивідуальну мовну систему (згадаймо
з вдячністю Л.В. Щербу), яка забезпечує мовленнєву діяльність людини і урахування
якої є принципово необхідним для моделювання мовленнєвої діяльності людини.
Інформаційний підхід до аналізу структурного рівня мовної організації
«Штучний інтелект» 4’2010 101
3К
Література
1. Поршнев Б.Ф. О начале человеческой истории (проблемы палеонтологии) / Б.Ф. Поршнев. – М. :
Мысль, 1974. – 487 с.
2. Кисленко Ю.И. Перспективы развития естественно-языковых технологий / Ю.И. Кисленко //
Системні дослідження та інформаційні технології. – 2004. – № 2. – Інститут прикладного
системного аналізу НАН України та Міносвіти і науки.
3. Кисленко Ю.И. О моделировании речевого поведения / Ю.И. Кисленко // Искусственный интел-
лект. – 2004. – № 1. – С. 173-195.
4. Перцов Н.В. О некоторых проблемах современной семантики и компьютерной лингвистики /
Н.В. Перцов // Московский лингвистический альманах. – 1996. – Вып. 1. – С. 9-66.
5. Щерба Л.В. О трояком аспекте языковых явлений и эксперименте в языкознании / Л.В. Щерба //
Языковая система и речевая деятельность. – М., 1974.
6. Звегинцев В.А. Предложение и его отношение к языку и речи / Звегинцев В.А. – М. : Изд. МГУ,
1976. – 308 с.
7. Компьютерная лингвистика: моделирование языкового общения : пер. с англ. / [сост., ред. и вступ. ст.
Б.Ю. Городецкого]. – Серия «Новое в зарубежной лингвистике». – М. : Прогресс, 1989. – Вып. 24. – 432 с.
8. Астахова Л.И. Предложение и его членение (прагматика, семантика, синтаксис) / Астахова Л.И. –
Днепропетровск : Днепропетровский ГУ, 1992. – 160 с.
9. Кисленко Ю.І. Нейрофізіологічне підгрунтя структурної організації мовного матеріалу / Ю.І. Кис-
ленко // Доповіді НАН України. – 2007. – № 11. – С. 158-164.
10. Кисленко Ю. От мысли к знанию (нейрофизиологические основания) : монография / Кисленко Ю. –
К. : Издательство «Український літопис», 2008. – 101 с.
11. Кисленко Ю.І. Системна організація мови : монографія / Кисленко Ю.І. – К. : Український літопис,
1997. – 217 с.
12. Кисленко Ю.І. Архітектура мови (лінгвістичне забезпечення інтелектуальних інтегрованих сис-
тем) : учбовий посібник / Кисленко Ю.І. – К. : Віпол, 1998. – 343 с.
13. Зеки Семир. Зрительный образ в сознании и мозге / Зеки Семир // В мире науки. – 1992. – № 11-12. –
С. 33-41.
14. Крышталь Олег. К пению птиц. Академическая проза / Олег Крышталь. – СПб. : Борей – Арт, 2001. – 300 с.
15. Теньєр Л. Основы структурного синтаксиса / Теньєр Л. – М. : Прогресс, 1988.
16. Ф. де Сосcюр. Курс общей лингвистики / Ф. де Сосcюр; [пер. со 2-го фр.издания]. – М., 1963.
17. Кисленко Ю.И. Рекурсивный синтаксический анализатор / Ю.И. Кисленко // Науковий вісник ка-
федри ЮНЕСКО Київського державного лінгвістичного університету. – 2000. – Вип. 1. – С. 157-164.
18. Гвоздев А.Н. Формирование у ребенка грамматического строя русского языка / Гвоздев А.Н. –
М. : Изд-во АПН, 1949.
Ю.И. Кисленко
Информационный подход к анализу структурного уровня организации языка
Предлагается новый подход к анализу структурного уровня организации языка, который базируется
на структурно-функциональных особенностях нейронной организации зрительного тракта человека;
это обусловливает новое видение синтаксиса, который представляет формальное определение базовой
семантико-синтаксической структуры как основания формирования произвольного сообщения,
противоречивое разбиение предложений на простые/сложные заменяет более четкой дихотомией
«монопредикатное/полипредикатное» сообщение, снимает проблему словосочетания и приводит все
наши знания относительно организации языка в стройную систему.
Yu. Kislenko
Informative Approach to the Analysis of Structural Level of Language Organization
The new approach offered to the analysis of structural level of language organization which is based on the
structure-functional features of neuron organization of visual channel of man; it stipulates new vision of
syntax which basic presents formal determination of base semantical-sintax structure as grounds of forming
of arbitrary report, the contradictory breaking up of sentences on simple/complicated ones replaces by more
clear dichotomy a «monopredicative/polipredicative» report, takes off the problem of combination of words
and brings all our knowledges over in relation to organization of language in the orderly system.
Стаття надійшла до редакції 21.06.2010.
|