Математическое описание словоизменительной классификации грамматических категорий в итальянском языке
В статье рассматривается проблема построения формализованных словоизменительных классификаций на примере итальянского языка. Приведена система признаков (грамматических категорий), которые определяют словоизменение указанных классов слов. При разработке модели учитываются все значения, которые эти п...
Gespeichert in:
Datum: | 2012 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут проблем штучного інтелекту МОН України та НАН України
2012
|
Schriftenreihe: | Штучний інтелект |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/57740 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Математическое описание словоизменительной классификации грамматических категорий в итальянском языке / Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова // Штучний інтелект. — 2012. — № 4. — С. 264-271. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-57740 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-577402014-03-15T03:01:24Z Математическое описание словоизменительной классификации грамматических категорий в итальянском языке Четвериков, Г.Г. Вечирская, И.Д. Фёдорова, Т.Н. Анализ и синтез коммуникационной информации В статье рассматривается проблема построения формализованных словоизменительных классификаций на примере итальянского языка. Приведена система признаков (грамматических категорий), которые определяют словоизменение указанных классов слов. При разработке модели учитываются все значения, которые эти признаки (категории) могут принимать. У статті розглядається проблема побудови формалізованих словозмінних класифікацій на прикладі італійської мови. Наведено систему ознак (граматичних категорій), які визначають словозміну зазначених класів слів. При розробці моделі враховуються всі значення, які ці ознаки (категорії) можуть приймати. The article considers the problem of constructing a formal inflectional classification as an example of Italian language. Shows the system of attributes (grammatical categories), which determine the inflection of the word classes. In developing the model takes into account all the values that these attributes (categories) can take. 2012 Article Математическое описание словоизменительной классификации грамматических категорий в итальянском языке / Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова // Штучний інтелект. — 2012. — № 4. — С. 264-271. — Бібліогр.: 7 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/57740 004.89:004.93 ru Штучний інтелект Інститут проблем штучного інтелекту МОН України та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации |
spellingShingle |
Анализ и синтез коммуникационной информации Анализ и синтез коммуникационной информации Четвериков, Г.Г. Вечирская, И.Д. Фёдорова, Т.Н. Математическое описание словоизменительной классификации грамматических категорий в итальянском языке Штучний інтелект |
description |
В статье рассматривается проблема построения формализованных словоизменительных классификаций на примере итальянского языка. Приведена система признаков (грамматических категорий), которые определяют словоизменение указанных классов слов. При разработке модели учитываются все значения, которые эти признаки (категории) могут принимать. |
format |
Article |
author |
Четвериков, Г.Г. Вечирская, И.Д. Фёдорова, Т.Н. |
author_facet |
Четвериков, Г.Г. Вечирская, И.Д. Фёдорова, Т.Н. |
author_sort |
Четвериков, Г.Г. |
title |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
title_short |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
title_full |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
title_fullStr |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
title_full_unstemmed |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
title_sort |
математическое описание словоизменительной классификации грамматических категорий в итальянском языке |
publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
publishDate |
2012 |
topic_facet |
Анализ и синтез коммуникационной информации |
url |
http://dspace.nbuv.gov.ua/handle/123456789/57740 |
citation_txt |
Математическое описание словоизменительной классификации грамматических категорий в итальянском языке / Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова // Штучний інтелект. — 2012. — № 4. — С. 264-271. — Бібліогр.: 7 назв. — рос. |
series |
Штучний інтелект |
work_keys_str_mv |
AT četverikovgg matematičeskoeopisanieslovoizmenitelʹnojklassifikaciigrammatičeskihkategorijvitalʹânskomâzyke AT večirskaâid matematičeskoeopisanieslovoizmenitelʹnojklassifikaciigrammatičeskihkategorijvitalʹânskomâzyke AT fëdorovatn matematičeskoeopisanieslovoizmenitelʹnojklassifikaciigrammatičeskihkategorijvitalʹânskomâzyke |
first_indexed |
2025-07-05T09:00:36Z |
last_indexed |
2025-07-05T09:00:36Z |
_version_ |
1836796909604306944 |
fulltext |
«Искусственный интеллект» 4’2012264
3-Ч
УДК 004.89:004.93
Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова
Харьковский национальный университет радиоэлектроники, г. Харьков
Украина, 61166, г. Харьков, пр. Ленина, 14, tanja_fyodorova@mail.ru
Математическое описание словоизменительной
классификации грамматических категорий
в итальянском языке
G.G. Chetverikov, I.D. Vechirska, T.M. Fedorova
Kharkov National University of Radioelectronics, c. Kharkov
Ukraine, 61166, Kharkov, Lenin Avenue, 14, tanja_fyodorova@mail.ru
Mathematical Description of Inflectional Classification
of Grammatical Categories in Italian
Г.Г. Четвериков, І.Д. Вечірська, Т.М. Федорова
Харківський національний університет радіоелектроніки, м. Харків
Україна, 61166, м. Харків, пр. Леніна, 14, tanja_fyodorova@mail.ru
Математичний опис словозмінної класифікації
граматичних категорій в італійській мові
В статье рассматривается проблема построения формализованных словоизменительных классификаций
на примере итальянского языка. Приведена система признаков (грамматических категорий), которые
определяют словоизменение указанных классов слов. При разработке модели учитываются все значения,
которые эти признаки (категории) могут принимать.
Ключевые слова: словоизменение, грамматические категории, признаки, структура.
The article considers the problem of constructing a formal inflectional classification as an example of Italian
language. Shows the system of attributes (grammatical categories), which determine the inflection of the word
classes. In developing the model takes into account all the values that these attributes (categories) can take.
Key words: inflection, grammatical categories, attributes, structure.
У статті розглядається проблема побудови формалізованих словозмінних класифікацій на прикладі
італійської мови. Наведено систему ознак (граматичних категорій), які визначають словозміну зазначених
класів слів. При розробці моделі враховуються всі значення, які ці ознаки (категорії) можуть приймати.
Ключові слова: словозміна, граматичні категорії, ознаки, структура.
Введение
В последнее время наряду с традиционными лексико-грамматическими иссле-
дованиями в лингвистике все большую актуальность приобретает вопрос построения
формализованных словоизменительных классификаций. Это связано как с теоретич-
ескими задачами грамматики по разноплановому и глубокому описанию языковых
систем, так и с необходимостью построения эффективных лингвистических техноло-
гий. Основным требованием к описанию языковой системе, ориентированной на при-
менение в лингвистических технологиях, является максимальная формализация этого
mailto:tanja_fyodorova@mail.ru
mailto:tanja_fyodorova@mail.ru
mailto:tanja_fyodorova@mail.ru
Математическое описание словоизменительной классификации...
«Штучний інтелект» 4’2012 265
3-Ч
описания, доведение результатов соответствующих исследований до уровня формальных
моделей и лингвистических алгоритмов, адаптированных к использованию в современ-
ных языково-информационных системах.
Актуальной является проблема создания морфологических классификаций слов
и на этой основе – средств грамматической идентификации и маркировки лингвисти-
ческих структур в естественно-языковых текстах. В этой связи необходимыми ока-
зываются компьютерные программы автоматической грамматической идентификации
лексических единиц, способные самостоятельно, без участия человека, приписывать
параметры грамматического значения текстовым словоформам. И без формализова-
нных словоизменительных классификаций создания таких средств невозможно. [1-6].
Целью данной работы является разработка математической модели словоиз-
менительной классификации частей речи итальянского языка для электронного словаря.
Моделирование словоизменения
Романские языки принадлежат к флективным языкам с сильной тенденцией к
аналитизму. Морфологическое выражение нерегулярно (имеются случаи невыражен-
ности грамматических категорий и морфологических омонимов). Существительное
имеет категории числа, рода (мужской и женский род; латинский средний перерас-
пределился между ними). Особенностью романских языков является разнообразие
форм артикля. В местоимениях сохраняются элементы системы падежей. Отличи-
тельная черта романских языков – наличие двух рядов объектных местоимений:
самостоятельных и служебных. Прилагательные согласуются с существительным в
роде и в числе во всех позициях, но некоторые не изменяются в роде. Романские
языки характеризуются разветвленной системой глагольных форм. Широкое развитие
получили аналитические формы, состоящие из вспомогательного глагола и безличных
форм (причастия, инфинитива, герундия). Имеются активный и пассивный залоги, а
также местоименная форма, выражающая возвратное (и косвенно-возвратное), вза-
имное (и косвенно-взаимное), пассивное или неопределенно-личное значения. Свое-
образны в романских языках неличные формы глагола (инфинитив, герундий, при-
частие II, в некоторых языках и причастие I). Порядок слов в ряде случаев фиксирован: в
сложной глагольной форме вспомогательный глагол предшествует причастию (инфи-
нитиву). Прилагательное обычно следует за существительным, тогда как детерминативы
предшествуют имени.
Итальянский язык – один из романских языков (итало-романская подгруппа), в
котором явление словоизменения является характерным для основных значимых ча-
стей речи. Определенное количество словоизменительных форм образуется синтети-
чески, т.е. путем присоединения к основе слова флексий, которые содержат в себе
информацию о конкретных значения одного или нескольких грамматических катего-
рий. Также существует часть грамматических форм, которые образуются аналитиче-
ски (грамматические формы состоят более чем из одного слова).
Приведем систему признаков (грамматических категорий) для итальянского
языка, которые определяют словоизменение указанных классов слов и значения,
которые эти признаки (категории) могут принимать.
Имя существительное (Il sostantivo) (parola (слово), domando (вопрос))
• Род (gènere)– мужской (maschile), женский (femminile);
• Число (nùmero) – единственное (singolare), множественное (plurale).
Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова
«Искусственный интеллект» 4’2012266
3-Ч
Рисунок 1 – Структура грамматических категорий имени существительного
Артикль (L’ articolo) (il, l’, lo, la, i, gli, le, un, una, uno, un’)
• Вид* – определенный (determinato), неопределенный (indeterminato);
• Род (gènere)– мужской (maschile), женский (femminile);
• Число (nùmero) – единственное (singolare), множественное (plurale).
Рисунок 2 – Структура грамматических категорий артикля
Имя прилагательное (L’ aggettivo) (verde (зеленый), amichevole (дружеский),
mio (мой), tuo (твой), questo (этот), quello (тот), alcuno (несколько), diversi (многие),
quanto (сколько), quale (какой, который из))
• Тип* – качественные (qualitativi), притяжательные (possessivi), указательные (di-
mostrativi), неопределенные (indefiniti), вопросительные (interrogativi), воскли-
цательные (esclamativo);
• Род (gènere)– мужской (maschile), женский (femminile);
• Число (nùmero) – единственное (singolare), множественное (plurale).
•
Рисунок 3 – Структура грамматических категорий имени прилагательного
Имя числительное (Il numerale) (cinque (пять), ventidue (двадцать два), primo
(первый), ventiduesimo (двадцать второй), una decina (десяток), una dozzina (дюжина))
Имя прилагательное
Число
Род
Тип*
Качественные
Притяжательные
Мужской
Женский
Единственное
Множественное
Указательные
Неопределенные
Вопросительные
Восклицательные
Артикль Число
Род
Вид*
Определенный
Неопределенный
Мужской
Женский
Единственное
Множественное
Имя существительное
Число
Род
Мужской
Женский
Единственное
Множественное
Математическое описание словоизменительной классификации...
«Штучний інтелект» 4’2012 267
3-Ч
• Тип* – количественные (quantitative), порядковые (ordinali), существительные
неточного количества (sostantivi inesatta numero);
• Род (gènere)– мужской (maschile), женский (femminile);
• Число (nùmero) – единственное (singolare), множественное (plurale).
Рисунок 4 – Структура грамматических категорий имени числительного
Местоимение (Il pronome) (lei (она), loro (они), questo (это), quello (что),
chiunque (любой), tutto (всё, весь), che (который), chi (кто), che cosa (что), quale
(какой))
• Тип* – личные (personali), указательные (dimostrativi), неопределенные
(indefiniti), относительные (relativi), вопросительные (interrogativi);
• Род (gènere)– мужской (maschile), женский (femminile);
• Число (nùmero) – единственное (singolare), множественное (plurale);
• Лицо (persona) – 1 (prima), 2 (secondo), 3 (terzo).
Рисунок 5 – Структура грамматических категорий местоимения
Глагол (Il verbo) (essere (быть), avere (иметь), telefonare (звонить), prendere
(брать), dormire (спать), finire (заканчивать))
• Лицо (persona) – 1 (prima), 2 (secondo), 3 (terzo);
• Число (nùmero) – единственное (singolare), множественное (plurale);
• Наклонение (modo) – изъявительное (indicativo), сослагательное (congiuntivo),
условное (condizionale), повелительное (imperativo)
Местоимение Число
Род
Тип*
Личные
Указательные
Мужской
Женский
Единственное
Множественно
Неопределенные
Относительные
Вопросительные
Имя числительное Число
Род
Мужской
Женский
Единственное
Множественное
Тип*
Количественные
Порядковые
Существительные
неточного количества
Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова
«Искусственный интеллект» 4’2012268
3-Ч
• Время (tempo) – настоящее (presente), прошедшее (passato), будущее (futuro
semplice), прошедшее незаконченное время (imperfetto), прошедшее законченное
время (passato remoto), прошедшее ближайшее время (passato prossimo), предпро-
шедшее время (trapassato prossimo), предпрошедшее непосредственное время (trapas-
sato remoto), сложное будущее время (futuro anteriore), будущее время прошедшего
(condizionale passato).
• Залог (voce) – действительный (vera), страдательный (passiva).
Рисунок 6 – Структура грамматических категорий глагола
По значениям своих классификационных категорий грамматические классы де-
лятся на подклассы (в приведенной выше системе признаков для каждого из грамма-
тических классов их классификационные признаки обозначены символом «*»).
Количество подклассов зависит от того, сколько значений может принимать данная
классификационная категория. Например, класс артиклей делится на два подкласса
по признаку вида; класс прилагательных по типу делится на 6 подклассов; класс
числительных по типу делится на 3 подкласса; класс местоимений по типу делится
на 5 подклассов.
Глагол
Число
Лицо
Наклонение
1
2
Единственное
Множественное
Изъявительное
Сослагательное
Условное
3
Повелительное
Время
Настоящие
Прошедшее
Будущее
Прошедшее незаконченное
Залог
Действительный
Страдательный
Прошедшее законченное
Предпрошедшее непосредственное
Прошедшее ближайшее
Предпрошедшее
Сложное будущее
Будущее время прошедшего
Математическое описание словоизменительной классификации...
«Штучний інтелект» 4’2012 269
3-Ч
Пусть W – множество склоняемых слов итальянского языка. Разобьем множе-
ство W на подмножества (классы слов), которые взаимно не пересекаются:
6
1
j
j
WW , (1.1)
где W1 – имя существительное, W2 – артикль, W3 – имя прилагательное, W4 –
имя числительное, W5 – местоимение, W6 – глагол.
Омонимию будем считать снятой, а омонимы промаркированными, так что
21 jj WW при .6,1,, 2121 jjjj
Некоторые классы слов по своим классификационным признакам
подразделяются на подклассы. Подклассы будем обозначать k
jW .
Артикли по значению грамматической категории вид делятся на два подкласса:
2
2
1
22 WWW ,
где 1
2W – определенный артикль,
2
2W – неопределенный артикль.
Подклассы k
jW будем называть грамматическими классами артиклей и обозна-
чать их в дальнейшем 3,2, iPi
: 2,1,2, kjWP k
ji .
Имена прилагательные по значению грамматической категории тип делятся на
следующие подклассы:
6
3
5
3
4
3
3
3
2
3
1
33 WWWWWWW ,
где 1
3W – качественные прилагательные,
2
3W – притяжательные прилагательные,
3
3W – указательные прилагательные,
4
3W – неопределенные прилагательные, 5
3W –
вопросительные прилагательные,
6
3W – восклицательные прилагательные.
Подклассы kW3 (k=1,2,...,6) будем называть грамматическими классами прила-
гательных. Обозначим 6,1;9,4,3 kiWP k
i .
Имена числительные по значению грамматической категории тип делятся на
следующие подклассы:
3
4
2
4
1
44 WWWW ,
где 1
4W – количественные числительные,
2
4W – порядковые числительные,
3
4W – существительные неточного количества.
Подклассы kW4 (k=1,2,3) будем называть грамматическими классами числи-
тельных. Обозначим 3,2,1;12,11,10,4 kiWP k
i .
Местоимения по значению грамматической категории тип делятся на следую-
щие подклассы:
5
5
4
5
3
5
2
5
1
55 WWWWWW , где 1
5W – личные местоимения,
2
5W –
указательные местоимения, 3
5W – неопределенные местоимения,
4
5W – относитель-
ные местоимения, 5
5W – вопросительные местоимения.
Подклассы kW5 (k=1,2,...,5) будем называть грамматическими классами место-
имений. Обозначим 5,...,2,1;17,...,14,13,5 kiWP k
i .
Г.Г. Четвериков, И.Д. Вечирская, Т.Н. Фёдорова
«Искусственный интеллект» 4’2012270
3-Ч
В результате для каждого Wx определяется принадлежность к определен-
ному грамматическому классу 18,...2,1, iP
i
.
Всего имеем 18 грамматических классов:
18
1
i
i
PW , 18,1,,,
212111
iiiiPP
ii
.
Внутри грамматических классов выделяем парадигматические классы. Это
означает, что произвольная лексема x представляется в виде комбинации неизменя-
емой и изменяемой составляющих (квазиосновы и квазифлексии): x=c(x)*f(x), где
c(x) – квазиоснова, f(x) – квазифлексия, * – конкатенация [7].
Квазифлексия помимо только флексии может включать часть основания, в кото-
рой происходит чередование. Например, итальянский глагол ‘pescare’ – ловить рыбу.
io//я pesco noi//мы peschiamo
tu//ты peschi voi//вы pescate
lui/lei//он/она pesca loro//они pescano
Таким образом, моделирование словоизменений происходит по следующему
правилу: для всех слов, принадлежащих к одному парадигматическому классу,
парадигматические формы в конкретных грамматических значениях строятся путем
присоединения к квазиоснове слова квазифлексий, соответствующие этим грамма-
тическим значениям.
Выводы
В статье был проведен анализ грамматики итальянского языка. Были опреде-
лены парадигматические типы и словоизменительные параметры итальянского языка.
Лексический состав языка был разбит на грамматические классы. Было установлено
соответствие между парадигматическими типами, грамматическими классами и слово-
изменительными категориями. Внутри грамматических классов были выделены пара-
дигматические классы. Таким образом, была сформирована база для построения
модели грамматической лексикографической системы итальянского языка. На основе
полученных результатов была построена математическая модель словоизменительной
классификации частей речи итальянского языка
Разработанная модель словоизменительной классификации итальянской лексики
является удобной для использования ее в электронных словарях и соответствует
всем требованиям построения подобных словарей.
Литература
1. Широков К.В. Іменна словозміна у сучасній турецькій мові / К.В. Широков. – К. : Довіра, 2009. –
318 с.
2. Бондаренко М.Ф. Основи території синтезу надшвидкодіючих структур мовних систем штучного
інтелекту / М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков. – К., 1997.-263 с.
3. Бондаренко М.Ф. Основи території багатозначних структур і кодування в системах штучного
інтелекту / М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков. – Х. : Фактор-Друк, 2003. – 336 с.
4. Четвериков Г.Г. Алгебро-логические средства моделирования естественного языка. Сообще-
ние 3 / Г. Г. Четвериков // Бионика интеллекта. – 2007. – № 1 (66) – С. 48-52.
Математическое описание словоизменительной классификации...
«Штучний інтелект» 4’2012 271
3-Ч
5. Четвериков Г.Г. Малий тлумачний словник з інтелектуальних систем : навч. посібник / Г.Г. Чет-
вериков. – К. : ІЗМН, 1997. – 64 с.
6. Четвериков Г.Г. Малий тлумачний словник з інтелектуальних систем (Доповнення) : навч.
посібник / Г.Г. Четвериков. – Х. : ХТУРЕ, 1999. – 56 с.
7. Широков В.А. Елементи лексикографії / В.А. Широков. – К. : Довіра, 2005.-303 с.
Literatura
1. Shyrokov K.V. Іmenna slovozmіna u suchasnіj turec’kіj movі. K.: Dovіra. 2009. 318 s.
2. Bondarenko M.F. Osnovy terytorіi syntezu nadshvydkodіjuchyh struktur movnyh system shtuchnogo
іntelektu. K.. 1997. 263s.
3. Bondarenko M. F. Osnovy teritorіi bagatoznachnyh struktur і koduvannja v systemah shtuchnogo
іntelektu. H.: Faktor-Druk. 2003. 336s.
4. Chetverikov G.G. Bionika intellekta. 2007. № 1 (66). S. 48-52.
5. Chetverikov G.G. Malyj tlumachnij slovnyk z іntelektual’nyh system: Navch. Posіbnyk. K.: ІZMN.
1997. 64 s.
6. Chetverikov G.G. Malyj tlumachnij slovnyk z іntelektual’nyh system (Dopovnennja): Navch. Posіbnik.
H.: HTURE. 1999. 56 s.
7. Shyrokov V.A. Elementy leksykografіi. K.: Dovіra. 2005. 303 s.
RESUME
G.G. Chetverikov, I.D. Vechirska, T.M. Fedorova
Mathematical Description of Inflectional Classification
of Grammatical Categories in Italian
In the article, Italian grammar is analyzed. Paradigmatic types and inflectional para-
meters are identified. The lexical structure of language is divided into grammar classes. It
is established the correlation between the paradigmatic types, grammar classes and inflecti-
onal categories. Within the grammatical classes, paradigmatic classes are identified. Thus,
the basis for constructing the model of the grammatical lexicographic system of Italian has
been made. On the basis of the results, mathematical model for the inflectional classifica-
tion of Italian parts of speech is constructed.
The developed model of inflectional classification of the Italian language is suitable
for use in electronic dictionaries and corresponds to the all requirements for constructing
such dictionaries.
Статья поступила в редакцию 03.06.2012.
|