Місце словотворення в розвитку сучасного українського лексикону

У статті відповідно до знаннєорієнтованої системи машинного перекладу розглядається можливість оптимізації обсягу перекладного словника засобами словотворення. Головну увагу зосереджено на методиці формування словника квазісуфіксів та формату його словникової статті, характеристиці побудови бази дан...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2012
Автор: Шипнівська, О.О.
Формат: Стаття
Мова:Ukrainian
Опубліковано: Інститут мовознавства ім. О.О. Потебні НАН України 2012
Назва видання:Мовознавство
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/183625
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Місце словотворення в розвитку сучасного українського лексикону / О.О. Шипнівська // Мовознавство. — 2012. — № 1. — С. 55-63. — Бібліогр.: 18 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-183625
record_format dspace
spelling irk-123456789-1836252022-04-07T01:34:54Z Місце словотворення в розвитку сучасного українського лексикону Шипнівська, О.О. У статті відповідно до знаннєорієнтованої системи машинного перекладу розглядається можливість оптимізації обсягу перекладного словника засобами словотворення. Головну увагу зосереджено на методиці формування словника квазісуфіксів та формату його словникової статті, характеристиці побудови бази даних продуктивних моделей суфіксального словотворення. In the paper the possibility of optimization of the dictionary volume by the use of derivation according to the knowledge-based machine translation system is considered. The procedure of the creation of kwasisuffixes dictionary and the format of its entry are presented. The main principles of databases for the productive models of the suffixal derivation are described. 2012 Article Місце словотворення в розвитку сучасного українського лексикону / О.О. Шипнівська // Мовознавство. — 2012. — № 1. — С. 55-63. — Бібліогр.: 18 назв. — укр. 0027-2833 http://dspace.nbuv.gov.ua/handle/123456789/183625 uk Мовознавство Інститут мовознавства ім. О.О. Потебні НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
description У статті відповідно до знаннєорієнтованої системи машинного перекладу розглядається можливість оптимізації обсягу перекладного словника засобами словотворення. Головну увагу зосереджено на методиці формування словника квазісуфіксів та формату його словникової статті, характеристиці побудови бази даних продуктивних моделей суфіксального словотворення.
format Article
author Шипнівська, О.О.
spellingShingle Шипнівська, О.О.
Місце словотворення в розвитку сучасного українського лексикону
Мовознавство
author_facet Шипнівська, О.О.
author_sort Шипнівська, О.О.
title Місце словотворення в розвитку сучасного українського лексикону
title_short Місце словотворення в розвитку сучасного українського лексикону
title_full Місце словотворення в розвитку сучасного українського лексикону
title_fullStr Місце словотворення в розвитку сучасного українського лексикону
title_full_unstemmed Місце словотворення в розвитку сучасного українського лексикону
title_sort місце словотворення в розвитку сучасного українського лексикону
publisher Інститут мовознавства ім. О.О. Потебні НАН України
publishDate 2012
url http://dspace.nbuv.gov.ua/handle/123456789/183625
citation_txt Місце словотворення в розвитку сучасного українського лексикону / О.О. Шипнівська // Мовознавство. — 2012. — № 1. — С. 55-63. — Бібліогр.: 18 назв. — укр.
series Мовознавство
work_keys_str_mv AT šipnívsʹkaoo mísceslovotvorennâvrozvitkusučasnogoukraínsʹkogoleksikonu
first_indexed 2025-07-16T03:36:21Z
last_indexed 2025-07-16T03:36:21Z
_version_ 1837773075739836416
fulltext О. О. ШИПНЮСЬКА МІСЦЕ СЛОВОТВОРЕННЯ В РОЗВИТКУ СУЧАСНОГО УКРАЇНСЬКОГО ЛЕКСИКОНУ___ У статті відповідно до знаннєорієнтованої системи машинного перекладу розглядається можливість оптимізації обсягу перекладного словника засобами словотворення. Головну увагу зосереджено на методиці формування словника квазісуфіксів та формату його словникової статті, характеристиці побудови бази даних продуктивних моделей суфіксального словотворення. К л ю ч о в і слова: оптимізація обсягу перекладного словника, знаннєорієнтована систе­ ма машинного перекладу, словотвірна модель, словотвірний тип, формат словникової статті, база даних моделей суфіксального словотворення. Лексичний склад будь-якої мови — це динамічна система, функціонування і роз­ виток якої визначається механізмом утворення слів. Для практичних потреб люд­ ство навчилося систематизувати слова у словниках завдяки різним принципам подання матеріалу, різноманітним методикам добору та опису текстового слова. На сьогодні у світі наявна багата спадіцина різноманітних словників і з мінімаль­ ним, і з інтегральним описом слова \ Якщо від початку лексикографії слугували матеріали картотек, то сьогодні— мільйонні корпуси текстів з різношаровою лек­ сикою 2. Не поступається фактичному матеріалу й вагома теоретична база, логіч­ ним продовженням якої стала теорія лексикографічних систем3. Актуальною залишається проблема обсягу словника у двох її виявах — мак­ симально повній фіксації наявних у мові слів (з урахуванням суб’єктивності у формуванні реєстру) та ідентифікації нових лексем. Якщо в середині минулого століття питання кількості та фіксації словникових одиниць активно дискутува­ лося в контексті теорії та практики перекладу, зокрема машинного 4, то сьогодні йдеться про опис великого за обсягом словника для будь-якої галузі мовознав­ ства. Потреба представлення об’єктивного світу в слові, викликана швидкими темпами цивілізаційного розвитку людства, зумовлює інтенсивне поновлення 1 Апресян Ю. Д. Лексическая семантика. Синонимические средства языка.— М., 1995.— 473 с.; Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка.— М., 1981.— 357 с.; Баранов А. Н. Введение в прикладную лингвистику : Учебник.— М., 2001,— 360 с. 2 Британський національний корпус містить понад 100 млн слововживань [http://www. natcorp.ox.ac.uk], стільки ж — Корпус іспанської мови [http://www.corpusdelespanol.org/], Український національний лінгвістичний корпус — понад 42 млн слововживань, Націо­ нальний корпус російської мови — понад 35 млн слововживань [http://ruscorpora.ru/ сог- pora_stat.html], Корпус польської мови Наукового видавництва PWN — близько 40 млн слововживань [http://www.korpus.pwn.pl]. 3 Широков В. А. Феноменологія лексикографічних систем.— К., 2004.— 327 с. 4 РевзинИ. К , Розенцвейг В. Ю. Основы общего и машинного перевода.— М., 1964.— С. 180-185. О О. О. ШИПНЮСЬКА, 2012 ISSN 0027-2833. Мовознавство, 2012, № 1 55 http://www http://www.corpusdelespanol.org/ http://ruscorpora.ru/ http://www.korpus.pwn.pl О. О. Шипнівська. лексичного складу будь-якої мови. Свідченням такої тенденції є словники нових слів і значень, лінгвістичні дослідження темпів та специфіки розвитку словни­ кового складу5. Для розуміння нового слова, зокрема в системах автоматичного аналізу, од­ ну із провідних ролей відіграє словотворення, оскільки відображає процес по­ родження та сприйняття не тільки наявних у мові лексичних одиниць, а й слів, що позначають нові реалії. Моделювання механізмів словотворення як одного з компонентів морфологічної моделі мови передбачає застосування сучасних як теоретичних, так і практичних здобутків у царині лінгвістичних знань та інфор­ маційних технологій. Теоретичні та практичні розвідки, присвячені вивченню словотвору та побудові модуля автоматичного аналізу та синтезу словотвірних явищ, спеціальні лінгвістичні бази даних, у тому числі й словотвірні словники та словники морфем, за своїм характером є аналітичними, відображають позицію лінгвіста-дослідника6. Зважаючи на це, у контексті автоматичного опрацювання текстів природної мови існує потреба у створенні відповідних методик, які б за­ безпечували словотвірний аналіз без урахування знань про конкретну лексичну одиницю, одночасно подаючи її як елемент лексико-граматичної системи мови. Відповідно до завдань розроблення знаннєорієнтованої системи машинного ської та англійської мов на основі запропонованої методики виділення слово­ творчих афіксів1. Ці словники розглядаємо як інформаційний ресурс— частину словотвірної моделі мови, що може доповнюватися та бути інтегрованою до системи автоматичного морфологічного опрацювання тексту природної мови. Основою формування баз даних стали граматичні та орфографічні словники об­ раних мов та корпус різножанрових текстів. Потужний арсенал теоретичних розвідок та теоретико-прикладних праць зі словотвору містить необхідний матеріал для моделювання словопороджуваль- ного механізму мови. Зокрема, колектив співробітників Інституту мовознавства ім. О. О. Потебні НАН України разом зі співробітниками Інституту української мови НАН України розробили проект спеціальної автоматизованої інформацій­ ної системи — морфемно-словотвірний фонд української мови 8. Цей проект, крім фактичної бази морфемно-словотвірного фонду української мови, має до­ слідницьку частину, головне завдання якої — побудова морфемних словників з показниками продуктивності використання окремих морфем при словотворенні. 5 Див. бібліографію: КлименкоН. Ф., Карпіловська Є. А. та ін. Динамічні процеси в сучасному українському лексиконі : Монографія.— К., 2008.— 336 с.; Струганець Л. В. Динаміка лексичних норм української літературної мови XX століття.— Тернопіль, 2002.— 6 Клименко Н. Ф., Карпіловська Є. А. та ін. Словотвірна морфеміка сучасної української літературної мови.— К., 1998.— 162 с.; Клименко Н. Ф., Карпіловська Є. А. Морфемно-сло- вотвірний фонд української мови як дослідницька та інформаційно-довідкова система // Мовознавство.— 1990.— №6.— С. 41-50;Клименко Н. Ф.,Карпіловська Є. А. та ін. Словник афіксальних морфем української мови.— К., 1998.— 434 с.; Карпіловська Є. А. Кореневий гніздовий словник української мови : Гнізда слів з вершинами-омографічними коренями.— К., 2002.— 912 с.; Степанова М. Д. Вопросы моделирования в словообразовании и условия реализации моделей // Вопр. языкознания.— 1975.— № 4.— С. 24—37; Тагабилева М. Г., Березуцшя Ю. Н. Словообразовательная разметка Национального корпуса русского языка: задачи и методы.— 1ійр:/\¥^№.с1іа^-21 ,ги/с1іа1о§2010/таІегіаІз/рсІЕ^З .рсИ; Образование упо­ требительных слов русского языка / Под ред. Л. Н. Засориной.— М., 1979.— 279 с. 7 Замаруєва І. В. Комп’ютерна модель розуміння природно-мовної текстової інформа­ ції // Проблемы программирования.— 1999.— № 2.— С. 96-102. 8 Клименко Н. Ф., Карпіловська Є. А. Морфемно-словотвірний фонд української мови...— словників афіксів для української, росій- 348 с. С. 41-50. 56 1ББЫ 0027-2833. Мовознавство, 2012, № 1 Місце словотворення в розвитку сучасного українського лексикону Зважаючи на розробку знаннєорієнтованої системи машинного перекладу, що спирається на вилучення закодованих у текстовій інформації знань з пред­ метної галузі, запропонована нами словотвірна модель повинна передусім забезпечувати оптимізацію побудови електронних перекладних словників. У своїй структурі модель містить словник квазісуфіксів та квазіпрефіксів. Для виділення одиниць базового лексичного складу мови ми пропонуємо спеціальну методику, суть якої полягає у виділенні словотворчих квазіформантів з початку та з кінця слова — за методом аналогії. Мовознавці неодноразово залучали метод аналогії до своїх досліджень зі словотвору. Так, Ф. О. Нікітіна обґрунтувала саме явище аналогії та його зна­ чення у словотвірних процесах 9. Став у нагоді метод аналогії і для Д. С. Уорта під час розроблення словотвірного словника російської мови 10. Цей метод ус­ пішно використовували російські вчені, зокрема Г. Г. Бєлоногов, для граматич­ ної ідентифікації нових слів п. У нашому дослідженні принцип аналогії може бути сформульований так: аналогічним формально-семантичним схемам побу­ дови слів відповідають певні словотвірні значення. Для застосування цього під­ ходу необхідно виявити всі або найбільш імовірні формально-семантичні схеми та визначити відповідні їм словотвірні значення. З-поміж ключових понять словотвору, розроблених лінгвістами для об’єкти­ вації процесів породження та сприйняття словотворчих процесів, актуальними для нашого дослідження є словотворчий афікс, словотвірне значення, словотвір­ ний тип, словотвірна модель, словотвірна категорія12. Базовою одиницею запро­ понованої студії є словотвірна модель — структурно-семантична словотвірна схема, що об’єднує певну кількість слів, для яких можна встановити однозначне співвідношення словотворчого форманта (словотворчого афікса, за допомогою якого утворюється лексична одиниця) та твірної основи. Словотворчий фор­ мант — це структурна одиниця, яка виконує дериваційну функцію. За своєю формою словотворчий формант може співвідноситися з одиницею, що виділя­ ється під час традиційного словотвірного аналізу, а також може бути виділеним за необхідності суто формально. Твірна основа в межах нашого дослідження мо­ же мати також формальний характер і не відповідати вимогам традиційного сло­ вотвірного аналізу, наприклад, щодо напрямку мотивації. Лексико-граматичне співвідношення між операційно виявленими слово­ творчим формантом та твірною основою — це категорійне словотвірне значен­ ня, притаманне визначеній словотвірній моделі, а отже, і лексичній одиниці, яка відповідає заздалегідь встановленим правилам. 9 Никитина Ф. А. Влияние аналогии на словообразование (На материале родственных языков).— К., 1973.— 198 с. 10 У орт Д. С. Русский словообразовательный словарь. Введение // Новое в зарубежной лингвистике.— М., 1983.— С. 227-260. 11 Белоногов Г. Г., Зеленков Ю. Г. Еще раз о принципе аналогии в морфологии // НТИ.— Сер. 2. Информ. процессы и системы.— 1995.— № 3.— С. 29-32.; Белоногов Г. Г., Зелен­ ков Ю. Г. и др. Метод аналогии в компьютерной лингвистике // Там же.— 2000.— № 1.— С. 21-30. 12 Клименко Н. Ф. Словотвірний тип // Українська мова : Енциклопедія / Ред. кол.: Руса- нівський В. М., Тараненко О. О. (співголови) та ін.— К., 2000.— С. 645-646; Клименко Н. Ф. Словотвірна категорія // Там же.— С. 641; Клименко Н. Ф. Словотвірна модель // Там же.— С. 642. Клименко Н. Ф. Формант // Там же.— С. 799; Словотвір сучасної української літера­ турної мови / За ред. М. А. Жовтобрюха.— К., 1979. — 404 с.; Быкова Л. А. Современный русский литературный язык : Морфемика и словообразование.— К., 1974.— 94 с.; Куб- рякова Е. С. Типы языковых значений : Семантика производного слова.— М., 2008.— 208 с. ISSN 0027-2833. Мовознавство, 2012, № 1 57 О. О. Шипнівська. Визначені під час дослідження словотвірні моделі об’єднані словотвірними типами, що підпорядковані словотвірним категоріям. Словотвірний тип розу­ міємо як формально-семантичну схему побудови похідних слів, мотивованих твірними словами певної частини мови, за допомогою того самого словотвірно­ го форманта з тим самим значенням. Словотвірну категорію розглядаємо як су­ купність похідних слів, що мають спільне словотвірне значення і використо­ вують однаковий спосіб словотворення. У своєму дослідженні ми розрізняємо й поняття продуктивності та ужива­ ності словотвірних категорій13. Продуктивність визначаємо як властивість, при­ таманну мові й фіксовану в словниках та граматиках. Цю категорію розглядаємо у площині як кількісних даних, так і доцільності, можливості виділення тієї чи іншої моделі. Уживаність — це спроможність словотвірних одиниць до вико­ ристання їх у словах лексичного складу мови. Розглянемо процедуру виділення словотворчого афікса, визначення продук­ тивної словотвірної моделі, словотвірного типу та словотвірної категорії на прикладі українського словотворчого форманта -к а14. Так, у граматиках україн­ ської мови суфікс -ка кваліфікується як неоднозначний: його вживають на поз­ начення іменників жіночого роду (архітекторка), опредметненої дії {мандрів­ ка), як зменшено-пестливий суфікс (рибка). За інверсійним словником, укладе­ ним на основі аналізованих нами текстів, та з урахуванням даних орфографіч­ них словників української мови лексичні одиниці з формально виділеним ква- зісуфіксом -ка охоплюють значний масив лексики. Проте з огляду на обраний нами операційний підхід виділення словотворчого форманта та словотвірної моделі цей корпус лексичних одиниць є доволі строкатим. Наприклад, до нього потрапили слова, які за розроблюваною нами методикою визначення словотвір­ ної моделі, не можуть бути проаналізованими: русалка, вівсянка, шибка, лелека, ластівка, ложка. Незважаючи на спільність форманта, для цих слів на синхрон­ ному етапі аналізу не визначаємо однозначне співвідношення похідного та твір­ ного слів. Не потрапляють до нашого аналізу слова, в яких за одним із значень лексему можна поділити на словотворчий афікс та твірну основу, а за іншим — ні. Наприклад, слова лебідка, губка, скибка, помадка, колодка, один із лексико- семантичних варіантів яких — це «зменшено-пестливе від іменника», а дру­ гий — означає поняття безвідносно до твірного. Не стали об’єктом нашого ана­ лізу стилістично марковані слова з маркером «розмовне» типу комуналка, стін­ нівка, читалка та ін. Розглянемо вісім словотвірних моделей із словотворчим формантом -ка 15 (див. табл. 1). До алгоритму аналізу залучено інформацію про лексико-грама- тичне значення похідного слова (поле 4), про граматичне значення твірного сло­ ва (поле 5), вказано квазісуфікс, який необхідно додати для одержання пошуко­ вого слова (поле 3). Інформацію про словотвірну категорію, словотвірний тип, модель словотворення містять відповідно поля 6,7 та 8. Застосований операцій­ ний підхід накладає обмеження й на одиниці, у яких виділений словотворчий 13 Клименко Н. Ф. Основи морфеміки сучасної української мови.— К, 1998.— С. 99-103. 14 Цей продуктивний формант виділяємо, зважаючи на дослідження словотвору сучасної української мови. 15 Застосовані позначення: іж — іменник жіночого роду; іжі — іменник жіночого роду, істота; іч — іменник чоловічого роду; ічі — іменник чоловічого роду, істота; дн — дієслово недоконаного виду (поле 4, поле 5); о — особа; одрд— опредметнена дія, результат дії (поле 6); змп— зменшено-пестливе; ож— особа жіночої статі (поле 7); нм— особа за національністю, місцем проживання; вдіп — особа за видом діяльності, ідейними переконаннями; іпфм — особа за ідейними переконаннями, формою мислення. 58 ІББИ 0027-2833. Мовознавство, 2012, № 1 Місце словотворення в розвитку сучасного українського лексикону формант та отримана в такий спосіб твірна основа не дозволяють однозначно сформулювати категорійне словотвірне значення та ідентифікувати модель ана­ лізу, а отже, й синтезу. На такі обмеження вказують поле 10 та з урахуванням стилістичної характеристики — поле 9. Якщо стилістичні обмеження поля 9 вказують на реальну мовленнєву картину, наприклад, у таблиці — це стилістич­ но маркована розмовним стилем модель «зменшено-пестливе до іменника жіно­ чого роду», то в полі 10 містяться винятки, які не відповідають нашій системі аналізу. Так, слово голубка можна ідентифікувати за моделлю: «особа жіночої статі за національністю, місцем проживання», оскільки граматичні значення і твірної основи, і твірного слова відповідають встановленому правилу, і слово­ творчий формант дозволяє встановити твірне слово — голуб — іменник чоло­ вічого роду, істота. З огляду ж на знання про довкілля, слово голубка не має зна­ чення цієї моделі, його розпізнавання здійснюватиметься на етапі семантичного аналізу. Подальший аналіз дистрибутивних можливостей словотворчого форманта -ка обраного корпусу лексики продемонстрував необхідність розширення кон­ тексту його реалізації для ефективності алгоритму аналізу. Наприклад, слово­ твірний тип «опредметнена дія, результат дії», де похідне слово — іменник жіночого роду, а твірне — дієслово недоконаного виду, містить близько 10 мо­ делей, становлячи 3,74 % матеріалу (у табл. 2 подано моделі з найбільшою кількістю одиниць). Загалом виділено близько 65-ти моделей із формантом -ка, які представляють словотвірні типи: «особа жіночої статі», «опредметнена дія, результат дії», «зменшено-пестливе» та ін. Обраний підхід дозволяє уникнути неоднозначності завдяки залученню різної інформації (див. табл. 2). Т а б л и ц я 1 Словотвірні моделі зі словотворчим формантом -ка (фрагмент) Поле 2 Поле 3 Поле 4 Поле 5 Поле 6 Поле 7 Поле 8 Поле 9 Поле 10 Поле 11 Поле 12 Квазі- суфікс 1 Квазі- суфікс 2 Гр. зн. 1 Гр. зн. 2 Сл. кат. Сл. тип. Сл. мод. Ст. Винятки Приклади Кіль­ кість 16 -ка -а іж іж іж змп р садибка, шубка 40 -ка 0 іжі ічі 0 ож нм голубка кашубка, швабка 1,2 -ка -ець іжі ічі 0 ож нм кубанка американка 13,6 -ка 0 іжі ічі 0 ож вдіп оригіналка, меломанка 8,6 -ка -ин іжі ічі 0 ож нм парижанка, марсіанка 3,05 -ка -ець іжі ічі 0 ож іпфм Р початківка 0,8 -ка -чати іж дн д одрд відзнака, ознака 0,14 -ка -кувати іж дн д одрд атака, пака 0,08 16 Відносну частоту моделей встановлювали щодо загальної кількості слів із цим фор­ мантом в аналізованому списку слів. /5£ЛГ 0027-2833. Мовознавство, 2012, № 1 59 О. О. Шипнівська. Т а б л и ц я 2 Словотвірні моделі типу «опредметнена дія, результат дії» із словотворчим формантом -ка (фрагмент) Поле 2 Поле 3 Поле 4 Поле 5 Поле 6 Поле 7 Поле 8 Поле 10 Поле 11 Квазі- суфікс 1 Квазі- суфікс 2 Гр. зн. 1 Гр. зн. 2 Сл. тип Сл. мод. Сл. мод. 1 Винятки Приклади -вка -вляти ІЖ ДН одрд надбавка, заставка -дка -джувати ІЖ ДН одрд висадка, розсадка -ска -шувати ІЖ ДН одрд навіска -вка -вати ІЖ ДН одрд поливка -івка -увати ІЖ ДН одрд гвинтівка, готівка мандрівка -ірка -іряти ІЖ ДН одрд перевірка Аналіз текстів, зокрема в системах машинного перекладу, показав, що від­ сутність перекладних еквівалентів у машинному словнику пов’язана як з випад­ ками опису нових понять (нових фрагментів знань), так і з продуктивним афік­ сальним словотворенням, на частку якого припадає близько половини так званих нових слів (наприклад: near — nearly; вчитель — вчителька тощо). Словотвірна модель у розроблюваній системі машинного перекладу вклю­ чає словник префіксів та словник суфіксів. Розглянемо процедуру аналізу на прикладі розроблюваних словників суфіксів. Так, формат словникової статті продуктивних суфіксів має вигляд: <St(Sk) [поле граматичних ознак] # [поле семантичних ознак]>, де Si — послідовність літер, яку треба відкинути, Sk — послідовність літер, яку треба додати. Поле граматичних ознак містить інформацію про частину мови слова з відповідним суфіксом та відповідні граматичні категорії (рід, істота то­ що), поле семантичних ознак — відповідну цьому суфіксу семантику (наприк­ лад, розмір, рід діяльності тощо). Процедура опрацювання не відомого системі слова полягає в тому, що у ви­ падку, 1) якщо слово (у початковій формі) не знайдено в перекладному словни­ ку, слід перейти на словник суфіксів; 2) якщо суфікс знайдено, відкинути 5, від слова і додати Sk; 3) перейти на перекладний словник; 4) якщо слово знайдено, взяти перекладний еквівалент та синтезувати необхідну словоформу через син­ тетичний словотвірний словник вихідної мови; 5) якщо слово не знайдено, пе­ рейти на словник префіксів (опрацювання аналогічним способом); 6) якщо сло­ во не знайдено, перейти на рівень семантичного розпізнавання. Так, російський суфікс -ниц(а) налічує близько 1000 словникових оди­ ниць 17, які можна подати у словнику суфіксів двома словниковими статтями: ница (ник) * іменник ж. роду, істотаіїрід діяльності для жінки; ьница (ь) * іменник ж. роду, істота#рід діяльності для жінки, що забезпечують опрацювання понад 600 слів, які доречно представляти в пе­ рекладному словнику лише для іменників чоловічого роду, істот. Решту слів 17 Зализняк А. А. Грамматический словарь русского языка: Словоизменение. Около 100000 слов,— М., 1980,— 880 с. 60 ISSN 0027-2833. Мовознавство, 2012, № 1 Місце словотворення в розвитку сучасного українського лексикону необхідно додати до перекладного словника. Наприклад, в українській мові сло­ вотворчий формант зі значениям «зменшено-пестливе», що вживається для тво­ рення іменників жіночого роду -ка, охоплює близько 2 000 лексем, які в пере­ кладному словнику можна подати однією статтею: ка (а) *іменник ж. роду, неістота # зменшено-пестливе. Реєстр кожного із словників формували на основі інформації, взятої з граматик аналізованих мов, граматичних та орфографічних словників. Цей фактографічний ресурс сприяв визначенню списку продуктивних типів і моделей словотворення. Для формування остаточного списку активних моделей було залучено мор­ фологічно розмічений корпус текстів та розроблено систему АРМ-лінгвіста18. У застосованій нами системі автоматичного морфологічного аналізу використано флективний підхід за словником квазізакінчень. Словник словоформ складено за текстами різної жанрово-тематичної спрямованості. За необхідності залуча­ лися дані з граматик української та російської мов. Основою пропонованого принципу є розроблений метод, який спирається на позиційно-цифрове коду­ вання граматичної інформації у словниковій статті. У такий спосіб кожна ана­ лізована словоформа отримує свій код, що містить інформацію про її частино­ мовну належність та конкретне граматичне значення (див. рис. 1). Р in _ s p is - Б л о к н о т -ЮІ х| Файл Правка Формат Вид Справка xTSâ 2 0 * 0 0 0 0 0 0 0 0 0 \2 4 *0000000004 З шайба 1 * 2 1 1 0 0 0 0 0 0 \ дам ба 1 "2 1 1 0 0 0 0 0 0 \ диф ірам ба 1 “1120000004 н ім ба 1*112 0 0 0 0 0 0 \ бомба 1 * 2 1 1 0 0 0 0 0 0 \ апломба 1 * 1 1 2 0 0 0 0 0 0 \ ромба 1*112 0 0 0 0 0 0 \ ямба 1*1120000004 боба 1 * 1 1 2 0 0 0 0 0 0 \ жадоба 1 * 2 1 1 0 0 0 0 0 0 \ о здо б а 1 “ 2 1 1 0 0 0 0 0 0 \ подоба 1 * 2 1 1 0 0 0 0 0 0 \ худоба 1 * 2 1 1 0 0 0 0 0 0 \ лоб а 1*112 0 0 0 0 0 0 \ жалоба 1 “ 2 1 1 0 0 0 0 0 0 \ су гл о б а 1* 1 1 2 000000Х с п ід л о б а 14 * 0 0 0 0 0 0 0 0 0 \ жолоба 1* 1 1 2 0 0 0 0 0 0 \ н ероба 1 * 4 1 1 0 0 0 0 0 0 \ ви роба 1* 1 1 2 0 0 0 0 0 0 \ м ік р о ба 1*112 0 0 0 0 0 0 \1*114 0 0 0 0 0 0 \ х л іб о р о б а 1 * 1 1 2 0 0 0 0 0 0 \1 “1 1 4 0 0 0 0 0 0 \ х вороба 1 * 2 1 1 0 0 0 0 0 0 \ профхвороба 1 * 2 1 1 0 0 0 0 0 0 \ бракороба 1 “1 1 2 0 0 0 0 0 0 \1 "1 1 4 0 0 0 0 0 0 \ м аслороба 1 " 1 1 2 0 0 0 0 0 0 \1 * 1 1 4 0 й 0 0 0 0 \ проба 1 * 2 1 1 0 0 0 0 0 0 \ випроба 1 * 2 1 1 0 0 0 0 0 0 \ спроба 1 * 2 1 1 0 0 0 0 0 0 \ у тр о б а 1 * 2 1 1 0 0 0 0 0 0 \ о соба 1 * 2 1 1 0 0 0 0 0 0 \ н ац іоф оба 1 * 1 1 2 0 0 0 0 0 0 \1 “1 1 4 0 0 0 0 0 0 \ укр а їн о ф о б а 1 * 1 1 2 0 0 0 0 0 0 \1 » 1 1 4 0 0 0 0 0 0 \ с л о в ' янофоба 1*112000000X 1*1140000004 \А Л Рис. 1. Фрагмент інверсійного словника словоформ української мови. Саме на основі інверсійного словника та завдяки розробленій пошуковій системі АРМ-лінгвіста визначалися вживані моделі суфіксального словотворення. У результаті формування словників суфіксів для української, російської та англійської мов було розроблено базу квазісуфіксів (див. рис. 2), яку пропо­ нуємо як необхідний універсальний інструментарій у вивченні та дослідженні аналізованого явища. Сформований лінгвістичний ресурс унаочнює результати визначення словотвірних моделей, містить усі необхідні квазісуфікси, встанов­ лені за обраною методикою; подає продуктивні та активні моделі словопоро- джувального механізму; подає інформацію про похідне та твірне слово; репре­ зентує статистичну інформацію, достатню для характеристики квазісуфікса, моделі, типу. 18 Замаруєваї В., Шитівська О. О. Морфемна обробка текстів у системах машинного перекладу І І Вісн. Київ. нац. ун-ту ім. Тараса Шевченка.— К., 2008.— N° 20.— С. 61-63. ISSN 0027-2833. Мовознавство, 2012, № 1 61 О. О. Шитівська. в Microsoft Access - [Таблицаї : табл<ца] я п в : j ФапП Правка Вид Вставка Формат Загуси Серем Л н о Справ« йеаитивогрк . . * X * £ • « П J 4 ? І ^ & 4 | J l 11 У 'Ù V « > * Э / Э - Ь ' | D 1 suf_p І * 0 suf_ й g ra m jj У » * " -1 type 1іІ modèB ôxCépt 6 хЖ р \ fret) * І Ік а кувати іж J H __ ДРД атака, пака • 2 ка чати іж ж РД відзнака, ознака : 3 и з іж іж змп садибка, шубка 2303 ■ 1 ка 0 їжі ІЧІ ож НМ голубка швабка, кашубка І У . Щ 5 * з 0 іжі ІЧІ ОЖ р 6ДІП оригіналка, професіоналка, мело 4 8 9 Н 6 ка ин №1 ІЧІ ож НМ парижанка, марсіанка І 7 д Н 7 г а ець Ькі ІЧІ ож НМ кубанка американка 776 В 8 ка ець №І ІЧІ ож р іпфм початківка : ■ і 9 ібка оба ІЖ іж змп р 1 худібка •: 10 бка бляти ІЖ Дн ОД обробка j 11 бка бати бувати ІЖ дд дрд_____ рм р у б ю , вирубка 7 12 ка мій ас_______ дд ДрД насадка, висадка 13 вка вляти іж дн дрд надбавка.заставка ■ 14 д ія дити джувати іж дн ДРД висадка, розсади ■- 15 ска сити шувати іж J H __ ДРД навіска ■з 16 с с и ОСИТМ іж ДН ДРД розноска, виноска 17 ка увати (Ж дн дрд гримерка звірника, підтримка, подяка 18 ка эти увати іж дд дрд відгадка, розгадка, вигадка 371 19 вка вати ти ІЖ ДН ДРД поливка 34 ■ ЗО дка дати сти іж Дн ДРД закладка '1 21 деа дувати дати іж Дн ДРД розвідка 7 22 Дка джати (Ж Дн ДрД зарядка зарщ ка 23 ка 0 їжі ІЧІ ож іпфм с ерцеїдка 'У 24 іека івець игі__ ІЧІ ож МП чернігівка 6? 25 івка івець №__ ІЧІ ож р ВДІП спартаківка, початківка, динамів IV 25 івка ова іж J5K__ змп голівка, корівка 7 27 івка увати іж J H _____ ДРД шнурівка, мандрівка 1 28 їдка ода іж J jk__ ЗМП р Т І ЯПДК8 2 29 ж ка га іж іж _____ ЗМП р слажка. смужка ; ЗО іжка ога іж іж ЗМП р ніжка ; 31 жка га іс іс зг р злодюжка ; ■ 32 и и 0 (Ж ічі гнсдо Лінгвістика, софістика 41Н 33 о ІЖ ІЧІ ГНСДР ботаніка, техніка і; 34 йка £ЦЬ їжі ІЧІ ож МП плебейка англійка, іудейка 37 ■ d Рис. 2. База квазісуфіксів Microsoft Access - [Таблица! : таблица] : J Файл Правка Вид Вставка Формат Записи и !Д J Д ? А 4 AI 4 . « Серйіс Окно Справка HI¥f l |Ÿ) f l > » ї д а » s i -т - 5 X ID І suf_p І s u f j І su fJ2 g ia m j 1 gram . 1 type 1 style_t 1 model modelel| modeC except exampl freq ± 72 ння ти ІС _ДН____ ДРД 1 оспівування Я В 73 ння ти ІС дд З рд командування 3658 74 ання ати уваги іс дд дрд обрубання 864 77 джування джувати дити ІС дн дрд впровадження 87 82 ення увати іс ДН дрд заниження, навішення, проголои 87 83 ення ювати іс ДН дрд освітлення 56 17 ка увати іж Дн дрд гримерка затримка, підтримка, подяка 56 76 ення ювати іс Дн АРА Отруєння 48 18 ка ати увати (Ж ДД дрд вщгадка. розгадка, вигадка 37 19 вка вати ти ис__ А« дад поливка 34 75 ення іти ювати іс ДРД удостоєння 24 14 д ю дити джувати ]ж _____ Дн ДРД висадка, розсадка 24 16 оска осити іж _ДН____ д м розноска, виноска 23 92 ння тмся jç____ _ДН____ да листування 23 20 дка дати сти іж__ дн дрд закладка 21 15 ска сіл и шувати ІЖ Дн АРА навіска 19 11 бка бати бувати іж ДД АРА разрубка,вирубка 12 ка ити 0К дд дрд насадка, висадка 38 НК8 ти (ЖН ДН дрд оранка,читанка 85 щення пити ІС Дн дрд пещення 13 вка вляти іж Дн дрд надбавка, заставка 14 94 езення озиіи іс Дн АРА завезення 12 84 ення ити іс Дн ДРД тлумачення, завезення 12 £й чвння чувати іс Дн ДРА перекручування б 21 два дувати дати (Ж J H ____ дрд розвідка 7 90 ення ути іс ДН АРА худнення 7 81 вжвння ігати je _______ Дн дрд спостереження 7 85 есення осити іс J H ____ АРА внесення 7 1 ка кувати іж ДН ДРД атака, пака 5 22 д ю джати іж Дн ДРД зарядка зарядка 87 етения тати іс Дн дрд заплетення 5 42 т а чувати ІЖ ДН дрд викочувати 5 93 кнення кати 1C ДН дрд замикнення 4 91 ення юватися іс Дн дрд 1 1 1 спізнення, 4 62 Рис. 3. Модель типу «опредметнена дія, результат дії» ІЇЇЖЛГ 0027-2833. Мовознавство, 2012, № 1 Місце словотворення в розвитку сучасного українського лексикону Подання лінгвістичної інформації в електронному форматі сприяє ефектив­ ності дослідження явища, дозволяє отримувати потрібну інформацію як у про­ цесі дослідження, так і в разі залучення її до інших систем автоматичного ана­ лізу тексту. Так, можна відібрати певну модель з необхідною інформацією про її продуктивність у мові, наприклад, модель типу «опредметнена дія, результат дії» словотвірної категорії «дія» з урахуванням їх частотного розподілу (за спад­ ною) (див. рис. 3). Отже, урахування продуктивного та активного афіксального словотворення дозволить розпізнавати «нові» слова, які утворюються завдяки цьому способу, навіть у разі відсутності їх у перекладному машинному словнику. Крім того, урахування словотвірної моделі дозволяє сформулювати вимоги до функціона­ льної повноти перекладних словників у системах машинного перекладу. Засто­ сована операційна методика виділення моделей словотворення на основі прин­ ципу аналогії є засобом економії в системі автоматичного опрацювання текстів. Залучення до аналізу нових текстів дасть можливість перевірити та в разі потре­ би доповнити наявну базу, з ’ясувати не лише продуктивність, а й регулярність моделей у мовленні. О. V. SHYPNTVSKA THE PLACE OF THE DERIVATION IN THE DEVELOPMENT OF THE MODERN UKRAINIAN LEXICON In the paper the possibility of optimization of the dictionary volume by the use of derivation ac­ cording to the knowledge-based machine translation system is considered. The procedure of the cre­ ation of kwasisuffixes dictionary and the format of its entry are presented. The main principles of da­ tabases for the productive models of the suffixal derivation are described. Key words: the optimization of the translated dictionary volume, the knowledge-based ma­ chine translation system, derivation model, derivation type, the format of the entry, the databases for the productive models of the suffixal derivation. ISSN 0027-2833. Мовознавство, 2012, № 1 63