Інформаційні технології у польській лексикографії: сучасний стан та перспективи
У статті аналізується сучасний стан польської комп’ютерної лексикографії, вказуються основні періоди її розвитку, визначаються перспективи застосування інформаційних технологій у створенні електронних словників нового покоління....
Gespeichert in:
Datum: | 2012 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | Ukrainian |
Veröffentlicht: |
Інститут мовознавства ім. О.О. Потебні НАН України
2012
|
Schriftenreihe: | Мовознавство |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/183656 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Інформаційні технології у польській лексикографії: сучасний стан та перспективи / В.В. Чумак, Р.П. Тимошук // Мовознавство. — 2012. — № 3. — С. 75-79. — Бібліогр.: 20 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-183656 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1836562022-04-08T01:35:16Z Інформаційні технології у польській лексикографії: сучасний стан та перспективи Чумак, В.В. Тимошук, Р.П. У статті аналізується сучасний стан польської комп’ютерної лексикографії, вказуються основні періоди її розвитку, визначаються перспективи застосування інформаційних технологій у створенні електронних словників нового покоління. This article analyzes the current state of Polish computer lexicography, indicates major periods of its development. The prospects of applying information technologies of composing new generation dictionaries are determined. 2012 Article Інформаційні технології у польській лексикографії: сучасний стан та перспективи / В.В. Чумак, Р.П. Тимошук // Мовознавство. — 2012. — № 3. — С. 75-79. — Бібліогр.: 20 назв. — укр. 0027-2833 http://dspace.nbuv.gov.ua/handle/123456789/183656 uk Мовознавство Інститут мовознавства ім. О.О. Потебні НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
description |
У статті аналізується сучасний стан польської комп’ютерної лексикографії, вказуються основні періоди її розвитку, визначаються перспективи застосування інформаційних технологій у створенні електронних словників нового покоління. |
format |
Article |
author |
Чумак, В.В. Тимошук, Р.П. |
spellingShingle |
Чумак, В.В. Тимошук, Р.П. Інформаційні технології у польській лексикографії: сучасний стан та перспективи Мовознавство |
author_facet |
Чумак, В.В. Тимошук, Р.П. |
author_sort |
Чумак, В.В. |
title |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи |
title_short |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи |
title_full |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи |
title_fullStr |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи |
title_full_unstemmed |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи |
title_sort |
інформаційні технології у польській лексикографії: сучасний стан та перспективи |
publisher |
Інститут мовознавства ім. О.О. Потебні НАН України |
publishDate |
2012 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/183656 |
citation_txt |
Інформаційні технології у польській лексикографії: сучасний стан та перспективи / В.В. Чумак, Р.П. Тимошук // Мовознавство. — 2012. — № 3. — С. 75-79. — Бібліогр.: 20 назв. — укр. |
series |
Мовознавство |
work_keys_str_mv |
AT čumakvv ínformacíjnítehnologííupolʹsʹkíjleksikografíísučasnijstantaperspektivi AT timošukrp ínformacíjnítehnologííupolʹsʹkíjleksikografíísučasnijstantaperspektivi |
first_indexed |
2025-07-16T03:39:55Z |
last_indexed |
2025-07-16T03:39:55Z |
_version_ |
1837773319600865280 |
fulltext |
В. В. ЧУМАК, Р. П. ТИМОШУК
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ У ПОЛЬСЬКІЙ
ЛЕКСИКОГРАФІЇ: СУЧАСНИЙ СТАН ТА
ПЕРСПЕКТИВИ ____________________________
У статті аналізується сучасний стан польської комп’ютерної лексикографії, вказуються
основні періоди її розвитку, визначаються перспективи застосування інформаційних техно
логій у створенні електронних словників нового покоління.
К л ю ч о в і слова: електронний словник, інформаційні технології, польська комп’ютер
на лексикографія, тлумачний словник.
Усебічне й масштабне проникнення комп’ютерної техніки в різні сфери суспіль
ної діяльності зумовлює активізацію роботи лексикографів-славістів щодо
впровадження інформаційних технологій та створення нових словникових ре
сурсів із використанням комп’ютерних систем, які надають нові інструменталь
ні можливості для фіксації й дослідження одиниць мови. Сьогодні розвиток
комп’ютерної лексикографії характеризується застосуванням принципів авто
матизованої побудови й укладання реєстрів традиційних паперових словників,
розробленням електронних словників як елементів інформаційно-пошукових
підсистем та створенням лексикографічних систем як мовно-інформаційних
об’єктів принципово нового типу \
У сучасній слов’янській лексикографії пріоритетними є наукові дослідження,
пов’язані з автоматичним одержанням текстів різних словників, комп’ютерними
програмами різноманітного застосування в системах штучного інтелекту, машин
ного перекладу та в інформаційно-пошукових системах (М. Банько, А. М. Бара
нов, П. Жмігродський, М. М. Пещак, В. А. Широков, 3. Салоні та ін.) 2.
Крім значної економії часу та інтелектуальних ресурсів, комп’ютерне
опрацювання лексикографічних даних дає можливість підтримувати точність і
ретельність контролю лексикографічного процесу, оперативно виправляти по
милки, створювати нові лексикографічні та термінографічні комплекси 3. За
1 Широков В. А. Елементи лексикографії.— К., 2005.— С. 18.
2 Баранов А. Н. Введение в прикладную лингвистику.— М., 2003.— 360 с.; Пещак М. М.
Нариси з комп’ютерної лінгвістики.— Ужгород, 1999.— 199 с.; Широков В. А. Лінгвістичні
та технологічні основи тлумачної лексикографії.— К., 2010.— 295 с.; Широков В. А. Комп’ю
терна лексикографія.— К., 2011.— 351 с.; Banko М. Z pogranicza leksykografii і j^zykoznaw-
stwa.— Warszawa, 2001.— 336 s.; Saloni Z. Perspektywy polskiej leksykografii jednoj?zycznej //
Poradnik j^zykowy.— Warszawa, 1996.— N 7.— S. 1—18; Zmigrodzki P. Wprowadzenie do lek
sykografii polskiej.— Katowice, 2009.— 310 s.
* Дубининский В. В. Теоретическая и практическая лексикография.— Вена; X., 1998.—
С. 55.
О В. В.ЧУМАК, Р. П. ТИМОШУК, 2012
ISSN 0027-2833. Мовознавство, 2012, № З 75
В. В. Чумак, Р. П. Тимошук.
стосування інформаційних технологій у традиційному словникарстві дозволяє
також проводити різні лексикологічні та лексикографічні роботи в автомати
зованому режимі й надає можливість створення лінгвістичних, зокрема лекси
кографічних, баз даних і знань з метою використання їх у дослідницькому та
технологічному режимах.
Як показує вивчення наукових джерел, у лінгвістичній славістиці немає од
нозначного трактування багатьох понять, пов’язаних з комп’ютерною лексико
графією. Так, польські лексикографи поняття «електронний словник» застосо
вують до різного типу об’єктів: 1) словникових модулів, убудованих у програми
для різноманітних (не тільки лексикографічних) використань; 2) окремих ком
п’ютерних програм, записаних на електронних носіях, що містять лексикографіч
ну базу даних, а також спеціальних пошукових інструментів; 3) словникових сис
тем, доступних з інтернету; 4) перекладних словників у вигляді окремих
мініатюрних комп’ютерних пристроїв; 5) систем, які полегшують уведення
текстів 4. Однак найчастіше термін «електронний словник» у теорії та практиці
лексикографування застосовується на позначення перекладних словників у виг
ляді окремих комп’ютерних засобів. Водночас поняття «комп’ютерний словник»
уживається як щодо об’єктів, перелічених у другому пункті, так і в загальному ви
користанні поряд із терміном «електронний словник»5.
Таку ж неоднозначність трактування спостерігаємо й у східнослов’янських
дослідників. Зокрема, російський учений А. М. Баранов автоматичним (елект
ронним) словником називає словник у спеціальному машинному форматі, при
значений для використання користувачем або комп’ютерною програмою об
роблення тексту6. Український дослідник В. В. Дубічинський поняття «елект
ронний словник» визначає як частину автоматизованої системи інтелектуаль
ного призначення із зібраними й певним чином упорядкованими найменуван
нями понять у тій галузі знань, з якими працює або на які спирається ця автома
тизована система1.
Перші польські електронні словники з’явилися в 90-х роках XX ст. У цей
період виходять у світ «Komputerowy slownikjçzykapolskiego» (1996) 8 та елект
ронна версія 11-томного словника польської мови В. Дорошевського (1997) 9.
За нашими спостереженнями, електронний варіант великого тлумачного
словника В. Дорошевського є комп’ютерною програмою, за допомогою якої
можна проводити перегляд окремих словникових статей у графічному режимі,
а також пошук словникового матеріалу за певними лексикографічними пара
метрами. Оснащена такою пошуковою системою, комп’ютерна версія в абет
ковому порядку дає повний доступ до реєстрових одиниць одинадцятитомного
тлумачного словника В. Дорошевського (1958-1961 pp.). Натомість «Kom
puterowy slownik jçzyka polskiego» 10, в основі якого лежить лексичний мате
ріал трьохтомного «Slownika jçzyka polskiego» М. Шимчака, а також «Slow-
nika wyrazôw obcych» E. Соболь, надає швидкий доступ до лексикографічної
інформації кожного з перелічених джерел з можливістю пошуку та системати
зації словникового матеріалу за відповідними ремарками.
4 Zmigrodzki P. Op. cit.— S. 251-252.
5 Ibid.— S. 252.
6 Баранов А. Н. Зазнач, праця.— C. 85.
7 Дубічинський В. В. Українська лексикографія: історія, сучасність та комп’ютерні тех
нології.— X., 2004.— С. 72.
8 Komputerowy slownikjçzykapolskiego.— Warszawa, 1996.
9 Slownik jçzyka polskiego [Wersja elektroniczna] / Red. W. Doroszewski.— Warszawa,
1958-1969,1997,— T. 1-11.
10 Назва продукту з погляду металексикографії є неточною, оскільким комп’ютерним
словником може називатися будь-яка інша електронна лексикографічна праця даного типу.
76 ISSN 0027-2833. Мовознавство, 2012, № З
Інформаційні технології у польській лексикографії..
Саме після появи цього словника польські лексикографи П. Жмігрод-
ський, 3. Салоні, К. Томчак та ін. відзначають переваги електронного носія
над паперовими виданнями. Серед основних позитивних характеристик ком
п’ютерних лексиконів учені називають: гнучкість інформації, зручність опе
рування лексикографічними даними, швидкий доступ до реєстрових слів та
їх пошук за різноманітними критеріями, можливість інтеграції кількох слов
ників в одній програмі п. Ретельно опрацьований комп’ютерний словник, на
думку П. Жмігродського, знімає будь-які обмеження, притаманні традицій
ному словникарству п.
Як відомо, на початку XXI ст. у польській комп’ютерній лексикографії спо
стерігалася певна стагнація у застосуванні цифрових технологій. Електронні
словники розглядалися здебільшого як додаткова форма паперової версії
(через доступ в Інтернеті або додавання оптичного диска до традиційного
словника). Бар’єром на шляху розвитку інформаційних технологій став неви
сокий попит на електронні словники з боку масового користувача 13. На думку
М. Банька, комп’ютеризація інформації, з одного боку, збільшує можливості
паперових словників (дозволяє здійснювати вибірковий пошук реєстрових
одиниць, фрагментів слів тощо), а з другого, — виявляє непослідовності й про
галини друкованого тексту. Можливості комп’ютерних словників значно б
зросли, якби вони із самого початку створювалися в електронній формі14.
Якісно інший етап розвитку польської комп’ютерної лексикографії розпо
чався тоді, коли електронний словник перестав сприйматися дослідниками ли
ше як зведення вказівок щодо вживання або значення того чи іншого слова і
почав розглядатися як джерело певним чином структурованої лінгвістичної ін
формації, на основі якої виявляються додаткові механізми функціонування
мови як системи. Це підтверджує висновки В. А. Широкова про загальну тен
денцію зміщення акценту комп’ютерно-лексикографічних праць із технології
укладання словника до постановки й розв’язання питань опрацювання тексту,
реалізованого словником. Для сучасної комп’ютерної лексикографії одним із
важливих завдань стає дослідження природномовного тексту словника з ме
тою формалізації відображених у ньому мовних явищ 15.
Польська комп’ютерна лексикографія серед інших завдань передбачає
створення комплексних лексикографічних систем, що інтегрують репрезента
тивну лінгвістичну та когнітивну інформацію певної природної мови або су
купності мов. Ідеалом теорії і практики польської лексикографії залишається
універсальний словник, який з максимальною повнотою міг би відобразити
мовну стихію, усі розряди одиниць лексикону зі всіма властивими їм ознака
ми. Вимогою до такого словника є подання всебічної інформації про специ
фіку реєстрових одиниць: їх значення, основні граматичні характеристики,
стилістичні властивості, контексти вживання, фразеологізми та інші семанти-
ко-синтаксичні структури, до складу яких входить реєстрове слово.
Інноваційним продуктом польської лексикографії є комп’ютерна версія
«ипі\¥ег5а1пе§0 віошпіка ̂ гука polskiego» С. Дубіша (2004 р .)16. Цей словник,
11 Saloni Z. Op. cit.— S. 16; TomczakK. O wyzszosci slownika komputerowego nad tradycyj-
nym // Poradnik j^zykowy.— Warszawa, 1997.— N 7.— S. 59-64.
12 Zmigrodzki P. Terazniejszosc і przysztosc polskiej leksykografii j^zykoznawczej // Poradnik
j^zykowy.— Warszawa, 2003.— N 1.— S. 25.
13 Ibid.— S. 25.
14 Banko M. Stan і perspektywy wspolczesnej polskiej leksykografii j ednoj ̂ zycznej // J^zyko-
znawstwo w Polsce.— Opole, 2003.— S. 132-133.
15 Широков В. А. Інформаційна теорія лексикографічних систем.— K., 1998.— C. 70.
16 Uniwersalny slownik j?zyka polskiego [Wersja elektroniczna] / Red. S. Dubisz.— War
szawa, 2004.
ISSN 0027-2833. Мовознавство, 2012, № 3 77
В. В. Чумак, Р. П. Тимошук
у якому використано досвід укладання різних типів словників (тлумачних, ор
фографічних, фразеологічних, словників іншомовних слів, словників синоні
мів, антонімів тощо), репрезентує різноаспектну словникову інформацію. В
електронній версії словника, крім значного лексикографічного матеріалу з ве
ликими можливостями пошуку (окремо винесено індекси «Hasla slownika»,
«Przyslowia», «Terminy і frazeologizmy», «Indeks a tergo»), доступна інтерак
тивна мережа відсилань між реєстровими одиницями, які пов’язані певними
значеннєвими відношеннями (синонімічними, антонімічними, гіперо-гіпо-
німічними), що надає широкі можливості для проведення різного роду лінгвіс
тичних досліджень. Лексикографічна праця С. Дубіша є першим польським
тлумачним словником універсального типу, лінгвістичний матеріал якого
ґрунтується на основі Корпусу текстів польської мови, що дозволяє мініма-
лізувати суб’єктивність в інтерпретації значень реєстрових одиниць.
Окремо варто спинитися на Граматичному словнику польської мови, який
укладено в електронній формі 2007 року (автори: 3. Салоні, В. Грущинський,
М. Волинський, Р. Волош)17. У лінгвістичній полоністиці відзначається, що цей
словник створено за допомогою спеціальних лінгвістичних алгоритмів, у ре
зультаті чого подано граматичну характеристику близько 254 тис. польських
мовних одиниць. Формат такого словника дозволяє фіксувати всі флексійні
форми описаних реєстрових слів (понад 4 млн словоформ), а також здійснюва
ти пошук за окремими граматичними класами: іменниками, прикметниками,
числівниками, дієсловами та іншими частинами мови. Окрім того, реєстрові
одиниці словника розміщено двома способами: а fronte — звичайний алфавіт
ний порядок слів, а також a tergo (зворотний порядок), що дозволяє автоматич
но виявляти лексеми, які мають подібну словозмінну парадигму.
На сьогодні значна частина польських словникових систем функціонує в
онлайновому режимі. Вони надають користувачам можливість прямого до
ступу до фундаментальних словникових ресурсів через Інтернет. Найважли
вішими серед них є: «Slownik j^zyka polskiego» (www.sjp.pwn.pl) 18, який є
електронною версією словника «100 tysi^cy potrzebnych slow» Є. Бральчика
(2005 p.), «Uniwersalny slownik j?zyka polskiego» (www.usjp.pwn.pl) — доступ
платний, «Wielki slownik ortograficzny PWN» (www.so.pwn.pl) та «Slownik
wyrazow obcych PWN» (swo.pwn.pl).
Однак польські лексикографічні праці, що виходять протягом останніх
п’ятнадцяти років, усе ж не можуть претендувати на роль повного джерела
опису лексики сучасної польської мови. У зв’язку із значним поширенням на
укової та технічної термінології різних галузей знань, процесу термінологіза
ції мовних одиниць, упровадженням у польську мову величезного масиву но
вої лексики, насамперед іншомовного походження, зростає потреба створення
нового великого академічного словника польської мови, який міг би прийти на
зміну словнику В. Дорошевського, від часу створення якого пройшло понад
п’ятдесят років.
З одного боку, зазначені мовні процеси є ознакою нормального природного
розвитку мови, але з другого, — приводять до певних проблем при лексикогра-
фуванні польської лексики загальномовними та термінологічними словника
ми, оскільки лексикографічні джерела не завжди вчасно фіксують зміни, що
відбулися в лексичній семантиці сучасної літературної мови, часто не всти
гаючи врахувати темпи розвитку загальновживаної і термінологічної лексики.
Розв’язання цієї проблеми полягає у створенні нових словникових праць тлу-
17 Slownik gramatyczny j?zyka polskiego / Z. Saloni, W. Gruszczynski і in.— Warszawa, 2007.
18 Усі вказані електронні адреси актуальні станом на квітень 2012 року.
78 ISSN 0027-2833. Мовознавство, 2012, № З
http://www.sjp.pwn.pl
http://www.usjp.pwn.pl
http://www.so.pwn.pl
Інформаційні технології у польській лексикографії..
манного та термінологічного типу із застосуванням інформаційно-комп’ютер-
них технологій, що дозволить ефективніше вирішувати поставлені лексико
графічні завдання.
У перспективі польських лексикографів — «Wielki slownik jçzyka pol
skiego» 19, робота над яким здійснюється авторськими колективами академіч
них наукових осередків Варшави, Кракова, Катовіц, Торуня. В основі проек
ту лежить загальна концепція нового великого тлумачного словника
дескриптивного характеру у виключно електронному варіанті, що виконува
тиме функцію основного інформативного джерела польської мови, охоп
люючи польську лексику, починаючи від 1945 року. Укладачі передбачили
необхідність вичерпного опису якнайбільшої кількості польських лексичних
одиниць згідно із сучасним станом мовознавчої науки та новітніми стандар
тами світової лексикографії.
Основними принципами лексикографування польської лексики у майбут
ньому словнику є:
1. Доступ до мовних одиниць в електронній формі, що сприятиме постій
ному збагаченню ресурсів словника, даватиме можливість коректування,
удосконалення лексикографічного опису реєстрових слів.
2. Синхронний опис — словник охоплюватиме новітню польську лексику
останнього десятиліття XX ст. — поч. XXI ст.
3. Автономність — незалежність словника від лексикографічних концеп
цій попередніх тлумачних лексиконів.
4. Дескриптивність — характеристика мовних одиниць із урахуванням їх
функціонування та уживаності в сучасній польській мові.
5. Урахування надбань сучасної мовознавчої науки, зокрема в галузі се
мантики, граматики і прагматики20.
Така постановка завдання є для польського словникарства доволі новою.
Вона вимагає вироблення нових концептуальних засад, що враховували б як
суто лінгвістичні аспекти, так і технологічні моменти лексикографічного про
цесу. Це підтверджує висновки про необхідність і перспективи активізації
впровадження у традиційне слов’янське словникарство новітніх комп’ютер
них методів опрацювання лексикографічних даних, розроблення нової мето
дики та засобів комп’ютеризації процесу лексикографування аж до створення
лексикографічних систем нового типу.
V. V. CHUMAK, R. P. TYMOSHUK
INFORMATION TECHNOLOGIES IN POLISH LEXICOGRAPHY: CURRENT
STATE AND PROSPECTS
This article analyzes the current State of Polish computer lexicography, indicates major periods
of its development. The prospects of applying information technologies of composing new généra
tion dictionaries are determined.
Keywords : electronic dictionary, information technologies, Polish computer lexicography,
explanatory dictionary.
19 Докладну інформацію про проект «Wielkiego slownika jçzyka polskiego» можна знайти
за адресою: http://www.wsjp.pl/
2® Zmigrodzki P. Jak powstaje «Wielki slownik jçzyka polskiego» // Jçzyk polski wczoraj —
dzis — jutro / Red. B. Czopek-Kopciuch.— Krakôw, 2010.— S. 151-152.
ISSN 0027-2833. Мовознавство, 2012, № 3 79
http://www.wsjp.pl/
|