Тегування власних назв організацій в національному корпусі української мови

У статті здійснено спробу уніфікувати оформлення власних назв у Національному корпусі української мови. Запропоновано способи тегування назв організацій.

Gespeichert in:
Bibliographische Detailangaben
Datum:2007
1. Verfasser: Лозова, Н.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут української мови НАН України 2007
Schriftenreihe:Лексикографічний бюлетень
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/73038
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Тегування власних назв організацій в національному корпусі української мови / Н. Лозова // Лексикографічний бюлетень: Зб. наук. пр. — К.: Ін-т української мови НАН України, 2007. — Вип. 16. — С. 88-92. — Бібліогр.: 1 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-73038
record_format dspace
spelling irk-123456789-730382015-01-06T18:16:22Z Тегування власних назв організацій в національному корпусі української мови Лозова, Н. Комп'ютерна лінгвістика У статті здійснено спробу уніфікувати оформлення власних назв у Національному корпусі української мови. Запропоновано способи тегування назв організацій. 2007 Article Тегування власних назв організацій в національному корпусі української мови / Н. Лозова // Лексикографічний бюлетень: Зб. наук. пр. — К.: Ін-т української мови НАН України, 2007. — Вип. 16. — С. 88-92. — Бібліогр.: 1 назв. — укр. XXXX-0118 http://dspace.nbuv.gov.ua/handle/123456789/73038 811.161.2’374.72’22 uk Лексикографічний бюлетень Інститут української мови НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Комп'ютерна лінгвістика
Комп'ютерна лінгвістика
spellingShingle Комп'ютерна лінгвістика
Комп'ютерна лінгвістика
Лозова, Н.
Тегування власних назв організацій в національному корпусі української мови
Лексикографічний бюлетень
description У статті здійснено спробу уніфікувати оформлення власних назв у Національному корпусі української мови. Запропоновано способи тегування назв організацій.
format Article
author Лозова, Н.
author_facet Лозова, Н.
author_sort Лозова, Н.
title Тегування власних назв організацій в національному корпусі української мови
title_short Тегування власних назв організацій в національному корпусі української мови
title_full Тегування власних назв організацій в національному корпусі української мови
title_fullStr Тегування власних назв організацій в національному корпусі української мови
title_full_unstemmed Тегування власних назв організацій в національному корпусі української мови
title_sort тегування власних назв організацій в національному корпусі української мови
publisher Інститут української мови НАН України
publishDate 2007
topic_facet Комп'ютерна лінгвістика
url http://dspace.nbuv.gov.ua/handle/123456789/73038
citation_txt Тегування власних назв організацій в національному корпусі української мови / Н. Лозова // Лексикографічний бюлетень: Зб. наук. пр. — К.: Ін-т української мови НАН України, 2007. — Вип. 16. — С. 88-92. — Бібліогр.: 1 назв. — укр.
series Лексикографічний бюлетень
work_keys_str_mv AT lozovan teguvannâvlasnihnazvorganízacíjvnacíonalʹnomukorpusíukraínsʹkoímovi
first_indexed 2025-07-05T21:40:39Z
last_indexed 2025-07-05T21:40:39Z
_version_ 1836844727628988416
fulltext 88 Лексикографічний бюлетень 2007’16 2. Електронний ресурс: http://nkum.nm.ru. 3. Електронний ресурс: http://www.w3.org/TR/1998/NOTE-datetime-19980827 4. Словник іншомовних слів / Уклад. Л. О. Пустовіт, О. І. Скопненко та ін. – К.: Довіра, 2000. – 1018 с. ТЕГУВАННЯ ВЛАСНИХ НАЗВ ОРГАНІЗАЦІЙ В НАЦІОНАЛЬНОМУ КОРПУСІ УКРАЇНСЬКОЇ МОВИ © Ніна Лозова, 2007 Інститут української мови НАН України (Київ) УДК 811.161.2’374.72’22 У статті здійснено спробу уніфікувати оформлення власних назв у Національному корпусі української мови. Запропоновано способи тегування назв організацій. В Інституті української мови продовжується робота над створенням Національного корпусу української мови. Однією з невідкладних проблем є визначення принципів тегування текстів. Завданням цієї статті є випрацювання способів тегування власних назв організацій. Для того щоб виокремити в тексті власні назви організацій, потрібно визначити, що саме ми розуміємо під поняттям організація. Оскільки створюваний корпус української мови потребує формалізованого викладу даних, слід спиратися не на юридичне визначення, а на формальне. Пропонуємо власною назвою організації вважати будь-яку власну назву на позначення об’єднання осіб, організацій або держав. Це й підприємства, і громадські установи. До організацій зараховуємо й такі, як ЄС, СНД, Рада національної безпеки і оборони, Рада народних депутатів, Верховна Рада України, Рада Європи. Організацією вважаємо також комплекс споруд, у якому група людей або організацій здійснює певний обсяг робіт (це й аеропорт, і зоопарк). Отже, назва організації – це назва об’єднання осіб, організацій або держав, перше слово якої пишеться з великої літери. Назва може бути оформлена графічно будь-яким чином, містити пунктуаційні знаки, скорочення. Усі слова (або частина слів), а не лише перше, можуть писатися з великої літери. Слід визначити межу, за якою починається (закінчується) назва організації. Так, у наведених вище прикладах (Верховна Рада України, Рада Європи) до назви організації належить і географічна назва. Однак якщо топонім лише вказує на місце, якому організація належить чи де вона Лексикографічний бюлетень 2007’16 89 розташована, його розглядаємо як самостійний об’єкт (наприклад, «Динамо» Київ – тут назва організації «Динамо», Київ – географічна назва). По-іншому розглядаємо загальні назви при власних назвах організацій. Зрозуміло, що футбольний клуб «Динамо» Київ – це поєднання загальної назви (футбольний клуб), власної назви організації («Динамо») та топоніма (Київ). Топонім може подаватися після назви в дужках і без. Якщо перед назвою організації наводиться відтопонімічний прикметник, то він може входити до назви (Київський національний економічний університет) або просто визначати географію організації (київське «Динамо»). Формально в такому разі приналежність відтопонімного прикметника до назви виражена великою літерою прикметника. Загальні назви (клуб, об’єднання) перед власними до назв організацій не входять. Це стосується й абревіатур, які пишуть з великої літери (ТОВ, ВАТ). Назва організації може бути оформлена як у лапках, так і без них. Вважаємо, що лапки є частиною назви. Ті самі назви організації можуть бути оформлені по-різному. Так, можлива повна і часткова назва, є назви офіційні і неофіційні, подані розгорнуто і скорочено. Усі вони, як і назви з помилками, однаково будуть бути прийняті за назву організації. Проблему помилок під час тегування розв’язують поданням тексту відповідно до оригіналу із зазначенням помилки та вказівкою на правильний варіант. Назви організацій подаємо з тими помилками, які є в тексті. Отже, та сама організація може мати в текстах (або й у тому самому тексті) різні назви – повну, скорочену, абревіатуру, побутову, з помилками (пор. Інститут рукопису Національної бібліотеки України імені В. І. Вернадського; Інститут рукопису НБУВ НАН України; Інститут НБУВ; ІР НБУВ; Інститут Національної бібліотеки України імені В. І. Вернадського; ІР Національної бібліотеки України; Інститут рукопису або Ужгородський державний університет; Ужгородський держуніверситет; УжДу). У пропонованих способах тегування ми спираємося на систему кодування TEI Lite [1]. Назви організацій позначаємо в тексті як <name type=org>. За усталеною практикою для полегшення тегування після назви ми пропонуємо не повторювати </name type=org>, а ставити лише </name>. Отже, назву організації в тексті оформляємо так: <name type=org>Чорноморський біосферний заповідник </name>, <name type=org>Голландські авіалінії</name>. Складнощі виникають у тому разі, коли назва організації містить у своєму складі іншу назву, що вказує на місце її розташування, напр. Національний архівний фонд України, Індустріальний союз Донбасу, Форум порятунку Києва, Чорноморський біосферний заповідник, Японська православна церква; організацію, напр. Національний науково-дослідний реставраційний центр 90 Лексикографічний бюлетень 2007’16 Міністерства культури і туризму України, Інститут української мови Національної академії наук України; особу, напр. Смітсонівський інститут, Джек Расел тер'єр клуб, ДРЕС ім. Классона. Постає питання, чи варто тегувати кожну з назв, чи знехтувати іншими заради назви організації: <name type=org>Інститут української мови Національної академії наук України</name> або <name type=org>Інститут української мови <name type=org>Національної академії наук <name type=country>України</></> 1 </name>. На нашу думку, оскільки будь-який аспект може зацікавити дослідника, не варто нехтувати якимсь із них. Однак для спрощення системи тегування доцільно після периферійної в цьому разі назви ставити не </name>, а </>, залишаючи </name> наприкінці повної назви: <name type=org>Інститут української мови <name type=org>Національної академії наук<name type=country> України</></></name>. У назвах організацій, до складу яких уходить місце розташування, тобто <name type=place>, <name type=country>, <name type=town> тощо, пропонуємо розв’язати проблему так само, як і в попередньому випадку, а саме не <name type=org>Радою Європи </name> чи <name type=org>Рада <name type=place>Європи </name></name>, а <name type=org>Рада <name type=place> Європи</> </name>. Однак вказівка на розташування організації може бути у формі як топоніма, так і відтопонімічного прикметника. Пропонуємо в тегуванні виділяти лише перші, другі ж уважати частиною назви, оскільки якщо вилучити відтопонімний прикметник, назва організації перетворюється на родову назву, пор. Чорноморський біосферний заповідник і біосферний заповідник. Якщо ж видалити топонім, будемо мати неповну назву тієї самої організації, пор. Національний архівний фонд України і Національний архівний фонд. Відповідно й оформлення назви організації, що містить у своєму складі географічну назву, буде таким: <name type=org>Чорноморський біосферний заповідник </name>, але <name type=org>Національний архівний фонд <name type=country> України </> </name>. Схожою є ситуація й із назвами організацій, до складу яких входить назва особи. Тут теж пропонуємо по-різному розв’язувати тегування назв з антропоніми. Відантропонімні прикметники варто не відокремлювати від назви організації 1 Чи доцільно повторювати знак </> кілька разів, потрібно з’ясувати не лише для назв організацій, а й для інших випадків тегування. Лексикографічний бюлетень 2007’16 91 <name type=org>Смітсонівський інститут</name>. Виділяємо в межах назви організації антропоніми, якщо організація названа на честь кого-небудь <name type=org>Інститут мовознавства <type=abbr>ім. 1 <name type=person>О.О. Потебні 2 </> </name>. Однак у назві Джек Расел тер'єр клуб ім’я Джек Расел невід’ємне від назви організації. Тому в подібних випадках недоцільно виділяти ті антропоніми, які виступають на початку назви (у препозиції). Вони називають переважно фундатора або власника організації, іменем якого вона й названа. Таку назву оформлюємо: <name type=org>Джек Расел Тер'єр Клуб</name> на відміну від <name type=org>Національний музей <name type=person>Тараса Шевченка</></name>. Як випливає з зазначеного вище, варто виділяти й скорочення в межах назви організації (окремо слід зауважити про розширене поняття абревіатури в тегуванні). Про скорочення на зразок ім. і його оформлення вже йшлося. Так само оформляємо й інші скорочення, що входять до назви організації <name type=org>Рада Міністрів<name type=country> <type=abbr>УРСР</></name>. Досить часто вся назва подається як абревіатура: <name type=org><type=abbr>МГТС<name type=org>. Можливе скорочення лише частини назви: <name type=org><type=abbr>ДРЕС <type=abbr>ім. <name type=person> Классона</></name>, <name type=org><type=abbr>УПЦ Київського патріархату</name>. Якщо при скороченні зазначено й відмінкове закінчення (ЮКОСом), його варто подавати разом зі скороченням: <name type=org> <type=abbr>ЮКОСом </name>. Пропонуємо тегувати в назвах і графіку, якою подано назву організації або її частину (можливо, варто позначати <foreign lang> назви лише за графічною приналежністю – пор. Ай Пі Телеком і IР-Telecom). Звичайно, у назвах організацій трапляються й пунктуаційні знаки. Їх слід позначати так само, як і в інших фрагментах тексту: <name type=org><q>ФарлепhyphІнвест</q></name>; lpar<name type=org> <type=abbr>ЄБРР</name> rpar (lpar і rpar ставимо перед <name type=org>, оскільки вони не належать до назви. 1 Ґрунтуючись на традиції, після <type=abbr></> не ставимо. 2 Питання про доцільність уважати ініціали окремим скороченням (<type=abbr>) у цій статті не розглядаємо. 92 Лексикографічний бюлетень 2007’16 Послідовність подання тегів можлива така: спочатку <name type=org>, а потім інші теги залежно від послідовності об’єктів тегування. Наприкінці назви організації після всіх</> наводимо <name type=org>. Література 1. Lou Burnard, C.M.Sperberg-McQueen TEI Lite. – Електронний ресурс: http://www.tei.org, 1995. ОСНОВНІ КРИТЕРІЇ ВСТАНОВЛЕННЯ ПАРАМЕТРІВ СИНОНІМІЧНОСТІ СЛІВ В ЕЛЕКТРОННОМУ СЛОВНИКУ СИНОНІМІВ УКРАЇНСЬКОЇ МОВИ © Олена Устимець, 2007 Український мовно-інформаційний фонд НАН України (Київ) УДК: 81’374.221 У статті проаналізовано основні критерії встановлення синонімічності слів під час побудови Електронного словника синонімів української мови (ЕСС) на базі комп’ютерної версії „Словника синонімів української мови”. Визначення критерію семантичної подібності слів запропоновано вирішувати через встановлення схожості їхніх тлумачень, спираючись на теорію семантичних станів мовних одиниць. Проблема лексичних синонімів та синонімії була й залишається актуальною, цікавою й складною для лінгвістів. Особливого значення вона набуває тепер, коли розвиваються нові засоби комунікації (Internet), машинний переклад, системи інформаційного пошуку (індексація за ключовими словами обов’язково передбачає врахування синонімів), створюється новий тип лексичних ресурсів – електронні словники. А це означає, що змінилися практичні вимоги до укладання таких словників, постала потреба в операційному визначенні синонімів. Як зазначає академік Ю. Д. Апресян [1: 216], проблемі синонімії присвячували й присвячують чимало уваги в лінгвістичних дослідженнях. Однак важливі питання, пов’язані з сутністю цього явища, однозначно все ще не розв’язані. Так, на думку зарубіжних та українських провідних фахівців із питань синонімії, чіткості в проблемі про принципи та критерії синонімічності поки що немає, наявні класифікації синонімів досить умовні, а саме поняття „синонім‖ надто розпливчасте і практично синонімічні відношення між словами під час укладання словників встановлюють інтуїтивно, без урахування чітко випрацюваних наукових положень [1; 2; 3; 9; 10].