Системи анотування просодії китайської мови

Збережено в:

Бібліографічні деталі
Дата:	2011
Автор:	Гобова, Є.
Формат:	Стаття
Мова:	Ukrainian
Опубліковано:	Інститут сходознавства ім. А.Ю. Кримського НАН України 2011
Назва видання:	Китаєзнавчі дослідження
Теми:	Питання китайського мовознавства
Онлайн доступ:	http://dspace.nbuv.gov.ua/handle/123456789/31212
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Системи анотування просодії китайської мови / Є. Гобова // Китаєзнавчі дослідження: Зб. наук. пр. — 2011. — Т. 1. — С. 96-102. — Бібліогр.: 15 назв. — укр.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

id	irk-123456789-31212
record_format	dspace
spelling	irk-123456789-312122012-02-27T12:08:59Z Системи анотування просодії китайської мови Гобова, Є. Питання китайського мовознавства 2011 Article Системи анотування просодії китайської мови / Є. Гобова // Китаєзнавчі дослідження: Зб. наук. пр. — 2011. — Т. 1. — С. 96-102. — Бібліогр.: 15 назв. — укр. XXXX-0094 http://dspace.nbuv.gov.ua/handle/123456789/31212 uk Китаєзнавчі дослідження Інститут сходознавства ім. А.Ю. Кримського НАН України
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection	DSpace DC
language	Ukrainian
topic	Питання китайського мовознавства Питання китайського мовознавства
spellingShingle	Питання китайського мовознавства Питання китайського мовознавства Гобова, Є. Системи анотування просодії китайської мови Китаєзнавчі дослідження
format	Article
author	Гобова, Є.
author_facet	Гобова, Є.
author_sort	Гобова, Є.
title	Системи анотування просодії китайської мови
title_short	Системи анотування просодії китайської мови
title_full	Системи анотування просодії китайської мови
title_fullStr	Системи анотування просодії китайської мови
title_full_unstemmed	Системи анотування просодії китайської мови
title_sort	системи анотування просодії китайської мови
publisher	Інститут сходознавства ім. А.Ю. Кримського НАН України
publishDate	2011
topic_facet	Питання китайського мовознавства
url	http://dspace.nbuv.gov.ua/handle/123456789/31212
citation_txt	Системи анотування просодії китайської мови / Є. Гобова // Китаєзнавчі дослідження: Зб. наук. пр. — 2011. — Т. 1. — С. 96-102. — Бібліогр.: 15 назв. — укр.
series	Китаєзнавчі дослідження
work_keys_str_mv	AT gobovaê sistemianotuvannâprosodííkitajsʹkoímovi
first_indexed	2025-07-03T11:38:06Z
last_indexed	2025-07-03T11:38:06Z
_version_	1836625625480167424
fulltext	96 ПИТАННЯ КИТАЙСЬКОГО МОВОЗНАВСТВА Системи анотування просодії китайської мови Гобова Є. Із пожвавленням розвитку цифрових технологій акустичні дослідження просодії вийшли на новий рівень. Завдяки новітнім досягненням у цій сфері для широкого загалу стали доступні різноманітні засоби, що дають змогу проводити аналіз про- содичного матеріалу усного мовлення з доволі високою точністю. Проте, окрім питань пов’язаних з суто технологічною стороною цього процесу, актуальною стала проблема уніфікованого підходу до анотування мов із різними просодич- ними атрибутами. Так навіть близькоспоріднені мови вимагають кардинально відмінних підходів до опису та транскрибування. Першим етапом розвитку та впровадження системи анотації та транскрибу- вання стало створення баз даних призначених для неавтоматизованої обробки спеціалістами переважно лінгвістичної галузі. Саме на цьому етапі були закла- дені основні риси системи ТоВІ – чотири мінімальні рівні анотування, основні графічні символи-позначки. Окрім слів, усне мовлення оперує такими інформа- тивними надсегментними елементами як тривалість, інтонація, наголошеність, поділ на мовні одиниці, якість звуку, ритм тощо. У сукупності вони складають просодію мовлення. Поміж інших спроб адаптації системи просодичної анотації ТоВІ до окремих мов світу, створено кілька системи для китайської мови. Зокрема першою систе- мою стала С-ТоВІ, вперше випущена 1996 року [Beckman 1997, 10]. Через фак- тичну відсутність робочої інтонаційної теорії мовлення китайської мови, розроб- ники системи були змушені використовувати результати різних просодичних до- сліджень. Створення цієї системи засновувалося на таких принципах: по-перше, головним призначенням цієї системи є розмітка тональних варіацій, інтонації, на- голосу та просодичних структур, що мають лінгвістичні функції. Так, наприклад, тональна коартикуляція між складами не анотується, натомість анотуєтсья то- нальна коартикуляція, що виникла під дією наголосу. По-друге, анотуються якісні риси просодії, на відміну від кількісних, таких як тривалість та інтенсивність. Крім того, “непевні” місця анотації відмічаються задля уникнення неправильного розу- міння іншими користувачами системи. Оскільки транскрибування проводиться не одним користувачем, між ними має існувати узгодженість та послідовність дій. Найбільш очевидною відмінністю С-ТоВІ від оригінальної системи анотації, створеної на основі специфіки англійської мови, можна назвати відносну “багатоша- ровість” її структури. В той час як для Е-ТоВІ базова кількість рівнів анотації стано- вить чотири, включаючи “тони”, “паузи”, “слова” та категорію “різне” для особли- вих явищ, часто екстралінгвістичного характеру [Beckman 1997, 38], то для С-ТоВІ її автори пропонують аж вісім рівнів. Серед них: “ієрогліфи”, “піньінь”, фонетична сегментація “ініціалі-фіналі”, категорія “різне”, “тип речення”, “паузи”, “наголоси” та “експресивність”. Звичайно ж не завжди є потреба у використанні всіх цих рівнів, тому найчастіше у вжитку цієї системи найчастіше використовуються практично ті самі ж рівні, що і в оригінальній системі ТоВІ, виключення становлять ті рівні, що безпосередньо пов’язані з графічною специфікою китайської мови. 97 Також існує система анотації під назвою М-ТоВІ, що ще іноді називається “всекитайською” (Pan-Mandarin) через намір її авторів створити систему ано- тування просодичної інформації не тільки у стандартизованій китайській мові путунхуа але й у її місцевих різновидах та, в перспективі, для всіх діалектів ки- тайської мови. Щоправда, думки самих розробників розбігаються щодо можли- вості та доцільності її застосування для таких значних діалектних груп як У, Юе та Мінь [Lee 2007, 12]. Варто відмітити, що для основних груп діалектів також створюються та вже створені відповідні системи [Chen 2000, 58]. Рівень “піньінь” містить у собі фонетичні позначення за допомогою стандартного китайського алфавіту піньінь, в яких тони позначаються не діакритичними знаками, а цифрами від 0 до 4, де 0 – нейтральний тон, а 1-4 відповідно тони від першого до чет- вертого. Таке маркування тонів обумовлене технічною специфікою – програми, що використовуються для анотування найчастіше не підтримують діакритичні позначки. Рівень “ієрогліфи” містить у собі запис висловлювання оригінальною ієроглі- фікою. Проте, на відміну від інших рівнів, в цьому символи використовуються не як теги, чи позначки, а як додаткова інформація, що супроводжує процес ано- тування та аналізу. Тобто ієрогліфічний запис слугує семантичною приміткою не прив’язаною напряму до інших рівнів, чи візуального вираження анотованого уривку мовлення. Рівень “ініціалі-фіналі” за допомогою символів МФА чи піньі- ну репрезентує компоненти складів. На рівні “тонів та інтонації” за допомогою системи позначок маркуються змі- ни регістру. Через неусталеність інтонаційної граматики китайської мови інтона- ційна транскрипція застосування деяких позначок може бути неоднозначним на різних етапах обробки та аналізу мовленнєвої інформації. Саме на цьому рівні реалізується одне з основних призначень системи анотування. Через це між різ- ними мовно-спеціалізованими системами ТоВІ головні відмінності у анотацій- них засобах відносяться до рівня тонів та інотнації. Наприклад, у системі С-ТоВІ впроваджено наступні символи: H-L, L-H, H-H, L-L: тональні властивості чотирьох тонів стандартної китай- ської мови; H, L: тональні властивості нейтрального тону стандартної китайської мови; L%, H%, %L, %H: кінцевий граничний тон, початковий граничний тон; &: перехідний тон; ^, !, ^^, !! : підйом, широкий підйом, опущення, широке опущення; Re^(), Re^^(), Re!(), Re!!(): зміна висоти регістру, де дужками позначаються межі зміни; Ra^(), Ra^^(), Ra!(), Ra!!(): глобальна варіація висоти регістру, де дужками по- значаються межі варіації; H^^, H^, L! : локальна варіація висоти регістру. Іншим специфічним рівнем анотування є рівень «паузи». Залежно від загаль- ного типового темпу мовлення, притаманного кожній конкретній мові, ієрархія позначень може суттєво відрізнятися. Паузи позначаються між двома складами тоді, коли транскрибувальник здатний їх сприйняти на слух. Місце та тривалість пауз може змінюватися у різних мовців, що начитують один і той самий текст, та навіть у одного мовця, що читає той самий текст через невеликі періоди часу. Автори системи С-ТоВІ пропонують використовувати для анотації китайської мовлення паузи п’яти категорій відповідно до їх фактичної тривалості: - Індекс паузи = 0: мінімальна пауза між складами, найчастіше це пауза у про- содичному слові; 98 - Індекс паузи = 1: просодичні межі слова; - Індекс паузи = 2: межі малої просодичної фрази; - Індекс паузи = 3: межі великої просодичної фрази (інтонаційної фрази); - Індекс паузи = 4: межі просодичної групи; - 1р, 2р та 3р позначають аномальні паузи, наприклад спричинені ваганням, кашлем тощо; - “?”: невизначеність паузи. Між іншим, у системі М-ТоВІ наряду з індексацією пауз обумовлені типові значення індексів рівнів “наголос” та “тон”, що є закономірними для них: - Елемент з індексом паузи (далі – ВІ від Break Index) = 0 зліва або зправа ви- магає наголосу зі значенням 0 або 1; - Після елементу з ВІ=2 має бути наголос зі значенням щонайменше 2; - Межі просодичної групи, з ВІ=4 мають позначатися відповідними символа- ми для граничних тонів. Разом з тим, у цих двох системах дещо відрізняються класифікації пауз. Наприклад, у М-ТоВІ вона нараховує на одну ступінь більше – тут ще надається окрема позначка паузи для “переведення дихання” ВІ=5 (breath group). Проте така деталізованість виявилася надмірною вже на перших етапах практичного випробовування системи – як з’ясувалося, для транскрибувальників було про- блематичним розрізнення ВІ=4 та ВІ=5 [Lee 2007, 261]. До того ж, така доклад- ність абсолютно не принципова у більшості випадків користування системою. Специфічним рівнем, характерним саме для китайської мови, можна назвати рівень “сандхі”, запропонований до використання розробниками Pan-Mandarin- ToBI [Lee 2007, 246]. За прикладами з діалектних варіантів китайської мови були відстежені відмінності у функціонуванні змішання лексичних тонів. Таким чи- ном, доцільним виявилося також введення окремого рівня для нього. Для запису значення рівня “сандхі” прийнято використовувати так звану “цифрову систему Чао”, тобто послідовність двох чи більше цифр ряду від 1 до 5, що схематично позначає загальний вигляд реалізованого лексичного тону. Крім того, введені додаткові суто функціональні позначки. Всі акустичні події, що не належать до лінгвістичних явищ та істотно не впливають на процес опра- цювання матеріалу, прийнято фіксувати на рівні під назвою “різне” за допомогою відповідних умовних слів-позначок, наприклад: “кашель”, “сміх”, “шум” тощо. При графічному позначенні в одній зі спеціально створених програм (Praat, waves тощо) можна створювати рівні кількох типів: такі, що вказують на значення кон- кретної обраної точки за певними параметрами та такі, що позначають межі одиниці категорії, обраної для конкретного рівня. Так, наприклад рівень “висоти звучання” та “наголосу” зазвичай при створенні встановлюють “точковим” (point tier), а такі рівні як “піньінь” та решта подібних встановлюють “інтервальними” (interval tier). Серед найбільш типових відмінностей між М-ТоВІ та С-ТоВІ слід відзначити саме відсутність рівня “сандхі” в останньому [Lee 2007, 126]. Крім того, С-ТоВІ пропонує введення окремого рівня для вказівки на приналежність мовлення до діалектного за допомогою відповідних позначок. Достеменно важко сказати, на- скільки це доречно, враховуючи, що ця система створювалася саме для путун- хуа, проте в цьому випадку можливі різні тлумачення самого поняття “діалект”, оскільки на рівні з ним у даній статті в аналогічному контексті функціонує термін “акцент”, що в принципі не є тотожним поняттям. Цілком можливо, що цей рівень було запропоновано для позначення виключних, а не закономірних випадків, тоб- то не для систематичного опису діалектів китайської мови, на відміну від М-ТоВІ. 99 Для інших різновидів анотації мовного матеріалу, наприклад синтаксичної, частини мови транскрибуються аналогічно до систем синтезу мовлення. Серед інших нетипових рівнів анотування – емоції та ставлення, що часто зводяться в одному рівні “ефективність”. Емоції означають внутрішні почуття мовця – ра- дість, злість, здивування, агресивність тощо. Ставленням описуються зовнішні прояви поведінки мовця – дружність, співчуття, вибачення і т. п. На даний мо- мент створено програму Feeltrace, що слугує допоміжним засобом для впрова- дження маркування афективної інформації мовних корпусів у різних часових проміжках відповідно до сприйняття слухачем. Проте, наразі не створено жодної послідовної системи такого анотування для окремої мови. Укладачі базового варіанту ТоВІ розрахованого на англійську мову, перш за все наголошують на тому, що цей інструмент створювався головним чином для опису ритму, або чергування різною мірою наголошених складів, принципів гру- пування просодичних слів у більші одиниці та інтонаційних моделей, що скла- даються з сукупності фразових акцентів, різниці у висоті звучання та граничних тонів, функціонування, що уможливлюють проведення опису сандхі тонів, зо- крема особливо складних випадків послідовностей третього тону. Натомість деякі типові аспекти просодії не тільки не мають безпосереднього усталеного способу запису у цій системі, але й разом з тим не передбачені уклада- чами. Серед них – темп та лексичний наголос. Причин для цього може бути кілька: по-перше, ці категорії мають лише дотичне відношення до першочергового при- значення системи, по-друге, у випадку з темпом занадто вузькі можливості для маркування цієї категорії, оскільки темп та тривалість звучання некоректно запи- сувати позначками лише з кількома варіаціями значення, що є достатньо типовим та зручним для інших категорій. По-третє, у випадку з лексичним наголосом, немає потреби у його фіксації, оскільки словниковий варіант наголосу має бути відомий слухачеві апріорі, а відхилення від норми все одно фіксуються на інших рівнях. Разом з тим існують й інакші погляди на доцільність використання системи анотації ТоВІ в межах групи мов чи діалектів однієї мови, оскільки окрім фіксаці- ях тональних малюнків, ТоВІ також фіксує моменти переходу між двома суміж- ними словами, тобто транскрибування фактично відбувається на фонологічному а не фонетичному рівні [Yip 2002, 180]. Таким чином, певний набір інструментів- рівнів, що використовується для однієї мови чи діалекту може бути непридатним для іншого, навіть якщо відмінності між ними на перший погляд незначні. Тому випадки типологічного чи порівняльного опису фонології кількох мов доцільно проводити із використанням інших транскрибувальних систем [Cummins 1999, 25]. До послуг дослідників наразі запропоновано, наприклад, таку універсаль- ну систему як INSINT – International Transcription System for Intonation [Hirst, Di Cristo 1998, 14]. З одного боку, вона має доволі вузьке призначення – виключно в рамках інтонації, з іншого, до її переваг можна віднести можливість одночасного транскрибування великої кількості мов за допомогою доволі простого та інтуї- тивно зрозумілого способу анотування. Зокрема цю систему широко вживають при описах інтонаційних систем мало досліджених чи рідкісних мов. Також, по- рівнюючи цю систему з ТоВІ, очевидно, що INSINT фіксує виключно інформа- цію по висоті звучання, при тому, що ТоВІ окрім висоти транскрибує й інші про- содичні дані, зокрема й міру сполученості окремих просодичних елементів. При цьому така з першого погляду «невизначена» структура ТоВІ, насправді є пере- вагою в тому плані, що немає потреби використовувати одну громіздку систему фонетичного запису для всіх мов та діалектів, оскільки цілком достатньо, щоби 100 кожен різновид системи мав свою послідовну систему анотування. Особливо зручним це виявляється при введенні рівня “фонеми” чи для мало описаних мов. Специфіка запису INSINT головним чином полягає у використанні міток ↑, ↑↑, ↓, ↓↓ для позначення зростаючої інтонації, спадаючої інтонації та посиле- них варіантів обох інтонацій відповідно. Очевидність та простота цього спосо- бу анотування є значною перевагою в контексті одночасного дослідження цілої множини мов та діалектів. Проте в цьому полягає і деяка примітивність цієї сис- теми – опис при цьому занадто поверхневий та прямолінійний. Тому цю систему прийнято називати «фонетичною» на противагу “фонологічній” ТоВІ через від- сутність гнучкості та можливостей деталізації. Перш за все, варто відзначити, що самі автори стверджують про недоціль- ність використання одного різновиду ТоВІ для кількох мов, чи навіть кількох діалектів однієї мови [Beckman 2006, 31]. Разом з тим, вони визнають необхід- ність використання принаймні чотирьох основних рівнів разом із записом F0 та аудіо-файлом у будь-якому специфічному різновиді цієї системи. Більше того, заохочується створення нових рівнів, відповідно до побажань та потреб дослід- ників. Таким чином вже було створено чимало можливостей для транскрибу- вання дискурсу, синтаксичної сегментації тощо. Фактично на основі ТоВІ було створено систему транскрибування жестів та міміки – Anvil, що працює з фай- лами візуального відтворення. З іншого боку існують спроби відмовитися від обов’язкового мінімального набору інструментів. Зокрема Cantonese-ToBI, створений для транскрибування кантонського діалекту, не включає рівня «Наголос», натомість введено рівень “Романізація”, або “Транслітерація”. Така заміна цілком прийнятна з огляду на специфіку цієї мови: наголос тут не є принциповою складовою мовлення і практично не виділяється з загального мовного потоку, змішуючись зі складною системою тонального малюнку. Разом з тим рівень транслітерування за допомо- гою символів латинського алфавіту цілком доречний виходячи з суто технічних міркувань – деяке програмне забезпечення, за допомогою якого проводяться до- слідження, може не підтримувати як дореформене, так і спрощене ієрогліфічне письмо, в той час як романізація є доступним та доволі зручним засобом запису. Відкритим лишається питання доцільності використання рівня «Наголос» для різних китайських мов. Як вже було сказано вище, для кантонського різновиду системи ТоВІ та кантонської мови як такої не прийнято виділяти таке поняття як наголос взагалі [Lee 2007, 432], натомість для СКМ запропоновано окремо описувати наголос, а лексичні тони відмічати разом із транслітерацією. Звичайно ж, доцільність використання тих чи інших засобів створених розробниками цих систем просодичної анотації цілком визначається користувачем відповідно до безпосередніх потреб. До того ж, окрім запропонованих рівнів та їх індексів, ціл- ком можливо створити свої власні функціональні інструменти, чи розширити на- бір доступних індексів. Проте доцільним та ефективним таке доповнення буде за умови дотримання послідовності введення позначень [Dong, Lua 2000, 8] . Також, з наведеної у “Просодичній типології” таблиці не важко зробити висно- вок, що серед усіх розроблених на даний момент різновидів цієї системи, М-ТоВІ (в даному випадку це Pan-Mandarin) має найбільш поширений та складний інстру- ментарій, порівняно велику кількість типів індексів паузи [Lee 2007, 434-435]. Натомість кількість індексів тонів значно поступається корейській мові, зокре- ма у поширеності та складності сполучень. При цьому багато подібностей можна знайти між цією системою та, наприклад, ТоВІ неаполітанської італійської мови. 101 На даний момент створено кілька комп’ютерних програм для обробки, аналі- зу та відтворення мовлення. Серед них є й такі, що підтримують просодичну роз- мітку аудіо-, відео- чи текстового файлу. Найбільш доступною для широкого за- галу користувачів наразі є програма Praat, яку створили Пауль Боерсма та Давід Веенінк в Інституті фонетичних наук при Амстердамському університеті. Слід зазначити, що просодичне транскрибування є лише однією з функцій цієї про- грами поряд із аналізом та синтезом окремих звуків. Хоча така багатосторонність програми значно ускладнює користування нею – більшість функцій потребує від користувача деяких спеціальних знань та вмінь: від базових знань фонології до вміння компілювати так звані “сценарії”-скрипти для адаптації програми під кон- кретні вимоги та загалом оптимальнішої роботи. Це ж стосуєтсья автоматизації процесів програми – це можливо лише частково та за умови наявності доволі ви- сокого рівня навичок користувача у сфері програмування. Серед інших програм цього призначення варто згадати Waves від розробників Entropic Research Laboratories. Ця програма, на відміну від інших, є платною та ра- зом з тим більш зручною у використанні навіть для менш досвідчених спеціаліс- тів. Разом з тим, останніми роками популярність цієї програми суттєво зменшу- ється із відсутністю можливості інтегрувати файли з інших програм анотування та відмінності у форматах опису порівняно із найбільш поширеними програмами. Із суміжних за призначенням програм можна назвати Anvil, що також безко- штовно розповсюджується серед усіх бажаючих. Специфікою цієї програми є її спрямованість на анотування відеозаписів. В першу чергу вона була створена саме для опису особливостей жестикуляції та міміки у прив’язці до інтонаційних про- явів мовлення. Можливо через те, що програма більш сучасна, в ній є дещо більше можливостей для автоматизації процесів обробки матеріалу. Разом з тим, автома- тизація тут має доволі формальний характер на рівні встановлення відповідного таймінгу для субтитрів. Що характерно – ця програма сумісна із форматами файлів Praat, що тим більш важливо для дослідників, що користуються обома програмами. ЛІТЕРАТУРА Advances in Chinese Spoken Language Processing. Edited by Chin-Hui Lee. – World Scientific, Singapore, 2007. Beckman Mary E., Hirschberg Julia, Shattuck-Hufnagel Stefanie. The Original ToBI System and the Evolution of the ToBI Framework / Prosodic Typology: The Phonology of Intonation and Phrasing. – University Press, Oxford, 2006. – P. 9-55. Beckman Mary E. Guidelines for ToBI Labelling (version 3.0). – State University Research Foundation, Ohio, 1997. Chen, Matthew Y. Tone Sandhi: Patterns across Chinese Dialects. –University Press, Cambridge, 2000. Chen Weijun. Training Prosodic Phrasing Rules for Chinese TTS Systems // Eurospeech. – 2001. – P. 1159-1162. Cummins, Fred. Comparing Prosody Across Many Languages. – IDSIA, 1999. Dong Ming-hui, Lua Kim-Teng. Automatic Prosodic Break Labeling for Mandarin Chinese Speech Data. – School of Computing at National Singapore University, Singapore, 2000. Hirst, Daniel and Di Cristo, Albert. Intonation Systems: A Survey of Twenty Languages. – University Press, Cambridge, 1998. Jun Sun-Ah. Prosodic Typology / Prosodic Typology: The Phonology of Intonation and Phrasing. – University Press, Oxford, 2006. – P. 430-459. 102 Ladd, D. Robert. Intonational Phonology. – University Press, Cambridge, 1996. Li Aijun. Chinese Prosody and Prosodic Labeling of Spontaneous Speech / Report of Phonetic Research, 2000. San Duanmu. The Phonology of Standard Chinese. – Oxford University Press, Oxford, 2007. Tones and Tunes. Vol. 1-2. Edited by Carl Gussenhoven – Mouton de Gruyter, Berlin, 2007. Tseng Chiu-yu, Pin Shao-huang et al. Fluent Speech Prosody: Framework and Modeling. – Academia Sinica, Taipei, 2005. Yip Moira. Tone. – University Press, Cambridge, 2002.

Системи анотування просодії китайської мови

Репозитарії

Схожі ресурси