Метод зменшення потокової швидкості мовних кодерів ІР-телефонії

Gespeichert in:
Bibliographische Detailangaben
Datum:2010
Hauptverfasser: Тимченко, О.В., Заярнюк, М.В.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України 2010
Schriftenreihe:Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/27230
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Метод зменшення потокової швидкості мовних кодерів ІР-телефонії / О.В. Тимченко, М.В. Заярнюк // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2010. — Вип. 55. — С. 214-219. — Бібліогр.: 5 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-27230
record_format dspace
spelling irk-123456789-272302011-09-29T12:25:35Z Метод зменшення потокової швидкості мовних кодерів ІР-телефонії Тимченко, О.В. Заярнюк, М.В. 2010 Article Метод зменшення потокової швидкості мовних кодерів ІР-телефонії / О.В. Тимченко, М.В. Заярнюк // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2010. — Вип. 55. — С. 214-219. — Бібліогр.: 5 назв. — укр. XXXX-0067 http://dspace.nbuv.gov.ua/handle/123456789/27230 621.3 uk Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
format Article
author Тимченко, О.В.
Заярнюк, М.В.
spellingShingle Тимченко, О.В.
Заярнюк, М.В.
Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
author_facet Тимченко, О.В.
Заярнюк, М.В.
author_sort Тимченко, О.В.
title Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
title_short Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
title_full Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
title_fullStr Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
title_full_unstemmed Метод зменшення потокової швидкості мовних кодерів ІР-телефонії
title_sort метод зменшення потокової швидкості мовних кодерів ір-телефонії
publisher Інститут проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України
publishDate 2010
url http://dspace.nbuv.gov.ua/handle/123456789/27230
citation_txt Метод зменшення потокової швидкості мовних кодерів ІР-телефонії / О.В. Тимченко, М.В. Заярнюк // Збірник наукових праць Інституту проблем моделювання в енергетиці ім. Г.Є. Пухова НАН України. — К.: ІПМЕ ім. Г.Є. Пухова НАН України, 2010. — Вип. 55. — С. 214-219. — Бібліогр.: 5 назв. — укр.
series Збірник наукових праць Інституту проблем моделювання в енергетиці ім.Г.Є.Пухова НАН України
work_keys_str_mv AT timčenkoov metodzmenšennâpotokovoíšvidkostímovnihkoderívírtelefoníí
AT zaârnûkmv metodzmenšennâpotokovoíšvidkostímovnihkoderívírtelefoníí
first_indexed 2025-07-03T01:40:24Z
last_indexed 2025-07-03T01:40:24Z
_version_ 1836588020316241920
fulltext 214 © О.В. Тимченко, М.В. Заярнюк порождению новых информационных элементов системы SZ . В связи с этим, возникает проблема инициации процессов модификации интерпретационных расширений и инициации процессов порождения новых компонент системы. 1. Падучева Е.В. Понятие презумпции в лингвистической семантике. /Семантика и информатика. №8, 1977, с.91-126. 2. Потосян Э.М. К теории автоматического синтеза понятий. /Семантика и информатика. №8, 1977, с.125-152. 3. Скороходько Э.Ф. Семантические сети и автоматическая обработка текста. Киев, Наукова думка, 1983,-218с. 4. Хейс-Роз Ф. Синтаксис, семантика и прагматика в системах понимания речи. / Методы автоматического распознавания речи. М.:Мир, 1983. Поступила 18.02.2010р. УДК 621.3 О.В. Тимченко, М.В. Заярнюк МЕТОД ЗМЕНШЕННЯ ПОТОКОВОЇ ШВИДКОСТІ МОВНИХ КОДЕРІВ ІР-ТЕЛЕФОНІЇ Вступ З ростом пропускних здатностей глобальної мережі Інтернет та впровадженням нових технологій мобільного та бездротового зв’язку залишається актуальним питання досягнення максимального стиску мовних даних при високій швидкодії та збереженні високої якості зв’язку. Якість значною мірою залежить від вибраного методу: кодування форми сигналу, параметрів джерела чи змішане (гібридне) кодування. Через нестаціонарність мовного сигналу у високоякісних кодерах бажано застосовувати методи, що близькі до сигналу за формою і параметрами, зі змінною структурою в частотно-часовій області. Серед відомих і апробованих методів слід виділити вейвлет-перетворення [1, 2], яке має найкращу частотно-часову локалізацію. Проте методи кодування за формою на основі вейвлет-перетворення і кодери, що працюють за вказаними принципами ІР-телефонії, поки що розроблені не достатньо. Мета роботи – розглянути можливість застосування вейвлет- перетворення для попередньої обробки мовного сигналу з метою зменшення швидкості потоку при незначних втратах якості сигналу. 215 Основи застосування вейвлет-перетворення для обробки мовних сигналів Вейвлет-перетворення (ВП) має кілька привабливих властивостей [1], які вирізняють його серед інших існуючих типів перетворень та роблять дуже популярним в областях обробки сигналів та зображень: - локальність – кожний вейвлет-коефіцієнт представляє вхідні дані локалізованими як у просторі даних, так і у частотному просторі, що, скажімо, недоступно для класичного перетворення Фур’є, локалізованого лише у частотній області. Властивість локальності дозволяє визначати положення особливостей даних у їхньому просторі і застосовувати орієнтовані на певні типи даних методи лише в тих місцях простору, де такі типи присутні; - багатомасштабність – вейвлет-перетворення представляє та дозволяє аналізувати дані з різною роздільною здатністю на різних масштабах. Це дозволяє проводити аналіз як великих, так і малих об’єктів; - концентрація енергії – зображення та сигнали у вейвлет-просторі мають тенденцію до розрідженого представлення, тобто енергія даних, розподілена по великих областях простору даних, перерозподіляється таким чином, що, як правило, лише відносно невелика кількість відліків вейвлет-простору містить основну енергію; - декореляція – вейвлет-перетворення значною мірою декорелює дані, що є важливим з точки зору спрощення побудови математичних моделей, які враховують взаємозв’язки між сусідніми точками простору, та дозволяє обробляти елементи даних незалежно від їхнього оточення. Властивості локальності та багатомасштабності дозволяють за допомогою ВП ефективно описувати широкий спектр особливостей даних, починаючи від плавнозмінних гармонік і закінчуючи високочастотними неоднорідностями потоків даних чи їх різкими змінами. Властивість концентрації енергії випливає з того факту, що вейвлет- коефіцієнти є порівняно великими лише у точках, що містять різкі зміни значень даних у своєму околі, а оскільки типові зображення та сигнали лише у відносно невеликій своїй частині містять різкі переходи рівня, то лише невелика кількість вейвлет-коефіцієнтів буде мати великі значення, тобто міститиме основну енергію сигналу. Властивості концентрації та декореляції дозволяють значно спростити статистичне моделювання вхідних даних у вейвлет-просторі в порівнянні з описом у просторі даних, оскільки спрощуються зв’язки між коефіцієнтами та зменшується їх кількість, важлива для відтворення даних. В результаті, завдяки вказаним властивостям, методи обробки даних у вейвлет-просторі для багатьох задач є набагато ефективніші, ніж класичні методи обробки у просторі даних чи у частотному просторі. Дискретне вейвлет-перетворення (ДВП) є дискретним варіантом неперервного, в якому значення параметрів s і t обмежені дискретними множинами [2]: 216 ,m mt a s nba= = , де ,m n Z∈ , 0 01, 1a b> > – фіксовані параметри дискретизації. Якщо параметр b вибрати близьким до одиниці 1b i= + , де 1i << , то отримаємо наступне представлення ДВП: 2 , ( ) ( ) m m n mW a x t a t bn dtψ ∞ − − −∞ = −∫ , де m та n пробігають всі допустимі значення. Звичайно значення параметрів дискретизації вибирають рівними а = 2 та b = 1, що дозволяє отримати ортогональне ДВП. У цьому випадку ДВП відображає властивості сигналу ( )x t у коефіцієнтах апроксимації ,{ }j iCA та деталізації ,{ }j iCD . Таке представлення набуває вигляду: 1, 1, 1, 1,( ); ( )j j k j k j j k j k k z k z CA a x CD d xϕ ψ− − − − ∈ ∈ = ⋅ = ⋅∑ ∑ . ДВП є ортогональним, тобто сім’я функції , ( ) (2 )m m n t t nψ ψ −= − складає ортонормований базис в L2(R). Найбільш ефективним для реалізації вейвлет-перетворення мовних сигналів з точки зору адаптивного кодування є ліфтинг-схема. Вейвлет-перетворення за схемою ліфтингу включає декілька етапів, на кожному з яких виконуються три кроки, в результаті яких отримують з вхідного сигналу { }jx дві послідовності 1{ }jx − та 1{ }jd − . Ці кроки такі: 1. Розділення (split). З відліків сигналу { }jx формують дві незалежні послідовності, наприклад, лише парні jeven та непарні jodd відліки. Позначимо цю дію оператором: { } { , }j j jS x even odd= . 2. Передбачення (predict). Оскільки вхідні мовні відліки корельовані, отримані послідовності { , }j jeven odd також будуть залежні. Тому на другому етапі відбувається передбачення наступних значень. У випадку розділення на парні та непарні складові передбачені відліки збігаються з найближчим зліва відліком. Для обчислення різниці між дійсним і передбаченим значенням застосовують оператор передбачення { }jP even : 1 { }j j jd odd P even− = − . 3. Оновлення (update). Цей крок застосовується для збереження середнього значення при переході до наступного етапу перетворення: 1 1 1{ }j j jx even U d− − −= + . На рис. 1 схематично показані перетворення сигналу за ліфтинг-схемою. 217 Ця схема формує два набори коефіцієнтів 1{ }jx − та 1{ }jd − , кожний з яких має в два рази меншу довжину ніж початковий. Послідовність апроксимації 1{ }jx − відображає поведінку сигналу на більшому масштабі, а послідовність деталізації 1{ }jd − показує відмінність початкового сигналу { }jx від передбаченого 1{ }jx − . Адаптивність кодування за заданим методом закладена в самому алгоритмі – рівень наближення відображають коефіцієнти 1{ }jd − . Безперечними перевагами вказаного алгоритму є: • перетворення здійснюється дуже швидко; • послідовність вейвлет-коефіцієнтів займає той же обсяг, що і вхідні дані; • зворотне перетворення при використанні коефіцієнтів деталізації 1{ }jd − є абсолютно точним. Рис.1. Отримання вейвлет-коефіцієнтів в ліфтинг-схемі Методика проведення дослідження Запропонована методика передбачає отримання коефіцієнтів апроксима- ції А і деталізації Д вихідного сигналу за допомогою віконного вейвлет- перетворення (рис.2). Далі пакети апроксимації і деталізації групуються послідовно і передаються паралельно на два кодеки ІР-телефонії (наприклад кодери G.729, G.723 та ін.). Вихідна швидкість потоку на виході кодека буде як мінімум в 2 рази менша за швидкість обробки оригінального сигналу, а обробка займатиме той самий час оскільки часові інтервали стиснуті в 2 рази. Рис. 2. Блок схема попередньої обробки мовного сигналу за допомогою вейвлет- перетворення Після проходження сигналів через канал зв’язку сигнали демультиплексуються і подаються на відповідний тип декодера. Отримані вихідні сигнали подаються на пристрій відновлення оригінального сигналу Д кодер кодер А декодер декодер зворотнє перетворення сигнал 218 (де проводиться зворотне ДВП, та маніпуляції з сигналом аналогічні до способу отримання вейвлет-коефіцієнтів). Дана модель доволі проста в реалізації, дає можливість використання різноманітних видів вейвлет-функцій, немає необхідності в значних затримках при попередній обробці сигналу, оскільки перетворення можна проводити в межах вікна довільного розміру. Використання двох мовних фрагментів для відправки на кодер не впливає на затримку при обробці сигналу, оскільки всі протоколи ІР-телефонії передають в канал зв’язку в одному ІР-пакеті як мінімум 60 мс мовних даних. Оскільки коефіцієнти деталізації представляють собою сигнал, відмінний від мовного, можна використовувати будь-яку методику кодування для їх компресії, але й при використанні вище згаданих кодерів чи навіть рівномірного чи динамічного кодування амплітуди зі зменшеним динамічним порогом, отримуємо суттєвий виграш по пропускній здатності при незначних спотвореннях сигналу в порівнянні з сигналом без попередньої обробки вейвлет- перетворенням. Дослідження ефективності запропонованого методу Вейвлет-перетворення здійснювалося за допомогою цифрової згортки, в якості базового вейвлета використовувався вейвлет Хаара мінімальної тривалості. Розмір вихідних даних в межах вікна обробки сигналу складав половину вхідного плюс 2 додаткові відліки, які виникають внаслідок застосування згортки. В дослідженні використовувалися ряд мовних файлів, 10 з яких представляли вікову групу україномовного населення від 10 до 50 років, решта сигналів було взято з рекомендації ITU P.860, набір середньостатистичних англійських речень, рекомендованих ITU-Т для використання в процесі проведення експериментів з об’єктивного вимірювання PESQ. При застосуванні до коефіцієнтів деталізації і апроксимації кодера G.729 (вихідний потік 8 кбіт/с), попри високу ступінь компресії якість мовного сигналу різко падає. Наприклад, при безпосередній обробці мовних сигналів за допомогою кодера G.729 рівень оцінки PESQ [4] складає 3.5 - 3.7. При використанні запропонованої методики оцінка значно погіршується 2.5 - 3. При детальнішому розгляді коефіцієнтів апроксимації і сигналу на виходів G.729 кодера суттєво підсилюються некорельованість сигналів на початку та кінці інтервалів обробки [5]. Також в відтворених мовних даних проявляється ефект металічного звучання. Однак при застосуванні методики подібної до АДІКМ описаної в [5]. досягнутий рівень компресії незначний, проте якість сигналу лише частково поступається G711. Оцінка PESQ складає від 4.1 до 4.5 при рівні компресії в порівнянні з 219 © Б.В.Дурняк, Є.Д.Бабинець основним цифровим каналом 1,45. В експериментальній моделі використовувалося перших 8 біт для кодування максимуму в пакеті який піддавався обробці, решта відліків піддавалися рівномірному квантуванню відносно максимального значення 4 розрядами. Висновки Запропонована методика показує доцільність запропонованого методу обробки. Подальше її впровадження вимагає глибшого дослідження методів усунення кореляційних ефектів. Одним з можливих варіантів, які вимагають подальшого дослідження, - різні методи мультиплексування і демультиплексування коефіцієнтів деталізації і апроксимації, та методи їх подальшої спільної обробки. 1. Harten. Discrete Multi-Resolution Analysis and Generalized Wavelets, J. App. Num. Math., v. 12, pp. 153-193, 1993. 2. Beylkin G., Coifman R., Rokhlin V. Fast wavelet transforms and numerical algorithms I // Comm. Pure and Appl. Math. – 1991. – Vol. 44. – Pp. 141-183. 3. Тимченко О., Колодій Р., Заярнюк М. Дослідження методів кодування мовних сигналів за допомогою вейвлет-перетворення // Моделювання та інформаційні технології. Зб. наук. пр. ІПМЕ НАН України. – Вип.31. – К.: 2005. – С.130-135. 4. Тимченко О.В., Заярнюк М.В. Співвідношення оцінок PESQ та MSE для мовних кодерів ІР-телефонії // Моделювання та інформаційні технології. Зб. наук. пр. ІПМЕ НАН України. – Вип.43. – К.: 2007. – С.162-169. 5. Тимченко О.В., Заярнюк М.В. Оцінка співвідношення рівня компресії та якості PESQ для найбільш поширених мовних кодерів // Зб. наук. пр. ІПМЕ НАН України. – Вип.45. – К.: 2008. – С. 186-189. Поступила 1.02.2010р. УДК 683.03 Б.В.Дурняк, Є.Д.Бабинець СИСТЕМА ВИВОДУ ТА ПЕРЕТВОРЕНЬ КОМПОНЕНТ ІНФОРМАЦІЙНИХ МОДЕЛЕЙ В процесі проектування образу книжки, в залежності від опису загальних вимог до проекту образу, виникає необхідність формувати нові комплекти ix , які можна було би використовувати в конструкції книжки. В даному випадку, мова йде про опис таких елементів. Необхідність у формуванні нових елементів ix обумовлюється наступними факторами: - вимогами, що описуються в частині P iSD , які описують психологічні