Технология построения интеллектуальной системы распознавания речи

Предложена информационная технология для системы распознавания речи с большим словарем на основе алгоритма сегментно-слогового синтеза траектории параметров. В основу технологии положены модели обучения и распознавания, использующие быстросходящиеся алгоритмы поиска....

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2008
Автори: Савенкова, О.А., Карпов, О.Н.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/7672
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Технология построения интеллектуальной системы распознавания речи / О.А. Савенкова, О.Н. Карпов // Штучний інтелект. — 2008. — № 4. — С. 785-795. — Бібліогр.: 17 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-7672
record_format dspace
spelling irk-123456789-76722010-04-07T12:01:55Z Технология построения интеллектуальной системы распознавания речи Савенкова, О.А. Карпов, О.Н. Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами Предложена информационная технология для системы распознавания речи с большим словарем на основе алгоритма сегментно-слогового синтеза траектории параметров. В основу технологии положены модели обучения и распознавания, использующие быстросходящиеся алгоритмы поиска. У статті розглянуто інформаційну технологію для системи розпізнавання мовлення з великим словником на основі сегментно-складового синтезу траєкторії параметрів. В основу технології покладені моделі навчання та розпізнавання, які використовують швидкозбіжні алгоритми пошуку. New information technology for the speech recognition system by segment-syllabic parameters trajectory synthesis is considered. The technology is based on convergence algorithms and consists of two models: learning model; recognition model. 2008 Article Технология построения интеллектуальной системы распознавания речи / О.А. Савенкова, О.Н. Карпов // Штучний інтелект. — 2008. — № 4. — С. 785-795. — Бібліогр.: 17 назв. — рос. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/7672 004.934 ru Інститут проблем штучного інтелекту МОН України та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
spellingShingle Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
Савенкова, О.А.
Карпов, О.Н.
Технология построения интеллектуальной системы распознавания речи
description Предложена информационная технология для системы распознавания речи с большим словарем на основе алгоритма сегментно-слогового синтеза траектории параметров. В основу технологии положены модели обучения и распознавания, использующие быстросходящиеся алгоритмы поиска.
format Article
author Савенкова, О.А.
Карпов, О.Н.
author_facet Савенкова, О.А.
Карпов, О.Н.
author_sort Савенкова, О.А.
title Технология построения интеллектуальной системы распознавания речи
title_short Технология построения интеллектуальной системы распознавания речи
title_full Технология построения интеллектуальной системы распознавания речи
title_fullStr Технология построения интеллектуальной системы распознавания речи
title_full_unstemmed Технология построения интеллектуальной системы распознавания речи
title_sort технология построения интеллектуальной системы распознавания речи
publisher Інститут проблем штучного інтелекту МОН України та НАН України
publishDate 2008
topic_facet Распознавание речи. Интеллектуальные системы для работы с естественными языками и текстами
url http://dspace.nbuv.gov.ua/handle/123456789/7672
citation_txt Технология построения интеллектуальной системы распознавания речи / О.А. Савенкова, О.Н. Карпов // Штучний інтелект. — 2008. — № 4. — С. 785-795. — Бібліогр.: 17 назв. — рос.
work_keys_str_mv AT savenkovaoa tehnologiâpostroeniâintellektualʹnojsistemyraspoznavaniâreči
AT karpovon tehnologiâpostroeniâintellektualʹnojsistemyraspoznavaniâreči
first_indexed 2025-07-02T10:27:50Z
last_indexed 2025-07-02T10:27:50Z
_version_ 1836530607252832256
fulltext «Штучний інтелект» 4’2008 785 9C УДК 004.934 О.А. Савенкова, О.Н. Карпов Днепропетровский национальный университет, г. Днепропетровск, Украина Технология построения интеллектуальной системы распознавания речи Предложена информационная технология для системы распознавания речи с большим словарем на основе алгоритма сегментно-слогового синтеза траектории параметров. В основу технологии положены модели обучения и распознавания, использующие быстросходящиеся алгоритмы поиска. Введение Создание компьютерных интерфейсов с речевым вводом/выводом информации требует решения проблемы построения системы распознавания речи (СРР) с большим словарем, для чего необходимо: определить структуры объектов распознавания и операции, необходимые для интеллектуального решения проблемы; разработать быстросходящиеся стратегии для эффективного поиска потенциальных решений, кото- рые могут быть сгенерированы этими структурами и операциями с учетом допол- нительной информации (эвристик) об исследуемой проблемной области [1-10]. Существующие технологии построения СРР с большим словарем используют подход, при котором предполагается, что в предъявленном речевом сигнале (РС) последовательность сегментов рассматривается как совокупность независимых событий, которым в соответствие ставятся независимые речевые единицы (РЕ) [3-6]. Однако такой подход не учитывает зависимости между параметрами смежных сег- ментов. Необходимо разработать информационную технологию, которая оперирует с непрерывными траекториями параметров и позволяет аппроксимировать любую реализацию РС в терминах РЕ как функцию времени. В качестве РЕ, которые могут использоваться в процессе синтеза (композиции) слов или предложений, удовлет- воряют требованию максимальной полноты покрытия множества слов и учитывают зависимости между сегментами, могут быть выбраны слоги [7], [11], [12]. Постановка задачи Разработать информационную технологию построения СРР с большим слова- рем на основе алгоритмов реализации сегментно-слогового синтеза траекторий параметров и ее программную реализацию. Основная часть Разработка информационной технологии требует решения следующих важных задач, которые вытекают из перечисленных актуальных проблем. 1. Создание оптимальных словарей РЕ: выбор способа хранения информатив- ных параметров РЕ словаря. 2. Реализация автоматической сегментации РС. Савенкова О.А., Карпов О.Н. «Искусственный интеллект» 4’2008 786 9C 3. Реализация эффективных алгоритмов распознавания на основе сегментно- слогового синтеза последовательности параметров для предъявленного РС. В соответствии с иерархическими принципами построения СРР [11], резуль- татами экспериментальных исследований [13], [14], [15] и с учетом рекомендаций к проектированию и разработке информационной технологии [16], в основу решения поставленной задачи положим две модели: модель обучения и модель распознавания. 1. Модель обучения Общая схема модели обучения данной информационной технологии пред- ставлена на рис. 1 и состоит из следующих процедур. Рассмотрим более детально основные процедуры модели обучения. Рисунок 1 – Функционально-структурная схема модели обучения СРР 1. Ввод речевого сигнала с микрофона или открытие wav-файла с необходимой записью речевого сообщения. 2. Первичная обработка РС. Первичная обработка РС заключается в вычислении информативных параметров РС (формировании траектории параметров) и удалении пауз в начале и конце речевого высказывания. Процедура формирования ТП реализации РС: на каждом i -м интервале анализа РС вычисляется вектор признаков (набор информативных параметров) },,,,,{ 21 inijiii xxxxx  , далее формируется траектория параметров (ТП) анализируемого РС, таким образом },,,,,{ 21 pi xxxxX  , где p – число интервалов анализа РС; n – размерность вектора признаков. Для представления ТП X исследуемого РС в данной информационной технологии выбраны [11], [13]:  спектрально-временное представление (СВП) ),( tXA  ;  спектрально-полосное представление (СПП) ),( tlXE в 9 частотных полосах. СВП и СПП выбраны из следующих соображений: проведенные в [13] исследования по распознаванию РС, параметры которых представлены СВП и СПП, по критериям быстродействия и надежности показали, что увеличение быстродейс- твия распознавания в случае использования СПП в среднем в 9 раз приводит к увеличению ошибки распознавания на 1,6 % по сравнению с использованием СВП. Первичная обработка РС Вычисление параметров РС РС Удаление пауз в начале и конце РС Сегментация РС Формирование словарей СПП РС СВП РС Инфо SL3 SL4 SL2 Технология построения интеллектуальной системы распознавания речи «Штучний інтелект» 4’2008 787 9C Таким образом, по надежности распознавания оба метода представления ТП прак- тически сравнимы и могут совместно использоваться как иерархия распознавания: СПП для предварительного распознавания и выделения списка кандидатов на распознавание, а затем СВП для принятия окончательного решения. Процедура удаления пауз в начале и конце речевого высказывания. В качестве критериев нахождения границ сегментов, содержащих паузы в начале и конце высказывания, используются значения динамически меняющихся порогов нормированных энергий в двух полосах: 86 – 3010 Гц (НЭ); 3956 – 8084 Гц (ВЭ). Для пауз характерны минимальные значения энергий на всем частотном диапазоне: ВЭВЭ min , НЭНЭ min , где ВЭ min , НЭ min  [0,03, 0,06]. 3. Автоматическая сегментация РС. Сегментация РС выполняется независимо для СВП и СПП по методу верификации временной последовательности параметров, при этом уточняются границы сегментов-фонем [11]. 4. Формирование словарей для речевых единиц. Для формирования словаря РЕ выполняется автоматическое деление сегментированной речевой последовательности параметров на акустические слоги- эталоны (двух-, трех-, четырехсегментные слоги) с соответствующей маркировкой лингвистической информации (название РЕ, транскрипция). ТП слогов-эталонов и вспомогательная информация распределяются в словари в соответствии с форматом хранения данных. Алгоритм автоматической декомпозиции РС на слоги-эталоны приведен на рис. 2. Рисунок 2 – Алгоритм автоматической декомпозиции РС на слоги-эталоны j=2, 3, 4 L = LEN(STranskr) st = COPY(STranskr, k, j) k <= L – j ? st  jSL ? PUSH(XA, XE, GranSegments, jSL ) k = k + 1 k = 0 STranskr, ColSegm Нет Нет Савенкова О.А., Карпов О.Н. «Искусственный интеллект» 4’2008 788 9C Информация о речевой единице kSL ( SLNk 1 ) в словаре представлена в следующем виде: <Номер РЕ>_<Имя РЕ>_<Транскрипция РЕ>_ <Количество временных отсчетов>_<Количество сегментов>_ <Адреса границ сегментов>_ <Групповая принадлежность сегментов>. Для создания СРР, которая работает в реальном времени, возникает необ- ходимость создания оптимальных словарей РЕ с точки зрения объема занимаемой памяти и быстродействия их обработки. Следовательно, необходимо получить для каждого способа представления ТП модель описания с помощью аналитических функций, согласно которой можно восстановить исходную ТП с минимальной погрешностью. Сплайн-описание СПП речевых единиц словаря. После сглаживания ТП в полосах на каждом временном участке, который соответствует сегменту-фонеме, последовательности параметров СПП ),( tlYE в каждой частотной полосе имеют простую форму, которую можно описать полиномами низких порядков ( 3n ) [11]. Таким образом, для каждой k -й РЕ словаря может быть построена следующая модель сплайн-описания сегментированной ТП ),( tlYE , которая с достаточной точностью аппроксимирует последовательности параметров в каждой частотной полосе l ( 91l )                  ,,~ ,,~ ,,~ ,,~ YE 1 1 212 101 ~ SGSGNSG NiN kkik i i sisEY sisEY sisEY sisEY   (1) для каждого сегмента находятся параметры полинома 3-го порядка i lki i lki i lki i lk i lk dstcstbstaEY ,, 2 , 3 ,, )()()(~  , (2) где SGNk 1 ( SGN – количество сегментов в ТП слога-эталона); SGNsss ,,, 10  – границы сегментов внутри слога-эталона ),( tlYE . Для нахождения неизвестных параметров сплайн-описания решается задача минимизации среднеквадратического приближения с условиями в точках сегмен- тации, которые обеспечивают требуемую гладкость склеивания ТП сегментов в каждой частотной полосе l (точки сегментации являются узлами сплайна) min~ 1 2 ,, 2 1               SG j j N j s si k li k lil YEEYу , (3) где js ( SGNj  1 ) – границы сегментации, SGN – количество сегментов для k -й РЕ словаря; kY - исходные траектории параметров слогов-эталонов ),( tlYE , kY~ – траектории параметров слогов-эталонов, восстановленные согласно модели (1), (2). Технология построения интеллектуальной системы распознавания речи «Штучний інтелект» 4’2008 789 9C Описание СВП речевых единиц словаря в классе колоколообразных функций. Для построения аналитического описания СВП  t,YS * элементов словаря используется колоколообразная функция модифицированный локон Аньези, которая обладает следующими свойствами [17]: 1) функция гладкая непрерывная и дифференцируемая во всей области определения, имеет максимум на заданной координате и асимптотически при- ближается к плоскости области определения в любом направлении от максимума; 2) достаточно универсальная функция, форму которой можно варьировать в широких пределах с помощью изменения ее параметров a , b , c и имеет вид 22 3 )( )( bxc axZ   . (4) По алгоритму, предложенному в работе [17], для элементов словаря kSL , ТП ),( lk tYA  которых представлены в некоторой частотно-временной области  :    NM tt ,, 00  ( k , lt – дискретно заданные частота и время, NlMk ...1,...1  ), вычисляются параметры колоколообразных функций {  ltZt }, {  kZ  }, которые обладают вышеперечисленными свойствами 1), 2), причем:  функция  li tZt )( ( Li ...1 ) описывает временные свойства компонент речевого сигнала, определена в диапазоне  NttZt ,0 ;  функция  kiZ  )( ( Li ...1 ) описывает частотные свойства компонент речевого сигнала, определена в диапазоне  MZ  ,0 . Аналитическое описание ),(* lk tYA  СВП элемента словаря в некоторой точке области определения  вычисляется как суперпозиция L произведений колоколо- образных функций  li tZt )( ,  kiZ  )( ( NlMk ...1,...1  , Li ...1 ).          2)( 2 )( 3 )( 2 )( 2 )( 3 )( 1 )()( 1 * iki i ili iL i liki L i lk d b Ttc a tZtZt,YA        . (5) Таким образом, с учетом моделей аналитического описания ТП речевых единиц структура оптимального словаря может быть представлена на рис. 3. Рисунок 3 – Структура словаря речевых единиц kSL Инфо – лингвистическая информация о РЕ kSL (название РЕ, транскрипция) + вспомогательная информация о РЕ kSL (количество временных отсчетов, количество сегментов, границы сегментов, групповая принадлежность сегментов Тон-Шум-Пауза). ОКФ СВП СО СПП Инфо Савенкова О.А., Карпов О.Н. «Искусственный интеллект» 4’2008 790 9C Двух- и трехсимвольные РЕ (слоги) kkk SLSL,SL 32  , которым соответ- ствуют двух-, трех- и четырехсегментные ТП ({ 2kYSL },{ 3kYSL },{ 4kYSL }) пред- ставлены в виде: СО СПП – параметров моделей сплайн-описания СПП; ОКФ СВП – параметров моделей описания СВП в классе колоколообразных функций. Анализ элементов словаря и вычисление эвристических оценок. Наиболее значимые характеристики сегментно-слогового представления рече- вой последовательности:  вложенность РЕ (слогов) kk 32 SLSL  , kk 42 SLSL  . Значение оценки вложенности vh рассчитывается с учетом количества совпадений/несовпадений элементов линг- вистической информации на соответствующих позициях и их порядка следования, 1)(0  nhv ;  наличие определенной структуры групповых признаков сегментов (Т – «Тон»; Ш – «Шум»; П – «Пауза»). Значение оценки )(nhg рассчитывается на основе анали- за количества сочетаний групповых признаков сегментов Т-Ш-П, 1)(0  nhg ; – величина расстояния между ТП слогов, содержащих различные сочетания груп- повых признаков. Оценка расстояния )(nhd рассчитывается для возможных сочета- ний сегментов, относящихся к разным групповым признакам, например, Т-Т, Ш-Т, Т-П. На основе рассчитанных эвристических оценок формируется структура груп- пировки элементов в словарях, благодаря чему сокращается время на поиск подхо- дящего элемента при распознавании. 2. Модель распознавания Сформулируем задачу построения модели распознавания на основе сегментно- слогового синтеза ТП согласно [11], [14], [15] таким образом. Пусть задан словарь { kSL }, состоящий из N слогов. Для каждого слога заданы эталонные последовательности параметров { kY }. Каждый слог kSL сегментирован на kn сегментов-фонем y kjSG ( knjNk  1,1 ). Пусть задана входная последовательность параметров Х, которая сегмен- тирована на pm сегментов-фонем x piSG , объединяемых в M групп-слогов (сочетания двух, трех или четырех сегментов) x pSL ( pmiMp  1,1 ). Необходимо разработать быстросходящийся алгоритм для нахождения наилуч- шего соответствия последовательности параметров предъявленной реализации X эталонным последовательностям параметров словаря { kY }, минимизируя величину  k x p p k S#SLmind L , (6) где x pSL , kSL содержат сегменты x piSG , y kjSG соответственно; # – операция сопоставления. Технология построения интеллектуальной системы распознавания речи «Штучний інтелект» 4’2008 791 9C Такая постановка задачи распознавания данной информационной технологии приводит к следующей схеме, которая представлена на рис. 4. Рассмотрим основные процедуры модели распознавания. Рисунок 4 – Функционально-структурная схема модели распознавания Предъявленная реализация РС (с микрофона или из wav-файла) подвергается процедурам первичной обработки и сегментации, которые используются в модели обучения. Сегментированная ТП XE для речевого сигнала, поступающего на вход системы распознавания, рассматривается как совокупность двух-, трех- и четырех- сегментных слогов, для которой выполняется поиск решений-комбинаций для эталонной ТП (ЭТП) с помощью алгоритмов: поиск в ширину и в глубину с использованием эвристических оценок [11], [14], [15]. Для полученного списка ком- бинаций ЭТП принимается решение о выборе наилучшей по критерию (6). Для синтеза ЭТП выбирается соответствующее описание ТП слогов-эталонов. Сплайн-синтез ЭТП для СПП. Синтез эталонной ТП *XE выполняется согласно следующей модели конкатенации ТП слогов-эталонов               ,1,~ ,1,~ ,,~ ),( 1 1 10 1 * RR M i kk k i i NiNY NiNY NiNY tlXE   (7) где Rk  1 ; R – количество слогов-эталонов k iY~ в ЭТП XE ; k iY~ – ТП соот- ветствующей РЕ словаря, восстановленная согласно модели (1), (2); kN – количество временных отсчетов ТП k -й ТП, ],1[ 11 Nt  , ],1[ 22 Nt  , …, ],1[ kk Nt  , …, ],1[ RR Nt  . Границы слогов внутри текущей комбинации траекторий параметров для ЭТП определяются таким образом: Словарь Первичная обработка РС Сегментация РС Эвристический алгоритм сегментно- слогового синтеза ТП СПП РС СВП РС Инфо SL3 SL4 SL2 РС Символьный аналог РС Савенкова О.А., Карпов О.Н. «Искусственный интеллект» 4’2008 792 9C 10 N ; 11 NN  ; 212 NNN  ; 3213 NNNN  ; …; RR NNNN  21 . Параметры моделей описания траекторий параметров РЕ, составляющих текущую комбинацию ЭТП, уточняются при условии минимизации ошибки в каждой частотной полосе l : min~ 1 2 ,, 2 1             R k N Ni i lk i lkl k k YYу . (8) Синтез ЭТП в классе колоколообразных функций для СВП. ТП j -й РЕ внутри текущей комбинации ЭТП определена в прямоугольной области jD :    NjM tt ,, 00  и восстановлена в виде суперпозиции произведения колоко- лообразных функций  li tZt )( ,  kiZ  )( ( jLi ...1 , Mk ...1 , Njl ...1 ). Для текущей комбинации ЭТП ),(* tXA  , состоящей из R РЕ словаря, область определения с учетом объединения частотно-временных диапазонов каждой РЕ в комбинации – D :    NM tt ,, 00  , где RNNNN tttt  21 . Описание СВП для эталонной ТП  t,XA * в точке ( k , lt ) области опре- деления D вычисляется как суперпозиция R гладких функций  t,YAm * ( Rm ...1 ), которые являются аналитическим описанием СВП речевых единиц словаря, таким образом                  R m liki Lm i R m lkmlk tZtZtYAtXA 1 )()( 11 ** ,,  , (9) где R – количество слогов в ЭТП  t,XA * , mL – количество параметров коло- колообразных функций  li tZt )( ,  kiZ  )( ( mLi ..1 ) для соответствующего m -го слога комбинации для ЭТП  t,XA * . Композиция символьного аналога РС. После завершения работы алгоритма поиска ЭТП, которая наилучшим образом соответствует последовательности пара- метров предъявленного РС, выполняется композиция ее символьного аналога W composef ( 1SL , 2SL , …, iSL , …, RSL ). 3. Программная реализация информационной технологии Представленная в статье информационная технология была реализована в виде компьютерной системы распознавания речи SPeach. Основной средой, в которой реализованы алгоритмы данной информационной технологии, является Borland Delphi 5. Структурно система SPeach реализована в модулях, которые перечислены в табл. 1. Интерфейс программы представлен на рис. 5. Технология построения интеллектуальной системы распознавания речи «Штучний інтелект» 4’2008 793 9C Таблица 1 – Перечень основных модулей системы SPeach Название модуля Назначение WAVReadWrite ввод РС с микрофона или wav-файла SpectrAnalis спектральный анализ РС, вычисление параметров Filters фильтрация и сглаживание данных Segmentation сегментация РС, определение типов сегментов UnitTeachProcFirmirSlovar формирование словарей РЕ ApproximationProc построение сплайн-описания СПП Lokony_Anjezi построение описания СВП в классе колоколообразных функций Recogn процедуры ДП, добавление элементов в словарь PoiskVShirinu алгоритмы BFS PoiskVGlubinu алгоритмы DFS Evristics эвристический алгоритм ModDraw3dGraph графика Рисунок 5 – Интерфейс приложения SPeach Подсистема вычисления эвристических оценок Вид СПП параметров РС Савенкова О.А., Карпов О.Н. «Искусственный интеллект» 4’2008 794 9C На рис. 6 а, б, в приведен пример синтеза ЭТП для предъявленной реализации РС «один» согласно представленной модели распознавания. а) б) в) Рисунок 6 – Описание СВП в классе колоколообразных функций: а) слог «ад»; б) слог «ин»; в) конкатенация слогов «ад» и «ин» в ЭТП Результаты тестирования разработанной системы Speech подтверждают эф- фективность предложенной информационной технологии. Выводы В данной статье предложена новая информационная технология для построе- ния интеллектуальной системы распознавания речи, которая обеспечивает комплекс- ный подход, учитывающий взаимосвязи между иерархией представлений о речевом сигнале. В дальнейшем предполагается усовершенствование эвристического алго- ритма поиска с целью повышения быстродействия распознавания. Литература 1. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. – К.: Наукова думка, 1987. – 264 с. 2. Survey of Russian Recognition Systems / A.L. Ronzhin, R.M. Yusupov, I.V. Li, A.B. Leontieva // In Proc. of Int. Conf. SPECOM'2006. – St. Petersburg, 2006. – P. 54-60. Технология построения интеллектуальной системы распознавания речи «Штучний інтелект» 4’2008 795 9C 3. Ронжин А.Л., Карпов А.А., Ли И.В. Система автоматического распознавания русской речи SIRIUS // Искусственный интеллект. – 2005. – № 3. – С. 590-601. 4. Obtaining candidate words by polling in a large vocabulary speech recognition system / L.R. Bahl, R. Bakis, P.V. De Souza, R.L. Mercer // In Proc. ICASSP'88 Int. Conf. Acoust., Speech and Signal Process. – NY, 1988. – P. 489-492. 5. The SSI large-vocabulary speaker-inependent continuous speech recognition system / Meisel W.S., Anikst M.T., Pirzadeh S.S., Schumacher J.E., Soares M.C., Trawick D.J. // In Proc. ICASSP'91 Int. Conf. Acoust. – Speech and Signal Process., Toronto, 1991. – P. 337-340. 6. Building acoustic models for a large vocabulary continuous speech recognizer for Russian / M. Tatarnikova, I. Tampel, I. Oparin, Yu. Khokholov // In Proc. of Int. Conf. SPECOM' 2006. – St. Peterburg, 2006. – P. 83-87. 7. Кодзасов С.В., Кривнова О.Ф. Общая фонетика. – М.: РГГУ, 2001. – 592 с. 8. Рассел С., Норвиг П. Искусственный интеллект: современный подход. – М., 2006. – 1408 с. 9. Шаповалова С.И. Оптимизация решения задач поиска на прологе // Искусственный интеллект. – 2000. – № 3. – С. 121-127. 10. Paul D.B. Algorithms for an optimal A*search and linearizing the search in the stack decoder // In Proc. ICASSP'91 Int. Conf. Acoust. – Speech and Signal Process. – Toronto, 1991. – P. 693-696. 11. Карпов О.Н. Технология построения устройств распознавания речи. – Д., 2001. – 184 с. 12. Kopeček I. Speech synthesis based on the composed syllable segments // Proc. of the First Workshop on Text, Speech and Dialogue – TSD’98. – 1998. – P. 259-262. 13. Карпов О.Н., Савенкова О.А. Некоторые эксперименты по повышению надежности распозна- вания слов заданного словаря // Системные технологии. Региональный межвуз: Сб. науч. тр. – Выпуск 6 (35). – Днепропетровск, 2004. – С. 60-66. 14. Карпов О.Н., Савенкова О.А. Распознавание речи на основе сегментно-слогового синтеза в терминах пространства состояний // Искусственный интеллект. – 2006. – № 3. – С. 532-536. 15. Карпов О.Н., Савенкова О.А. Эвристический алгоритм поиска оптимальных решений сегментно- слогового синтеза // Искусственный интеллект. – 2007. – № 4. – С. 378-385. 16. Осадчий А. Автоматизация проектирования, спецификация ПО. На пути к применению UML // Компьютеры + Программы. – 2002. – № 9 (94). – С. 46-49. 17. Карпов О.Н. Вычислительные схемы представления функций многих переменных в классах функций меньшего числа переменных: Аналитическое описание поверхностей и спектров рече- вых сигналов: Монография. – Д.: Изд-во Днепропетр. ун-та, 2003. – 120 с. О.О. Савенкова, О.М. Карпов Технологія побудови інтелектуальної системи розпізнавання мовлення У статті розглянуто інформаційну технологію для системи розпізнавання мовлення з великим словником на основі сегментно-складового синтезу траєкторії параметрів. В основу технології покладені моделі навчання та розпізнавання, які використовують швидкозбіжні алгоритми пошуку. O.A. Savenkova, O.N. Karpov Information Technology of Design the Intelligent Speech Recognition System New information technology for the speech recognition system by segment-syllabic parameters trajectory synthesis is considered. The technology is based on convergence algorithms and consists of two models: learning model; recognition model. Статья поступила в редакцию 17.08.2008.