Использование малых речевых единиц при распознавании речи с помощью алгоритма DTW

dc.contributor.authorШелепов, В.Ю.
dc.contributor.authorНиценко, А.В.
dc.date.accessioned2017-01-25T19:18:57Z
dc.date.available2017-01-25T19:18:57Z
dc.date.issued2015
dc.description.abstractОписана разработанная авторами техника автоматической сегментации речевых сигналов и DTW-распознавания русской речи с использованием малых речевых единиц. Предложено использовать дифоны, содержащие межфонемные переходы. Предлагаемые подходы реализованы в реальных программах распознавания, которые показывают достаточно высокий уровень надежности.uk_UA
dc.description.abstractОписано розроблену авторами техніку автоматичної сегментації мовних сигналів і DTW-розпізнавання російської мови з використанням малих мовних одиниць. Запропоновано використовувати дифони, що містять міжфонемні переходи. Запропоновані підходи реалізовано в реальних програмах розпізнавання, які показують досить високий рівень надійності.uk_UA
dc.description.abstractIntroduction: The article describes a technique of automatic speech segmentation and DTW-recognition using minor language units, developed by the authors for Russian speech. The main tool for segmentation is a numerical analogue of the total variation. In [11, 17,19] the authors suggest using the diphones containing interphoneme transitions as the minor language units. The templates for these are used to synthesize the templates of the semantic units, i.e. words and phrases. Then the DTW algorithm (with its advantages) is applied to the recognition of a word as a whole. As the result of this procedure there is no need to pronounce the words of the vocabulary under recognition during the training, thus a possibility to set the vocabulary just in text form is created. Purpose: The purpose of the research is to reduce the size of the reference template database, and, as a consequence, the training time for a particular speaker. Results: An innovation of this research is the use of exclusively diphones, whose first sound is one of explosive (b, g, d, k, p, t), and the stationary parts of other sounds. A set of automatically generated vocabulary words’ transcriptions is organized in a tree structure, which considerably speeds up the process of recognition. The proposed approach is implemented in realrecognition software, demonstrating the high reliability.uk_UA
dc.identifier.citationИспользование малых речевых единиц при распознавании речи с помощью алгоритма DTW / В.Ю. Шелепов, А.В. Ниценко // Управляющие системы и машины. — 2015. — № 6. — С. 74–77. — Бібліогр.: 19 назв. — рос.uk_UA
dc.identifier.issn0130-5395
dc.identifier.udc004.934.2
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/112655
dc.language.isoruuk_UA
dc.publisherМіжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН Україниuk_UA
dc.relation.ispartofУправляющие системы и машины
dc.statuspublished earlieruk_UA
dc.subjectИнформационные речевые технологииuk_UA
dc.titleИспользование малых речевых единиц при распознавании речи с помощью алгоритма DTWuk_UA
dc.title.alternativeВикористання малих мовних одиниць при розпізнаванні мови за допомогою алгоритму DTWuk_UA
dc.title.alternativeUsing Minor Language Units for Speech Recognition with the Help of DTW Algorithmuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
11-Shelepov.pdf
Розмір:
313.27 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: