Технология разметки звуковых файлов с использованием неточного текстового сопровождения

dc.contributor.authorПилипенко, В.В.
dc.date.accessioned2013-06-19T18:21:39Z
dc.date.available2013-06-19T18:21:39Z
dc.date.issued2012
dc.description.abstractОписана технология разметки звуковых файлов с использованием неточного текстового сопровождения. Предварительно формируется система распознавания на основе речевых записей, размеченных экспертами. Новые речевые записи распознаются для выяснения временны́х границ слов. Процедура сравнения ответа распознавания и неточного описания выявляет фрагменты звука, для которых есть точное соответствие. На основе автоматически полученной разметки строится новая, более точная система автоматического многодикторного распознавания спонтанной украинской речи с объемом словаря в 125 тысяч словоформ. Проведенные эксперименты показали пословную точность распознавания в 80 %.uk_UA
dc.description.abstractОписано технологію розмітки звукових файлів з використанням неточного текстового супроводження. Заздалегідь формується система розпізнавання мовлення на базі мовленнєвих записів, розмічених експертами. Нові мовленнєві записи розпізнаються для з’ясування меж слів у часовому просторі. Процедура порівняння відповіді розпізнавання і неточного текстового опису виявляє фрагменти звуку, для яких є точний збіг текстового опису зі звуковим сигналом. На базі автоматично отриманої розмітки будується нова більш точна система автоматичного багатодикторного розпізнавання спонтанної української мови з обсягом словника в 125 тисяч словоформ. Наведені результати експериментів, які показали точність 80 % послівного розпізнавання.uk_UA
dc.description.abstractThis paper describes the speech labeling technology using an inexact text description. Preliminary there was built the speech recognition system based on the manually labeled corpus. This system is used to recognize new voice records and to determine the words temporal boundaries. A comparison of the recognition response and inexact text description identifies the audio chunks, where there is an exact match. The new more accurate large vocabulary continuous speech recognition system for Ukrainian is build by using the automatically labeled corpus. This approach can be useful for automatic labeling of large amount of partially annotated audio signals, so that the significantly reducing the cost of developing speech recognition systems is achieved. Experimental results show the effectiveness of the approach and reduce errors in speech recognition by 24.8 % so that the accuracy of 80 % by word recognition is achieved for broadcasts.uk_UA
dc.identifier.citationТехнология разметки звуковых файлов с использованием неточного текстового сопровождения / В.В. Пилипенко // Кибернетика и вычисл. техника. — 2012. — Вип. 169. — С. 67-77. — Бібліогр.: 7 назв. — рос.uk_UA
dc.identifier.issn0452-9910
dc.identifier.udc004.934
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/45873
dc.language.isoruuk_UA
dc.publisherМіжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН Україниuk_UA
dc.relation.ispartofКибернетика и вычислительная техника
dc.statuspublished earlieruk_UA
dc.subjectИнформационные технологии и системыuk_UA
dc.titleТехнология разметки звуковых файлов с использованием неточного текстового сопровожденияuk_UA
dc.title.alternativeТехнологія розмітки звукових файлів з використанням неточного текстового супроводженняuk_UA
dc.title.alternativeSpeech labeling technology using inexact text descriptionuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
06-Pilipenko.pdf
Розмір:
148.2 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: