Система преобразования телерадиовещания в текст для украинского языка

Сажок, Н.Н.; Робейко, В.В.; Федорин, Д.Я.; Селюх, Р.А.

Система преобразования телерадиовещания в текст для украинского языка

dc.contributor.author	Сажок, Н.Н.
dc.contributor.author	Робейко, В.В.
dc.contributor.author	Федорин, Д.Я.
dc.contributor.author	Селюх, Р.А.
dc.date.accessioned	2017-01-25T19:19:53Z
dc.date.available	2017-01-25T19:19:53Z
dc.date.issued	2015
dc.description.abstract	Описаны система превращения сигнала телерадиовещания в текст для украинского языка и моделирование особенностей, специфических для него – нерегулярность лексического ударения и высокая флективность. Разработанная система реализует подход клиент–сервер и позволяет просматривать пятиминутные сегменты речи синхронно с результатом распознавания речи.	uk_UA
dc.description.abstract	Описано систему перетворення сигналу телерадіомовлення в текст для української мови та моделювання особливостей, специфічних для неї – нерегулярність лексичного наголосу та висока флективність. Розроблена система реалізує підхід клієнт–сервер і дає змогу переглядати п’ятихвилинні сегменти мовлення синхронно з результатом розпізнавання мови.	uk_UA
dc.description.abstract	Introduction: Broadcast data processing is an important task for information society. The experience in development of real-time systems for Ukrainian dictation and speech record recognition on several computational platforms is the base for the described R&D devoted to extracting text from broadcast speech signal. Methods: The modeling is focused on features that are specific particularly for Ukrainian such as lexical stress and high inflexibility. Given arguments confirm the necessity to distinguish stressed and unstressed vowels in the phoneme alphabet. Lexical stress irregularity implies expert involvement for stress assignment. To automate this procedure we implemented a data-driven stress prediction algorithm that represents words as sequences of substrings and searches for one or more sequences with the best criteria. As a Slavonic language Ukrainian is highly inflective and tolerates relatively free word order, which motivates transition from word- to class-based statistical language model. Experimental research: Modeling both stressed and unstressed vowels leads to recognition accuracy improvement. Introduction word equivalence classes to the Language Model significantly decreases RAM consumption keeping the same recognition accuracy level. The developed experimental system implements client–server approach and allows for browsing 5-minute broadcast segments synchronously with speech recognition result. Conclusion: Language-specific speech feature modeling is beneficial for a speech recognition system. The created broadcast speech-to-text system opens news prospectives for broadcast stream analysis in Ukraine.	uk_UA
dc.identifier.citation	Система преобразования телерадиовещания в текст для украинского языка / Н. Н. Сажок, В. В. Робейко, Д. Я. Федорин, Р. А. Селюх // Управляющие системы и машины. — 2015. — № 6. — С. 66–73. — Бібліогр.: 16 назв. — рос.	uk_UA
dc.identifier.issn	0130-5395
dc.identifier.udc	004.934
dc.identifier.uri	https://nasplib.isofts.kiev.ua/handle/123456789/112656
dc.language.iso	ru	uk_UA
dc.publisher	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України	uk_UA
dc.relation.ispartof	Управляющие системы и машины
dc.status	published earlier	uk_UA
dc.subject	Информационные речевые технологии	uk_UA
dc.title	Система преобразования телерадиовещания в текст для украинского языка	uk_UA
dc.title.alternative	Система перетворення телерадіомовлення в текст для української мови	uk_UA
dc.title.alternative	Broadcast Speech-to-Text System for the Ukrainian	uk_UA
dc.type	Article	uk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1

Назва:: 10-Sazhok.pdf
Розмір:: 532.46 KB
Формат:: Adobe Portable Document Format

Завантажити

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 817 B
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекція

Управляющие системы и машины, 2015, № 6