Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями

dc.contributor.authorКалюжный, А.Я.
dc.contributor.authorСеменов, В.Ю.
dc.date.accessioned2015-10-16T16:31:39Z
dc.date.available2015-10-16T16:31:39Z
dc.date.issued2009
dc.description.abstractВ статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов.uk_UA
dc.description.abstractВ статті запропоновано метод автоматичної класифікації мовних фрагментів за ознакою "чоловік/жінка" та описані основні етапи його алгоритмічної реалізації. Метод заснований на моделюванні щільності розподілу вектора акустичних ознак голосу зваженою сумою декількох гаусівських розподілів (метод гаусових сумішей, GMM). При цьому кожний член GMM відповідає деякому підкласу множини акустичних параметрів голосового сигналу. За вектор акустичних ознак було обрано сукупність кепстральних RASTA-PLP коефіцієнтів, доповнених періодом основного тону. Навчання гаусових сумішей для чоловічих та жіночих голосів виконувалось за методом expectation-maximization з ініціалізацією згідно алгоритму K-середніх. Досліджено залежність процента помилок класифікації від типу коваріаційних матриць GMM та їхніх порядків. У різних експериментах запропонований метод показав достатньо малу ймовірність помилки класифікації (від 9 до 0%). Зроблено висновок щодо другорядності порядку та типу GMM у порівнянні з необхідністю різноманітного представлення дикторів у навчальній базі мовних сигналів.uk_UA
dc.description.abstractThe method for automatic speaker's gender classification has been proposed and its basic algorithmic stages have been described. The method is based on modeling of voice acoustic parameters distribution by a weighted sum of several Gaussian distributions (Gaussian mixture modeling, GMM). In doing so, every component of the GMM corresponds to a certain subset of voice acoustic parameters. The set of cepstral RASTA-PLP coefficients extended by the period of the basic tone has been selected as the vector of acoustic features. The male and female GMMs were trained by the expectation-maximization method initialized according to the K-means algorithm. The dependence of classification errors on the GMM types and their orders has been investigated. In different experiments, the proposed method has shown low probability of classification errors (from 9 to 0%). This fact allows the conclusion about minor importance of the GMM order and type in comparison with a necessity of the diverse presenting of the speakers in the training data set.uk_UA
dc.identifier.citationМетод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос.uk_UA
dc.identifier.issn1028-7507
dc.identifier.udc534.78+621.391
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/87277
dc.language.isoruuk_UA
dc.publisherІнститут гідромеханіки НАН Україниuk_UA
dc.relation.ispartofАкустичний вісник
dc.statuspublished earlieruk_UA
dc.titleМетод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесямиuk_UA
dc.title.alternativeA method for speaker's gender identification on the basis of the Gaussian mixture modeling of voice acoustic parametersuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
04-Kalyuzhny.PDF
Розмір:
310.02 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: