Идентификация диктора по порядковым статистикам спектров речевых сигналов
Loading...
Date
2014
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Рассматривается контекстно-независимая идентификация диктора по порядковым статистикам совокупности текущих амплитудных спектров Фурье сегментов речевых цифровых сигналов спонтанной речи после удаления пауз. Метод спектральной идентификации в качестве информационного использует вектор значений порядковых статистик (выборочных квантилей) текущих амплитудных спектров речевых сигналов всей совокупности сегментов анализа (спектральный образ). Решение об идентичности дикторов (допуске или отказе) принимается по минимуму евклидовой метрики нормированного спектрального образа анализируемого речевого сигнала диктора и спектральных образов базы целевых абонентов. Приводятся предварительные экспериментальные оценки надежности идентификации дикторов по спектральным образам в целом без предварительной спек-тральной обработки и сепарации речевых сигналов.Розглядається контекстно-незалежна ідентифікація диктора за порядковими статистиками сукупності поточних амплітудних спектрів Фур’е сегментів мовних цифрових сигналів спонтанної мови після видалення пауз. Метод спектральної ідентифікації в якості інформаційного використовує вектор значень порядкових статистик (вибіркових квантилів) поточних амплітудних спектрів мовних сигналів всієї сукупності сегментів аналізу (спектральний образ). Рішення про ідентичність дикторів (допуск або відмову) приймається за мінімумом евклідової метрики нормованого спектрального образу аналізованого мовного сигналу диктора і спектральних образів бази цільових абонентів. Наводяться попередні експериментальні оцінки надійності ідентифікації дикторів за спектральними образами в цілому без поперед-ньої спектральної обробки та сепарації мовних сигналів.The context-independent speaker identification by serial statistics of the current amplitude of Fourier spectra of segments of the digital speech signals of the spontaneous speech after the removal of pauses is considered. The method of spectral identification as an information one uses a vector of values of order statistics (sample quantiles) of the current amplitude spectrum of the speech signal of the totality of segments analysis (spectral image). The decision about the identity of the speakers (admission or rejection) shall be based on the minimum Euclidean metric of the normalized spectral image of the analyzed speech signal of the speaker and spectral images of the database of target subscribers. Preliminary experimental evaluation of the reliability of the speaker identification by spectral images in whole without the prior spectral processing and separation of speech signals are stated.
Description
Keywords
верификация и идентификация диктора, база речевых сигналов целевых абонентов, кепстральное преобразование, порядковые статистики, верифікація та ідентифікація диктора, база мовних сигналів цільових абонентів, кепстральні перетворення, порядкові статистики, verification and speaker identification, database of speech signals target subscribers, casterline conversion, order statistics