Обнаружение конечной точки в речевом сигнале с использованием энтропии и ее статистических свойств

В предварительной обработке распознавания речи важно выделить речевой участок из аудиосигнала и обнаружить конечную точку. Для этой цели применяются различные методы – скорость пересечения нуля, кратковременная энергия и т. д., однако присутствие шума влияет на их эффективность, поскольку случайные шумовые сигналы кроме уменьшения отношения сигнал/шум могут влиять на скорость пересечения нуля. Если распознавание речи происходит не в лабораторных или студийных условиях, то в окружающем пространстве всегда существуют случайные шумовые источники. Поэтому в данной статье, используя энтропию речевого сигнала и его статистику, мы провели улучшенную методику обнаружения конечной точки для достоверного выделения речевого участка в сигнале в присутствии шума. Проведены сравнительные анализы для вышеназванных методов обнаружения конечной точки слова в речевом сигнале. Эксперимент проведен для двух слов монгольского языка: «ас» и «будэг», которые были заранее записаны в компьютере с расширением wav.

Авторы: Б. Зандан, О. Бухцоож, Т. Галбаатар, А. Г. Ченский

Направление: Информатика, вычислительная техника и управление

Ключевые слова: Распознавание речи, обнаружение конечной точки, скорость пересечения нуля, кратковременная энергия, энтропия, центральная предельная теорема


Открыть полный текст статьи