Такун Евгения Научный руководитель: Булашевич Александр Евгеньевич к.т.н.

advertisement
Такун Евгения
Научный руководитель:
к.т.н. Булашевич Александр Евгеньевич



Распознавание слитной речи в общем виде,
в том числе и в условиях сильной
зашумленности сигнала
Для лабораторной речи диктора задача
решена
Для слитной речи задача решена в частных
случаях (например, в случае ограниченного
словаря или в случае обучения
распознающего автомата особенностям
естественной речи конкретного человека


Выделение основного тона на
стационарных гармонических участках
(гласные) решена в 60-х годах
При выделении основного тона
зашумленного сигнала число ошибок резко
возрастало. Приходилось ограничиваться
промежутками стационарности


Частотные
Временные



Выделив импульсы основного тона, мы
получим ещё один признак распознавания
фонемы
Сегментация речи на фонемы должна быть
«натянута» на основной тон
Деление на кадры для параметризации
тоже должно быть по моментам импульсов
ОТ


Проанализировать основные подходы
Путём комбинации известных решений, а
также поиска новых решений реализовать
автомат, который выделяет импульсы
основного тона на нестационарных
участках с большим шумовым фоном

Анализ поведения «Тигрового» оператора
T(i) = (s(i)′)2 – s(i)•s(i)′′
Сигнал [la”]
Тигровый оператор
T(i) = (s(i)′)2 – s(i)•s(i)′′



Легко считать
Работает
практически
мгновенно
Хорошо описывает
поведение энергии
сигнала
Недостатки:
Дифференцирование очень сильно подчёркивает шумы
На реальном сигнале Тигр получается зашумленным



Комплексное представление сигнала
cos(x) = (eix + e-ix)/2
Умножаем наш сигнал на сопряженный
задержанный к нему - получаем квадрат
амплитуды и мгновенную частоту
В итоге хорошая оценка общей мощности
энергии сигнала, лишенная главного
недостатка Тигра - дифференцирования
Related documents
Download