Виконаємо дослідження завадозахищеності безпошукового

реклама
Оконечные устройства и линии абонентского участка информационной сети
10. Лекция: Кодирование с адаптивным предсказанием
Показаны современные методы модуляции с предсказанием. Даны принципы построения
различных типов кодирования, основанных на использовании характеристик речи и
предсказании (вокодеры) — полосовые, формантные, с линейным предсказанием.
В настоящее время при передаче информации в сотовых сетях связи и передаче речи по
Internet (IP-телефония) очень популярны методы кодирования с предсказанием. Они могут
использоваться как в чистом виде, так и в сочетании с другими видами кодирования,
например вокодерами, которые будут рассмотрены в следующей лекции.
Принцип предсказания достаточно прост (рис. 10.1).
Рис. 10.1. Модель адаптивного предсказания
На передающей стороне устанавливается предсказатель, которой по полученной в
предыдущий момент информации вырабатывает (предсказывает) последующую
информацию. При поступлении информации от передатчика предсказанное и истинное
значение сравниваются (вычитаются) и передается ошибка предсказания. В предельном
случае, когда предсказание полностью верно, сигнал "ошибка предсказания" равен нулю.
На приемном конце устанавливается предсказатель, который, по предыдущей
информации, вырабатывает последовательные значения сигнала — те же самые, что и
предсказатель передатчика, — и корректирует (суммирует) с поступившим сигналом
ошибки. Передача разностного сигнала в большинстве случаев требует меньшего числа
разрядов. Выигрыш от кодирования на практике легче оценивать по мощности. Поэтому
выигрыш от кодирования измеряют отношением мощности кодирования при равномерном
и при разностном квантовании.
Поскольку информация в канале достаточно предсказуема — кодирование с адаптивным
предсказанием снижает объем передаваемой по каналу информации.
Наглядным примером предсказания может служить служба передачи поздравительных
посланий, которая существовала на телеграфах всего мира.
Если вечером 31 декабря передатчику поступает первоначальное сообщение
"Поздравляю…..", то предсказатель с вероятностью 95-98% вырабатывает в следующий
момент слова "С Новым годом". Если последующая информация совпадает с
предсказанной информацией, то в канал передается сигнал ошибки, равный нулю. На
приемном конце будут выработаны те же слова, и при сложении предсказанной
информации и значения ошибки пользователю будет передан полный текст. При этом в
канале была передана минимальная информация. Если же последующие слова будут "С
днем рождения", то соответственно передается код ошибки. На телеграфе все виды
поздравлений были перенумерованы и занесены в кодовую книгу. Поэтому передавался
код, который обозначал поздравление с Днем рождения. Таким образом устранялась
смысловая избыточность. Конечно, пока устранение смысловой избыточности — дело
будущего, но этот пример указывает на возможное направление работ.
Кодирование с адаптивным предсказанием в настоящее время используется для
предсказания формы сигнала, которая имеет достаточно прогнозируемые участки.
Всякое кодирование с предсказанием основывается обычно на аппроксимации формы
сигнала, т.е. кодирование кривой с помощью значений этой кривой в отдельных точках и
восстановление ее формы на приемном конце по этим отдельным отсчетам.
В математике известны несколько видов аппроксимации. В технике кодирования речи
применяется линейная аппроксимация.
При этом способе каждая кривая может быть представлена с произвольной точностью
суммой величин предыдущих отсчетов, умноженных на коэффициенты, которые
называются коэффициентами предсказания.
Такая аппроксимация отображается с помощью уравнения
где
— отсчет на выходе в следующий момент времени;
— коэффициент аппроксимации;
— порядок модели.
Чем выше порядок модели, тем точнее она приближается к истинному значению формы
кривой.
Предсказание — это генерация последующей формы кривой на основании уравнения
отрезков (новых коэффициентов
). Оно может также основываться на различных
принципах.
Дифференциальная импульснокодовая модуляция
Самый простой принцип предсказания — это принцип "сохранения предыдущего
значения". В этом случае предполагается, что значение предыдущего отсчета сохранится и
в последующий момент времени. Так, человек, одеваясь перед выходом из дома,
предполагает, что температура на улице сохранится хотя бы на один час. Опровержение
этого факта возможно только установлением их разности. Действительно, эксперименты
показывают, что разница между предыдущим и последующим значением меньше, чем
само значение отсчета. Поэтому для большей части кривой сигнал ошибки может быть не
таким значительным.
Приведенная выше формула тогда модифицируется в
Тогда в линию передается разность между текущим и предыдущим значениями:
Обратим внимание, что
— аппроксимированное значение сигнала. Восстановление
сигнала на приеме заключается в том, что к предыдущему значению сигнала прибавляется
разность
На рис. 10.2 показана одна из реализаций этого метода.
Рис. 10.2. Реализация ДИКМ
В данном случае предсказатель представляет собой простой регистр, который накапливает
значение предыдущего отсчета. В линию передается разностный сигнал.
Для определения следующего разностного отсчета сигнал восстанавливается в сумматоре
сложением этого отсчета с предыдущим значением сигнала (см. на рисунке сумм. 2).
Разновидностью этого метода является аппроксимирование на основании нескольких
отсчетов. Такой способ позволяет увеличить точность аппроксимации, но требует
накопления нескольких отсчетов. При этом последующее значение
определяется по
приведенной выше формуле. При предсказании, основанном на предположении
"сохранение предыдущего значения", коэффициенты не меняются, поэтому на приемном
конце они те же самые — это позволяет не передавать их по линии, а передать только
разность аппроксимированного сигнала.
Эффективность такого кодирования, как было указано выше, оценивается выигрышем от
кодирования и измеряется в отношении мощности сигнала, представленного кодами
равномерного квантования, и мощностью сигналов кодирования разностного сигнала.
При ДИКМ такой выигрыш достигает 5 дБ [10.1]. Однако это значение изменяется от
характера сигнала. Система с разностным предсказанием становится неэффективной при
большом значении разностного сигнала.
Это может произойти из-за возрастания разности соседних отсчетов или из-за нарушения
системы предсказания.
Первое увеличивает количество передаваемой информации. Второе является
существенным недостатком систем с предсказанием.
Потеря или искажения значения разностных отсчетов приводят к полному искажению
восстанавливаемых значений, поскольку ошибка в предыдущем значении сигнала
вызывает катастрофические ошибки в определении последующих.
Все это требует передачи на приемный конец величины выигрыша (для контроля качества
принимаемого сигнала) и периодического обновления значений коэффициентов (при
устойчивом изменении характера сигнала).
Это усложняет реализацию, которая показана на рис. 10.3 (кодер) и 10.4 (декодер).
На этих рисунках показаны кодер и декодер, которые способны передавать три блока
информации:
1. кодированный разностный сигнал;
2. значение выигрыша;
3. коэффициенты аппроксимации.
Такая схема позволяет периодически проверять качество разностного кодирования и
подстраивать коэффициенты аппроксимации. В этом смысле она адаптируема.
Рис. 10.3. Кодер с адаптивным предсказанием
Рис. 10.4. Декодер с адаптивным предсказанием
Имеются методы, основанные на вероятностных методах прогнозирования. При этом
последовательные n отсчетов рассматриваются как n случайных величин, и определяется
вероятность их совместного появления [10.8] —
отсчета основано на определении математического ожидания
где
— вероятность появления
. Прогнозирование всего
-го отсчета.
При этом в линию передается разность между реальной величиной в момент
прогнозируемым значением (математическим ожиданием).
и его
.
Вероятностные формулы предсказания могут иметь самый различный характер: от
формул, предполагающих наличие вероятностного закона, например, распределение
вероятности по формуле Пуассона [10.8], до линейнокусочной аппроксимации значений
вероятности. Во всех случаях на сторону приема передаются параметры формулы
прогнозирования. Моментами передачи, кроме момента инсталляции, могут быть моменты
изменения на основе новой статистики (адаптация параметров). Вероятностные методы
связаны с нахождением оптимального соотношения сбора отсчетов (чем больше, тем
лучше) и своевременной реакцией на изменения (чем больше собранных отсчетов, тем
реакция медленнее).
Из всего сказанного можно сделать вывод, что эффективность кодирования с адаптивным
предсказанием зависит от сложности адаптивной логики и числа отсчетов для следующего
предсказания. Но существует оптимальная точка эффективности предсказания между
большим накоплением статистики (осторожная тактика) и быстротой реакции на
изменение (тактика быстрого реагирования).
Вычисление коэффициентов предсказания не обязательно проводить в реальном масштабе
времени. Их расчет производится на основании математических моделей, исходя из
выигрыша от предсказания. Отношение мощности входного сигнала к мощности
разностного сигнала называется выигрышем предсказания [10.1].
Поскольку при рассматриваемом методе передачи кодируется разностный сигнал,
имеющий меньшую мощность, то такой метод обеспечивает высокий уровень выигрыша
предсказания (от 13 до 20 дБ).
Вокодер
Работа вокодера (voice mathr) основана на анализе характерных особенностей
человеческой речи. На рис. 10.5 показаны условно частотные характеристики речи как
функция от времени.
Рис. 10.5. Пример распределения энергии в частотных диапазонах
На рисунке изображены частотные полосы (от 0 до 1 КГц, от 1 КГц до 2 КГц и т. д.) и
распределение энергии по ним при произнесении фразы.
Как видно из рисунка, энергия распределяется во времени только в некоторых частотных
диапазонах и различается по величине. Отдельные пики энергии, возникающие в одном
частотном диапазоне, называются фонемами.
Эта картина может изменяться в больших диапазонах, в зависимости от тембра голоса и
особенностей произношения, но нам сейчас важно рассмотреть общие закономерности
построения. На рисунке видно, что буквы отличаются не только частотным диапазоном, но
и структурой. Для каждого звука характерны пики (резонансы) энергии в определенных
частотных диапазонах и провалы в других. Частоты, на которых в данный момент
возникают комбинации пиков (фонем), называются "частотами формант" или просто
"формантами". Гласные и звонкие согласные звуки речи содержат обычно от трех до
четырех формант. Эти свойства и иллюстрируются рис. 10.5. Изображенная
"спектрограмма" представляет распределение энергии речи в виде функции времени и
частоты. Горизонтальная ось представляет время, вертикальная — частоту, уровень
энергии условно показан частью синусоиды. Периоды между сменами формант
составляют от 10 до 30 мс. Изучение образцов речи показало, что в русском языке
содержится 42 фонемы: это 6 гласных звуков и остальные согласные [10.5]. Чтобы
закодировать их номера, достаточно 6 битов.
Человек в среднем произносит в секунду 10 звуков. То есть от центральной нервной
системы к речевому аппарату сигналы передаются со скоростью
.
Это вычисление порождает иллюзию, что речь имеет небольшой объем информации и
может быть передана с небольшой скоростью. Однако если рассмотреть подробнее, как
образуется звук, то можно обнаружить, что при передаче речи требуется передать больше
информации. При разговоре грудная клетка сжимается и расширяется, поток воздуха
проходит через трахею и гортань в полости глотки, рта и носа. Голосовой тракт
простирается от голосовой щели (отверстие между голосовыми складками гортани) до губ
и в процессе речи его форма меняется. Если произносятся звонкие звуки (гласные,
носовые, звонкие согласные), называемые также вокализованными (voiced), голосовые
складки в гортани смыкаются и размыкаются с частотой, которая называется частотой
основного тона (pitch). Получается последовательность импульсов воздушного потока,
которые возбуждают полости голосового тракта. В процессе разговора человек меняет
геометрические размеры этих полостей, соответственно меняются и резонаторные
частоты, "форманты".
При произнесении глухих невокализированных (unvoiced) звуков голосовые связки
расслаблены. Проходя по суженному голосовому тракту, воздух создает турбулентный
поток (завихрение), т.е. в полости рта и носа возбуждаются шумоподобные сигналы.
Взрывные (смычные, stop) звуки получаются путем кратковременного выхлопа — полного
перекрытия речевого тракта, нагнетания давления и внезапного открытия тракта.
Взрывные звуки бывают звонкие (б, д, г) и глухие (п, т, к), т.е. могут образовываться с
участием голосовых складок и без них. Таким образом, в терминах спектра сигналов,
когда человек говорит, он производит спектральновременную модуляцию
широкополосного сигнала, генерируемого голосовыми складками и представляющего
своего рода несущую. Полезная информация содержится только в интонации (изменении
частоты основного тона) и в смене спектра с тонального на шумовой и наоборот.
Линейная модель речеобразования представляет речь как систему, состоящую из
генератора возбуждения (генераторная функция) и линейной системы с медленно
изменяющимися параметрами (фильтровая функция), которая им возбуждается. В такой
модели не учитывается взаимное влияние голосовой щели и голосового тракта. Это не
соответствует действительности, зато сильно упрощает анализ и синтез. Для экономичной
передачи и хранения речи надо определить параметры генераторной и фильтровой
функций. В генераторной функции изменяется частота и амплитуда основного тона
(высота и громкость голоса) и происходит смена вида функции (основной тон или шум). У
фильтровой функции происходит постоянное изменение коэффициента передачи,
проявляющееся в изменении огибающей спектра.
Эта модель представляет речь человека, который "гудит" на одной частоте, периодически
изменяя ее на другую и меняя громкость, а основная информация "добавляется" в
"подтонах".
Рассматриваемые ранее принципы и реализующая их аппаратура были предназначены в
первую очередь для воспроизведения формы входного сигнала на приеме как можно
точнее в форму сигнала на выходе приемной стороны. Ниже рассмотрим принципы
построения аппаратуры, которая моделирует человеческую речь, используя при этом
методы цифрового кодирования. Они называются вокодеры (это слово получено
объединением двух английских слов voice mathr — кодер речевого сигнала).
По принципу определения параметров фильтровой функции различают следующие типы
вокодеров:




канальные (полосовые, channel);
формантные;
ортогональные;
вокодеры с линейным предсказанием (липредеры — с Линейным ПРЕдсказанием
РЕчи).
Ранее вокодеры выполнялись только на основе аналоговой техники на протяжении всего
разговорного тракта. Теперь наиболее распространена цифровая техника.
Вокодерное оборудование
Полосовой вокодер
На рис. 10.6 и рис. 10.7 показан полосовой (канальный) вокодер [10.6, 10.7]. Основная
задача процесса кодирования в вокодере — определить спектр сигнала, мощности в
каждом диапазоне частот за достаточно длинный отрезок времени, в который существует
форманта. На передающей стороне аналоговый сигнал поступает на аналогоцифровое
устройство преобразования (АЦП). После этого он проходит ряд цифровых фильтров,
каждый из которых выделяет узкую полосу. Чем меньше полоса, тем лучше будет
качество речи на приемном конце. Но чем больше информации о частотных полосах, тем
больше придется передавать информации по цифровому тракту. Далее используются
устройства, измеряющие и кодирующие значение мощности спектра в каждом диапазоне
частот. В дополнение к информации о спектре вокодеры определяют характер
возбуждения (гласный или звонкий согласный, в отличие от глухого согласного) и частоту
основного тона для гласных или звонких согласных звуков.
Полученная информация передается на приемный конец, где она используется для
управления цифровым генератором. Он представляет память, где хранятся временные
отсчеты частот, из которых необходимо выбрать нужную по частоте и мощности.
Возбуждение гласных происходит с помощью генератора импульсов, который открывает
на определенное время генерацию основного тона. Возбуждение глухих звуков
имитируется шумовым генератором.
Ортогональный вокодер
Ортогональные вокодеры отличаются от полосовых тем, что функции фильтров
выполняются с помощью цифровых методов. Это либо быстрое преобразование Фурье,
либо ортогональные функции Уолша (периодические дискретные функции, принимающие
значения 0 или 1) [10.5].
Рис. 10.6. Схема полосового кодера
Рис. 10.7. Схема полосового декодера
Формантный вокодер
Как видно из рис. 10.7, энергия речи может концентрироваться в трех-четырех пиках,
называемых формантами. Формантный вокодер определяет и передает положение пика
энергии в частотном диапазоне, амплитуду спектральных пиков. Вследствие этого
снижается объем передаваемой информации. Качество восстановленной речи зависит от
точности определения этих параметров. Принцип устройства формантного вокодера
основан, так же как и в предыдущем случае, на разделении спектра на полосы и в
определении в полосах необходимых характеристик. Но для передачи отбираются только
данные о возбужденных спектрах. Это снижает требования к объему передаваемой
информации. Декодер восстанавливает сигнал также с помощью генерации основного тона
и различных типов сигналов (шумовых и импульсных). Такой тип вокодера обеспечивает
передачу речи со скоростью до 1 Кбит/с, но применяется сравнительно редко из-за
больших трудностей, связанных с точным вычислением формант.
Вокодеры с линейным предсказанием (липредеры)
Этот тип вокодера (рис. 10.8, рис. 10.9), в отличие от предыдущих типов, для передачи
речи применяет не фильтры, а систему линейного предсказания. Как уже упоминалось
(рис. 10.1), в линию передается разностный сигнал между истинным и предсказанным
значениями. Коэффициенты предсказания [10.8] используются для предсказания
управлением, восстанавливающим генератором на приеме и добавления генератором
шума для передачи глухих и "свистящих" согласных.
Рис. 10.8. Схема передающей части вокодера с линейным предсказанием
Рис. 10.9. Схема приемной части вокодера с линейным предсказанием
Прямое использование предсказания позволяет воспроизводить звук, но с плохим
качеством. ( Качество оценивается в соответствии с методиками, рассмотренными в главе
1.) Поэтому этот метод имеет много различных разновидностей, улучшающих это
качество. Эти методы касаются улучшения параметров возбуждения генераторов на
приемном конце. Поэтому из трех составляющих системы с предсказанием —
аппроксимации, предсказания и методов восстановления (возбуждения генераторов) речи
— все усовершенствования метода линейного предсказания касаются последней
составляющей. Поэтому они иногда называются гибридными кодерами, ибо представляют
собой гибриды вокодеров и кодеров сигнала. Рассмотрим коротко каждый из них.
Многоимпульсное кодирование (MPLPC — Multi-Pulse LPC) [10.2, 10.9] . Оно отличается
от LPC тем, что предсказание касается не основного тона, а параметров передаваемых и
принимаемых импульсов, что более похоже на методы адаптивного кодирования. В
отличие от последних прогнозируется последовательность импульсов. При этом способе
не надо находить тип фрагмента речи (вокализированная речь или нет) и находить
параметры основного тона. Такой тип кодирования применяется в широко применяемой
системе передачи речи по Internet — система Skyphone. Он позволяет передавать речь со
скоростью 9,6 кбит/с.
Линейное предсказание с возбуждением усеченного остаточного сигнала (RELP LTP —
Residual Excited Linear Predication Long Term Prediction). Отличается от предыдущего тем,
что в результате обработки кодируется и предсказывается нижняя часть речевого спектра,
и это уменьшает число обрабатываемых и предсказываемых отсчетов. Применение RELP в
некоторых Европейских мобильных системах позволяет снизить скорость передачи в
канале с 16 до 9,6 Кбит/с без существенного снижения качества речи.
Линейное предсказание с кодовым возбуждением (CELP — math Excited Linear Prediction).
Данный класс речевых кодеров занимает промежуточное место между кодерами формы
сигнала и параметрическими вокодерами. Анализ параметров речи осуществляется на
интервалах 10-30 мс, что позволяет эффективно применять CELP при скоростях передачи
от 4 до 16 Кбит/c. Как видно из структурной схемы кодера CELP (рис. 10.10), вместо
кодирования сигналов отсчет за отсчетом кодером разностного сигнала (см. рис. 10.2 и
10.3) применяется "кодовая книга возбуждения". В этом случае каждому разностному
сигналу сопоставляется строка (шаблон) сигналов. Эта строка содержит набор отсчетов,
соответствующих передаваемой остаточной последовательности на основе полученного
значения ошибки. На приемном конце вместо декодера разностного сигнала также
применяется "кодовая книга возбуждения".
Существует большое число разновидностей кодовых книг, которые классифицируются:
1. по принципу поиска кодов векторов (с полным перебором, двоичный или
последовательный поиск и т.п.);
2. по способам обучения (Фиксированная или адаптируемая книга);
3. по виду хранимой информации (выборки речи или реализация шума).
Алгоритм CELP позволяет воспроизводить речь с высоким качеством. Средняя экспертная
оценка: 3,5—3,5. Однако он требует больших вычислительных ресурсов, поэтому на его
основе построено много разновидностей кодеров.
Рис. 10.10. Структурная схема кодера CELP
Многие из технологий, использующих методы предсказания и вокодерные принципы
преобразования, стандартизированы ITU-T [10.12-10.20].
Ниже приводится табл. 10.1, которая позволяет сравнить качество методов при различных
типах кодеров.
При том заметим, что:



метод экспертных оценок с помощью показателя усредненного мнения (MOS —
Mean Opinion Score) мы рассматривали в главе 1;
метод артикуляционных испытаний основан на использовании списков фраз,
каждый из которых содержит по 96 пар рифмованных близких по звучанию слов
(радостьгадость, кошкакрошка….);
оценка разборчивости речи характеризуется числом правильно принятых слов
;
выраженным в процентах, т.е.
где
— число правильных ответов;
— число неверных ответов.
Оценка качества проводится по следующей таблице (табл. 10.1).
Таблица 10.1. Экспертная оценка по шкале Рифмованного Диагностического Теста
(DRT)
Оценка в %
Показатель качества
95-100
Превосходно
87-95
Хорошо
79-87
Удовлетворительно
70-79
Плохо
Менее 70
Неудовретворительно
В таблице 10.2 приводятся результаты оценки различных кодеров по различным методам
оценок.
Таблица 10.2. Сравнение качества речи для основных типов кодеров
метод оценки
скорость
Диагностический
метод
кодер
кодирования, Диагностический
критерий
экспертных
кбит/с
рифмованный тест
пригодности
оценок
ИКМ
64
95
73
4,3
QCLEP-13 14,4
4,2
АДИКМ
32
94
4,1
LD-CELP 16
94
4,0
MP- MLQ* 6,4
3,9/3,4**
(G.723.1)
RPE-LTP
13
3,5
(GSM)
MPLPC
9,6
3,4
(Skyphone)
QCELP
9,6
3,4
CELP
LPC
8
2,4
93
90
68
54
3,7
2,5
Краткие итоги







В настоящее время при передаче информации в сотовых сетях связи и передаче
речи по Internet (IP-телефония) очень популярны методы кодирования с
предсказанием.
Принцип предсказания. На передающей стороне устанавливается предсказатель,
которой по полученной в предыдущий момент времени информации вырабатывает
(предсказывает) последующую информацию. При поступлении информации от
передатчика предсказанное и истинное значение сравниваются (вычитаются) и
передается ошибка предсказания. На приемном конце устанавливается
предсказатель, который по предыдущей информации вырабатывает
последовательные значения сигнала (те же самые, что и предсказатель передатчика)
и корректирует (суммирует) с поступившим сигналом ошибки.
Кодирование с предсказанием основывается обычно на аппроксимации формы
сигнала, т.е. кодирование кривой с помощью значений этой кривой в отдельных
точках и восстановление ее формы на приемном конце по этим отдельным
отсчетам.
При линейной аппроксимации каждая кривая может быть представлена с
произвольной точностью суммой величин предыдущих отсчетов, умноженных на
коэффициенты, которые называются коэффициентами предсказания.
При дифференциальной импульснокодовой модуляции в линию передается
разность между текущим и предыдущим значениями.
Выигрыш от кодирования на практике легче оценивать по мощности. Поэтому
выигрыш от кодирования измеряют отношением мощности кодирования при
равномерном и при разностном квантовании.
Система с разностным предсказанием становится неэффективной при большом
значении разностного сигнала.
Это может произойти из-за возрастания разности соседних отсчетов или из-за
нарушения системы предсказания.






Имеются методы, основанные на вероятностных методах предсказания. Они
рассматривают последовательные n отсчетов как n случайных величин и
определяют вероятность их совместного появления [10.8] —
).
Прогнозирование всего отсчета основано на определении математического
ожидания.
Вероятностные методы связаны с нахождением оптимального соотношения сбора
отсчетов (чем больше, тем лучше) и своевременной реакцией на изменения (чем
больше собранных отсчетов, тем реакция медленнее).
Работа вокодера (voice mathr) основана на анализе характерных особенностей
человеческой речи.
Энергия речевого сигнала распределяется во времени только в некоторых
частотных диапазонах и различается по величине. Отдельные пики энергии,
возникающие в одном частотном диапазоне, называются фонемами. Частоты, на
которых в данный момент возникают комбинации пиков (фонем), называются
"частотами формант" или просто "формантами".
По принципу определения параметров фильтровой функции различают следующие
типы вокодеров: канальные (полосные, channel); формантные; ортогональные;
вокодеры с линейным предсказанием.
Основная задача процесса кодирования в вокодере — определить спектр сигнала,






мощности в каждом диапазоне частот за достаточно длинный отрезок времени, в
который существует форманта. Полученная информация передается на приемный
конец, где она используется для управления цифровым генератором.
Ортогональные вокодеры отличаются от полосовых тем, что функции фильтров
выполняются с помощью цифровых методов.
Формантный вокодер определяет и передает положение пика энергии в частотном
диапазоне, амплитуду спектральных пиков. Вследствие этого снижается объем
передаваемой информации.
Этот тип вокодера, в отличие от предыдущих типов, для передачи речи применяет
не фильтры, а систему линейного предсказания. Как уже упоминалось, в линию
передается разностный сигнал между истинным и предсказанным значением.
Коэффициенты предсказания используются для предсказания управления
восстанавливающим генератором на приеме и добавления генератором шума для
передачи глухих и "свистящих" согласных.
Многоимпульсное кодирование (MPLPC — Multi-Pulse LPC) отличается от LPC
тем, что предсказание касается не основного тона, а параметров передаваемых и
принимаемых импульсов, а это более похоже на методы адаптивного кодирования.
Линейное предсказание с возбуждением усеченного остаточного сигнала (RELPResidual Excited Linear Predication) отличается тем, что в результате обработки
кодируется и предсказывается нижняя часть речевого спектра, а это уменьшает
число обрабатываемых и предсказываемых отсчетов.
Линейное предсказание с кодовым возбуждением (CELP — math Excited Linear
Prediction) занимает промежуточное место между кодерами формы сигнала и
параметрическими вокодерами. При этом методе вместо кодирования сигналов
отсчет за отсчетом кодером разностного сигнала применяется "кодовая книга
возбуждения".
Задачи и упражнения
Преположим:
1. Сигналы на выходе квантователя имеют дапазон от
до
и шаг квантования
0,5
2. На вход в течение каждого момента времени зависит от текущего значения сигнала
и задается матрицей преходных вероятностей (таблица 10.3).
Таблица 10.3. Матрица переходных вероятностей
-2,0 -1,5 -1,0 -0,5 +0,5 +1,0 +1,5 +2,0
-2,0 0,05 0,15 0,30 0,15 0,15 0,05 0,1 0,05
-1,5 0,15 0,05 0,3 0,15 0,15 0,05 0,1 0,05
-1,0 0,1 0,3 0,15 0,2 0,15 0,05 0,1 0,05
-0,5 0,05 0,05 0,15 0,15 0,3 0,15 0,1 0,05
+0,5 0,05 0,05 0,05 0,15 0,15 0,3 0,2 0,05
+1,0 0,05 0,1 0,05 0,15 0,2 0,05 0,3 0,1
+1,5 0,05 0,1 0,05 0,1 0,1 0,25 0,05 0,3
+2,0 0,05 0,05 0,05 0,15 0,15 0,3 0,2 0,05
Определите сигналы, передаваемые в сдучае поступления последовательности показанной
в табл. 10.4.
Таблица 10.4. Последовательности сигналов поступающих на вход
момент времени
Уровень сигнала
-1,5
-1,5
-0,5
+1,0
+1,5
+2,0
Пример:
Пусть предыдущий сигнал был равен
.
Определите сигнал, передаваемый в линию.
Определим величину математическое ожидание поступления следующего сигнала.
-2,0 -1,5 -1,0 -0,5 +0,5 +1,0 +1,5 +2,0
-2,0 0,05 0,15 0,30 0,15 0,15
0,05 0,1 0,05
Пусть поступает следующий сигнал
. Тогда в линию переадется сигнал равный
.
В линию передается этот сигнал
Используя данные таблицы 10.5, определите значение выходного сигнала, используя
формулу
где
— отсчет на выходе в следующий момент времени;
— коэффициент аппроксимации;
— порядок модели.
Таблица 10.5. Перечень коэффициентов определяющих выходной сигнал
коэффициенты аппроксимации
моменты времени
0,3
0,3
0,4
0,2
0,15
0,2
0,2
0,15
0,6
0,1
0,2
0,75
0,5
0,5
0,3
0,2
0,3
0,3
0,3
0,15
0,2
© 2003-2007 INTUIT.ru. Все права защищены.
0,4
0,7
0,6
Скачать