Банки фильтров - RightMark Audio Analyzer

advertisement
Лектор: Лукин Алексей Сергеевич
Вейвлеты
и банки фильтров
План

Вейвлеты и их связь с банками фильтров
► Непрерывное вейвлет-преобразование
► Дискретное вейвлет-преобразование
► Квадратурные зеркальные фильтры
► Пирамидальное представление данных


Банки фильтров: DFT, MDCT
Применения банков фильтров
► Аудиоэффекты
► Шумоподавление
► Компрессия звука и изображений
Понятие вейвлета

Вейвлеты – это сдвинутые и масштабированные
копии ψa,b(t) («дочерние вейвлеты») некоторой быстро
затухающей осциллирующей функции ψ(t)
(«материнского вейвлета»)
 a ,b (t ) 

1 t b


a  a 
Используются для изучения частотного состава
функций в различных масштабах и для
разложения/синтеза функций в компрессии и
обработке сигналов
Понятие вейвлета

Условия, обычно накладываемые на ψ(t):

► Интегрируемость
  (t) dt  

► Нулевое среднее, нормировка

  (t ) dt  
2



 (t )dt  0
  (t ) dt  1
2



► Нулевые моменты (vanishing moments)
 t  (t )dt  0
m

Понятие вейвлета

Примеры вейвлетов
Morlet (Gabor)
Meyer
Mexican hat
Непрерывное вейвлетпреобразование (CWT)

Скалярные произведения исследуемой функции
f(t) с вейвлетами ψa,b(t)
W {x}(a, b)  x, a ,b 

 x(t )

a ,b
(t )dt
Дискретное вейвлетпреобразование (DWT)



Используются лишь целочисленные сдвиги
вейвлета и масштабирование в 2 раза
Возможность построения ортогонального
преобразования
Дискретный вейвлет:
1. Последовательность чисел h2 [m]
2. Ортогонален своим сдвигам на четное число точек

 h [m]h [m  2k ]  0,
m  
2
2
k  Z , k  0
3. Существует скейлинг-функция (НЧ-фильтр),
ортогональная вейвлету

 h [m]h [m]  0
m  
1
2
Преобразование Хаара

Простейший случай вейвлет-преобразования
Дан входной сигнал x[n]
Образуем от него последовательности полусумм и
полуразностей:
x1*[n] 
x[n]  x[n  1]
2
x2*[n] 
x[n]  x[n  1]
2
Легко видеть, что сигнал x[n] можно восстановить:
x[n]  x1*[n]  x2*[n]
Такое кодирование избыточно: из одной
последовательности получаем две
Преобразование Хаара

Устранение избыточности
Проредим полученные последовательности в 2 раза:
x1[n]  x1*[2n]
x2 [n]  x2*[2n]
Легко видеть, что справедлив алгоритм восстановления:
 n
x
, n  четное
yi [n]   i  2 
i  1, 2

n  нечетное
 0,
x1**[n]  y1[n]  y1[n  1]
(интерполяция нулями)
x2**[n]  y2 [n]  y2 [n  1]
x[n]  x1**[n]  x2**[n]
(фильтрация)
(суммирование)
Дискретное вейвлетпреобразование

Обобщение преобразования Хаара
x[n]
H2
H1
↓2
↑2
+
Коэффициенты
↓2
Декомпозиция (анализ)
G2
↑2
x’[n]
G1
Реконструкция (синтез)
Свойство точного восстановления (PR): x[n]  x[n]
Количество информации не изменяется.
Нужно найти хорошие фильтры, обеспечивающие точное
восстановление.
Дискретное вейвлетпреобразование

Прореживание ВЧ-сигнала
↓2

Интерполяция ВЧ-коэффициентов до ВЧ-сигнала
↑2
Дискретное вейвлетпреобразование

Квадратурные зеркальные фильтры (QMF)
частотные
характеристики
H1 ( )  H 2 ( )  const
2
2
импульсные
характеристики
Дискретное вейвлетпреобразование

QMF: базис Хаара
Плохое частотное разделение,
но хорошая временная
(пространственная)
локализация
Дискретное вейвлетпреобразование

Условия точного восстановления:
► Рассмотрим случай
m  четное
 h [m],
h2 [m]   1
g1[m]  h1[m], g2 [m]  h2 [m],
 h1[m], m  нечетное
► h1[m] – симметричный, четной длины
► В этом случае требуется, чтобы

H1[ ]  H 2 [ ]  2
2
2
Построение PR-вейвлетов:
► Нужна хорошая пространственная локализация –
берем стандартные вейвлеты (например, вейвлеты
Добеши)
► Нужна хорошая частотная локализация – свойству PR
удовлетворить трудно. Поэтому строим QMF со
свойством «почти PR».
Дискретное вейвлетпреобразование

Построение «почти PR»-фильтров большого
размера с хорошим частотным разделением:
1. Строим симметричный НЧ-фильтр h1[m] методом
оконного взвешивания.
2. Нормируем его коэффициенты:
 h1[m]  2
m
3. Строим дополняющий его ВЧ-фильтр h2[m]:
m  четное
 h [m],
h2 [m]   1
 h1[m], m  нечетное
4. Проверяем величину искажений по суммарной
частотной характеристике и пробуем изменить частоту
среза НЧ-фильтра для уменьшения искажений.
Пирамидальное
представление

Продолжаем вейвлет-разложение для НЧкоэффициентов
Одномерный случай
x[n]
Частотный диапазон
делится на октавы
H2
↓2
H1
↓2
H2
↓2
H1
↓2
Коэффициенты
Двумерное вейвлетпреобразование
на каждом шаге получаем
4 набора коэффициентов:
НЧ («аппроксимирующие»)
и ВЧ («детализирующие»)
Банки фильтров

Банки фильтров (гребенки фильтров) –
преобразования, разбивающие сигнал на
несколько частотных полос
► С точным восстановлением?
► С увеличением количества информации?


Пример: дискретное вейвлет-преобразование
Еще пример: оконное преобразование Фурье
(STFT – Short Time Fourier Transform)
Банки фильтров

Применения:
►
►

Раздельная обработка сигнала в разных частотных
полосах
Компрессия сигналов с независимым квантованием в
разных частотных полосах
Пример банка фильтров, основанного на STFT
►
►
►
Декомпозиция: STFT с окном Хана (Hann), и с
перекрытием между окнами 75%
Синтез: обратное DFT от каждого блока, применение
весовых окон Хана и сложение окон с наложением (OLA)
Свойства:
►
►
Точное восстановление
Наличие избыточности
Банки фильтров

Как банки фильтров разбивают частотновременную плоскость?
► Вейвлеты делят частотную ось на октавы
► STFT разбивает частотную ось равномерно
f
f
t
Оконное ДПФ
t
Вейвлеты
Банки фильтров,
основанные на STFT

–
+
Без весовых окон, без перекрытия блоков
► Размытие спектра → плохое разделение частот в каналах
► Разрывы сигнала на границах блоков при синтезе
► Нет избыточности
0

+
–
N
2N
С весовыми окнами, с перекрытием блоков
► Хорошее разделение частот в каналах
► Нет разрывов на границах блоков при синтезе
► Избыточность
t
Банки фильтров,
основанные на STFT

+
Модифицированное дискретное косинусное
преобразование (MDCT)
► Перекрытие 50%, весовое окно
► Неплохое разделение частот в каналах
► Без избыточности! → подходит для компрессии
► Каждое окно длины 2N захватывает N новых отсчетов и
выдает N вещественных коэффициентов спектра
► Требования к окнам: w[ n ]2  w[ n  N ]2  const
► Примеры подходящих окон:
►
►
Полпериода синуса
Kaiser-Bessel derived (KBD)
Банки фильтров,
основанные на STFT

Частотно-временное разрешение
► Способность различать детали по частоте и по времени,
«размытость» спектрограммы
► Для STFT определяется длиной весового окна (а также,
отчасти, размером и шагом DFT по времени)
► Соотношение неопределенностей: разрешение по частоте
обратно пропорционально разрешению по времени
f  t  const
6 ms
12 ms
24 ms
48 ms
96 ms
размер окна
Банки фильтров,
основанные на STFT

Частотно-временное разрешение
► Частотное разрешение спектрограммы равномерное
► Частотное разрешение слуха на НЧ выше, чем на ВЧ
STFT, окно 12 мс
STFT, окно 93 мс
Банки фильтров:
достоинства и недостатки

STFT
Очень быстрая реализация для большого числа полос
+
–

Слишком различающееся число осцилляций
базисных функций, эффект Гиббса
DWT
Возможность произвольных разбиений F-T плоскости
+
–
Малое число частотных полос
Плохое частотное разделение между полосами
Download