Введение. информации об измеряемом объекте. При наличии полной информации процесс

advertisement
Введение. Множество практических задач решается на основе
информации об измеряемом объекте. При наличии полной информации процесс
обработки, хранения и восстановления экспериментальных данных уже хорошо
изучен. Иная ситуация может возникнуть, когда информация об изучаемом
объекте частично отсутствует. В работе рассматривается именно такой случай в
предположении, что для измеряемого объекта существует ограниченное число
образцов (классов), к одному из которых он может принадлежать. В работе к
рассмотрению предлагается метод распознавания исследуемого объекта,
основанный на использовании вейвлет-преобразования экспериментальных
данных.
Постановка задачи и методы решения. Предположим, что исходный
сигнал может принадлежать к одному из классов K1, K 2 ,..., K n , образующих
разбиение множества сигналов
и имеются теоретические значения
k
соответствующих функций f xi , y j , k  1,..., n в точках xi , y j эталонных

образцов каждого класса


K k . Пусть g xi , y j



- измеренные значения
экспериментального двумерного сигнала в тех же самых точках. На основе
значений g xi , y j требуется определить, к какому классу принадлежит


измеряемый сигнал.
Для принятия такого решения можно воспользоваться либо различными
статистическими или детерминированными методами, применёнными к
исходным сигналам, либо предварительно преобразовать дискретно-значные
функции f k xi , y j и g xi , y j с последующим сравнением полученных




характеристик.
В данной работе рассматривается второй подход, основанный на вейвлетпреобразовании соответствующих функций с использованием вейвлета Добеши
2-го порядка и сравнением получающихся коэффициентов.
Основную модель вейвлет-преобразования можно описать следующим
образом. Сначала выбирается подходящий анализирующий (т.н. отцовский)
вейвлет   x  . Затем на его основе строится масштабирующий (материнский
вейвлет)   x  . Из функций   x  и   x  путём сдвига и растяжения, получаем
копии, называемые вейвлетными функциями.[1]
Для одновременного проведения как частотного, так и временного
анализа данных вейвлеты должны удовлетворять определённым условиям,
например, иметь компактный носитель, нулевое среднее значение, быть
непрерывными, желательно, чтобы вейвлетные функции образовывали
ортогональный базис и т.п. Одними из наиболее удобных в использовании
таких функций являются вейвлеты Добеши, не имеющие формального
математического описания, но легко получаемые алгоритмически. В данной
работе использовался вейвлет Добеши 2-го порядка.
В результате разложения двумерного сигнала по базисным функциям,
полученным из вейвлета Добеши, получаем наборы коэффициентов,
соответствующих различным уровням детализации.
Соответствующие коэффициенты принято называть следующим образом:
Аппроксимирующие коэффициенты cA j получаются как коэффициенты
разложения по вейвлет-базису  j ,n  x   j ,m  y  .
Горизонтальные детализирующие коэффициенты cH j получаются как
коэффициенты разложения по вейвлет- базису  j ,n  x   j ,m  y  .
Вертикальные детализирующие коэффициенты cV j получаются как
коэффициенты разложения по вейвлет- базису  j ,n  x   j ,m  y  .
Диагональные детализирующие коэффициенты cD j получаются как
коэффициенты разложения по вейвлет- базису  j ,n  x   j ,m  y  .[2]
Практически выходной сигнал задается матрицей S . При разложении этого
сигнала получаются указанные выше четыре типа коэффициентов. Например,
горизонтальные детализирующие коэффициенты cH1 получаются сверткой
строк матрицы S с низкочастотным фильтром вейвлета и децимацией и затем
сверткой столбцов полученной матрицы с высокочастотным фильтром и
децимацией[3].
Схему
разложения
можно
изобразить
в
виде
S   cA1, cH1, cV1, cD1    cA2 , cH 2 , cV2 , cD2 , cH1, cV1, cD1   ...
Поскольку массив начальных коэффициентов двумерный, то более
естественно схему разложения сигнала S (рис.1) изобразить в виде
cH 2
cA2
cH1
cD2
cV2
cH1
S
cV1
cD1
Рис. 1
Предположим, что измеренный сигнал g  x, y  является частью одного из
эталонных сигналов




f k  x, y  , т.е. или g xi , y j  f k xi , y j , k  1,..., n для


какого-то фиксированного k , или g xi , y j  0 . Тогда, в силу компактности
носителей для вейвлетов Добеши и соответствующих масштабирующих копий
в определённых областях все коэффициенты разложений g  x, y  и f k  x, y 
будут совпадать и значительно отличаться от соответствующих коэффициентов
других эталонных функций.
В качестве меры отличия между сигналами выберем l2 - норму:
f k  x, y   g  x , y  

  
   
   
   

2
2
2
2

k
k
k
k
cA
f

cA
g

cH
f

cH
g

cV
f

cV
g

cD
f

cD
g








  j
j
j
j
j
j
j
j
,

 
 
 
 
где cA j f k , cH j f k , cV j f k , cD j f k
- соответствующие коэффициенты
базисного разложения функции f k по вейвлет – базису, аналогичные
обозначения и для функции g .
В случае, когда g является частью f , эта норма будет иметь наименьшее
значение по сравнению с аналогичными нормами при использовании других
эталонных функций.
Алгоритм обработки информации следующий:
Этап 1 (Построение исследуемых сигналов). На этом этапе осуществляется
расчет вейвлет–коэффициентов, то есть разложение сигналов на
аппроксимирующие,
горизонтальные
детализирующие,
вертикальные
детализирующие и диагональные детализирующие коэффициенты, для так
называемых эталонных образцов. [3]
Этап 2 (Разложение сигнала). На данном этапе осуществляется разложение
измеренного
сигнала,
на
аппроксимирующие,
горизонтальные
детализирующие,
вертикальные
детализирующие
и
диагональные
детализирующие коэффициенты.
Этап 3 (Классификация). На этом этапе происходит сравнение вейвлеткоэффициентов измеренного сигнала и вейвлет-коэффициентов эталонных
образцов и определение к одному из классов. В качестве индикатора различий
выступает l2-норма.
Класс K k , к которому принадлежит измеряемый сигнал g , определяется
путем сравнения указанных выше норм и выбора наименьшей из них.
Результаты. В качестве примера работы алгоритма было рассмотрено
распознавание букв кириллического алфавита, встречающихся на
государственных регистрационных знаках автомобиля.
В качестве сигнала g(x,y) было взято изображение буквы А при условии,
что часть информации была намеренно стерта (рис. 2).
Рис. 2
В качестве классов принадлежности взяты буквы А, В, Е, К, М, Н, О, Р, С,
Т, У, Х.
В эксперименте исследуемыми сигналами были все буквы, встречаемые на
государственных регистрационных знаках. Результаты распознавания
приведены в таблице 1.
Таблица 1
Сравнительный анализ распознавания экспериментального сигнала
Буква
Значение F критерия
l2 -норма
Фишера- Снедекера
А
39880
В
53649
59,911
Е
50345
12,169
К
48648
1,365
М
57546
176,746
Н
49662
5,849
О
51073
21,382
Р
48786
0,259
С
47834
0,007
Т
42656
65,140
У
45068
27,994
Х
47349
0,931
Легко заметить, что наименьшая значение l2 -нормы получается при
сравнении буквы А с частично удалённой информацией именно с буквой А.
Для проверки значимости полученного результата распознавания был
проведён сравнительный однофакторный дисперсионный анализ для
выбранного базисного элемента и всех других возможных элементов при
доверительной вероятности 95%. Данный метод анализа эффективен в тех
случаях, когда в наличии есть три или более независимые выборки значений,
полученные из одной генеральной совокупности путем изменения какого-либо
независимого фактора. Для этих выборок предполагают, что они имеют разные
выборочные средние и одинаковые выборочные дисперсии. Необходимо
определить, оказал ли этот фактор существенное влияние на разброс
выборочных средних или разброс является следствием случайностей,
вызванных небольшими объемами выборок. Другими словами если выборки
принадлежат одной и той же генеральной совокупности, то разброс данных
между выборками (между наборами) должен быть не больше, чем разброс
данных внутри этих выборок (внутри набора).
Для анализа использовалась программа Microsoft Excel и включенный в её
состав пакет «Анализ данных». В качестве выборок брались значения разностей
коэффициентов вейвлет-разложения исходного сигнала и эталонных букв.
Сравнительные результаты также приведены в таблице 1.
При сравнении с теоретическим значением F, равным 3,84, можно
убедиться, что с большинством букв различие сигнала с утерянной на 79%
информацией всё равно является статистически значимым. При меньшей доле
потерь количество значимых различий будет возрастать.
Для проверки эффективности метода было проведено сравнение
предлагаемого метода распознавания сигнала с другими методами.
Если использовать только статистические методы и не подвергать
распознаваемый
сигнал
предварительной
обработке,
то
значимое
распознавание возможно лишь при потере информации не более одного
процента.
В случае же, если использовать предварительное вейвлет-преобразование
сигнала, то статистически значимое распознавание возможно в случаях, когда
процент потерянной информации достигает 23.
Аналогично, предлагаемый метод имеет преимущество перед сигналом, к
которому было применено двумерное преобразование Фурье, поскольку в
отличие от него, вейвлеты являются ограниченными функциями, как в
частотной, так и во временной области. Это доказывают значения l2 -нормы
найденные с использованием вейвлет-преобразования (таблица 1) и двумерного
преобразования Фурье (таблица 2) Двумерное преобразование Фурье можно
представить в виде:
 km ln 
2 i  
1 M 1 N 1
 M N  , где m  0,1,..., M  1 , n  0,1,..., N  1.
f mn 
f
e


k ,l
MN k 0 l 0
f k ,l номер элемента в матрице имеющей M строк и N столбцов.
Таблица 2
Нахождение l2 -нормы с использованием ДПФ
Буква
l2 -норма
А
В
Е
К
М
Н
О
Р
С
Т
У
Х
24902000
34641000
32156000
30670000
36494000
31154000
32289000
30988000
29974000
26771000
28128000
29676000
Как видно из рассмотренного выше примера, распознавание
предложенным методом возможно и при значительно больших потерях, но при
этом возникает ненулевая вероятность ошибок, как первого, так и второго рода.
Заключение. В данной работе предлагается метод распознавания сигналов
различной природы при отсутствии полной информации. Для проверки метода
было проведено распознавание сигнала и его классификация в практически
важной задаче распознавания текста. Полученные результаты свидетельствуют
о перспективности разработанного метода и его преимуществе по сравнению с
основными существующими методами распознавания.
Можно сделать вывод, что во многих случаях независимо от помех в
измерениях, по коэффициентам вейвлет-разложения можно определить, к
какому классу (какой букве) он относится. Данный метод может быть применен
при обработке видеосигналов, полученных с регистрирующих устройств в
условиях недостаточной видимости или при низком разрешении видеокамеры.
Описанный выше метод распознавания сигналов не требует проведения
сложных вычислений, и может применяется при решении практических задач
одним из направлений усовершенствования метода может служить поиск
паттернов (одинаковых ненулевых последовательностей) в коэффициентах
разложения.
Download