Мартинез-Диез С., Кобер В., Овсеевич И.

реклама
126
НЕЛИНЕЙНЫЕ КОМПОЗИТНЫЕ КОРРЕЛЯЦИОННЫЕ ФИЛЬТРЫ
ДЛЯ РАСПОЗНАВАНИЯ ОБРАЗОВ
С. Мартинез-Диез1, В. Кобер1,2, И.А. Овсеевич2
1Департамент
компьютерных наук, CICESE, Ensenada, Mexico
[email protected]
2 Институт
проблем передачи информации РАНб
Большой Каретный пер., 19, 101447 Москва, Россия
[email protected], [email protected]
В статье предлагаются новые методы композитной нелинейной корреляции.
Предлагаемые нелинейные фильтры основаны на ранговых операциях. Исследовано
качество обнаружения объектов с помощью новых корреляций. С помощью
компьютерного моделирования проведен сравнительный анализ результатов
обнаружения тестовых зашумленных объектов с использованием предлагаемых
нелинейных и линейных классических корреляционных фильтров.
1. Введение
На
протяжении
последних
лет,
распознавание образов с использованием
корреляционных методов остается областью
интенсивных исследований в области
обработки
сигналов
и
изображений.
Классический согласованный фильтр (КСФ)
[1] является оптимальным для обнаружения
объектов на фоне аддитивного гауссова
шума.
Композитные
корреляционные
фильтры,
такие
как
синтетические
дискриминантные
функции
(СДФ),
включают в себя информацию об объектах
распознавания
[2].
Недостатком
традиционного СДФ фильтра является то,
что он способен производить посторонние
выбросы на выходе фильтра. Можно
показать, что при определенных условиях
минимизация
среднеквадратичного
критерия
(СКО)
между
исходным
изображением и сдвинутой версией объекта
распознавания ведет к максимизации
линейной корреляции между изображением
и объектом. Реальные данные не содержат
идеальный гауссовый шум. В этом случае
другие
критерии
являются
более
устойчивыми
даже
при
небольшом
отклонении модели шума от гауссовой
модели. Одним из таких критериев является
средняя абсолютная ошибка (САО) [3].
Недавно
предложены
нелинейные
адаптивные корреляции, выведенные с
использованием САО критерия [4-6]. Эти
корреляции принадлежат к классу ранговых
фильтров [7, 8]. Эти фильтры являются
эффективными для удаления аддитивного и
импульсного шума, улучшение качества
изображений
и
восстановление
изображений.
Более
того,
они
демонстрируют прекрасную устойчивость и
дают часто решения в таких случаях, когда
линейные фильтры неудовлетворительны.
В этой статье мы предлагаем синтезировать
ранговые композитные корреляционные
фильтры для надежного распознавания
образов. Эти фильтры будут строиться на
основе как пространственной, так и
ранговой информации, вычисленной в
127
скользящем окне. Статья организована
следующим образом. В секции 2 мы вводим
необходимые обозначения, краткий обзор
СДФ фильтров, и предлагаем нелинейные
композитные корреляционные фильтры. В
секции 3 мы приводим результаты
компьютерного моделирования линейных и
нелинейных фильтров и проводим их
сравнительный анализ с точки зрения
коэффициента дискриминации. В секции 4
даны наши выводы.
2. Синтез фильтров
2.1. Традиционный СДФ фильтр
СДФ
фильтры
используют
набор
обучающих изображений для создания
эталона, при согласованной корреляции с
которым получаются заданные значения
корреляционных пиков для данного набора
изображений.
Пусть есть N линейно независимых
изображений объекта, каждое размером d
элементов. Преобразуем эти изображения в
одномерные вектор-столбцы матрицы X
размера d×N. Также определим желаемые
значения корреляционных пиков для всех
изображений и представим их в форме
вектора u, размер которого N элементов.
Традиционный СДФ фильтр можно записать
следующим образом [2]:
h SDF = X  XX  u
-1
(1)
Импульсная характеристика hSDF – вектор,
содержащий
d
элементов.
Главным
недостатком СДФ фильтров является
отсутствие
контроля
над
всей
корреляционной плоскостью. Как следствие,
возможно появления ложных пиков на
выходе системы.
2.2. Нелинейная композитная корреляция
Ранговая фильтрация - это локальноадаптивная обработка сигнала в скользящем
окне. Введем некоторые полезные понятия и
обозначения: Sm ,n  - вектор элементов
исходного изображения, Q – количество
уровней квантования; n, m – координаты
элементов изображения, n=1,2,…N и
m=1,2,…M; L=NxM – размер матрицы
изображения; Tm ,n  - вектор элементов
неискаженного объекта распознавания;
{Cn,m} - вектор элементов корреляционной
плоскости. Пространственная окрестность
размера объекта распознавания для каждого
элемента изображения определяется как
множество элементов, которые окружают
данный элемент геометрически. Такая
окрестность, состоящая из пространственноблизких элементов центральному элементу,
называется
W-окрестностью.
Размер
окрестности W вычисляется, как размер
объекта
распознавания.
В
случаях
нестационарного аддитивного шума или
быстро изменяющихся по пространству
данных,
размер
W-окрестности
рекомендуется выбирать достаточно малым,
чтобы можно было бы рассматривать сигнал
и шум приблизительно стационарными в
окрестности. Критерий
MAE
часто
используется для задач оптимизации в
ранговой фильтрации [8]. Этот критерий
является
более
устойчивым,
когда
распределения аддитивного шума имеет
даже небольшое отклонение от гауссова
распределения. Локальный критерий MAE
между
исходным
изображением
и
сдвинутой версией объекта распознавания
можно записать как
MAEk ,l 

n ,mW
ak ,l Sn k ,ml  bk ,l  Tn ,m ,
(2)
где
локальные
нормализирующие
коэффициенты ak,l и bk,l позволяют
учитывать неравномерное освещение и
смещение
интенсивности
объекта
распознавания.
Оптимизированные
значения для этих коэффициентов можно
вычислить, минимизируя СКО между
объектом и содержимым скользящего окна,
ak ,l 
T
m ,nW
m ,n
 S
m ,nW
Smk ,n l  W T Sk ,l
m  k ,n  l

2
 W  Sk ,l 
,
2
(3)
128
T
bk ,l 
 S
m ,nW
m  k ,n  l
 S
m ,nW

2
 Sk ,l
m  k ,n  l

2
T
m ,nW
S
m , n m  k ,n  l
 W  Sk ,l 
.
(4)
2
Q 1 N
Tˆm,n  
Здесь T и Sk ,l - средние значения объекта и
сигнала в скользящем окне в точке с
координатами
(k,l).
Нелинейную
корреляцию
между
W-окрестностями
изображения и объектом распознавания
можно записать как
Ck ,l 

m ,nW
MIN  ak ,l Smk ,n l  bk ,l , Tm ,n  ,
(5)
MIN(x,y) – минимальное значение из x и y.
Пусть X – неотрицательное полутоновое
изображение с Q уровнями квантования. В
соответствие с концепцией пороговой
декомпозиции [8], исходное изображений
можно представить как сумму бинарных
изображений:
Q 1
X m,n   X mq ,n ,
(6)
q 1
где бинарные изображения  X mq ,n  , (q = 1…
Q – 1) получены пороговой декомпозицией с
порогом q следующим образом:
1, if X m,n  q
X mq ,n  
.
(7)
 0, otherwise
Следовательно, нелинейная корреляция в (5)
вычисляется как
Q 1
Ck ,l  
 

q 1 m ,nW

корреляция в (8) между исходным
изображением и композитным объектом
распознавания, вычисляемым как

MIN Sˆmq k ,nl , Tmq,n ,
(8)
q 1 i 1
Tmq,n  i  .
(9)
W-окрестность выбрана равной форме
объекта распознавания. Можно показать,
что корреляционные пики для всех объектов
распознавания, участвующих в процессе
обучения
равны
между
собой.
Предположим, что известны искаженные
версии объекта распознавания и различные
классы ложных объектов. Для простоты,
рассмотрим проблему двух классов. Таким
образом, мы хотим распознать объекты
заданного класса и отвергнуть объекты
ложного
класса.
Предположим,
что
дополнительно существуют M изображений
из ложного класса Pmi ,n , i  1... M  . В
соответствии
с
нашим
подходом,
синтезируемый объект распознавания – это
логическая комбинация всех изображений
Tm1,n , Tm2,n ..., TmN,n , Pm1,n ,...PmM,n  :
Q 1 N


 M
Tˆm ,n    Tmq,n  i   Pmq,n  i  . (10)
q 1  i 1
  i 1

W-окрестность выбрана также равной форме
нового объекта распознавания. Можно
показать, что корреляционные пики для всех
объектов распознавания, участвующих в
процессе обучения не равны нулю, а пики
ложных объектов равны нулю.
где Sˆmq ,n и Tmq,n  - бинарные изображения,
3. Компьютерное моделирование
полученные из изображений ak ,l Sm ,n  bk ,l  и
В
этой
главе
мы
демонстрируем
распознавание образов с использованием
предложенных композитных корреляций.
Качество распознавания оценивается по
критерию дискриминационной способности
(ДС) и устойчивости к шуму. На рис. 1(а)
показан объект распознавания. Размер
объекта - 19x35 элементов. Среднее
значение в области объекта равно 64.7, а
стандартное отклонение равно 36.5. На рис.
1(b) приведен пример исходной сцены,
содержащей объект распознавания и
T  .
m ,n
Композитные нелинейные корреляции с
равными
выходными
значениями
корреляционных пиков можно использовать
для внутриклассового инвариантного к
искажениям распознавания образов, т.e.,
обнаружению
искаженных
объектов,
принадлежащих одному классу. Пусть
Tmi ,n , i  1... N  - множество изображений
объекта
распознавания.
Композитная
нелинейная корреляция – нелинейная
129
1
0.9
Discrimination Capability
0.8
(a)
0.7
0.6
SDF filter
Nonlinear composite filter
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
Std of noise
25
30
35
40
Рис. 2. ДС линейной м нелинейной композиционных
корреляций как функция стандартного отклонения
аддитивного шума
(b)
(c)
Рис. 1. (a) объект распознавания, (b) тестовая сцена,
(c) зашумленная сцена
два ложных объекта. Размер изображения 256x256 элементов. Среднее значение равно
97.9, а стандартное отклонение равно 17.3.
Исходная
сцена
искажена
белым
аддитивным шумом с нулевым средним и
различными
значениями
стандартного
отклонения от 0 до 40. Каждый эксперимент
мы проводили 30 раз и полученные
результаты, с точки зрения ДС, усредняли.
На рис. 1(c) приведен пример сцены,
искаженной
шумом
со
стандартным
отклонением равным 40. ДС формально
можно определить как
DC  1 
CB
2
CO
2
,
(11)
где CB – максимальное значение на
корреляционной плоскости в области фона,
CO
максимальное
значение
на
корреляционной плоскости в области
объекта распознавания. Область фона
определяется как область дополнительная к
области объекта распознавания.
Мы тестировали традиционный СДФ
фильтр
в
(1)
и
предложенный
композиционный фильтр в (8). Результаты
экспериментов приведены на рис. 2.
Отметим, что предложенный метод обладает
хорошей дискриминационной способностью
и устойчивостью к аддитивному шуму.
4. Выводы
В статье предложены новые методы
композиционной нелинейной корреляции.
Проведен
сравнительный
анализ
результатов
обнаружения
тестовых
объектов с использованием предлагаемых
нелинейных и линейных корреляционных
фильтров. Компьютерное моделирование
продемонстрировало
значительное
улучшение
распознавания
образов
с
использованием предложенных корреляций.
Список литературы
1. A.B. VanderLugt, Signal detection by complex
filtering// IEEE Trans. Inf. Theory. -1964. -Vol. 10. –
P. 135-139.
2. B. V.K.V. Kumar, Tutorial survey of composite filter
design for optical correlators// Applied Optics. -1964.
-Vol. 31. –P. 135-139.
3. P. Maragos, Morphological correlation and mean
absolute error criteria// Proc. conf. IEEE Trans.
Acoust. Speech Signal Process., Glasgow.-1989. –P.
1568-1571.
.4. V. Kober, J. Alvarez-Borrego, I.A. Ovseyevich,
Adaptive rank-order correlations// Pattern Recognition
and Image Analysis. -2004. -Vol. 14, No. 1. -P. 33-39.
5. V. Kober, M. Mozerov, J. Alvarez-Borrego, Pattern
recognition based on rank correlations//. Proceedings
of SPIE.- 2004. –Vol. 5558. –P. 99-104.
6. V. Kober, Robust nonlinear correlations// Proceedings
of SPIE. -2003. -Vol. 5203. –P. 82-87.
7. P. Maragos, Morphological filtering for image
enhancement and feature detection (Elsevier
Academic Press, 2005).
8. I. Pitas and A.N. Venetsanopoulos, Nonlinear digital
filters. Principles and applications (Kluwer Academic
Publishers, Boston, 1990).
Скачать