модель зрительной системы человека

реклама
МОДЕЛЬ ЗРИТЕЛЬНОЙ СИСТЕМЫ ЧЕЛОВЕКАОПЕРАТОРА ПРИ РАСПОЗНАВАНИИ ОБРАЗОВ ОБЪЕКТОВ
Ю.С. Гулина, В.Я. Колючкин
Московский государственный технический университет им. Н.Э. Баумана,
Изложена математическая модель зрительной системы человека-оператора при
решении задачи распознавания образов объектов по изображениям, формируемым
оптико-электронными приборами наблюдения. Предложенная модель зрительной
системы может быть использована для формулирования целевой функции
проектирования оптико-электронных приборов наблюдения.
Для достижения успешных результатов при проектировании оптикоэлектронных приборов (ОЭП) наблюдения необходимо формализовать свойства
зрительного восприятия изображений человеком-оператором для условий и задач,
определённых назначением прибора. Такая формализация представляет собой
математическую модель зрительной системы человека. В настоящее время не
существует математической модели, описывающей зрительную систему человека во
всём многообразии её свойств. Тем не менее, известны математические модели,
позволяющие оценить возможность обнаружения изображений объектов при
наблюдении человеком-оператором изображений, формируемых ОЭП наблюдения.
Для целей проектирования ОЭП наблюдения можно использовать модельное
описание зрительной системы человека-оператора, учитывающее лишь некоторые из ее
свойств.
Можно рассматривать зрительную систему в линейном приближении и
учитывать такие свойства зрения, как [1]:
селективность по длинам волн оптического излучения, характеризуемую,
так называемой, кривой видности глаза V (λ ) ;
инерционность
восприятия,
которую
можно
характеризовать
передаточной функцией H% (ν ) , соответствующей по виду апериодическому звену с
зр
постоянной времени τ = (0,1,..., 0, 2) с;
зр
пространственную селективность, оцениваемую функцией контрастной
чувствительности (ФКЧ) - H% (ν ,ν ).
k x y
Анализ образов объектов, осуществляемый в зрительной системе человека,
очень сложный процесс. Было показано [1], что зрительную систему человекаоператора можно представить в виде линейной подсистемы, в которой производится
анализ признаков, и подсистемы принятия решений об обнаружении, распознавании
или идентификации на основе имеющейся априорной информации об объектах.
Обработка сигналов, предшествующая принятию решений об образах объектов,
описывается с помощью многоканальной модели зрительной системы человекаоператора. В основе этой модели лежит известная гипотеза о том, что в зрительной
системе осуществляется оптимальный прием и последующий анализ не всего образа
наблюдаемого объекта, а отдельных гармонических составляющих образа этого
объекта [1].
Чтобы отнести объект к тому или иному классу, нужно, во-первых, выбрать
эффективный словарь признаков распознавания – набор гармоник, достаточных для
263
принятия решения о распознавании, и описать каждый класс объектов, подлежащих
распознаванию, в признаковом пространстве. В рамках статистической теории
распознавания образов такое описание задаётся функциями правдоподобия. Во-вторых,
нужно определить границы между классами, задающие решающее правило для
принятия решения о принадлежности объекта к тому или иному классу. Предложенная
структурная схема модели зрительной системы человека оператора при распознавании
образов объектов имеет вид, представленный на рисунке 1.
1 – оптический фильтр; 2 – временной фильтр; 3 – пространственный фильтр; 4 –
параллельные фильтры; 5 – блок определения решающих границ; 6 –процессор;
7 – память.
Рис.1. Структурная схема модели зрительной системы человека оператора при
распознавании образов объектов
В предпроцессоре осуществляется первичная обработка и анализ отдельных
финитных гармонических составляющих образов объектов. Первичная обработка
заключается в оптической, временной и пространственной фильтрации, выполняемой
соответствующими фильтрами.
Анализ отдельных гармоник в зрительной системе осуществляется в
параллельных mn − ных каналах, содержащих линейные пространственные фильтры с
импульсными откликами вида:
x y
mx ny
1
H mn ( x, y ) =
+ )] ,
rect( , ) cos[ 2π (
lxl y
lx ly
lx
ly
где lx , l y - габаритные размеры объекта.
Пространственные фильтры настроены на определенные пространственные
частоты и реализуют согласованную фильтрацию образов объектов.
Сигналы на выходе этих фильтров, представляющие собой коэффициенты
разложения изображения в базисе финитных гармонических функций, могут
использоваться как признаки распознавания.
Известно, что в качестве признаков, по которым проводится анализ образов
объектов, удобно использовать не амплитуды гармонических составляющих, а
воспринимаемые отношения сигнал/шум (ОСШ) на этих гармониках, которые
определяются формулами [1]:
264
~
µ 00 = µ п L 'н (0,0)
2ν kτ зр Ao % m n
m n
m n
m n
⋅ L 'н ( , ) ⋅ H% пс ( , ) ⋅ H% э ( , ) ⋅ H% в ( , )
Aш
lx l y
lx l y
lx l y
lx l y
µmn = 2µп
(2)
где
2ν kτ зр Ao
Aш
(1)
,
µп –
пиковое ОСШ; ν k – частота кадров в ОЭП наблюдения; Ao – габаритная
площадь изображения объекта; Aш – площадь корреляции аддитивного шума;
~ m n
L 'н ( , ) – Фурье-образ нормированной функции, описывающей изображение
lx l y
объекта без учета линейных искажений, которые вносит тракт ОЭП наблюдения;
H% пс (ν x ,ν y ) – передаточная функция приемной системы ОЭП наблюдения; H% э (ν xVx ) –
передаточная функция электронного тракта; H% в (ν x ,ν y ) – передаточная функция
видеоконтрольного устройства.
В логическом блоке определяются решающие границы по совокупности
гармоник и решается задача о принадлежности объекта к тому или иному классу.
Рассмотрим задачу построения решающих границ на примере двух подлежащих
распознаванию типов объектов. При зашумлении изображений объектов аддитивным
шумом с нормальным законом распределения, значения амплитуд различных
спектральных составляющих будут меняться случайным образом, и, следовательно,
будут представлять собой нормально распределенные случайные величины, которые
характеризуются математическим ожиданием и дисперсией. Для двух объектов, у
которых признаки распознавания являются нормально распределёнными случайными
величинами, можно использовать байесовское решающее правило, которое
относительно вектора наблюдения Х, представляется в виде [2]:
⎧ω
1
1
1 Σ < P (ω1 )
T
T
→ X ∈ ⎨ 1 , (3)
( Х − M1 ) Σ1−1 ( Х − M1 ) − ( Х − M 2 ) Σ−21 ( Х − M 2 ) + ln 1 ln
2
2
2 Σ2 > P (ω2 )
⎩ω2
где X = [ x1 x2 ... xn ] – случайный вектор, реализация сигнала,
T
T
M j = ⎡⎣ m1 j m2 j ... mnj ⎤⎦ – вектор математического ожидания случайного вектора Х,
⎡σ 112 ... σ 12n ⎤
⎢
⎥
Σ = ⎢ ... ... ... ⎥ – ковариационная матрица, элементами которой являются числа
⎢σ n21 ... σ n2n ⎥
⎣
⎦
{( x − m ) ( x − m )} , где q,w=1,2,…,n.
P (ω ) – априорная вероятность, характеризующая принадлежность объекта к
2
σ qw
=M
q
q
w
w
j
тому или иному классу
ωj .
Примем следующие допущения. Во-первых, пусть шум «белый». Тогда
ковариационная матрица принимают диагональный вид. Во-вторых, будем считать, что
появление объектов различных классов равновероятно, т.е. P (ω1 ) = P (ω2 ) = 0,5 .
265
Обозначим вектора математического ожидания M 1 и M 2 через Mu1 и Mu2 :
Mui = [ µ1i µ2i ... µ ni ] . Эти векторы численно выражаются через воспринимаемые
ОСШ. Затем введем нормированную переменную Ζ = [ζ 1, ζ 1...ζ n ] , элементы которой
T
представляют собой элементы вектора Х, нормированного на СКО шума.
Тогда уравнение границы между классами в признаковом пространстве
воспринимаемых ОСШ будет иметь вид:
1
T
(4)
( Mu2 − Mu1 ) Ζ + ( Mu1T Mu1 − Mu2T Mu2 ) = 0
2
Вероятность правильного распознавания i–го класса:
⎛ (ζ 1 − µ1 )2 + ... + (ζ n − µn )2 ⎞
1
exp ⎜ −
PRi =
⎟ dζ 1...dζ n ,
(5)
n ∫
⎜
⎟
2
2π Ωi
⎝
⎠
(
)
где Ωi − области в пространстве признаков, ограниченные решающими границами
i-х классов.
Вероятность распознавания двух классов объектов:
PR = P (ω1 ) Р R + P (ω2 ) Р R
(6)
1
2
Для проверки правильности предложенной модели зрительной системы
человека-оператора при распознавании образов объектов были проведены
экспериментальные исследования. В экспериментах принимали участие 11 специально
обученных операторов. В процессе обучения на мониторе им предъявлялись нецветные
изображения объектов различного масштаба, наблюдаемые на равномерном фоне
(рис. 2).
Рис.2. Изображения объектов для распознавания.
В процессе экспериментов операторам предлагались искаженные белым шумом
изображения объектов (рис. 3), и ставилась задача определения принадлежности к одному из
двух классов. Значение среднеквадратического отклонения шума увеличивалось до такой
степени, когда каждый оператор уже не мог распознать объект. Условия наблюдения
(освещенность и расстояние наблюдения) каждый из операторов выбирал по своему
усмотрению.
Рис.3. Изображение объекта, искаженное белым шумом.
266
По данным, полученным в ходе экспериментов, были рассчитаны вероятности
распознавания объектов различных размеров при различных значениях пикового ОСШ.
Полученные экспериментально результаты и рассчитанные по формулам (5) и
(6) графики вероятности распознавания объектов приведены на рис. 4а – 4г. При
расчете использовались 4 признака распознавания: нулевая ((0,0)) и первые ((0,1), (1,0)
и (1,1)) гармонические составляющие образов объектов.
4а.
4б.
4в.
4г.
«-»– теоретически рассчитанная зависимость, «○» – экспериментально
полученные значения
а – размеры объектов 38×68 пикселей; б – размеры объектов 19×34 пикселей;
в – размеры объектов 10×17 пикселей; г – размеры объектов 5×9 пикселей.
Рис. 5.Зависимость вероятности распознавания от пикового отношения
сигнал/шум.
Из анализа полученных результатов следует, что отличие экспериментальных
значений вероятности распознавания от расчётных не превышает 10%. Такое хорошее
соответствие свидетельствует об адекватности разработанной математической модели,
описывающей зрительную систему человека-оператора при распознавании
изображений объектов.
В заключение следует отметить, что полученные в ходе исследования
результаты свидетельствуют о принципиальной возможности использования
предложенной модели зрительной системы человека-оператора для формулирования
целевой функции проектирования оптико-электронных приборов наблюдения.
1. Бенуни А.А., Колючкин В.Я. Модель зрительной системы человекаоператора // Вестник МГТУ им. Н.Э. Баумана. Сер. "Приборостроение". −
2002. − №4. − С. 43−52.
2. Фукунага К. Введение в статистическую теорию распознавания образов: –
Пер. с англ. – М.: Наука. Главная редакция физико-математической
литературы, 1979. – 368 с.
267
Скачать