МОДЕЛЬ ЗРИТЕЛЬНОЙ СИСТЕМЫ ЧЕЛОВЕКАОПЕРАТОРА ПРИ РАСПОЗНАВАНИИ ОБРАЗОВ ОБЪЕКТОВ Ю.С. Гулина, В.Я. Колючкин Московский государственный технический университет им. Н.Э. Баумана, Изложена математическая модель зрительной системы человека-оператора при решении задачи распознавания образов объектов по изображениям, формируемым оптико-электронными приборами наблюдения. Предложенная модель зрительной системы может быть использована для формулирования целевой функции проектирования оптико-электронных приборов наблюдения. Для достижения успешных результатов при проектировании оптикоэлектронных приборов (ОЭП) наблюдения необходимо формализовать свойства зрительного восприятия изображений человеком-оператором для условий и задач, определённых назначением прибора. Такая формализация представляет собой математическую модель зрительной системы человека. В настоящее время не существует математической модели, описывающей зрительную систему человека во всём многообразии её свойств. Тем не менее, известны математические модели, позволяющие оценить возможность обнаружения изображений объектов при наблюдении человеком-оператором изображений, формируемых ОЭП наблюдения. Для целей проектирования ОЭП наблюдения можно использовать модельное описание зрительной системы человека-оператора, учитывающее лишь некоторые из ее свойств. Можно рассматривать зрительную систему в линейном приближении и учитывать такие свойства зрения, как [1]: селективность по длинам волн оптического излучения, характеризуемую, так называемой, кривой видности глаза V (λ ) ; инерционность восприятия, которую можно характеризовать передаточной функцией H% (ν ) , соответствующей по виду апериодическому звену с зр постоянной времени τ = (0,1,..., 0, 2) с; зр пространственную селективность, оцениваемую функцией контрастной чувствительности (ФКЧ) - H% (ν ,ν ). k x y Анализ образов объектов, осуществляемый в зрительной системе человека, очень сложный процесс. Было показано [1], что зрительную систему человекаоператора можно представить в виде линейной подсистемы, в которой производится анализ признаков, и подсистемы принятия решений об обнаружении, распознавании или идентификации на основе имеющейся априорной информации об объектах. Обработка сигналов, предшествующая принятию решений об образах объектов, описывается с помощью многоканальной модели зрительной системы человекаоператора. В основе этой модели лежит известная гипотеза о том, что в зрительной системе осуществляется оптимальный прием и последующий анализ не всего образа наблюдаемого объекта, а отдельных гармонических составляющих образа этого объекта [1]. Чтобы отнести объект к тому или иному классу, нужно, во-первых, выбрать эффективный словарь признаков распознавания – набор гармоник, достаточных для 263 принятия решения о распознавании, и описать каждый класс объектов, подлежащих распознаванию, в признаковом пространстве. В рамках статистической теории распознавания образов такое описание задаётся функциями правдоподобия. Во-вторых, нужно определить границы между классами, задающие решающее правило для принятия решения о принадлежности объекта к тому или иному классу. Предложенная структурная схема модели зрительной системы человека оператора при распознавании образов объектов имеет вид, представленный на рисунке 1. 1 – оптический фильтр; 2 – временной фильтр; 3 – пространственный фильтр; 4 – параллельные фильтры; 5 – блок определения решающих границ; 6 –процессор; 7 – память. Рис.1. Структурная схема модели зрительной системы человека оператора при распознавании образов объектов В предпроцессоре осуществляется первичная обработка и анализ отдельных финитных гармонических составляющих образов объектов. Первичная обработка заключается в оптической, временной и пространственной фильтрации, выполняемой соответствующими фильтрами. Анализ отдельных гармоник в зрительной системе осуществляется в параллельных mn − ных каналах, содержащих линейные пространственные фильтры с импульсными откликами вида: x y mx ny 1 H mn ( x, y ) = + )] , rect( , ) cos[ 2π ( lxl y lx ly lx ly где lx , l y - габаритные размеры объекта. Пространственные фильтры настроены на определенные пространственные частоты и реализуют согласованную фильтрацию образов объектов. Сигналы на выходе этих фильтров, представляющие собой коэффициенты разложения изображения в базисе финитных гармонических функций, могут использоваться как признаки распознавания. Известно, что в качестве признаков, по которым проводится анализ образов объектов, удобно использовать не амплитуды гармонических составляющих, а воспринимаемые отношения сигнал/шум (ОСШ) на этих гармониках, которые определяются формулами [1]: 264 ~ µ 00 = µ п L 'н (0,0) 2ν kτ зр Ao % m n m n m n m n ⋅ L 'н ( , ) ⋅ H% пс ( , ) ⋅ H% э ( , ) ⋅ H% в ( , ) Aш lx l y lx l y lx l y lx l y µmn = 2µп (2) где 2ν kτ зр Ao Aш (1) , µп – пиковое ОСШ; ν k – частота кадров в ОЭП наблюдения; Ao – габаритная площадь изображения объекта; Aш – площадь корреляции аддитивного шума; ~ m n L 'н ( , ) – Фурье-образ нормированной функции, описывающей изображение lx l y объекта без учета линейных искажений, которые вносит тракт ОЭП наблюдения; H% пс (ν x ,ν y ) – передаточная функция приемной системы ОЭП наблюдения; H% э (ν xVx ) – передаточная функция электронного тракта; H% в (ν x ,ν y ) – передаточная функция видеоконтрольного устройства. В логическом блоке определяются решающие границы по совокупности гармоник и решается задача о принадлежности объекта к тому или иному классу. Рассмотрим задачу построения решающих границ на примере двух подлежащих распознаванию типов объектов. При зашумлении изображений объектов аддитивным шумом с нормальным законом распределения, значения амплитуд различных спектральных составляющих будут меняться случайным образом, и, следовательно, будут представлять собой нормально распределенные случайные величины, которые характеризуются математическим ожиданием и дисперсией. Для двух объектов, у которых признаки распознавания являются нормально распределёнными случайными величинами, можно использовать байесовское решающее правило, которое относительно вектора наблюдения Х, представляется в виде [2]: ⎧ω 1 1 1 Σ < P (ω1 ) T T → X ∈ ⎨ 1 , (3) ( Х − M1 ) Σ1−1 ( Х − M1 ) − ( Х − M 2 ) Σ−21 ( Х − M 2 ) + ln 1 ln 2 2 2 Σ2 > P (ω2 ) ⎩ω2 где X = [ x1 x2 ... xn ] – случайный вектор, реализация сигнала, T T M j = ⎡⎣ m1 j m2 j ... mnj ⎤⎦ – вектор математического ожидания случайного вектора Х, ⎡σ 112 ... σ 12n ⎤ ⎢ ⎥ Σ = ⎢ ... ... ... ⎥ – ковариационная матрица, элементами которой являются числа ⎢σ n21 ... σ n2n ⎥ ⎣ ⎦ {( x − m ) ( x − m )} , где q,w=1,2,…,n. P (ω ) – априорная вероятность, характеризующая принадлежность объекта к 2 σ qw =M q q w w j тому или иному классу ωj . Примем следующие допущения. Во-первых, пусть шум «белый». Тогда ковариационная матрица принимают диагональный вид. Во-вторых, будем считать, что появление объектов различных классов равновероятно, т.е. P (ω1 ) = P (ω2 ) = 0,5 . 265 Обозначим вектора математического ожидания M 1 и M 2 через Mu1 и Mu2 : Mui = [ µ1i µ2i ... µ ni ] . Эти векторы численно выражаются через воспринимаемые ОСШ. Затем введем нормированную переменную Ζ = [ζ 1, ζ 1...ζ n ] , элементы которой T представляют собой элементы вектора Х, нормированного на СКО шума. Тогда уравнение границы между классами в признаковом пространстве воспринимаемых ОСШ будет иметь вид: 1 T (4) ( Mu2 − Mu1 ) Ζ + ( Mu1T Mu1 − Mu2T Mu2 ) = 0 2 Вероятность правильного распознавания i–го класса: ⎛ (ζ 1 − µ1 )2 + ... + (ζ n − µn )2 ⎞ 1 exp ⎜ − PRi = ⎟ dζ 1...dζ n , (5) n ∫ ⎜ ⎟ 2 2π Ωi ⎝ ⎠ ( ) где Ωi − области в пространстве признаков, ограниченные решающими границами i-х классов. Вероятность распознавания двух классов объектов: PR = P (ω1 ) Р R + P (ω2 ) Р R (6) 1 2 Для проверки правильности предложенной модели зрительной системы человека-оператора при распознавании образов объектов были проведены экспериментальные исследования. В экспериментах принимали участие 11 специально обученных операторов. В процессе обучения на мониторе им предъявлялись нецветные изображения объектов различного масштаба, наблюдаемые на равномерном фоне (рис. 2). Рис.2. Изображения объектов для распознавания. В процессе экспериментов операторам предлагались искаженные белым шумом изображения объектов (рис. 3), и ставилась задача определения принадлежности к одному из двух классов. Значение среднеквадратического отклонения шума увеличивалось до такой степени, когда каждый оператор уже не мог распознать объект. Условия наблюдения (освещенность и расстояние наблюдения) каждый из операторов выбирал по своему усмотрению. Рис.3. Изображение объекта, искаженное белым шумом. 266 По данным, полученным в ходе экспериментов, были рассчитаны вероятности распознавания объектов различных размеров при различных значениях пикового ОСШ. Полученные экспериментально результаты и рассчитанные по формулам (5) и (6) графики вероятности распознавания объектов приведены на рис. 4а – 4г. При расчете использовались 4 признака распознавания: нулевая ((0,0)) и первые ((0,1), (1,0) и (1,1)) гармонические составляющие образов объектов. 4а. 4б. 4в. 4г. «-»– теоретически рассчитанная зависимость, «○» – экспериментально полученные значения а – размеры объектов 38×68 пикселей; б – размеры объектов 19×34 пикселей; в – размеры объектов 10×17 пикселей; г – размеры объектов 5×9 пикселей. Рис. 5.Зависимость вероятности распознавания от пикового отношения сигнал/шум. Из анализа полученных результатов следует, что отличие экспериментальных значений вероятности распознавания от расчётных не превышает 10%. Такое хорошее соответствие свидетельствует об адекватности разработанной математической модели, описывающей зрительную систему человека-оператора при распознавании изображений объектов. В заключение следует отметить, что полученные в ходе исследования результаты свидетельствуют о принципиальной возможности использования предложенной модели зрительной системы человека-оператора для формулирования целевой функции проектирования оптико-электронных приборов наблюдения. 1. Бенуни А.А., Колючкин В.Я. Модель зрительной системы человекаоператора // Вестник МГТУ им. Н.Э. Баумана. Сер. "Приборостроение". − 2002. − №4. − С. 43−52. 2. Фукунага К. Введение в статистическую теорию распознавания образов: – Пер. с англ. – М.: Наука. Главная редакция физико-математической литературы, 1979. – 368 с. 267