Формирование обучающего множества векторов признаков для алгоритма автоматического обнаружения

advertisement
Формирование обучающего множества векторов
признаков для алгоритма автоматического обнаружения
и локализации изображений элементов группы наземных
объектов в оптико-электронной визирной системе
летательного аппарата
Себряков Г.Г., Сошников В.Н., Кикин И.С., Ишутин А.А.
1
Введение
В работе [1] авторами был предложен двухэтапный алгоритм обнаружения и
локализации наземных объектов на полутоновых оптико-электронных изображениях,
основанный на методах оконно-разностных функций (ОРФ) и опорных векторов [2]. ОРФ
изображения объекта представляют собой разности некоторых интегральных
характеристик полей яркости, а также полей их спектральных и текстурных параметров
для минимального описывающего изображение объекта прямоугольника (МОП) и его
окрестности. Линейная комбинация ОРФ образует индикаторную функцию (ИФ). На
первом этапе алгоритм обеспечивает формирование множества прямоугольных
областей-претендентов, центры которых соответствуют максимумам ИФ, а на втором –
определение координат вершин МОП (решение задач обнаружения и локализации).
Решение задачи различения двух классов – «объект поиска» и «ложный объект» –
осуществляется в [1] при помощи составного классификатора. Его построение
осуществляется посредством обучения набора двоичных классификаторов, каждый из
которых производит различение двух подклассов исходных классов. Задача обучения
решается с использованием обучающего множества векторов признаков (ОМВП).
При решении задач обнаружения и локализации диапазоны значений геометрических
и энергетических характеристик условий наблюдения предполагаются известными. Для
этих условий наблюдения с помощью оптико-электронной визирной системы (ОЭВС) с
известными характеристиками пространственного и энергетического разрешения
экспериментально получена выборка прямоугольных растровых полутоновых
изображений. Она называется далее множеством наблюдаемых кадров (МНК).
Подлежащие обнаружению изображения элементов группы (объектов поиска)
определяются оператором, который указывает координаты вершин их МОП для каждого
из наблюдаемых кадров (НК) с помощью специального графического интерфейса.
2
Значения показателей качества обнаружения существенно зависят от репрезентативности ОМВП. Предлагаемые в статье алгоритмы сокращения размерности
ОМК и ОМВП основаны на методе репрезентативной выборки [3]. Метод позволяет
получить
вероятностные
утверждения
относительно
параметров
плотности
вероятности генеральной совокупности с использованием параметров плотности
вероятности, вычисленных для конечной выборки.
В работе [4] приведены зависимости значений элементов корреляционной матрицы
ошибок оценки параметров от числа измерений для линейной и квадратичной
зависимости траектории от времени. Приведенные в [4] результаты показывают, что
значения дисперсий ошибок оценивания параметров быстро уменьшаются при малом
числе измерений и медленно убывают при большом числе измерений. Это
обстоятельство позволяет существенно сократить число измерений при практически
незначительном снижении точности оценок.
Априорно неизвестна минимально допустимая размерность ОМК, при которой
обеспечивается заданный уровень показателей качества обнаружения. Предполагается,
что размерность имеющегося ОМК превосходит минимально допустимую размерность.
3
Заданы:
• блок-схема, описание блоков алгоритма автоматического обнаружения
и локализации [1] и рабочие диапазоны параметров настройки алгоритма;
• множество наблюдаемых кадров с известными характеристиками
пространственного и энергетического разрешения для известных
диапазонов изменения геометрических и энергетических условий
наблюдения;
• тестовое множество кадров (ТМК);
• ограничения мер репрезентативности обучающих множеств, в качестве
которых используются приращение показателей качества обнаружения
(вероятности обнаружения PD и среднего для тестовой выборки числа
ложных тревог на один кадр ― NF) при увеличении объема выборки.
Требуется:
• разработать алгоритмы минимизации размеров обучающего множества
кадров (ОМК) и обучающего множества векторов признаков (ОМВП), при
использовании которых на тестовом множестве кадров выполняются
заданные ограничения меры репрезентативности;
• получить зависимости мер репрезентативности обучающих множеств
от их размеров.
4
Сокращение размерности множества наблюдаемых кадров
Обеспечивает многократное снижение психологической нагрузки оператора и
затрат времени на подготовку обучающего множества кадров (ОМК).
Для одного наблюдаемого кадра, содержащего изображения 5÷10 объектов
поиска, оператор, при использовании специального графического интерфейса,
затрачивает на указание вершин минимальных описывающих прямоугольников
изображений объектов поиска (МОП) 50÷80 секунд.
Решение задачи сокращения размерности МНК:
• построение индикаторных функций для заданного числа и значений
размеров МОП в каждом из кадров;
• построение матрицы межкадровых расстояний;
• осуществление кластеризации МНК алгоритмом k-медоидов и
формирование сокращенного множества KR из медоидов полученных
кластеров.
5
Построение матрицы расстояний для множества наблюдаемых кадров
Определение межкадрового расстояния
Межкадровое расстояние – интегральная оценка расстояния между векторами
признаков, соответствующих максимумам индикаторной функции (ИФ) кадров.
Рассчитывается с помощью решения задачи оптимального взаимного
распределения максимумов ИФ двух кадров:
• Отыскивается заданное число – NM максимумов ИФ для каждого из двух кадров
для каждого из используемых значений размеров МОП. NM ~ 30÷50 значений
числа объектов поиска в кадре;
Формируется матрица расстояний для этих максимумов.
•
• Расстояние между двумя максимумами ИФ рассчитывается по следующей
формуле:
где a, b – векторы признаков, соответствующие двум рассматриваемым
максимумам ИФ;
• Решается задача оптимального распределения максимумов ИФ двух кадров с
использованием алгоритма [5], находящего совокупность взаимно-однозначных
соответствий между максимумами ИФ, при которой сумма расстояний между
ними является минимальной;
• Осуществляется сортировка по возрастанию массива расстояний между
максимумами ИФ при их оптимальном распределении и исключение последних L
членов этого массива (L = С∙NM, где C = 0.2÷0.5). Математическое ожидание
оставшихся элементов массива есть оценка межкадрового расстояния.
6
После кластеризации K (исходного МНК) производится построение KR –
сокращенного МНК, состоящего из медоидов кластеров K.
Из KR посредством внесения информации о координатах МОП формируется
обучающее множество кадров.
На слайде представлена визуализация трех кластеров НК.
Кадры – центры кластеров – выделены цветом.
7
Сокращение размера обучающего множества векторов признаков
Сокращение размера всекадрового ОМВП S∑ производится последовательно,
на каждом из этапов его формирования:
• построение сокращенных множеств SijR из множеств Sij для j = 1…NS;
i = 1…NK (NS – число рассматриваемых размеров МОП; NK – размерность
ОМК).
Sij формируется из первых NM в отсортированном по убыванию массиве
максимумов ИФ для i-го кадра ОМК и j-го размера МОП;
• построение сокращенных множеств SiR из множеств Si для i = 1…NK.
Si образуется объединением множеств SijR для i-го кадра и j = 1…NS;
• построение сокращенного всекадрового множества S∑R из S∑, образованного
объединением множеств SiR для i = 1…NK.
На каждом из этапов используется алгоритм кластеризации k-медоидов.
Сокращенное ОМВП формируется из медоидов полученных для кластеров
множества начального размера.
8
Формирование ОМВП и матрицы двоичных классификаторов на его основе
9
Сокращение размера ОМВП с использованием алгоритма кластеризации k-медоидов
• Алгоритм k-медоидов – разновидность
алгоритма k-средних;
• Центром кластера признается элемент с
наименьшим средним расстоянием до
остальных элементов кластера;
• Вычисление расстояний между
элементами входного множества
осуществляется предварительно, до
начала итераций кластеризации;
Производится минимизация функции F
расстояний между элементами внутри
кластера:
где NС – число кластеров;
ni – число элементов в i-том
кластере;
DjCi – расстояние между j-м
элементом i-го кластера
и центром данного кластера;
Критерий достаточной оптимальности
разбиения:
Di < Dmax для i = 1…NС,
10
Оценка меры репрезентативности обучающих множеств при сокращении их размера
Для оценки зависимости такой меры от размерности обучающих множеств
использовались:
• МНК из 176 кадров, представляющих 3 различные последовательности
кадров, полученные при помощи макета ОЭВС для различных
метеоусловий и времени суток;
• Тестовое множество из 55 кадров.
Оцениваемыми величинами являлись СI и СV – коэффициенты сокращения МНК
и ОМВП соответственно:
СI = I0/I1; СV = V0/V1,
где I0, I1 – размерности МНК – начальная и конечная, соответственно;
V0, V1 – размерности ОМВП начальная и конечная, соответственно.
Варьирование значений СI и СV осуществлялось путем задания в алгоритме
k-медоидов различных фиксированных значений числа кластеров NC.
11
Зависимости V1, PD и NF от CI и CV
12
Заключение
Разработаны алгоритмы сокращения размеров обучающего множества
наблюдаемых кадров и обучающего множества векторов признаков,
основанные на методе репрезентативной выборки. Алгоритмы позволяют
исключить из рассматриваемых выборок наименее информативные
элементы путем оптимального разбиения обучающих множеств методом
k-медоидов и формирования сокращенных множеств из медоидов
полученных кластеров. Показана возможность уменьшения размера
обучающего множества кадров ~ в 10 раз и уменьшения размерна
обучающего множества векторов признаков ~ в 20 раз при практическом
сохранении заданных показателей качества обнаружения.
13
Список используемой литературы
1. Двухэтапный алгоритм обнаружения и локализации наземных объектов в
монохромных оптико-электронных системах навигации и наведения
летательных аппаратов, основанный на методах оконно-разностных функций
и опорных векторов. Г.Г. Себряков, В.Н Сошников, И.С. Кикин, А.А. Ишутин.,
«Вестник компьютерных и информационных технологий», № 2, 2011.
2. A tutorial on support vector machines for pattern recognition, C. J. C. Burges, Data
Mining Knowl. Disc. 2, 1–47 (1998).
3. Г. Крамер. «Математические методы статистики». Изд-во «Мир», М., 1975.
4. С.З. Кузьмин, «Основы теории цифровой обработки радиолокационной
информации», М., «Советское радио», 1974.
5. R. Jonker, A. Volgenant, «A Shortest Augmenting Path Algorithm for Dense and
Sparse Linear Assignment Problems», Computing, vol. 38, pp. 325-340, 1987.
14
Download