Снижение разрешения
гистограммы ориентированных
градиентов (HOG) для детекции
объектов малого размера
Русинов Павел, 371 гр.
Научный руководитель:
к.ф.-м.н, доц. Вахитов А. Т.
Гистограмма ориентированных
градиентов (HOG)
Является необходимым преобразованием
изображения в многомерный вектор для
успешного использования классификатора
Вычисление HOG
SVM-классификатор


При обучении строится гиперплоскость,
разделяющая объекты на классы
Гиперплоскость задается уравнением
<w, x> = b

w — линейная комбинация опорных
векторов, являющихся подмножеством
обучающей выборки
Метод скользящего окна по
нескольким масштабам
Метод скользящего окна по
нескольким масштабам



При обработке изображения вычисляется до
нескольких тысяч HOG
Является ресурсоёмкой задачей
Актуален поиск метода снижения
вычислительной нагрузки
Подход к оптимизации


Получение из исходного классификатора
новых классификаторов для окон меньших
размеров
Их использование при детекции объектов
малого размера на входном изображении
Постановка задачи




Изучить структуру HOG и алгоритм его
получения, изучить алгоритм работы SVMклассификатора
Изучить существующие подходы к
оптимизации метода скользящего окна
Разработать и реализовать алгоритм
масштабирования HOG
Реализовать алгоритм масштабирования
SVM-классификатора (с использованием
предыдущего алгоритма)
Постановка задачи


Реализовать метод скользящего окна с
использованием масштабированных
классификаторов
Сравнить его с первоначальным методом
Существующие решения
Каскадный HOG:



Используются блоки произвольных размеров
Вместо одного классификатора — каскад
слабых классификаторов
Ускорение первоначального метода в 30 раз,
потеря точности распознавания
Алгоритм масштабирования HOG

HOG преобразуется в набор изображений
(размер набора = количеству значений в
блоке, размер изображения = размеру HOG
в блоках)


Каждое изображение интерполируется до
нужного размера
Изображения преобразуются в HOG
Масштабирование SVMклассификаторов


Используется предыдущий алгоритм для
масштабирования опорных векторов
В итоге получается классификатор для окон
другого размера
Тестирование
Алгоритм масштабирования SVMклассификатора был протестирован на базе
изображений рукописных цифр MNIST.
Точность распознавания изображений
исходного размера (28x28) составила 99.5%
Тестирование
На базе изображений пешеходов INRIA Person
был протестирован метод скользящего окна,
использующий уменьшенные
классификаторы. Падение точности
составило 4.6%, ускорение работы 40%
Также был протестирован метод скользящего
окна, использующий и уменьшенные, и
увеличенные классификаторы. Падение
точности составило 16.3%
Результаты
Изучены алгоритмы вычисления HOG и работы
SVM-классификатора
Реализован алгоритм масштабирования HOG
Реализован и протестирован алгоритм
масштабирования SVM-классификатора
Реализован и протестирован метод
скользящего окна, использующий
масштабированные классификаторы
Скачать