А.В. КУЗНЕЦОВ Научный руководитель – И.В. САФОНОВ, к.т.н., доцент РАЗРАБОТКА АЛГОРИТМА ВЫЧИСЛЕНИЯ

реклама
А.В. КУЗНЕЦОВ
Научный руководитель – И.В. САФОНОВ, к.т.н., доцент
Национальный исследовательский ядерный университет «МИФИ»
РАЗРАБОТКА АЛГОРИТМА ВЫЧИСЛЕНИЯ
ИНВАРИАНТНЫХ К ИЗМЕНЕНИЮ МАСШТАБА
ЛОКАЛЬНЫХ ДЕСКРИПТОРОВ ОДНОМЕРНЫХ
СИГНАЛОВ
Рассмотрены существующие подходы к решению задачи расчёта дескрипторов
одномерных сигналов. Разработан алгоритм вычисления инвариантных к масштабированию дескрипторов одномерных сигналов. Для разработанного алгоритма
реализовано программное обеспечение и исследована его инвариантность к масштабированию.
Локальные дескрипторы широко распространены в области обработки
изображений. Их использование позволяет эффективно сопоставлять точки на разных изображениях, что необходимо для решения задач создания
панорам, стереосопоставления, поиска по образцу и многих других [1].
Локальные дескрипторы одномерных сигналов пока не получили такого широкого распространения как локальные дескрипторы изображений,
но на данный момент есть исследования их применения в таких областях
как навигация роботов [2] и распознавание активности человека [3].
В ходе исследовательской работы были рассмотрены существующие
подходы к решению задачи и разработан алгоритм вычисления дескрипторов одномерных сигналов, основанный на методах SIFT [4] и BRIEF [5].
Вначале для сигнала вычисляются его ключевые точки. Для этого специальным образом строится пирамида разности гауссианов, и каждая точка, являющаяся локальным экстремумом в этой пирамиде, помечается как
ключевая, для неё определяются её уточнённая координата и размер. Использование пирамиды разности гауссианов для вычисления ключевых
точек обеспечивает инвариантность к изменению масштаба. Затем, используя метод BRIEF, для каждой ключевой точки вычисляются её локальные дескрипторы. В некоторой окрестности ключевой точки случайным образом выбираются пары соседних точек, и следующим образом
формируется битовая строка: если первая точка в паре больше второй,
соответствующий бит в строке принимается равным единице, иначе нулю.
Эта битовая строка и будет являться локальным дескриптором ключевой
точки. При размере дескриптора N байт, каждый дескриптор содержит в
себе информацию, полученную из 8*N таких тестов. Так как при построении дескриптора не участвуют сами абсолютные значения сигнала, а
только результаты их сравнения, дескриптор естественным образом получается инвариантным к прибавлению константы и умножению на число.
При сравнении дескрипторов рассчитывается их расстояние Хемминга,
которое эффективно вычисляется на процессорах с SIMD архитектурой, в
отличие от обычно использующейся L2-нормы. Использование метода
BRIEF позволяет существенно сократить объём памяти требующейся для
хранения дескрипторов и повысить производительность при их сравнении.
Также в ходе работы было реализовано программное обеспечение на
языке C++ с использованием библиотеки OpenCV, выполняющее разработанный алгоритм и была исследована его инвариантность.
Для исследования инвариантности разработанного алгоритма расчета
дескрипторов была взята база данных, состоящая из различных сигналов
от трёхосевого акселерометра [6]. С её помощью была построена база одномерных сигналов, где каждый сигнал отражал амплитуду соответствующего сигнала из базы данных. Затем для каждого одномерного сигнала
был проведен поиск его масштабированного варианта в базе с использованием разработанного алгоритма и метода RANSAC [7]. Доля корректно
сопоставленных сигналов составила как минимум 93% при масштабировании до четырёх раз при использовании 8 байт на ключевую точку и 96%
при использовании 32 байт.
Список литературы
1. Hartley R. Multiple View Geometry in Computer Vision, 2nd edition. Cambridge University Press, 2004.
2. Briggs A., Li Y., Scharstein D.. Feature matching across 1d panoramas // The sixth workshop on omnidirectional vision, 2005.
3. Xie J., Beigi M. S.. Scale-invariant local descriptor for event recognition in 1D sensor signals // Proceedings of ICME, pp. 1226-1229, 2009.
4. Lowe D. G.. Distinctive Image Features from Scale-Invariant Keypoints // International
journal of computer vision, 2004.
5. Calonder M., Lepetit V., Strecha C., Fua P.. BRIEF: Binary Robust Independent Elementary Features. // 11th European Conference on Computer Vision (ECCV), 2010.
6. Anguita D., Ghio A., Oneto L., Parra X., Reyes-Ortiz J.. Human Activity Recognition on
Smartphones using a Multiclass Hardware-Friendly Support Vector Machine // International Workshop of Ambient Assisted Living (IWAAL), 2012.
7. Fischler M., Bolles R.. Random Sample Consensus: A Paradigm for Model Fitting with
Applications to Image Analysis and Automated Cartography // Comm. of the ACM 24, pp. 381–
395., 1981.
Скачать