О возможности распознавания формы объекта с помощью

реклама
СЕКЦИЯ 4
Д.С. ПЕРЕВАЛОВ
Институт математики и механики УрО РАН, Екатеринбург
[email protected]
О ВОЗМОЖНОСТИ РАСПОЗНАВАНИЯ
ФОРМЫ ОБЪЕКТА
С ПОМОЩЬЮ МИКРОЧАСТИЦ
Аннотация
Предлагается метод распознавания трехмерной формы объекта, погруженного в жидкость. Для реализации распознавания используется
набор частиц, которые при контакте с поверхностью объекта запоминают
особенности ее геометрии. Для математического описания поверхности
используется расширенный образ Гаусса. В работе содержатся результаты
численных экспериментов по физическому моделированию процесса распознавания.
В связи с развитием нанотехнологий и проведением исследований по
созданию микро- и нанороботов и автономных биомолекулярных
устройств, встает задача построения микро- и наносенсоров [1], [3]. Такие
сенсоры требуются для технологического контроля производства и для
ориентации автономного устройства в некоторой среде. Нужно отметить,
что в зависимости от конкретной задачи варьируется тип необходимой
информации: начиная от химического состав раствора и его температурой
и заканчивая описанием трехмерной структуры объектов в наблюдаемой
сцене.
В работе предлагается метод распознавания формы трехмерного объекта, погруженного в жидкость. Метод основан на использовании набора
частиц, способных контактировать с объектом и запоминать особенности
поверхности в месте контакта. Применение метода не требует использования оборудования больших размеров. Поэтому он может использоваться для создания микророботов, функционирующих в водной среде и крови, а также при управлении химическими реакциями и нанотехнологическими процессами.
Постановка и анализ задачи
Пусть имеется объект небольших размеров, порядка микрометров или
нанометров. Требуется разработать метод, с помощью которого можно
УДК 004.032.26(06) Нейронные сети
175
СЕКЦИЯ 4
построить устройство, позволяющее определить тип объекта. При этом
устройство должно:
 быть небольших размеров для того, чтобы можно было использовать его в качестве сенсора микроробота;
 легко перестраиваться для распознавания новых классов объектов.
Существует несколько известных способов идентификации объектов,
но для решения задачи они не совсем подходят.
1. Методы компьютерного зрения [4] универсальны, но для их применения требуется достаточно большое по размерам оборудование, такое
как камера и компьютер.
2. Методы химической детекции молекул и веществ [2] компактны,
но для каждого класса молекул требуется синтез специальных молекулдетекторов.
3. Методы оптического и голографического распознавания [1] представляются перспективными, но в настоящий момент трудно в полной
мере оценить возможность их использования.
В работе предлагается и исследуется метод, объединяющий универсальность подходов компьютерного зрения с возможностями химической
детекции.
Описание метода
Метод заключается в использовании специальных частиц, которые исследуют форму объекта и передают собранную информацию распознающему устройству. Общая схема распознавания изображена на рис. 1. Работа распознающего устройства состоит из следующих операций.
 Устройство A выпускает частицы B из расположенного в нем контейнера.
 Частицы B совершают хаотическое движение и касаются поверхности объекта C, снимая и запоминая в точке касания некоторую информацию о поверхности.
 Устройство A захватывает частицы и считывает записанную в них
информацию.
Эти операции продолжаются некоторое время до достижения устойчивого состояния. В результате в устройстве будет содержаться статистическая информация о форме объекта. Используя ее, оно должно определить
тип объекта и передать результат распознавания для дальнейшего использования роботу или системе наблюдения.
УДК 004.032.26(06) Нейронные сети
176
СЕКЦИЯ 4
Рис. 1. Схема распознавания с помощью частиц: A – устройство распознавания,
способное хранить, выпускать, захватывать и анализировать частицы; B – частицы; C – исследуемый объект
Для работоспособности метода требуется, чтобы частицы случайным
образом касались поверхности объекта, и хотя бы часть из них возвращалась к распознающему устройству. Этого можно достичь, если потребовать, чтобы распознающее устройство, частицы и объект были помещены
в невязкую жидкость. Кроме того, устройство и объект не должны быть
расположены далеко друг от друга, а в жидкости не должно быть сильных
потоков. При выполнении этих условий в случае, если частицы достаточно малы, они будут совершать тепловое хаотическое движение и с равной
вероятностью касаться разных участков поверхности и возвращаться к
устройству. В дальнейшем предполагается, что все перечисленные условия соблюдены.
Конкретный способ проведения идентификации объекта зависит от
возможностей частиц. В работе мы сосредоточим внимание на простейшей ситуации, когда частицы независимы и не могут самопроизвольно
образовывать кластеры. В этом случае частицы могут снимать и информацию лишь о небольшом участке поверхности объекта. Это значит, что
им доступна информация о нормали и/или кривизне поверхности объекта,
или же о строении небольшого участка поверхности. При этом, если распознаваемый объект на 1-2 порядка больше частиц, можно использовать
все упомянутые характеристики поверхности, применив для распознавания, например, метод семантических сетей [5].
Более интересен случай, когда распознаваемый объект на 3-4 порядка
больше частиц. В этом случае кривизна поверхности во всех точках с
практической точки зрения нулевая, а небольшие участки поверхности
близки к плоскости. Поэтому остается использовать лишь нормали. Остановимся именно на этом случае.
УДК 004.032.26(06) Нейронные сети
177
СЕКЦИЯ 4
Распознавание гладких поверхностей
с помощью расширенного образа Гаусса
Формально задача распознавания поверхности объекта описывается
следующим образом: пусть имеется набор поверхностей S1 , S 2 , ..., S k ;
для некоторой поверхности S нужно определить, на какую из данных
поверхностей она больше всего похожа.
В предыдущем пункте было установлено, что при работе с большими
объектами система частиц может эффективно измерять только нормали к
поверхности. Поэтому для решения задачи распознавания был использован известный метод расширенных образов Гаусса [6]. Недавно было показано, что хотя этот метод в ряде случаев уступает по возможностям некоторым другим методам (использующим глобальную информацию о
поверхности), в то же время он эффективен и прост в реализации [7].
Расширенным образом Гаусса для гладкой поверхности S  R 3 называется вещественнозначная функция GS , определенная на единичной
сфере по правилу
GS (n)  mes{ p  S | n p  n} ,
где n – точка с единичной сферы, n p – нормаль к поверхности S в точке
p , mes – мера множества. Иными словами, значение расширенного образа Гаусса в некоторой точке n единичной сферы равно площади тех
точек поверхности, нормаль которых совпадает с n .
В нашем случае удобней работать с нормированной функцию
GSnorm (n)  GS (n) / mes ( S ) , в этом случае она будет инвариантной к размеру поверхности. Кроме того, эта функция инвариантна относительно
положения объекта, а при повороте поверхности «поворачивается» соответственно.
Для распознавания поверхностей требуется ввести расстояние между
двумя образами Гаусса, например,
dist (G1 , G2 ) || G1  G2 ||1   | G1 (n)  G2 (n) | dn .
После этого вычисляются расстояния между GS и всеми GSi , i  1..k .
Та S i , на которой достигается минимум расстояния, объявляется результатом распознавания поверхности S .
УДК 004.032.26(06) Нейронные сети
178
СЕКЦИЯ 4
Дискретная модель
Можно перенести описанный математический метод на дискретный
вариант с частицами. А именно, пусть имеется N частиц, каждая из которых способна хранить информацию о нормали в некоторой точке поверхности S . Тогда дискретный аналог нормированного расширенного образа
Гаусса будет выглядеть так:
g S ( n) 
1
N
N
 (n, n j ) ,
1
где n j – нормаль, записанная в j -й частице,
1, если n  n j ,
(n, n j )  
0, в противном случае.
Кинетическая модель
Формула для расчета g S (n) предусматривает идеальную ситуацию,
когда все выпущенные устройством частицы снимают информацию с
объекта и возвращаются обратно. Но на практике некоторые частицы могут никогда не вернуться, либо вернуться в устройство, не сняв показания
с объекта, либо после снятия показаний исказить информацию. Чтобы
учесть данные возможности, был разработан алгоритм для расчета расширенного образа Гаусса с учетом кинетической модели, описывающую
возможность возникновения ошибок в системе из N частиц.
1. Инициализация.
Все нормали частиц полагаются равными случайным единичным векторам.
2. Снятие данных с поверхности.
Следующие шаги повторяются T раз.
 Выбирается произвольная частица j  1..N .
 Выбирается случайное число r  [0,1] .
 Если r 1  perr , то считается, что частица j сняла информацию
с поверхности объекта. Поэтому нормаль частицы n j устанавли
вается равной нормали к произвольной точке S .
Иначе считается, что частица j повредила свои данные, и ее
нормаль полагается равной случайному единичному вектору (взятому с равномерным распределением на сфере).
УДК 004.032.26(06) Нейронные сети
179
СЕКЦИЯ 4
3.
Расчет нормированного расширенного образа Гаусса.
Так как параметр perr [0, 1] определяет вероятность возникновения
ошибки в частицах то, если распределение g err (n) случайных единичных векторов известно, можно отфильтровать g S (n) от ошибочных данных по формуле g S (n)  max( g S (n)  perr  g err (n),0) , и нормировать ее:
g Sfiltr (n)  g S (n) / || g S ||1 .
Результаты экспериментов
Построенная кинетическая модель была численно исследована на четырех эталонных объектах, изображенных на рис. 1. Каждый из объектов
был задан с помощью 50 000 треугольников.
1
2
3
4
Рис. 2. Объекты, используемые для экспериментов
На рис. 3 изображены двумерные проекции их расширенных образов
Гаусса (вычисленные на сетке размером 32x32), а в табл. 1 приведены
расстояния между ними (здесь и далее сопоставление образов Гаусса проходило с использованием двумерной проекции на сетке 32x32). Как нетрудно убедиться, данные в таблице соответствуют ожидаемому представлению о близости объектов.
Рис. 3. Изображение расширенных образов Гаусса для объектов. Светлые и
темные участки соответствуют малым и большим значениям функций
УДК 004.032.26(06) Нейронные сети
180
СЕКЦИЯ 4
Таблица 1
Расстояния между объектами (точность 2 знака после запятой)
1
2
3
4
1
0
0,59
1,24
0,84
2
0,59
0
0,77
0,99
3
1,24
0,77
0
1,37
4
0,84
0,99
1,37
0
Эксперименты по кинетическому моделированию проводились с
N  1 000 000 частиц. Оказалось, что статистическое распределение частиц практически стабилизируется при T  5 000 000 шагах, поэтому в
дальнейшем используется именно такое число шагов.
В табл. 2 приведены результаты испытаний распознавания объектов
при разных уровнях ошибок p err . А именно, запускался процесс, в котором частицы снимали информацию с объекта i . Для характеристики качества распознавания рассчитывалась неотрицательная величина
Q(i)  dist( g Sfiltr , g Si ) min{ dist( g Sfiltr , g S j ) | j  i, j  1..4} ,
i
i
т.е. отношение расстояния между образом Гаусса, полученным частицами
при распознавании эталона i до образа самого эталона к минимальному
расстоянию до образов остальных эталонов. Чем меньше ее значение, тем
данные, полученные частицами, больше похожи на исходный эталон, т.е.
тем качественней прошло распознавание.
Результаты табл. 2 показывают, что при данном числе частиц для выбранных эталонов метод дает приемлемое качество распознавания при
уровне ошибки около 0,95. (При уровне ошибок 0,99 функции Q(i ) приближаются к 1, это значит, что эталонный объект i , который распознавали частицы, практически неотличим от какого-то другого эталона, а значит, распознавание неустойчиво.)
УДК 004.032.26(06) Нейронные сети
181
СЕКЦИЯ 4
Таблица 2
Зависимость от ошибки (точность 4 знака после запятой)
p err
Q(1)
Q(2)
Q(3)
Q(4)
0
0,0345
0,0334
0,0217
0,0366
0,5
0,0714
0,0707
0,0504
0,0552
0,9
0,3171
0,3213
0,2589
0,2426
0,95
0,5707
0,5611
0,4587
0,4589
0,99
0,9525
0,9555
0,8958
0,8673
Заключение
Приведенные результаты моделирования с использованием 1 млн. частиц показали возможность устойчивого распознавания при уровне ошибок не превышающем 95 %, что подтверждает работоспособность метода.
В связи с этим встает задача разработки технических средств для реализации метода и его практической апробации.
Список литературы
1. Биомолекулярные нейросетевые устройства / Под ред. Н.Г. Рамбиди. М.: ИПРЖР,
2002. 224 с.
2. Глик Б., Пастернак Дж., Молекулярная биотехнология. Принципы и применение: Пер.
с англ. М.: Мир, 2002. 589 с.
3. Нанотехнология в ближайшем десятилетии. Прогноз направления исследований / Под
ред. Роко М.К., Уильямса Р.С., Аливисатоса П. Пер. с англ. М.: Мир, 2002. 292 с.
4. Форсайт Д.А., Понс Ж., Компьютерное зрение. Современный подход: Пер. с англ. М.:
Изд. дом Вильямс, 2004. 928 с.
5. Ivanko E., Perevalov D. On Using Sign Method For 3D Images Recognition And Classification. Int. Conf. on Computing, Communications and Control Technologies: CCCT'04, Austin,
USA, 2004. Vol. V. 248-251.
6. Horn B., Extended Gaussian images. Proc. of the IEEE, 72(12):1671 – 1686, December
1984.
7. Shilane, P., Min, P., Kazhdan, M., Funkhouser, T.: The Princeton Shape Benchmark, to appear in Shape Modeling International, Genova, Italy, June 2004.
УДК 004.032.26(06) Нейронные сети
182
Скачать