А.В. СЕРГИН БИОЛОГИЧЕСКИ ПРАВДОПОДОБНЫЙ НЕЙРОСЕТЕВОЙ ДЕТЕКТОР КРАЯ

advertisement
СЕКЦИЯ 6
А.В. СЕРГИН
Институт прикладной математики им. М.В. Келдыша РАН, Москва
post-box2000@mail.ru
БИОЛОГИЧЕСКИ ПРАВДОПОДОБНЫЙ
НЕЙРОСЕТЕВОЙ ДЕТЕКТОР КРАЯ
Аннотация
На основе физиологических данных об обработке зрительной информации в сетчатке глаза, латеральном коленчатом теле и первичной зрительной коре млекопитающих предлагается нейросетевой детектор края.
В системах машинного зрения важную роль играет выделение краев.
Однако ни один из известных детекторов края не является совершенным.
Принята следующая классификация ошибок: потеря настоящих краев,
появление ложных краев, искажение формы и положения краев. Широко
распространен подход, при котором края находят путем сглаживания и
последующего дифференцирования изображения. Из-за чувствительности
к шумам дифференцирование является некорректно поставленной задачей, а сглаживание изображения (регуляризация) приводит к потере информации [1].
Описываемый детектор края опирается не столько на математический
аппарат, сколько на данные о функционировании мозга. Такой подход
может привести к алгоритмам с очень хорошими характеристиками.
Свет воспринимается специальными фоторецепторами, колбочками и
палочками, содержащими зрительные пигменты. Сигналы от фоторецепторов, посредством биполярных, горизонтальных и амакриновых клеток
достигают ганглиозных клеток. Аксоны ганглиозных клеток проходят в
составе зрительного нерва и являются единственными нервными волокнами, несущими зрительную информацию от глаза в мозг. Волокна зрительного нерва заканчиваются в области латерального коленчатого тела,
где расположены вторые нейроны цепочки зрительного тракта. Нейроны
коленчатого тела, в свою очередь, проецируются в первичную зрительную
кору V1 [2].
Все эти связи имеют ретинотопическую организацию: окружающий
нас мир (его оптическое изображение на сетчатке) упорядоченно отображается в различных областях зрительной системы в виде пространственного распределения возбужденных нейронов [3].
УДК 004.032.26(06) Нейронные сети
249
СЕКЦИЯ 6
Рецептивным полем ганглиозной клетки называют область сетчатки,
световая стимуляция которой может повлиять на импульсацию данной
клетки. По устройству рецептивных полей можно выделить клетки с onцентром и клетки с off-центром. В обоих случаях рецептивные поля представляют собой круг и прилегающее к нему кольцо. Круг называют центром, а кольцо - периферией рецептивного поля.
Клетки с on-центром в темноте или при равномерном освещении их
рецептивных полей проявляют спонтанную активность. При освещении
небольшого пятна в центре рецептивного поля on-клетка разряжается с
повышенной частотой. Наиболее сильный ответ получается в том случае,
когда светлое пятно занимает весь центр. При освещении периферии рецептивного поля активность on-клетки, напротив, подавляется.
Поведение клетки с off-центром противоположно: освещение периферии увеличивает ее активность, а освещение центра – подавляет. Клетки
обоих типов перемешаны и встречаются одинаково часто. Рецептивные
поля соседних клеток частично перекрываются.
Ответы клеток латерального коленчатого тела не имеют разительных
отличий от сигналов ганглиозных клеток. Они также имеют концентрически организованные рецептивные поля on- или off-типа, но механизм контраста отрегулирован тоньше, за счет большего соответствия между тормозными и возбуждающими зонами [2].
В первичной зрительной коре V1 содержатся (среди многих других)
клетки, для которых наилучшим стимулом является граница между светлым и темным, проходящая в фиксированном направлении. Такая клетка
совсем не реагирует на границы, перпендикулярные оптимальному
направлению, и на рассеянный свет. Она дает несколько более слабый
ответ на границы, проходящие под небольшим углом к оптимальному
направлению.
Клетки с ориентационной чувствительностью сгруппированы в микроколонки. В микроколонке представлены все возможные ориентации на
данном участке зрительного поля. Рецептивные поля соседних микроколонок частично перекрываются.
Равномерной решеткой на прямоугольнике
x0  x  x0  x, y0  y  y0  y
называется множество точек
l  0,.., N x , k  0,..,N y , h x 
{(xl , yk )  ( x0  l  hx , y0  k  h y )} , где
y
x
, hy 
.
Nx
Ny
УДК 004.032.26(06) Нейронные сети
250
СЕКЦИЯ 6
Рис. 1. Общая схема биологически правдоподобного детектора края
Общая схема нейросетевого детектора края представлена на рис. 1.
Исходное изображение задано в виде значений яркости I l ,k в узлах
( xl , y k ) равномерной решетки. Яркость может принимать значения от 0
(черный) до 1 (белый). Искусственные нейроны, имитирующие активность ганглиозных клеток, клеток с ориентационной чувствительностью и
микроколонок, расположены в узлах точно таких же решеток.
Построим аналог ганглиозной on-клетки. Скалярный выход a l ,k искусственного нейрона, расположенного в узле ( xl , y k ) , определим как
свертку
весовой
функции
со
значениями
яркости:
Wi, j
УДК 004.032.26(06) Нейронные сети
251
СЕКЦИЯ 6
al ,k   Wi, j  I l i,k  j . Положим весовую функцию кусочно-постоянной,
i, j
в соответствии с устройством рецептивного поля on-клетки:
Wi, j
w ,
(i  h x ) 2  ( j  h y ) 2  R12 ж;
1

 w2 , R12  (i  h x ) 2  ( j  h y ) 2  R22 ;
w ,
R22  (i  h x ) 2  ( j  h y ) 2 ,
 3
где R1 – радиус центра рецептивного поля, R2 – внешний радиус периферии рецептивного поля, w1 , w2 и w3 – постоянные веса.
Поскольку световая стимуляция за пределами рецептивного поля не
может влиять на ответ on-клетки, имеем w3  0 . Потребуем, чтобы спонтанной активности on-клетки соответствовало a l ,k  0 . Это означает, что
при I l ,k  c (яркость одинакова во всех узлах)
al ,k   Wi, j  I l i,k  j  c   Wi, j  c  ( w1  N1  w2  N 2 )  0 ,
i, j
i, j
где N1 – число узлов, попавших в центр рецептивного поля (удовлетворяющих неравенству ( x m  xl ) 2  ( y n  y k ) 2  R12 ), а N 2 – число узлов,
попавших в периферию рецептивного поля (удовлетворяющих неравенству R12  ( x m  xl ) 2  ( y n  y k ) 2  R22 ). Отсюда w1  N1  w2  N 2  0 .
Световая стимуляция в центре увеличивает активность on-клетки, следовательно w1  0 . Световая стимуляция на периферии уменьшает активность on-клетки, следовательно w2  0 . Тогда максимально возможный
ответ a lmax
,k модели on-клетки достигается при
1, ( x m  xl ) 2  ( y n  y k ) 2  R12 ;
max 
Im
,n  
2
2
2

0, ( x m  xl )  ( y n  y k )  R1
(пятно максимальной яркости полностью занимает центр рецептивного
max
поля): almax
,k   Wi, j  I l i,k  j  w1  N1 . Минимально возможный ответ
i, j
a lmin
,k модели on-клетки достигается при
УДК 004.032.26(06) Нейронные сети
252
СЕКЦИЯ 6
0, ( x m  xl ) 2  ( y n  y k ) 2  R12 ;
min 
Im
.n  
2
2
2

1, ( x m  xl )  ( y n  y k )  R1
(пятно максимальной яркости полностью занимает периферию рецептивmin
ного поля): almin
,k   Wi, j  I l i ,k  j  w2  N 2 . Введем условие нормировi, j
min
ки: almax
,k  a l ,k  1 . Отсюда w1  N1  w2  N 2  1 .
С учетом того, что w1  N1  w2  N 2  0 имеем:
Wi, j
 1 /(2  N ),
(i  h x ) 2  ( j  h y ) 2  R12 ;
1

  1 /(2  N 2 ), R12  (i  h x ) 2  ( j  h y ) 2  R22 ;

0,
R22  (i  h x ) 2  ( j  h y ) 2 .

Свертка яркости с этой весовой функцией может быть найдена как половина разности средних значений яркости по центру и по периферии
рецептивного поля.
Аналогичным образом построенная модель off-клетки имеет весовую
функцию
Wi, j
 1 /(2  N ),
(i  h x ) 2  ( j  h y ) 2  R12 ;
1

  1 /(2  N 2 ), R12  (i  h x ) 2  ( j  h y ) 2  R22 ;

0,
R 22  (i  h x ) 2  ( j  h y ) 2 .

Скалярный выход a l ,k искусственного аналога off-клетки отличается от
выхода on-клетки только знаком: a l ,k   a l ,k .
Поскольку особое внимание в этой работе уделяется обнаружению
краев, введем следующее понятие. Идеальным краем называется такая
прямая  sin()  x  cos()  y  d , что яркость
 1,

I ( x, y )  1 / 2,
 0,

 sin()  x  cos()  y  d ;
 sin()  x  cos()  y  d ;
 sin()  x  cos()  y  d ,
где  – угол наклона прямой, d – расстояние от прямой до начала координат. На рис. 2 применительно к краям сравниваются ответы ганглиозУДК 004.032.26(06) Нейронные сети
253
СЕКЦИЯ 6
ных клеток сетчатки и описанной выше модели on-клетки. Из соображений подобия графиков (и, следовательно, соответствия физиологическим
данным) выбрано R2  4  R1 .
Рис. 2. Слева – ответы on- и off- клеток, построенные по экспериментальным данным [3]; справа – ответы модели on-клетки. По оси абсцисс отложено смещение
центра рецептивного поля клетки относительно границы светлого и темного
Построим аналог клетки из первичной зрительной коры V1, настроен
ной на край, проходящий под углом   . По аналогии с работой мозга,
2
входной информацией для модельной клетки является активность a l ,k onклеток и a l ,k off-клеток.
Распределение активности on-клеток на идеальном крае представлено
на рис. 2. Реальный край может быть размытым, иметь меньший контраст,
быть зашумлен. Размытость приводит к увеличению расстояния между
максимальным и минимальным ответами и к уменьшению их амплитуды
A . Уменьшение контраста – к пропорциональному уменьшению амплитуды. При малых значениях R1 подавление шума не происходит. В общем
случае можно лишь предположить, что в среднем слева от края положительными будут a l ,k , а справа – a l ,k . Иначе говоря, для узла ( xl , y k )
УДК 004.032.26(06) Нейронные сети
254
СЕКЦИЯ 6
через который проходит край с параметром  

будет выполнено
2
1
 a l i,k  j  0 , где R3 и R4
N
0ihx  R3 ,  R4  j h y  R4
 R3 ihx 0,  R4  j hy  R4
определяют прямоугольники, по узлам внутри которых производится
суммирование, а N – число слагаемых в сумме.
Необходимо, чтобы по мере отклонения угла наклона края  от угла

  , на который настроена клетка, ответ bl ,k модельной клетки убы2
вал. Необходимо, чтобы по мере удаления края от узла ( xl , y k ) ответ bl ,k
1
N
 a l i,k  j
быстро
bl ,k
убывал.
1
 min(
N  R ih
3
x
0,
Этим
требованиям
1
 a l i, k  j , N
0,  R  j h  R
0ih  R
4
y
4
x
удовлетворяет
 a l i,k  j ) .
3 ,  R4 
функция
Внутри одно-
j hy  R4
родных областей и когда край перпендикулярен оптимальному направлению имеем bl ,k  0 .

отличается от опи2
санной выше поворотом прямоугольников, по узлам внутри которых про
изводится суммирование, вокруг точки ( xl , y k ) на угол   .
2
Клетки с ориентационной чувствительностью, расположенные в одном
и том же узле ( xl , y k ) , но настроенные на разные ориентации края
i
i  2 , i  0,.., K  1 , сгруппированы в микроколонки. За ответ целой
K
микроколонки примем максимальный из ответов входящих в нее клеток:
cl ,k  max (bl ,k ( i )) . Тогда высокая активность микроколонки означает
Клетка в узле ( xl , y k ) , настроенная на угол  
i 0..K 1
наличие края, проходящего близко к центру ее рецептивного поля.
Работа описанного детектора края продемонстрирована на рис. 3.
УДК 004.032.26(06) Нейронные сети
255
СЕКЦИЯ 6
Рис. 3. Слева – матрица яркости, 192x168 узлов. Справа – результат выделения
краев с параметрами R1  1 , R2  4 , R3  2 , R4  1 , K  16 . Узел закрашивался в черный, если активность микроколонки в нем превосходила   0.004
Список литературы
1. Ziou D. and Tabbone S. Edge Detection Techniques - An Overview // Pattern Recognition and
Image Analysis. 1998. Vol 8. № 4. P. 537–559. http://www.loria.fr/~tabbone/PAPERS/EDsurvey.pdf
2. Николлс Дж. Г., Мартин А. Р., Валлас Б. Дж., Фукс П. А. От нейрона к мозгу. М.: Едиториал УРСС, 2003.
3. Физиология человека / Под ред. Р. Шмидта и Г. Тевса. 2-е изд., перераб. и доп. М.:
МИР, 1996.
УДК 004.032.26(06) Нейронные сети
256
Download