ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 А.И. МАНОЛОВ Московский физико-технический институт (государственный университет) [email protected] ТЕОРИЯ НЕЙРОДАРВИНИЗМА – КРИТИЧЕСКИЙ АНАЛИЗ Аннотация В работе описываются основные идеи теории нейродарвинизма Дж. Эдельмана и подходы к моделированию адаптивного поведения, основанные на данной теории. Теория нейродарвинизма предполагает, что в основе формирования поведения лежит отбор (селекция) нейронных групп. Рассматривается устройство и принципы работы анимата Darwin X, выполняющего задачу поиска скрытой платформы (лабиринт Морриса). Показана возможность связи теории нейродарвинизма и теории метасистемных переходов. 1. Концепция нейродарвинизма Джеральдом Эдельманом, лауреатом Нобелевской премии «за открытия, касающиеся химической структуры антител», в конце 1970-х годов была предложена собственная теория развития и функционирования мозга. Согласно данной теории механизмы селекции, обнаруженные Эдельманом и Портером в иммунной системе, также работают и в мозге животных. Аргументы в пользу селективного подхода (в противовес инструктивному) следующие: 1) Головной мозг состоит из огромного числа нейронов (около 10 11). В среднем нейрон образует от 1000 до 10000 синапсов. Что бы детально описать такую сложную сеть необходимо гораздо больше информации, чем может содержать в себе геном (около 3·10 9 нуклеотидных пар). 2) Иногда наблюдается восстановление функций мозга, потерянных при физических повреждениях. Что становится невозможным, если предположить, что выполнение тех или иных функций требует строго заданной организации нейронов и связей между ними. По мнению Эдельмана, основной единицей осуществления функций и основной единицей селекции в высших отделах мозга является группа различным образом связанных клеток (состоящая из 50-10 000 нейронов). Внутренние связи и состав группы делает ее почти уникальным элементом сети (в структурном, а не функциональном смысле). УДК 004.032.26(06) Нейронные сети 223 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 Следует отметить, что селективные механизмы не исключают наличие архитектурной организации. Эти два аспекта организации являются взаимодополняющими. Основные постулаты, выдвинутые Эдельманом в его теории нейродарвинизма, таковы: 1) Во время развития мозга формируется первичный репертуар нейронных групп и связей между ними. 2) В результате взаимодействия со средой и приобретения опыта формируется вторичный репертуар из отобранных нейронных цепей. Механизм его формирования – изменение сил синаптических связей между нейронными группами. 3) Повторный вход сигналов во взаимосвязанных нейронных группах обеспечивает обнаружение пространственно-временной корреляции событий. Сам же повторный вход обеспечивается наличием обратных связей. Проводя аналогию с эволюционной теорией и иммунологией, Эдельман говорит, что перед лицом неизвестного будущего основным условием успешного приспособления является заранее существующее многообразие. Важным понятием данной теории является понятие вырожденности нейронных групп. Под вырожденностью понимается наличие более чем одной групп способных распознать тот или иной сигнал. Считается, что группа распознает сигнал, если она более или менее специфично отвечает на него. Одна группа может распознавать более одного сигнала. Если бы вырожденность отсутствовала, то некоторые входные сигналы могли бы оказаться так и не распознанными ни одной группой. Так же Эдельманом рассматривается иерархия реакций распознавания (которая, вообще говоря, на своих поздних стадиях нелинейна из-за наличия обратных связей). Такую иерархию можно представить в виде: S -> R -> (R для R)n, n = 1, 2, 3, …, где S – сенсорный входной сигнал из окружающей среды, R – группы клеток коры, которые могут действовать как «распознаватели» этого входа, а (R для R) означает группы нейронов которые действуют как «распознаватели для распознавателей» [1, 2]. 2. Моделирование поведения анимата в лабиринте Мориса 2.1. Общее описание Подход Эдельмана к моделированию поведения животных состоит в конструировании так называемых brainbased device (далее называемыми аниматами) – физических устройств, управляемых моделируемой на комУДК 004.032.26(06) Нейронные сети 224 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 пьютерах нервной системой. Основные принципы построения таких устройств следующие: 1) Они должны функционировать в реальной физической среде. 2) Должны выполнять какую-либо поведенческую задачу. 3) Поведение устройства должно контролироваться искусственной нервной системой, отражающей архитектуру и динамику мозга животных. Последней на данный момент работой в этом направлении является анимат Darwin X. Задача его состоит в поиске скрытой платформы (лабиринт Морриса) [3]. Анимат перемещается в ограниченном стенами пространстве. На стенах расположены метки (бумажные полоски различного цвета и ширины), которые позволяют ему ориентироваться в пространстве. Анимат не способен увидеть скрытую платформу, но может распознать её на близком расстоянии с помощью инфракрасного датчика. Во время тренировочных испытаний он исследует местность пока не найдет скрытую платформу или пока не будет исчерпан лимит времени в 1000 с. Физически Darwin X представляет собой мобильную платформу, снабженную колесами для перемещения, камерой, одометром, инфракрасным приемопередатчиком для обнаружения скрытой платформы и светодиодами для отслеживания перемещений. Он снабжен встроенными поведенческими реакциями исследования местности и избегания препятствий [4]. 2.2. Архитектура нейронной сети Структура нервной системы анимата аналогична структуре нервной системы млекопитающих, но с гораздо меньшим числом нейронов и менее сложной архитектурой. Каждый моделируемый отдел нервной системы состоит из множества нейронных групп. Нейронная группа – это популяция из примерно ста нейронов. Работа нервной системы моделируется на кластере из 12 компьютеров Pentium 4 (1.4 Hz). При этом один цикл моделирования длится около 200 мс. Всего нервная система включала в себя 50 отделов, 90 000 нейронных групп, и примерно 1.4 млн. синаптических связей. Нервная система состоит из зрительной системы, системы выбора направления (head direction system), гиппокампа, базального переднего мозга (basal forebrain), системы оценки (value system) и системы выбора действий. В архитектуре гиппокампа примерно отражены особенности устройства гиппокампа у грызунов. УДК 004.032.26(06) Нейронные сети 225 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 Рис. 1. Структурная схема нервной сети. V1, V2/4 – области аналогичные зрительной коре, IT – inferotemporal cortex, PR – теменной коре (parietal cortex), ATN – переднему таламическому ядру (anterior thalamic nuclei), MHDG – моторным областям, отвечающим за выбор направления (egocentric heading), S – системе оценки (value system), EC – энторинальной области коры, DG – зубчатой извилине (dentate gyrus). HD – система выбора направления (head direction system) УДК 004.032.26(06) Нейронные сети 226 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 Рис. 2. Структура гиппокампа 2.3. Динамика нейронной сети Базальный передний мозг создает внешний ритм для нервной системы и ограничивает приток сигналов в гиппокамп. Активность системы оценки говорит о том, что произошло некоторое важное событие. Она приводит к изменению силы синаптических связей CA1->S и CA1->MHDG. Активность области S носит инерционный характер – она сохраняется в течение нескольких циклов. Изначально S активируется только при обнаружении скрытой платформы (вызывая усиление связей) и системой избегания препятствий (связи ослабляются). После обучения к её активации также может приводить и участок гиппокампа CA1. Нейронные группы связаны между собой как пластичными, так и непластичными связями. Так же связи могут быть зависящими или независящими от разности потенциалов (voltage-dependent). Под зависящей от УДК 004.032.26(06) Нейронные сети 227 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 разности потенциалов связью понимается такая связь, в которой приток к постсинаптической клетке зависит от уровня активности этой клетки. Этим учитывается вклад рецепторов, которые для своей активации требуют деполяризации постсинаптической клетки. Уровень активности одной нейронной группы может принимать значения от 0 до 1. Активационная функция имеет следующий вид si (t 1) (tanh( g i ( POSTi si (t ))) 0, x i x, иначе (1) ( x) где POSTi – это синаптический приток в клетку, отвечает за инертность уровня активности, g – масштабирующий коэффициент, σ – порог возбуждения данной нейронной группы. Вес синапса изменяется в зависимости от активности пре- и постсинаптической группы. Укреплению способствует корреляция активности обоих групп. Сила связи между группами, активность которых слабо коррелирует, уменьшается. Изменение силы синаптических связей, не зависящих от разности потенциалов, было основано на правиле Байненштока-Купера-Монро (Bienenstock-Cooper-Munro) [5] сij (t 1) si (t ) s j (t ) BCM ( si ) k 1 s , s / 2 BCM ( s) k1 ( s ), / 2 s k tanh( p( s )) / p, иначе 2 (2) 0.25 ( s 2 ), где si и sj – это активности пре- и постсинаптической группы соответственно, η – константа, задающая скорость обучения, p – константа насыщения. Для предотвращения слишком большого усиления связи веса нормируются: Cij Cij K sqrt ( C ) k 1 . 2 ik УДК 004.032.26(06) Нейронные сети 228 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 Силы синаптических связей второго типа (зависящих от разности потенциалов) изменяются на основе правила временных разностей (temporal difference learning rule).[6] cij (t 1) si (t ) s j (t ) TD(t ) R (t ) S (t ), R 0, TD S (t ) R (t ), R 0 S S (t ), иначе, (3) где S – это средний уровень активности системы оценки, τ – номер ритмического цикла, R+ – положительное подкрепление, равное 1 при нахождении скрытой платформы, R- – отрицательное подкрепление, равное 1, если анимат находится слишком близко к стене. 2.3. Результаты моделирования В результате серии запусков анимат приобретал способность находить скрытую платформу вне зависимости от места, на которое он помещался в начальный момент времени. До обучения нахождение платформы требовало около 700 с, после – около 120 с. Большинство нейронных групп гиппокампа проявляли активность типичную для «клеток места» (place cells) у животных [7]. Это означает, что такие группы были активны лишь в определенной области исследуемого пространства и почти неактивны в остальной его части. Так же исследовалось возникновение функциональных цепей (functional circuit) – наборов групп, активность которых причинно связана. Оказалось, что в ходе обучения число таких функциональных цепей увеличивается. Все они состоят из нейронных групп входящих в каждый из отделов гиппокампа и энторинальную область коры (EC). 3. Связь с теорий метасистемных переходов Предложенная Эдельманом теория нейродарвинизма может быть сопоставлена с теорией метасистемных переходов Турчина [8]. Нейронную группу можно рассматривать как элемент метауровеня над уровнем нейронов. Сеть из нейронных групп – это уже следующий уровень организации. Важным моментом в теории Эдельмана является многочисленУДК 004.032.26(06) Нейронные сети 229 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 ность и вырожденность нейронных групп, что соответствует закону разрастания предпоследнего уровня у Турчина. Можно предположить, что переход от сетей нейронов к сетям нейронных групп соответствует переходу от допонятийного уровня мышления к мышлению, основанному на понятиях. Заключение В работах Эдельмана показано, что нервная сеть, работающая на основе селективных принципов, может обеспечить успешное выполнение широкого круга задач, требующих адаптивного поведения. Именно такие механизмы могут быть использованы для объяснения процесса формирования новых функциональных систем (ФС). Однако возникновение новых ФС и их иерархии в течение жизни в работах Эдельмана не было рассмотрено. Представляется интересной попытка построения моделей с учетом как механизмов предложенных Эдельманом, так и реализацией идей теории функциональных сетей П.К. Анохина [9]. В более ранних версиях аниматов серии Darwin решалась задача инвариантного распознавания различных типов объектов. Анимат Darwin VI в результате приобретения опыта был способен распознавать три типа объектов (кубики с различными паттернами на верхней грани). Распознавание происходило вне зависимости от расположения кубиков в поле зрения анимата. Таким образом, было показано, что селективные механизмы могут обеспечить формирование понятий об объектах и их распознавание [10]. Можно поставить вопрос о том, насколько необходимо копирование архитектуры мозга млекопитающих при построении аниматов, как это делается в работах Эдельмана с сотрудниками. Аргументом против такого копирования может быть то, что выполнение сходных функций может осуществляться организмами с различной архитектурой мозга (птицы и млекопитающие). Тем не менее, видно, что в этих работах исследованы очень интересные особенности поведения аниматов, и необходимо сопоставление данных работ с другими моделями адаптивного поведения. Список литературы 1. Эдельман Дж., Маунткасл В. Разумный мозг. М.:Мир, 1981. – 135 c. 2. Edelman G. M. Neural Darwinism: The Theory of Neuronal Group Selection. – Basic Books, Inc. 1987. 3. Morris R. Developments of a water-maze procedure for studying spatial learning in the rat. // Neurosci. Methods. 1984. Vol. 11, 47–60. УДК 004.032.26(06) Нейронные сети 230 ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1 4. Edelman G. M., Krichmar J. L.,Seth A.K., Nitz D. A., Fleischer J.G. Spatial Navigation and Causal Analysis in a Brain-Based Device Modeling Cortical – Hippocampal Interactions // Neuroinformatics – 2005, Vol. 3, Num. 3. 5. Bienenstock, E. L., Cooper, L. N., Munro, P. W. Theory for the development of neuron selectivity: orientation specificity and binocular interaction in visual cortex // Neurosci. 1982. 2, 32–48. 6. Sutton R. S., Barto A. G. Time-derivative models of Pavlovian reinforcement. In: Learning and Computational Neuroscience: Foundations of Adaptive Networks, Moore, J. (ed.) MIT Press, Cambridge - 1990. pp. 497–537. 7. O’Keefe J., Dostrovsky J. The hippocampus as a spatial map. Preliminary evidence from unit activity in the freely-moving rat. Brain. Res. 1971. 34, 171–175. 8. Турчин B.Ф. Феномен науки. Кибернетический подход к эволюции. М.: Наука, 1993. 295 c. 9. Анохин П.К. Принципиальные вопросы общей теории функциональных систем // Принципы системной организации функций. М.: Наука, 1973. C. 5-61. 10. Krichmar J.L., Edelman G.M. Machine psychology: autonomous behavior, perceptual categorization and conditioning in a brain-based device // Cerebral Cortex, 2002. V. 12. P. 818-830. УДК 004.032.26(06) Нейронные сети 231