Распределенность архитектуры

advertisement
Карпов Валерий Эдуардович
Архитектура интеллектуальных
роботов
Некоторые общие
замечания
Лаборатория робототехники и искусственного интеллекта Политехнического музея
Предварительный посыл
Робот - это устройство, действующее в
реальной физической среде. Отсюда
очевидным требованием к роботу
является его способность к
самосохранению не только и не столько
его функций, но робота, как устройства.
Инстинкт самосохранения.
Следствия этого требования



Распределенность архитектуры системы
как минимум на функциональном уровне
(модульность).
Нарушение привычных в технике
принципов иерархичности управления.
Вторичность интеллектуальных функций
робота (что бы под этим ни понималось)
по сравнению с базовым набором
рефлекторных функций.
Распределенность архитектуры
На функциональном уровне - выделение
в некой единой системе (мозг)
управляющих областей
 На конструктивном уровне - совокупность
управляющих модулей
-----------------------------------------------Мозг. Локализация участков.
Связи.

Нарушение иерархичности
Внешняя
среда
Р
е
ц
е
п
т
о
р
ы
Выработка
Принятие
Оценка
решения
управляющего
воздействия
Э
ф
ф
е
к
т
о
р
ы
Внешняя
среда
Принятие
решения
Внешняя
среда
Первичные
рецепторы

Анализ и
выделение
признаков
Внешняя
среда
Выработка
управляющих
воздействий
Эффекторы
Иерархия потоков и стимул-реактивные связи
Технические аспекты рефлекторных
связей
СУ
Контроллер
двигателя
Стоп
к СУ
Датчик
препятствия
Каким бы интеллектуальным ни было УУ,
результаты его управления будут вторичными
относительно сигнала «стоп» датчика
препятствий
Реальная картина
На самом деле – немного сложнее
wупр
xупр
управление
Мотонейрон
Y
wз
xз
запрет
От датчика препятствий

0, wз x з  w упр x упр
Y 

 x упр , wз x з  w упр x упр
Принцип естественности
архитектуры
Под естественностью архитектуры системы
понимается прежде всего
«биологичность»:
 Модульность
 Естественность методов решения задач и
естественность общения робота с
внешним миром
Модульность


Совокупность сколь угодно сложно и
«интеллектуально» устроенных, но
имеющих простой входной интерфейс
узлов.
Решение локальных задач управления
(центральные моторные программы).
Естественность методов решения
задач
Проблема фрейма. Маккарти и Хейес, 1969 г.
Главное препятствие на пути прогресса в области
ИИ:
Дано:
1. Кубик А имеет черный цвет.
2. Кубики А и Б исходно расположены по
отдельности друг от друга.
Верно ли утверждение, что если кубик А положить
на кубик Б, то кубик А по-прежнему останется
черным.
Решение проблемы фрейма
В рамках ситуационного исчисления для
получения требуется наличие
дополнительного утверждения: «Кубик А
не меняет своего цвета при такой
операции»
Это - тяжелая задача для систем ИИ, т.к.
число подобных утверждений может быть
весьма велико.
Решение проблемы фрейма
«Естественный закон инерции»: изменения в системе не
происходят до тех пор пока они не оговариваются в
системе заранее.
Другая сторона этой проблемы по М.Минскому: каким образом
из памяти робота можно удалить последствия
некоторого действия, если ситуация изменилась и это
действие отменяется.
Или: каким образом машинная программа определяет, какие
из известных ему сведений робот должен пересмотреть,
когда он намечает совершить то или иное действие?
Решение проблемы фрейма

Динамические экспертные системы
(В.Л.Стефанюк). Используя
квазистатическую архитектуру, такая
система на каждом шаге рекурсии
пересматривает все данные и
вовлеченные в процесс вывода правила
Искусственность проблемы
фрейма в робототехнике
Робот, по определению, осуществляет постоянное
взаимодействие с окружающей средой, планируя и
осуществляя свою деятельность в соответствии с
сигналами рецепторов, т.е. робот является в этом смысле
динамической системой.
Замечание:
 Проблема фрейма может рассматриваться с точки зрения
функционирования внутренней модели мира робота,
однако вопрос устройства этой модели да и
целесообразности ее наличия требует отдельного
рассмотрения.
Центральные моторные
программы
Трехуровневая структура управления:
 Верхний уровень – анализ ситуации
 Средний уровень – программное
движение (желаемый закон изменения
обобщенных координат исполнительных
механизмов)
 Нижний – определение управления
исполнительными механизмами (уровень
движения) - ЦМП
Эффекторные функции
«В процессе эволюции соматической системы
определяющим звеном являются всё же
эффекторные функции. Судьбу индивидуума
решают его действия. Рецепторика здесь
представляет собой уже подсобную функцию.
<…> Нигде в филогенезе созерцание мира не
фигурирует как самоцель. Они <рецепторы>
процессуально обеспечивают полноценную
координированную работу эффекторов»
Бернштейн
Уровень движения
Н.А. Бернштейн, 30-40-е гг. XX века. Идея многоуровневого
иерархического управления применительно к построению
движений (пирамидная двигательная система).
Управление движением не только по типу непрерывной
коррекции, но и через механизм центральных моторных
программ.
Обратная афферентация в деятельности организма
перестает играть существенную роль. Обратная связь
становится нужной лишь при переделке, изменении навыка.
П1. Двигательные функции
таракана

Генератор локомоторного ритма у
Центральные
таракана командные нейроны
Волосковые
рецепторы
Генератор
разрядов для
сгибателей
Н
С
Сгибание
(перенос ноги)
Р
Разгибание
(опора)
Рецепторы растяжения
С
Р
П2. Поведение виноградной
улитки
Схема
Зрение
«форма»
управления
пищевым «Размер»
поведением
«пища
«движение к
обнаружена»
пище»
«пища
съедобна»
«поедание
пищи»
Двигательные
мускулы
«Яркость»
Осязание
Химическое
чувство
Сенсорные нейроны
Командные нейроны
Мускулы
глотки
возбуждающие связи
тормозящие связи
Общая модульная структура


Отсутствие инженерной
культуры?
Вера в безграничные
возможности ВТ?
E
45
Вывод: все должно
быть максимально
модульно. Каждый
модуль реализует
свою ЦМП.
------------------------------
Пальцы левой
кисти
Шея
ЦМ
Правая рука
Левая нога
Постановка тестовой задачи
При наличии сигнала голода робот должен
искать источник света (кормушку), а при
отсутствии голода – убегать от источника.
ЛВ  Фп  S
ЛН  Фл  R


ПВ  Фл  S
ПН  Фп  R
S = L  H, R = L  H, L = Фп  Фл
Здесь:
ЛВ, ЛН, ПВ, ПН – сигналы управления
эффекторами (двигателями.
Фл и Фп – сигналы от левого и правого
фотодатчиков, H – сигнал «голод».
Производные сигналы: S и R – сигналы
включения процедур «поиск» и «убегание», L –
сигнал наличия света.
Реализация схемы поведения

Логическая и функциональная схемы
командные нейроны
H
Голод
Фп
1
L
Фп
поиск
&
&
ЛВ
&
ЛН
&
ПВ
Фп
Свет
Фл
Фл
H
голод
1
&
L
убегание
Фл
Поиск
Убег.
R
Фл
&
Фп
ПН
Фп
Фп
Л
П
Фл
Фл
ЛВ ЛН
конечные эффекторы
ПВ ПН
Обучение
Система, реализующая простое управление – согласованную
работу двигателей для движения направо или налево
командный нейрон
Уровень 0
К
«0»
«1»
Прав.двиг.
Лев.двиг.
Л
«0»
Уровень 1
П
«1»
«0»
«1»
конечные эффекторы
ЛВ
ЛН
Основной вопрос – кого и за что
наказывать
ПВ
ПН
Уровень 2
Локальный характер процедуры
обучения:
• в роли учителя выступает
непосредственный родитель в
структуре иерархии (как в армии)
• обучающее воздействие
распространяется сверху вниз
U-модули
Yeff – эффекторные сигналы, Ystd – обучающие
сигналы,
Xans – отклик подчиненного U-модуля,
Imod – вход информации о модели поведения
подчиненного U-модуля.
Модель U-модуля:
Xctl
Yeff
C
Xrec
Y = F(X, C, M)
Xstd
Y = <Yeff, Ystd>,
X = <Xctl , Xrec, Xstd, Imod, Xans>,
Ystd = f(M, Xans),
Разрешение
M = M(Imod, Xans)
обучения
M. Модель
обучаемого
Imod
Xans
Ystd
Эксперименты

Переобучение локомоторной системы
Выводы
Из очевидного требования способности к самосохранению
робота следуют:
 Распределенность архитектуры.
 Нарушение принципов иерархичности управления.
 Вторичность интеллектуальных функций робота по
отношению к базовым рефлекторным функциям.
Следствие - естественная «биологичность» архитектуры:
 Модульность
 Естественность методов решения задач и естественность
общения робота с внешним миром
РЭКС
РЭКС - Робот-экскурсовод
Download