Карпов Валерий Эдуардович Архитектура интеллектуальных роботов Некоторые общие замечания Лаборатория робототехники и искусственного интеллекта Политехнического музея Предварительный посыл Робот - это устройство, действующее в реальной физической среде. Отсюда очевидным требованием к роботу является его способность к самосохранению не только и не столько его функций, но робота, как устройства. Инстинкт самосохранения. Следствия этого требования Распределенность архитектуры системы как минимум на функциональном уровне (модульность). Нарушение привычных в технике принципов иерархичности управления. Вторичность интеллектуальных функций робота (что бы под этим ни понималось) по сравнению с базовым набором рефлекторных функций. Распределенность архитектуры На функциональном уровне - выделение в некой единой системе (мозг) управляющих областей На конструктивном уровне - совокупность управляющих модулей -----------------------------------------------Мозг. Локализация участков. Связи. Нарушение иерархичности Внешняя среда Р е ц е п т о р ы Выработка Принятие Оценка решения управляющего воздействия Э ф ф е к т о р ы Внешняя среда Принятие решения Внешняя среда Первичные рецепторы Анализ и выделение признаков Внешняя среда Выработка управляющих воздействий Эффекторы Иерархия потоков и стимул-реактивные связи Технические аспекты рефлекторных связей СУ Контроллер двигателя Стоп к СУ Датчик препятствия Каким бы интеллектуальным ни было УУ, результаты его управления будут вторичными относительно сигнала «стоп» датчика препятствий Реальная картина На самом деле – немного сложнее wупр xупр управление Мотонейрон Y wз xз запрет От датчика препятствий 0, wз x з w упр x упр Y x упр , wз x з w упр x упр Принцип естественности архитектуры Под естественностью архитектуры системы понимается прежде всего «биологичность»: Модульность Естественность методов решения задач и естественность общения робота с внешним миром Модульность Совокупность сколь угодно сложно и «интеллектуально» устроенных, но имеющих простой входной интерфейс узлов. Решение локальных задач управления (центральные моторные программы). Естественность методов решения задач Проблема фрейма. Маккарти и Хейес, 1969 г. Главное препятствие на пути прогресса в области ИИ: Дано: 1. Кубик А имеет черный цвет. 2. Кубики А и Б исходно расположены по отдельности друг от друга. Верно ли утверждение, что если кубик А положить на кубик Б, то кубик А по-прежнему останется черным. Решение проблемы фрейма В рамках ситуационного исчисления для получения требуется наличие дополнительного утверждения: «Кубик А не меняет своего цвета при такой операции» Это - тяжелая задача для систем ИИ, т.к. число подобных утверждений может быть весьма велико. Решение проблемы фрейма «Естественный закон инерции»: изменения в системе не происходят до тех пор пока они не оговариваются в системе заранее. Другая сторона этой проблемы по М.Минскому: каким образом из памяти робота можно удалить последствия некоторого действия, если ситуация изменилась и это действие отменяется. Или: каким образом машинная программа определяет, какие из известных ему сведений робот должен пересмотреть, когда он намечает совершить то или иное действие? Решение проблемы фрейма Динамические экспертные системы (В.Л.Стефанюк). Используя квазистатическую архитектуру, такая система на каждом шаге рекурсии пересматривает все данные и вовлеченные в процесс вывода правила Искусственность проблемы фрейма в робототехнике Робот, по определению, осуществляет постоянное взаимодействие с окружающей средой, планируя и осуществляя свою деятельность в соответствии с сигналами рецепторов, т.е. робот является в этом смысле динамической системой. Замечание: Проблема фрейма может рассматриваться с точки зрения функционирования внутренней модели мира робота, однако вопрос устройства этой модели да и целесообразности ее наличия требует отдельного рассмотрения. Центральные моторные программы Трехуровневая структура управления: Верхний уровень – анализ ситуации Средний уровень – программное движение (желаемый закон изменения обобщенных координат исполнительных механизмов) Нижний – определение управления исполнительными механизмами (уровень движения) - ЦМП Эффекторные функции «В процессе эволюции соматической системы определяющим звеном являются всё же эффекторные функции. Судьбу индивидуума решают его действия. Рецепторика здесь представляет собой уже подсобную функцию. <…> Нигде в филогенезе созерцание мира не фигурирует как самоцель. Они <рецепторы> процессуально обеспечивают полноценную координированную работу эффекторов» Бернштейн Уровень движения Н.А. Бернштейн, 30-40-е гг. XX века. Идея многоуровневого иерархического управления применительно к построению движений (пирамидная двигательная система). Управление движением не только по типу непрерывной коррекции, но и через механизм центральных моторных программ. Обратная афферентация в деятельности организма перестает играть существенную роль. Обратная связь становится нужной лишь при переделке, изменении навыка. П1. Двигательные функции таракана Генератор локомоторного ритма у Центральные таракана командные нейроны Волосковые рецепторы Генератор разрядов для сгибателей Н С Сгибание (перенос ноги) Р Разгибание (опора) Рецепторы растяжения С Р П2. Поведение виноградной улитки Схема Зрение «форма» управления пищевым «Размер» поведением «пища «движение к обнаружена» пище» «пища съедобна» «поедание пищи» Двигательные мускулы «Яркость» Осязание Химическое чувство Сенсорные нейроны Командные нейроны Мускулы глотки возбуждающие связи тормозящие связи Общая модульная структура Отсутствие инженерной культуры? Вера в безграничные возможности ВТ? E 45 Вывод: все должно быть максимально модульно. Каждый модуль реализует свою ЦМП. ------------------------------ Пальцы левой кисти Шея ЦМ Правая рука Левая нога Постановка тестовой задачи При наличии сигнала голода робот должен искать источник света (кормушку), а при отсутствии голода – убегать от источника. ЛВ Фп S ЛН Фл R ПВ Фл S ПН Фп R S = L H, R = L H, L = Фп Фл Здесь: ЛВ, ЛН, ПВ, ПН – сигналы управления эффекторами (двигателями. Фл и Фп – сигналы от левого и правого фотодатчиков, H – сигнал «голод». Производные сигналы: S и R – сигналы включения процедур «поиск» и «убегание», L – сигнал наличия света. Реализация схемы поведения Логическая и функциональная схемы командные нейроны H Голод Фп 1 L Фп поиск & & ЛВ & ЛН & ПВ Фп Свет Фл Фл H голод 1 & L убегание Фл Поиск Убег. R Фл & Фп ПН Фп Фп Л П Фл Фл ЛВ ЛН конечные эффекторы ПВ ПН Обучение Система, реализующая простое управление – согласованную работу двигателей для движения направо или налево командный нейрон Уровень 0 К «0» «1» Прав.двиг. Лев.двиг. Л «0» Уровень 1 П «1» «0» «1» конечные эффекторы ЛВ ЛН Основной вопрос – кого и за что наказывать ПВ ПН Уровень 2 Локальный характер процедуры обучения: • в роли учителя выступает непосредственный родитель в структуре иерархии (как в армии) • обучающее воздействие распространяется сверху вниз U-модули Yeff – эффекторные сигналы, Ystd – обучающие сигналы, Xans – отклик подчиненного U-модуля, Imod – вход информации о модели поведения подчиненного U-модуля. Модель U-модуля: Xctl Yeff C Xrec Y = F(X, C, M) Xstd Y = <Yeff, Ystd>, X = <Xctl , Xrec, Xstd, Imod, Xans>, Ystd = f(M, Xans), Разрешение M = M(Imod, Xans) обучения M. Модель обучаемого Imod Xans Ystd Эксперименты Переобучение локомоторной системы Выводы Из очевидного требования способности к самосохранению робота следуют: Распределенность архитектуры. Нарушение принципов иерархичности управления. Вторичность интеллектуальных функций робота по отношению к базовым рефлекторным функциям. Следствие - естественная «биологичность» архитектуры: Модульность Естественность методов решения задач и естественность общения робота с внешним миром РЭКС РЭКС - Робот-экскурсовод