ЧАСТНЫЕ МЕХАНИЗМЫ ЛИДЕРСТВА И САМОСОЗНАНИЯ В ГРУППОВОЙ РОБОТОТЕХНИКЕ Карпов В.Э.

advertisement
Карпов В.Э.
ЧАСТНЫЕ МЕХАНИЗМЫ ЛИДЕРСТВА
И САМОСОЗНАНИЯ В ГРУППОВОЙ
РОБОТОТЕХНИКЕ
vkarpov@hse.ru
МИЭМ НИУ ВШЭ, Москва
1
Содержательная постановка задачи
Группа роботов трех типов: "жертва", "охотники" и "нейтралы".
•
«Охотники".
1. Догнать жертву, причем желательно догнать в составе некоторой группы (стаи).
2. Избегать нахождения рядом с "нейтралом".
•
•
1.
2.
«Жертва". Убегать от охотников
«Нейтралы". Живут сами по себе.
Внешне - типичная игра преследования, обремененная дополнительными
персонажами.
Важно, что персонажами (игроками) являются реальные технические
устройства – роботы.
2
Постановка задачи
•
•
•
•
•
•
•
Тезис 1: групповое (коллективное) поведение роботов невозможно в том
случае, когда сами роботы "примитивны" (групповое поведение – это некий
синергетический эффект, возникающий в группе сложно устроенных особей).
Роботу необходимо понимать действия других членов группы (или иметь хоть
какую-нибудь информацию об этом).
Тезис 2 ("Тезис групповой робототехники"): решение сложных задач может быть
получено совокупностью простых роботов.
… синергетические эффекты и проч. При этом, чем больше эта группа, тем
более сложные задачи она способна решать.
С технической точки зрения: если роботов должно быть много, то они должны
быть как можно проще и дешевле.
---------------------------------------------------------------------------------------------------------Решение поставленной задачи именно с точки зрения групповой робототехники,
т.е. совокупностью простых устройств.
Основная задача: попытка реализации таких нетривиальных для групповой
робототехники механизмов, как формирование лидера в коллективе и
формирование у робота некоторой модели субъективного Я применительно к
его модели мира.
Эти механизмы действительно реализуемы простыми средствами и имеют
реальное практическое значение.
3
Устройство робота
• 4 датчика: вперед (F), налево (L), направо (R) и назад (B).
• Определение типов объектов (других игроков), находящихся
рядом с ним: "жертва", "охотник" и "нейтрал".
• Действия: повороты на 90, движение вперед, назад и останов.
• Робот прост и дешев  можно создать группу из десятка
подобного рода устройств.
B
R
L
F
4
Самосознание
Пусть эффективность решения задач организмом
(роботом, животным) зависит от степени его –
животного – организации. Если принять этот
тезис, то получим следующую цепочку
рассуждений:
1. Общепринято, что ИС (ИР в особенности)
должна содержать модель мира, как
внутреннего, так и внешнего. Эта модель
отвечает за процедуру прогнозирования
развития ситуации и позволяет ИС работать в
условиях неполноты информации о среде
обитания.
2. С понятием модели мира теснейшим образом
связано то, что называется самосознанием
или субъективным Я (С.Я.). Без наличия С.Я.
модель мира теряет смысл.
Итак, модель мира, включающая С.Я., – это
прерогатива сложной, интеллектуальной
системы.
Тем не менее, рассмотрим возможность
реализации этих механизмов простыми
средствами, допускающими их воплощение на
скромном программно-аппаратном уровне
(основная парадигма ГР).
5
С.Я. и робот
Для робота С.Я. может рассматриваться в двух аспектах:
•
"Я" с точки зрения сенсорной системы;
•
"Я" как компонента модели, описывающей отношения между объектами окружающего мира.
С.Я. с точки зрения сенсорной системы.
Большинство сенсоров определяют сигнал
относительно робота. В этом смысле сенсорная
система неявным, но естественным образом
оперирует понятием "Я".
•
Смысл С.Я. с точки зрения робота: "Я", как
элемент модели мира, должно использоваться
для прогнозирования ситуации. Это
прогнозирование рассматривается в самом
общем смысле и сводится к моделированию
развития ситуации.
•
Видимо, наличие такой модели должно помочь
"жертве" более успешно избегать опасностей.
Описание модели мира. Модель мира - это способ
отображения в памяти ИС знаний о внешней
среде. Сведем эти знания к описанию отношений
между объектами мира, в котором живет робот:
•
•
•
Всякое действие робота должно быть
отображено в модели мира.
Совершая некое действие, происходит
изменение отношений между объектами.
Одним из объектов является сам робот. Это и
есть С.Я.
l
F
w
h
L
R
w
f
B
h
f
Типы распознаваемых
(идентифицируемых) роботом
объектов: w, l, h и f.
Спереди робот видит объект типа l, справа
– объекты типа w и f, слева - объекты
типа w и h, а сзади – объекты типа h и
f.
6
Отношения и операторы
l
Для робота все происходящее в окружающем мире
описывается отношениями между его датчиками и
наблюдаемыми объектами.
F
w
h
•
•
•
h
w
F 0
B 0
R
L 1

R 1
Описание изменений не с точки зрения "объект-датчик", а
с точки зрения лишь датчиков, т.е. с точки зрения робота.
l
F
L
R
w
h
R
B
w
f
l h f
1 0 0
0 1 1
0 1 0

0 0 1
F B L R
F 1.5 0 0 0
B  0 0.5 0 0
Mf  
L 0
0 1 0


R 0
0 0 1
F
F
L
B L R
0 1 0
0 0 1
1 0 0

0 0 0
f
l
B
w
h
F
F 0
B 0
Mr  
L 0

R 1
l
w
f
R
B
Элемент матрицы rij: датчик i определяет объект типа j на
расстоянии rij. Это – наблюдаемая роботом картина мира.
Совершение действия изменение картины мира, т.е.
изменяются отношения между датчиками робота и
объектами.
Операторы
• Поворот направо (на 90) Mr
(mij: то, что наблюдалось датчиком i, при
повороте направо будет наблюдаться
датчиком j. Например, то, что было впереди
(строка F), окажется при повороте слева
(столбец L)).
• Поворот налево Ml.=MrT
• Шаг вперед MF
• …
L
w
f
w
h
L
R
B
w
f
7
h
f
h
f
h
f
Сложные действия
Если в момент времени t наблюдаемая картина мира описывается отношением
R(t), то, совершая действие Mi, наблюдаемая картина изменится следующим
образом:
R(t  1)  M i R
T
Результаты поворота налево, направо и шага вперед:
Rr  M r  R
Rl  M l  R
T
T
w
F 1
B 1
Rl 
L 0

R 0
l h f
w
0 1 0
F 1
0 0 1
B 1
Rr 
0 1 1
L 0


1 0 0
R 0
l h f
w l
0 0 1
F 0 0.66
0 1 0
B 0
0
Rf 
1 0 0
L 1
0


0 1 1
R 1
0
Rf  M f  R
T
h f
0 0
2 2
1 0

0 1
Сложное действие "поворот направо" + "шаг вперед":
Rr  f  M f (M r  R)
T
T
Rr  f
w
F 0.66
B  2

L 0

R 0
l h
f
0 0 0.66
0 2
0 
1 0
0 

0 1
1 
8
Субъективное «Я»
• Используя последовательность преобразований начальной
ситуации, эти операции позволяют определить состояние
робота, совершающего соответствующие действия.
• Все это внешне похоже на последовательности преобразования
координат при геометрических построениях, однако здесь мы
имеем дело с некоторой точкой отсчета, связанной с самим
роботом – с тем самым субъективным Я.
Я-концепция (Я-образ, Образ «Я») — система представлений индивида о самом себе,
осознаваемая, рефлексивная часть личности. Эти представления о себе самом в большей
или меньшей степени осознаны и обладают относительной устойчивостью.
В психологии самосознание понимается как психический феномен, осознание человеком себя
в качестве субъекта деятельности, в результате которого представления человека о самом
себе складываются в мысленный «образ-Я».
Значение самосознания
•
Самосознание способствует достижению внутренней согласованности личности,
тождественности самому себе в прошлом, настоящем и будущем.
•
Определяет характер и особенности интерпретации приобретённого опыта.
•
Служит источником ожиданий относительно себя и своего поведения.
Функции самосознания
•
Самопознание — получение информации о себе.
•
Эмоционально-ценностное отношение к себе.
•
Саморегуляция поведения.
9
Работа с моделью
• В заданной модели мира С.Я. фигурирует неявно.
• Далее все рассуждения основываются на процедуре оценки
текущей ситуации
 ( R(t ), C (t ))
Здесь C(t) – некий текущий контекст, в рамках которого и происходит оценка ситуации (для
"жертвы" оценка зависит от того, сколько вокруг нее "охотников", а "охотнику" хорошо,
когда: рядом находится "жертва", собратья по стае и нет "нейтралов").
С практической точки зрения, наиболее приемлемыми вариантами прогнозирования развития
ситуации являются:
1. Построение дерева возможных вариантов действий. Здесь речь идет о генерации возможных
путей на некоторую глубину. Далее происходит оценка и выбор оптимального пути
(последовательности действий). Вычислительная (переборная) сложность очевидна.
2. Использование "жадных" (локально-оптимальных) алгоритмов. Здесь осуществляется выбор
следующего наилучшего шага.
Применяя подобную схему к поведению "жертвы", мы получим следующую последовательность:
1.
2.
3.
4.
Робот-жертва, получая информацию от своих сенсоров, формирует описание текущей ситуации в виде
отношения R(t).
Перебираются все возможные действия на 1-2 шага в глубину.
Результирующее (прогнозируемое) отношение R(t+1) оценивается.
Исходя из результатов оценки окончательно выбирается действие, приводящее к наиболее
благоприятному исходу.
10
Два замечания
1. Сама схема формирования модели мира детерминирована.
Случайность (неопределенность) возникает естественным
образом, как следствие поведения других игроков, ошибок
управления, восприятия и проч. Для этого и нужен постоянный
пересчет плана/прогноза. Кроме того, модель мира вовсе не
обязана быть стохастической (при планировании и/или
прогнозировании в нашей повседневной жизни мы можем не
оперировать понятием вероятности).
2. Очевидно, что описанную выше схему поведения можно
реализовывать совершенно различными способами. Та же
простейшая система продукций является не худшим вариантом.
Предложенная схема – это просто некий вариант, одна из
возможных точек зрения на то, как могла бы выглядеть система
управления. Речь идет лишь о некой системе координат, начало
которой связано именно с роботом. Отсюда и появляется
возможность рассуждений и описания поведения именно с
позиций С.Я. самого робота.
11
Лидерство
Поведение "охотников":
(I) если рядом жертва, то преследовать ее;
(II) избегать "нейтралов";
(III) держаться друг друга (охотиться стаей) (*).
•
•
•
Самое "проблемное" - правило (III). Если рядом нет "жертвы" или "нейтрала", то
"охотники" будут двигаться друг к другу и образовавшаяся группа (стая) просто останется
на месте.
В такой ситуации и нужен лидер ("вожак"), способный повести стаю хоть куда-нибудь.
Существует ряд общих схем формирования сознания "вожака", в т.ч. - связанные с
формированием коллектива роботов (Редько В.Г.). Этот "вожак" может появиться в
коллективе (стае) практически одинаковых роботов. При этом если "вожак" погибает, то в
стае появляется новый "вожак". Подразумевается, что в такой стае смена лидера
определяется психологией животных.
Примем феномен лидерства в готовом виде. С практической точки зрения он будет реализован
так:
12
Реализация механизма лидерства
1.
2.
Каждый робот-охотник обладает некоторым "весом". При этом он
способен оценить "вес" встреченного собрата.
При встрече двух "охотников", происходит их взаимное оценивание.
Тот робот, который "сильнее", становится лидером и начинает
движение в произвольном направлении (поиск). А тот робот, который
слабее, просто следует за своим лидером (правило (III)).
Реализация подобной схемы образования лидера позволяет роботамохотникам образовывать локальные стаи и двигаться согласованно.
Естественно, лидер может поменяться (встретится более сильный),
однако общая тенденция останется прежней.
13
Вычислительные эксперименты
На модельном уровне "охотники" успешно
загоняли "жертву", а последняя не менее
успешно убегала от своих преследователей,
прячась под защиту "нейтралов".
14
Натурные эксперименты
•
•
•
•
5 "охотников", 1 "нейтрал", 1 "жертва"
Результаты натурных экспериментов менее внятны по сравнению с
вычислительными.
Излишний "лаконизм" конструкции роботов не позволял в полной мере
определить состояние модели мира той же жертвы.
В большей степени эксперименты заключались в наблюдениях за
поведением игроков (т.н. принцип редукционизма: каждому внешнему
проявлению ставится в соответствие ненаблюдаемое внутренне
состояние ВНД).
15
Заключение
Возможно, что С.Я., как образ (модель) субъекта в окружающем мире, может быть
связано с коллективным аспектом существования. Однако механизмы, связанные с
коллективным (социальным) поведением, в т.ч. – и самосознание - могут
сформироваться только у сложной системы. Самосознание - это своего рода некое
эмерджентное свойство сложной системы.
Рассмотренные выше схемы больше похожи на некоторое трюкачество, искусственные
построения, введенные в угоду решения некоторой частной задачи.
Формирования эффективного управления можно добиться и иными путями, вовсе без
С.Я., на уровне стимул-реактивных реакций. Если говорить о лидерстве, то:
1.
2.
–
–
3.
1.
2.
имеется множество моделей децентрализованного управления (Варшавский, Поспелов, ГаазеРапопорт).
ранги рефлексии в играх автоматов (Цетлин). Там нет явного понятия С.Я., но, тем не менее,
автоматные модели превосходно справляются со своими задачами.
Специфика решаемых задач требует наличия механизма самообучения или, по
крайней мере, – адаптивной параметризации роботов. Это связано, как минимум, с тем,
что мы имеем дело с реальными объектами, работающими в физической среде. Если
робот умеет идентифицировать объекты, то возможно его самообучение, т.е.
формирование Mi. Например, Mi может представлять собой формируемую
стохастическую матрицу, соответствующую преобразованиям отношений при
совершении действия i.
------------------------------------------------------------------------------------Создание аппаратного базиса для проведение исследования в области ГР и
апробирование его на примере решения некоторых задач.
Имитация реализации сложных механизмов простыми средствами (технически
значимая реализация).
Главный вопрос:
Если Р=Р(Д, Э, СУ), то как определяются границы области компетентности робота в
зависимости от (Д, Э, СУ)
16
Download