Лекция 8. Позиционные игры (часть 2) 13.11.2014 1 8.1. Позиционные игры с полной информацией 8.2. Решение позиционных игр с полной информацией 2 2-й ход 1-й ход P(x=1) = 0.5 1?2 1 2 P(x=2) = 0.5 3-й ход 1?2 1?2 M (X, Y, Z) 3 Функция М(X, Y, Z) определяется следующим образом М(1, 1, 1) = -2 М(1, 1, 2) = -1 М(1, 2, 1) = 3 М(1, 2, 2) = -4 М(2, 1, 1) = 5 М(2, 1, 2) = 2 М(2, 2, 1) = 2 М(2, 2, 2) = 6 4 Графическое изображение игры – Пример 5 1 2 1 2 2 1 2 2 2 2 1 1 2 1 1 2 2 1 1 0 2 5 Нормализация игры – Пример 5 Стратегии 1-го игрока 1-я стратегия – выбирать Y=1, не взирая на X, 2-я стратегия – выбирать Y=2, не взирая на X, 3-я стратегия – выбирать Y=X, 4-я стратегия – выбирать Y=1, если X=2, и наоборот. Стратегии 2-го игрока 1-я стратегия – выбирать Z=1, не взирая на Y, 2-я стратегия – выбирать Z=2, не взирая на Y, 3-я стратегия – выбирать Z=Y, 4-я стратегия – выбирать Z=1, если Y=2, и наоборот. 6 Платежная матрица – Пример 5 Z=1 Y=1 Y=X Y≠X Y=2 Z=Y Z≠Y Z=2 1,5 Если (Х=1) и (Y=1) и (Z=1), то М(1, 1, 1) = -2 Если (Х=2) и (Y=1) и (Z=1), то М(2, 1, 1) = 5 Выигрыш 1-го игрока = 0,5*М(1,1,1)+0,5*М(2,1,1) = 1,5 7 Расчет элементов платежной матрицы – Пример 5 Y=1 Z=1 =0,5*M(1,1,1)+0,5*М(2,1,1) = 0,5*(-2)+0,5*5=1,5 Y=X Z=1 =0,5*M(1,1,1)+0,5*М(2,2,1) = 0,5*(-2)+0,5*2=0 Y≠X Z=1 =0,5*M(1,2,1)+0,5*М(2,1,1) = 0,5*3+0,5*5=4 Y=2 Z=1 =0,5*M(1,2,1)+0,5*М(2,2,1) = 0,5*3+0,5*2=2,5 Y=1 Z=Y =0,5*M(1,1,1)+0,5*М(2,1,1) = 0,5*(-2)+0,5*5=1,5 Y=X Z=Y =0,5*M(1,1,1)+0,5*М(2,2,2) = 0,5*(-2)+0,5*6=2 Y≠X Z=Y =0,5*M(1,2,2)+0,5*М(2,1,1) = 0,5*(-4)+0,5*5=0,5 Y=2 Z=Y =0,5*M(1,2,2)+0,5*М(2,2,2) = 0,5*(-4)+0,5*6=1 Y=1 Z≠Y =0,5*M(1,1,2)+0,5*М(2,1,2) = 0,5*(-1)+0,5*2=0,5 Y=X Z≠Y =0,5*M(1,1,2)+0,5*М(2,2,1) = 0,5*(-1)+0,5*2=0,5 Y≠X Z≠Y =0,5*M(1,2,1)+0,5*М(2,1,2) = 0,5*3+0,5*2=2,5 Y=2 Z≠Y =0,5*M(1,2,1)+0,5*М(2,2,1) = 0,5*3+0,5*2=2,5 Y=1 Z=2 =0,5*M(1,1,2)+0,5*М(2,1,2) = 0,5*(-1)+0,5*2=0,5 Y=X Z=2 =0,5*M(1,1,2)+0,5*М(2,2,2) = 0,5*(-1)+0,5*6=2,5 Y≠X Z=2 =0,5*M(1,2,2)+0,5*М(2,1,2) = 0,5*(-4)+0,5*2=-1 Y=2 Z=2 =0,5*M(1,2,2)+0,5*М(2,2,2) = 0,5*(-4)+0,5*6=1 8 Платежная матрица – Пример 5 Y=1 Y=X Y≠X Y=2 Z=1 Z=Y Z≠Y Z=2 1,5 1,5 0,5 0,5 0 2 0,5 2,5 4 0,5 2,5 -1 2,5 1 2,5 1 9 При составлении информационных множеств, следует учесть: 1. В одно информационное множество могут входить узлы, относящиеся только к одному игроку. 2. Любая ветвь дерева, отображающая партию игры, не должна пересекать одно и то же информационное множество больше одного раза. 10 Графическое изображение игры – Ошибки 1 2 1 2 1 1 1 1 2 2 1 1 1 1 2 2 2 2 1 1 2 11 8.1. Позиционные игры с полной информацией Позиционная игра называется игрой с полной информацией, если в любой точке ее партии игрок, делающий ход, точно знает, какие выборы были сделаны раньше. В графическом изображении каждый узел такой игры будет представлять собой отдельное информационное множество. 12 10.1. Позиционные игры с полной информацией Любая игра с полной информацией имеет седловую точку. 4 -2 3 -2 2 2 1 13 10.1. Позиционные игры с полной информацией Выбрать 1 Выбрать 2 Выбрать Y=X Выбрать 1 4 -2 4 Выбрать 2 -2 4 -2 4 -2 -2 -2 3 3 -2 -2 4 3 4 -2 3 3 Выбрать Y≠X -2 -2 Первый игрок моет выбирать любую стратегию. Второй игрок всегда выбирать Y≠X. Цена игры в этом случае будет равна -2. 14 10.1. Позиционные игры с полной информацией Допустим, что второй игрок не знает, что выбрал первый 4 -2 3 -2 2 2 1 15 10.1. Позиционные игры с полной информацией Решение позиционной игры с неполной информацией Выбрать 1 Выбрать 2 Выбрать 1 Выбрать 2 4 -2 -2 -2 3 -2 4 3 4 -2 -2 3 3 ( 2 ) 5 6 p1 p2 4 3 ( 2 ) ( 2 ) 11 11 3 ( 2 ) 5 6 q1 q2 4 3 ( 2 ) ( 2 ) 11 11 4 * 3 ( 2 )* ( 2 ) 8 V 4 3 ( 2 ) ( 2 ) 11 16 10.2. Решение позиционных игр с полной информацией Решение позиционной игры с полной информацией можно находить в соответствии с теоремой Куна, утверждающей, что данная игра разрешима по доминированию, т. е. для каждого из игроков имеются доминирующие стратегии, которые и необходимо применять. 17 10.2. Решение позиционных игр с полной информацией Пример «Выборы с правом вето» Игроки Кандидаты в президенты 18 10.2. Решение позиционных игр с полной информацией Пример «Выборы с правом вето» Накладывает вето Накладывает вето Накладывает вето Победитель определен 19 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева 4 3 3 4 2 3 2 4 3 4 4 4 3 4 3 2 2 3 3 3 3 2 1 4 2 4 1 2 1 3 2 3 1 2 1 4 3 4 4 2 3 3 2 1 2 3 3 4 1 3 3 2 1 1 3 3 4 3 4 1 2 1 3 2 2 2 1 3 1 3 1 2 3 3 2 3 2 1 1 1 4 20 10.2. Решение позиционных игр с полной информацией Известны также функции выигрышей игроков, в зависимости от того какой президент будет выбран U1=(5; 4; 3; 7) U2=(6; 7; 5; 8) U3=(3; 8; 5; 4) Поскольку из всех вершин, предшествующих конечным, ходит игрок 3, то остальные игроки, зная его функцию выигрыша U3, могут легко предвидеть его решения. 21 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши третьего игрока 4 4 3 5 4 3 4 8 5 2 3 8 4 2 4 5 4 3 4 4 4 3 4 3 2 2 3 3 3 3 2 3 4 1 4 8 4 2 4 3 8 1 2 3 5 1 3 2 5 2 3 3 8 1 2 3 1 4 3 4 4 2 3 3 2 1 2 3 3 4 1 3 3 2 1 3 5 1 3 3 4 3 4 1 2 1 3 2 2 2 1 3 1 3 1 2 3 3 2 3 2 1 1 1 4 22 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши третьего игрока 5 3 8 2 8 2 5 4 3 4 4 4 3 4 3 3 3 3 2 1 1 4 3 3 4 8 4 2 4 1 3 3 2 5 3 3 1 4 3 3 3 4 1 2 8 5 2 3 1 2 2 8 2 1 3 1 3 1 2 3 3 2 3 2 1 8 2 1 4 23 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши второго игрока 5 3 7 2 7 2 5 8 3 4 4 4 3 4 3 3 3 3 2 1 1 4 3 3 4 7 8 2 4 1 3 3 2 5 3 3 1 4 3 3 3 4 1 2 7 5 2 3 1 2 2 7 2 1 3 3 1 3 1 2 3 3 2 3 2 1 7 2 1 4 24 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши второго игрока 7 2 7 2 4 3 3 8 4 1 3 3 1 2 3 2 3 2 1 1 3 2 2 7 2 3 3 3 4 7 2 1 3 3 2 8 4 1 4 25 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши первого игрока 4 4 7 7 4 4 2 2 4 4 2 2 4 3 3 1 3 3 3 2 1 3 3 4 1 3 2 2 3 1 2 3 2 3 2 1 3 1 4 26 10.2. Решение позиционных игр с полной информацией Представление игры в виде дерева – выигрыши первого игрока 7 7 4 4 1 1 3 3 3 2 2 2 3 2 1 Первый игрок на первом ходе отклонит 2 или 3 претендента. Второй игрок также отклонит 2 или 3 претендента, в зависимости от того какого претендента отклонил первый игрок. Третий игрок отклонит первого претендента. В итоге выиграет четвертый претендент. 27 10.2. Решение позиционных игр с полной информацией Алгоритм решения игр с полной информацией, в соответствии с теоремой Куна, состоит в том, что начиная с последнего хода, последовательно отбрасываются заведомо худшие для игрока, делающего этот ход, решения. В итоге получаем решение в чистых стратегиях. 28