Лекция 4. Решение матричных игр mxn 02.10.2014 1

advertisement
Лекция 4.
Решение матричных игр mxn
02.10.2014
1
4.1 Метод приближенного определения
решения матричной игры (метод
Робинсона-Брауна)
4.2 Сведение матричной игры к задаче
линейного программирования
2
Наличие седловой Да
точки
Игра решается в
чистых стратегиях
Нет
Размерность
матрицы 2×2
Да
Игра решается в
смешанных
стратегиях
аналитическим
или графическим
методом
Нет
2×2
Упрощение
матрицы
n×2
2×m
Нахождение
активных
стратегий
графическим
методом
Нет
Приближенный
метод решения или
сведение к задаче
линейного
программирования
3
Метод Робинсона-Брауна позволяет найти цену и
оптимальные стратегии игроков с некоторой степенью
точности. Метод основан на следующих интуитивных
соображениях:
•Два игрока, участвующие в игре, не знают оптимальной
стратегии. Каждый из них решает вести себя так, чтобы
максимально увеличить свой выигрыш, предполагая, что
другие партии будут похожи на предыдущие.
•Игра будет состоять из последовательности партий. Для
каждой партии этой последовательности можно вычислить
верхнюю и нижнюю границу цены игры, а также
приближенную оптимальную стратегию для каждого
игрока.
4
Стратегии 2-го
игрока
Стратегии 1-го
игрока
А
В
С
α
1
4
2
β
2
0
3
γ
3
1
0
5
№
Выбор
Выбор
Стратегии стратеги
1-м
и 2-м
игроком игроком
Суммарный
выигрыш
1-го игрока
А
1
А
α
1
Суммарный
выигрыш 2-го
игрока
В
4
С
2
α
1
β
2
γ
3
6
Партии 1-5
1
2
3
4
5
А
В
В
В
С
α
α
β
β
β
А
1
2
4
6
8
В
4
8
8
8
8
С
2
4
7
10
13
α
1
5
9
13
15
β
2
2
2
2
5
γ
3
4
5
6
6
7
Партии 6-10
6
7
8
9
10
С
С
С
А
А
β
γ
γ
γ
γ
А
10
13
16
19
22
В
8
9
10
11
12
С
16
16
16
16
16
α
17
19
21
22
23
β
8
11
14
16
18
γ
6
6
6
9
12
8
Партии 10-15
11
12
13
14
15
А
А
А
А
А
γ
γ
γ
γ
γ
А
25
28
31
34
37
В
13
14
15
16
17
С
16
16
16
16
16
α
24
25
26
27
28
β
20
22
24
26
28
γ
15
18
21
24
27
9


Партии 15-20
16
17
18
19
20
А
А
А
А
А
А
40
41
42
43
44
В
18
22
26
30
34
С
16
18
20
22
24
α
29
30
31
32
33
β
30
32
34
36
38
γ
30
33
36
39
42
10
По результатам находим строки с максимальными
суммарными выигрышами 1-го игрока, обозначим их V1i ,
i=1,2,….20:
V1i = {4, 8, 8, 10, 13, 16, 16, 16, 19, 22, 25, 28, 31, 34,
37, 40, 41, 42, 43, 44}.
Cтроки с минимальными суммарными
выигрышами 2-го игрока, обозначим их V2i ,
i=1,2,….20:
V2i = 1,2,2,2,5,6,6,9,12,15,18,21,24,27,29,30,31,32,33
11
Цена игры V удовлетворяет неравенству:
v 1i min { 4 , 8 , 8 , 10 , 13 , 16 , 16 , 16 , 19 , 22 , 25 , 28 , 31 , 34 , 37 , 40 , 41 , 42 , 43 , 44
min = i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 }=2
i
i
v 2i
min
 1,8125
i
i
1,8125 ≤ V ≤ 2
12
Обозначим для каждой партии i стратегию 1-го игрока,
x
i
=
x , x , x 
i
i
i
1
2
3
а второго игрока:
y
i
 i i , i 
=  y1 , y 2 y3 
Координаты векторов X и Y представляют собой
частоты партий - это правильные неотрицательные
дроби, у которых числитель – это количество
стратегий А,В,С, α,β,γ соответственно, а знаменатель
номер партии.
13
Для 20-ти партий получаем следующие
приближенные стратегии для 1-го и 2-го игроков.
x  1,0,0
1
x
2
1 1 

0
 2, 2, 
3
x
1 2 

0
 3, 3, 
… … … …
x
20
 13 3 4 
 ,

 20 20, 20 
y  1,0,0,
1
y  1,0,0
2
y
3
2 1 

0
 3, 3, 
… …… …
y
20
 6 4 10 


 20, 20, 20 
14
Ответ: 1,8125 ≤ V ≤ 2,
x
20
y
20
 13 3 4 
 ,

 20 20, 20 
стратегия 1-го игрока
 6 4 10 


 20, 20, 20 
стратегия 2-го игрока
15
Пусть матрица Аmxn не содержит седловой точки и имеет вид:
B1
B2
 Bj
A1
a11
a12
 a2 j
 a2 n
A2
a 21
a 22
 a2 j
 a2 n

Ai

ai 1 ai 2  ai j


Am
am 1
am 2  am j
 Bn
(1)
 ai n
 am n
Будем считать, что все элементы матрицы А неотрицательны (в
противном случае, можно ко всем элементам А добавить некоторое
достаточно большое число L, при этом цена игры изменится на эту же
величину). Будем считать, что V>0.
16
p   p1 , p2 ,, pm ,
q  q1 , q2 , qn  - оптимальные смешанные
стратегии 1-го и 2-го игроков
Пусть 2-й игрок примет свою чистую стратегию B j , а 1-й игрок - свою
оптимальную стратегию р. тогда средний выигрыш 1-го игрока будет
удовлетворять неравенствам:
a11 p1  a 21 p 2    ai 1 pi    a m 1 p m  V

a12 p1  a 22 p 2    ai 2 pi    a m 2 p m  V
 


a1 j p1  a 2 j p 2    ai j pi    a m j p m  V
 


a1 n p1  a 2 n p 2    ai n pi    a m n p m  V
17
Разделив левую и правую части неравенств (1) на
положительную величину V, получим:
a1 j
pi
pm
p1
p2
 a2 j
   ai j
  am j
 1,
V
V
V
V
j  1, n
Введем обозначения:
pi
 x i , i  1, m
V
(2)
18
Тогда (1) примет вид:
a11 x1  a 21 x 2    a m 1 x m  1

a12 x1  a 22 x 2    a m 2 x m  1

 
a x  a x    a x  1
2n 2
mn m
 1n 1
(3)
xi  0, i  1, m
19
Так как V - гарантированный выигрыш, то 1-й игрок
стремится его максимизировать. Следовательно
1
 min  x1  x2    xm  min
V
20
Пример. Найти решение игры с платежной
матрицей:
А
В
С
α
1
4
2
β
2
0
3
γ
3
1
0
21
Для первого игрока
Для второго игрока
Найти xi , i  1 ,3
Найти y j , j  1,3
f ( x )  x1  x2  x3  min
f ( y )  y1  y2  y3  max
при условиях
при условиях
 x1  4 x2  2 x3  1

 2 x1  3 x3  1
3 x  x  1
 1
2
 y1  2 y2  3 y3  1

4 y1  y3  1
2 y  3 y  1
 1
2
xi  0 , i  1 ,3
y j  0 , j  1,3
22
23
24
25
26
27
28
29
30
31
32
33
Ответ: V=1.85,
Стратегия 1-го игрока (0,55; 0,2; 0,25)
Стратегия 2-го игрока (0,4; 0,35; 0,25)
Ответ найденный приближенным методом (20 партий):
1,81 ≤ V ≤ 2,
Стратегия 1-го игрока (0,65; 0,1; 0,25)
Стратегия 2-го игрока (0,3; 0,2; 0,5)
Ответ найденный приближенным методом (100 партий):
1,828 ≤ V ≤ 1,88,
Стратегия 1-го игрока (0,57; 0,26; 0,17)
Стратегия 2-го игрока (0,42; 0,34; 0,24)
34
Download