Лекция 2. Биматричные игры Биматричная игра

реклама
Лекция 2. Биматричные игры
Биматричная игра - это бескоалиционная игра
двух игроков, каждый из которых имеет конечное
множество стратегий.
Пусть первый игрок имеет m стратегий:
А1, А2,…, Аm.
Второй игрок имеет n стратегий:
В1, В2,…,Вn.
Игра имеет mxn возможных ситуаций вида (Аi,Вj).
Выигрыши игроков зависят от ситуации:
v1  v1 Ai, Bj
О.Д. Кичмаренко
v2  v2 Ai, Bj
Теория игр: моделирование и решение конфликтных ситуаций
1
Лекция 2. Биматричные игры
 b11 ... b1n 
 a11 ... a1n 




A    

 В    
b

a

...
b
...
a
mn 
 m1
mn 
 m1
v1 Ai, Bj  aij
 a11, b11 ... a1n , b1n 




 

a ,b

...
a
,
b
mn
mn 
 m1 m1
v2 Ai, Bj  bij
Формальная запись биматричной игры:
A i i 1,m , B j j 1,n , A  aij i 1,m , B  bij i 1,m
j 1, n
j 1, n
Но обычно говорят, что биматричная игра задана
матрицами выигрышей первого и второго игроков - А
и В соответственно, размерности mxn.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
2
Лекция 2. Биматричные игры
 a11 ... a1n 


A    

a

...
a
mn 
 m1
 b11 ... b1n 


В    

b

...
b
mn 
 m1
Ситуация равновесия в биматричной игре также
определяется по Нэшу:
aij*  ai* j*
bi* j  bi* j*
Решить биматричную игру – найти
все ситуации равновесия и
указать выигрыши каждого игрока в них.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
3
Лекция 2. Биматричные игры
Пример 6. Конкурс на реализацию проекта. Две
фирмы, борющиеся за заказ на определенную
работу, могут выбрать два варианта - подать
развернутую программу (1-я стратегия) или
простую заявку (2-я стратегия). Согласно правилам
при одинаковом выборе конкурентов заказ и доход
делятся пополам, а в другом случае предпочтение
отдается фирме, подавшей подробную заявку. На
реализацию проекта победителям (одному или
двоим) выделяется 10 тысяч долларов. Технические
затраты на простую заявку - 1 тысяча долларов, на
развернутую программу - 3 тысячи долларов.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
4
Лекция 2. Биматричные игры
1-й
игрок
0
развернутая
программа
развернутая
программа
простая
заявка
О.Д. Кичмаренко
простая
заявка
2-й
игрок
2
7
развернутая
программа
-1
4
простая
заявка
развернутая
программа
простая
заявка
2
-1
7
4
Теория игр: моделирование и решение конфликтных ситуаций
5
Лекция 2. Биматричные игры
Смешанное расширение биматричной игры
Смешанной стратегией игрока называется набор вероятностей
применения его чистых стратегий:
x   x1 ,..., xm , xi  p Ai 
y   y1 ,..., yn , y j  pB j 
m
x
i 1
i
 1, 0  xi  1, i  1,...m
n
y
j 1
j
 1, 0  y j  1, j  1,..., n
X – множество всех смешанных стратегий первого игрока.
Y – множество всех смешанных стратегий второго игрока.
Эта система называется смешанным расширением биматричной
игры.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
6
Лекция 2. Биматричные игры
Смешанное расширение биматричной игры
Смешанной стратегией игрока называется набор вероятностей
применения его чистых стратегий:
y   y1 ,..., yn , y j  pB j 
x   x1 ,..., xm , xi  p Ai 
m
x
i 1
i
n
 1, 0  xi  1, i  1,...m
y
j 1
j
 1, 0  y j  1, j  1,..., n
X – множество всех смешанных стратегий первого игрока.
Y – множество всех смешанных стратегий второго игрока.
A i i 1,m , B j j 1,n , X , Y , A  aij i 1,m , B  bij i 1,m
j 1, n
j 1, n
Эта система называется смешанным расширением биматричной
игры.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
7
Лекция 2. Биматричные игры
В1
…
Вn
В1
…
Вn
y1
…
yn
y1
…
yn
…
а1m
А1
х1
b11
…
b1m
:
:
:
:
аmn
Аm
хm
bm1
А1
х1
а11
:
:
:
Аm
хm
аm1
…
:
…
bmn
Выигрыш первого игрока в смешанном расширении игры:
m
v1  A, x, y   
i 1
n
x a
j 1
i ij
yj
Выигрыш второго игрока в смешанном расширении игры:
m
v2 B, x, y   
i 1
О.Д. Кичмаренко
n
xb y
j 1
i ij
j
Теория игр: моделирование и решение конфликтных ситуаций
8
Лекция 2. Биматричные игры
Ситуация (x*,y*) является ситуацией равновесия по Нэшу в
смешанном расширении биматричной игры,
если  x  X  y  Y
m
n
 x a
i 1
m

i 1
j 1
n
i
ij
m
y 
*
j
i 1
m
*
x
 i bij y j  
j 1
i 1
n
x a
j 1
n
*
i ij
y*j
*
*
x
b
y
 i ij j
(6)
(7)
j 1
Решить игру в смешанном расширении – найти оптимальные
смешанные стратегии (x*,y*), удовлетворяющие (6), (7).
Теорема Нэша. Биматричная игра всегда имеет решение.
Все ситуации, которые удовлетворяют (6), являются
приемлемыми для первого игрока.
Все ситуации, которые удовлетворяют (7), являются
приемлемыми для второго игрока.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
9
Лекция 2. Биматричные игры
Метод решения биматричной игры 2х2
В1
В2
В1
В2
y1
y2
y1
y2
А1
х1
а11
а12
А1
х1
b11
b12
А2
х2
а21
а22
А2
х2
b21
b22
x = (х1, х2) = (х1, 1-х1),
у = (у1, у2) = (у1, 1-у1)
m
v1  A, x, y   
x a
v2 B, x, y   
xb y
i 1
m
i 1
О.Д. Кичмаренко
n
j 1
n
j 1
i ij
i ij
yj
j
Теория игр: моделирование и решение конфликтных ситуаций
10
Лекция 2. Биматричные игры
v1  A, x, y   x1a11 y1  x1a12 (1  y1 )  (1  x1 )a21 y1  (1  x1 )a22 (1  y1 ) 
 (a11  a12  a21  a22 ) x1 y1  (a12  a22 ) x1  (a21  a22 ) y1  a22
v2 B, x, y   x1b11 y1  x1b12 (1  y1 )  (1  x1 )b21 y1  (1  x1 )b22 (1  y1 ) 
 (b11  b12  b21  b22 ) x1 y1  (b12  b22 ) x1  (b21  b22 ) y1  b22
Условия (6) примут вид:
a11 y1  a12 (1  y1 )  v1  A, x, y 
Условия (7) примут вид:
x1b11  (1  x1 )b21  v2 B, x, y 
a21 y1  a22 (1  y1 )  v1  A, x, y 
(8)
x1b12  (1  x1 )b22  v2 B, x, y 
(9)
Неравенства (8) описывают множество всех приемлемых для первого игрока
ситуаций (х,у).
Неравенства (9) - множество всех приемлемых ситуаций для второго игрока .
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
11
Лекция 2. Биматричные игры
Для первого игрока построим множество приемлемых для него
ситуаций K:
Обозначим
a1  a11  a12  a21  a22
a2  a22  a12
Тогда неравенства (8) перепишем в виде
a1 1  x1 y1  a2 (1  x1 )  0
a1 x1 y1  a2 x1  0
(10)
(11)
Система неравенств (10),(11) описывает ситуации вида:
1) (0,у1), где a1 y1  a2  0, 0  y1  1
2) (х1,у1), где a1 y1  a2  0, 0  x1  1, 0  y1  1
3) (1,у1), где a1 y1  a2  0, 0  y1  1
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
12
Лекция 2. Биматричные игры
Если a1  a2  0 , то множество K –
весь единичный квадрат
Если a1  0, a2  0 , то
при a2  0
при
О.Д. Кичмаренко
a2  0
х1=0, 0  y1  1
х1=1, 0  y1  1
Теория игр: моделирование и решение конфликтных ситуаций
13
Лекция 2. Биматричные игры
Если a1  0 , то множество K
a2

x1  0, if y1 


a1

x1  1, if y1  

0  x  1, if y  
1
1


Если a1  0 , то множество K
x1  0, if y1  


x1  1, if y1  

0  x  1, if y  
1
1

О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
14
Лекция 2. Биматричные игры
Аналогично для второго игрока построим множество
приемлемых для него ситуаций L:
Обозначим b1  b11  b12  b21  b22
b2  b22  b21
Тогда неравенства (9) описывает ситуации вида:
1) (х1,0), где b1 y1  b2  0, 0  x1  1
2) (х1,у1), где b1 y1  b2  0, 0  y1  1, 0  x1  1
3) (х1,1), где b1 y1  b2  0, 0  x1  1
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
15
Лекция 2. Биматричные игры
Если b1  b2  0 , то множество L –
весь единичный квадрат
Если b1  0, b2  0 , то
при b2  0
у1=0, 0  x1  1
при b2  0
у1=1, 0  x1  1
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
16
Лекция 2. Биматричные игры
Если b1  0 , то множество L
b2

y1  0, if x1   

b1

y1  1, if x1  

0  y  1, if x  
1
1


Если b1  0 , то множество L
y1  0, if x1  


y1  1, if x1  

0  y  1, if x  
1
1

О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
17
Лекция 2. Биматричные игры
Пересечение множеств K и L – это множество ситуаций,
приемлемых для обоих игроков, т.е. это ситуации равновесия.
Если точка F x1 , y1  K  L , то
оптимальная смешанная стратегия первого игрока x  x1 ,1  x1 
оптимальная смешанная стратегия второго игрока y   y1 ,1  y1 
Выигрыши каждого игрока в ситуации равновесия вычисляются
по формулам:
m
v1  A, x, y   
i 1
m
n
x a
j 1
i ij
yj
v2 B, x, y   
i 1
n
xb y
j 1
i ij
j
Если точка пересечения F x1 , y1  K  L попадает в угол
единичного квадрата, т.е. имеет координаты (0,0),(0,1),(1,0),(1,1),
то ситуации равновесия в чистых стратегиях.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
18
Лекция 2. Биматричные игры
Решение Примера 6.
 2 7

A  
 1 4
a1  a11  a12  a21  a22  2  7  (1)  4  0
a2  a22  a12  4  7  3
 2  1 b1  b11  b12  b21  b22  2  (1)  7  4  0

B  
 7 4  b2  b22  b21  4  7  3
F 1,1 K  L  x  (1,0), y  (1,0)
т.е. каждый игрок выбирает свою первую стратегию –
обе фирмы подают развернутую программу, потратив
по 3 тыс. долларов, поэтому из выделенных 10 тысяч
осталось только 4 тысячи, которые по правилам
конкурса поделили пополам, и выигрыш каждой составил 2 тыс.
В этом примере четко видно наличие противоречия между выгодностью и
устойчивостью : если бы каждая фирма исключила свои доминируемые стратегии,
то получила бы выигрыш 4 тыс. , что не совпадает с устойчивой по Нэшу ситуацией.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
19
Лекция 2. Биматричные игры
Пример 7. Семейный спор. Два экономических партнера
договариваются о совместном проведении одного из двух действий: D1
(предложенного первым партнером) и D2 (предложенного вторым
партнером), каждое из которых требует необходимого совместного
участия обоих партнеров. Если осуществляется D1, то первый получает 2
ед. полезности, а второй 1 ед., если осуществляется D2, то первый
получает 1 ед., а второй 2ед. полезности.
 0 2  a1  0  2 1  0  3

A  
 1 0  a2  0  2  2
 0 1  b1  0 1  2  0  3

B  
0
 2 0  b2  0  2  2
K L


2 2
 E 0,1, F  , , G 1,0,
3 3


E  x  (0,1), y  (1,0), v1 E   1, v2 E   2
G  x  (1,0), y  (0,1), v1 G   2, v2 E   1
2
2
 2 1
 2 1
F  x   , , y   , , v1 F   , v2 F  
3
3
 3 3
 3 3
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
20
Лекция 2. Биматричные игры
Домашнее задание:

Составить матрицы выигрышей и решить игру:
Завод выпускает автомобили партиями по 100 шт. За каждую а/м завод получает от
концерна 1.3 ден. ед. оплаты, из которых 1 ед. составляют премиальные, а 0.3
ден.ед. предназначены для операций технического контроля (ОТК). Завод может
выпускать партию а/м с ОТК либо без ОТК, увеличивая сумму премиальных (до 1.3
ден. ед.).
Чтобы уменьшить производственный брак, концерн решил привлечь независимую
фирму осуществляющую технический контроль за качеством продукции.
Стоимость проверки одной а/м составляет 0.12 ден.ед. Если ОТК заводом не
проводится, то а/м неисправен с вероятностью 4/5. В случае обнаружения
неисправностей завод обязан их устранить, затратив 0.3 ден.ед. и дополнительно
заплатить фирме-эксперту 0.2 ден.ед. из своих премиальных.
Фирма-эксперт может проверить партию а/м или не проверить ее.
Выигрыш завода – сумма оставшихся премиальных, а выигрыш фирмы-эксперта заработанные на проверке деньги.

Решить биматричную игру:
О.Д. Кичмаренко
 5 8  k 


4

l

7


 1

2l
2k

2 
Теория игр: моделирование и решение конфликтных ситуаций
21
Лекция 2. Биматричные игры
Выводы:

Биматричная игра – модель конфликта, в котором интересы игроков
не противоположны: каждый – сам за себя.

Биматричными играми можно моделировать решение ситуации в
условиях неопределенности, когда достоверно не известно, какое
действие выберет соперник.

Известны методы эффективного решения игр 2х2 в смешанных
стратегиях, для биматричных игр общего вида методы решения не
разработаны.

В моделях биматричных игр присутствует противоречие между
выгодностью и устойчивостью: устойчивые решения не всегда
являются выгодными для игроков.

Поведение игроков в биматричных играх направлено не на
повышение своего выигрыша, а на понижение выигрыша соперника.
О.Д. Кичмаренко
Теория игр: моделирование и решение конфликтных ситуаций
22
Скачать