Лекция 2. Биматричные игры Биматричная игра - это бескоалиционная игра двух игроков, каждый из которых имеет конечное множество стратегий. Пусть первый игрок имеет m стратегий: А1, А2,…, Аm. Второй игрок имеет n стратегий: В1, В2,…,Вn. Игра имеет mxn возможных ситуаций вида (Аi,Вj). Выигрыши игроков зависят от ситуации: v1 v1 Ai, Bj О.Д. Кичмаренко v2 v2 Ai, Bj Теория игр: моделирование и решение конфликтных ситуаций 1 Лекция 2. Биматричные игры b11 ... b1n a11 ... a1n A В b a ... b ... a mn m1 mn m1 v1 Ai, Bj aij a11, b11 ... a1n , b1n a ,b ... a , b mn mn m1 m1 v2 Ai, Bj bij Формальная запись биматричной игры: A i i 1,m , B j j 1,n , A aij i 1,m , B bij i 1,m j 1, n j 1, n Но обычно говорят, что биматричная игра задана матрицами выигрышей первого и второго игроков - А и В соответственно, размерности mxn. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 2 Лекция 2. Биматричные игры a11 ... a1n A a ... a mn m1 b11 ... b1n В b ... b mn m1 Ситуация равновесия в биматричной игре также определяется по Нэшу: aij* ai* j* bi* j bi* j* Решить биматричную игру – найти все ситуации равновесия и указать выигрыши каждого игрока в них. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 3 Лекция 2. Биматричные игры Пример 6. Конкурс на реализацию проекта. Две фирмы, борющиеся за заказ на определенную работу, могут выбрать два варианта - подать развернутую программу (1-я стратегия) или простую заявку (2-я стратегия). Согласно правилам при одинаковом выборе конкурентов заказ и доход делятся пополам, а в другом случае предпочтение отдается фирме, подавшей подробную заявку. На реализацию проекта победителям (одному или двоим) выделяется 10 тысяч долларов. Технические затраты на простую заявку - 1 тысяча долларов, на развернутую программу - 3 тысячи долларов. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 4 Лекция 2. Биматричные игры 1-й игрок 0 развернутая программа развернутая программа простая заявка О.Д. Кичмаренко простая заявка 2-й игрок 2 7 развернутая программа -1 4 простая заявка развернутая программа простая заявка 2 -1 7 4 Теория игр: моделирование и решение конфликтных ситуаций 5 Лекция 2. Биматричные игры Смешанное расширение биматричной игры Смешанной стратегией игрока называется набор вероятностей применения его чистых стратегий: x x1 ,..., xm , xi p Ai y y1 ,..., yn , y j pB j m x i 1 i 1, 0 xi 1, i 1,...m n y j 1 j 1, 0 y j 1, j 1,..., n X – множество всех смешанных стратегий первого игрока. Y – множество всех смешанных стратегий второго игрока. Эта система называется смешанным расширением биматричной игры. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 6 Лекция 2. Биматричные игры Смешанное расширение биматричной игры Смешанной стратегией игрока называется набор вероятностей применения его чистых стратегий: y y1 ,..., yn , y j pB j x x1 ,..., xm , xi p Ai m x i 1 i n 1, 0 xi 1, i 1,...m y j 1 j 1, 0 y j 1, j 1,..., n X – множество всех смешанных стратегий первого игрока. Y – множество всех смешанных стратегий второго игрока. A i i 1,m , B j j 1,n , X , Y , A aij i 1,m , B bij i 1,m j 1, n j 1, n Эта система называется смешанным расширением биматричной игры. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 7 Лекция 2. Биматричные игры В1 … Вn В1 … Вn y1 … yn y1 … yn … а1m А1 х1 b11 … b1m : : : : аmn Аm хm bm1 А1 х1 а11 : : : Аm хm аm1 … : … bmn Выигрыш первого игрока в смешанном расширении игры: m v1 A, x, y i 1 n x a j 1 i ij yj Выигрыш второго игрока в смешанном расширении игры: m v2 B, x, y i 1 О.Д. Кичмаренко n xb y j 1 i ij j Теория игр: моделирование и решение конфликтных ситуаций 8 Лекция 2. Биматричные игры Ситуация (x*,y*) является ситуацией равновесия по Нэшу в смешанном расширении биматричной игры, если x X y Y m n x a i 1 m i 1 j 1 n i ij m y * j i 1 m * x i bij y j j 1 i 1 n x a j 1 n * i ij y*j * * x b y i ij j (6) (7) j 1 Решить игру в смешанном расширении – найти оптимальные смешанные стратегии (x*,y*), удовлетворяющие (6), (7). Теорема Нэша. Биматричная игра всегда имеет решение. Все ситуации, которые удовлетворяют (6), являются приемлемыми для первого игрока. Все ситуации, которые удовлетворяют (7), являются приемлемыми для второго игрока. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 9 Лекция 2. Биматричные игры Метод решения биматричной игры 2х2 В1 В2 В1 В2 y1 y2 y1 y2 А1 х1 а11 а12 А1 х1 b11 b12 А2 х2 а21 а22 А2 х2 b21 b22 x = (х1, х2) = (х1, 1-х1), у = (у1, у2) = (у1, 1-у1) m v1 A, x, y x a v2 B, x, y xb y i 1 m i 1 О.Д. Кичмаренко n j 1 n j 1 i ij i ij yj j Теория игр: моделирование и решение конфликтных ситуаций 10 Лекция 2. Биматричные игры v1 A, x, y x1a11 y1 x1a12 (1 y1 ) (1 x1 )a21 y1 (1 x1 )a22 (1 y1 ) (a11 a12 a21 a22 ) x1 y1 (a12 a22 ) x1 (a21 a22 ) y1 a22 v2 B, x, y x1b11 y1 x1b12 (1 y1 ) (1 x1 )b21 y1 (1 x1 )b22 (1 y1 ) (b11 b12 b21 b22 ) x1 y1 (b12 b22 ) x1 (b21 b22 ) y1 b22 Условия (6) примут вид: a11 y1 a12 (1 y1 ) v1 A, x, y Условия (7) примут вид: x1b11 (1 x1 )b21 v2 B, x, y a21 y1 a22 (1 y1 ) v1 A, x, y (8) x1b12 (1 x1 )b22 v2 B, x, y (9) Неравенства (8) описывают множество всех приемлемых для первого игрока ситуаций (х,у). Неравенства (9) - множество всех приемлемых ситуаций для второго игрока . О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 11 Лекция 2. Биматричные игры Для первого игрока построим множество приемлемых для него ситуаций K: Обозначим a1 a11 a12 a21 a22 a2 a22 a12 Тогда неравенства (8) перепишем в виде a1 1 x1 y1 a2 (1 x1 ) 0 a1 x1 y1 a2 x1 0 (10) (11) Система неравенств (10),(11) описывает ситуации вида: 1) (0,у1), где a1 y1 a2 0, 0 y1 1 2) (х1,у1), где a1 y1 a2 0, 0 x1 1, 0 y1 1 3) (1,у1), где a1 y1 a2 0, 0 y1 1 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 12 Лекция 2. Биматричные игры Если a1 a2 0 , то множество K – весь единичный квадрат Если a1 0, a2 0 , то при a2 0 при О.Д. Кичмаренко a2 0 х1=0, 0 y1 1 х1=1, 0 y1 1 Теория игр: моделирование и решение конфликтных ситуаций 13 Лекция 2. Биматричные игры Если a1 0 , то множество K a2 x1 0, if y1 a1 x1 1, if y1 0 x 1, if y 1 1 Если a1 0 , то множество K x1 0, if y1 x1 1, if y1 0 x 1, if y 1 1 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 14 Лекция 2. Биматричные игры Аналогично для второго игрока построим множество приемлемых для него ситуаций L: Обозначим b1 b11 b12 b21 b22 b2 b22 b21 Тогда неравенства (9) описывает ситуации вида: 1) (х1,0), где b1 y1 b2 0, 0 x1 1 2) (х1,у1), где b1 y1 b2 0, 0 y1 1, 0 x1 1 3) (х1,1), где b1 y1 b2 0, 0 x1 1 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 15 Лекция 2. Биматричные игры Если b1 b2 0 , то множество L – весь единичный квадрат Если b1 0, b2 0 , то при b2 0 у1=0, 0 x1 1 при b2 0 у1=1, 0 x1 1 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 16 Лекция 2. Биматричные игры Если b1 0 , то множество L b2 y1 0, if x1 b1 y1 1, if x1 0 y 1, if x 1 1 Если b1 0 , то множество L y1 0, if x1 y1 1, if x1 0 y 1, if x 1 1 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 17 Лекция 2. Биматричные игры Пересечение множеств K и L – это множество ситуаций, приемлемых для обоих игроков, т.е. это ситуации равновесия. Если точка F x1 , y1 K L , то оптимальная смешанная стратегия первого игрока x x1 ,1 x1 оптимальная смешанная стратегия второго игрока y y1 ,1 y1 Выигрыши каждого игрока в ситуации равновесия вычисляются по формулам: m v1 A, x, y i 1 m n x a j 1 i ij yj v2 B, x, y i 1 n xb y j 1 i ij j Если точка пересечения F x1 , y1 K L попадает в угол единичного квадрата, т.е. имеет координаты (0,0),(0,1),(1,0),(1,1), то ситуации равновесия в чистых стратегиях. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 18 Лекция 2. Биматричные игры Решение Примера 6. 2 7 A 1 4 a1 a11 a12 a21 a22 2 7 (1) 4 0 a2 a22 a12 4 7 3 2 1 b1 b11 b12 b21 b22 2 (1) 7 4 0 B 7 4 b2 b22 b21 4 7 3 F 1,1 K L x (1,0), y (1,0) т.е. каждый игрок выбирает свою первую стратегию – обе фирмы подают развернутую программу, потратив по 3 тыс. долларов, поэтому из выделенных 10 тысяч осталось только 4 тысячи, которые по правилам конкурса поделили пополам, и выигрыш каждой составил 2 тыс. В этом примере четко видно наличие противоречия между выгодностью и устойчивостью : если бы каждая фирма исключила свои доминируемые стратегии, то получила бы выигрыш 4 тыс. , что не совпадает с устойчивой по Нэшу ситуацией. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 19 Лекция 2. Биматричные игры Пример 7. Семейный спор. Два экономических партнера договариваются о совместном проведении одного из двух действий: D1 (предложенного первым партнером) и D2 (предложенного вторым партнером), каждое из которых требует необходимого совместного участия обоих партнеров. Если осуществляется D1, то первый получает 2 ед. полезности, а второй 1 ед., если осуществляется D2, то первый получает 1 ед., а второй 2ед. полезности. 0 2 a1 0 2 1 0 3 A 1 0 a2 0 2 2 0 1 b1 0 1 2 0 3 B 0 2 0 b2 0 2 2 K L 2 2 E 0,1, F , , G 1,0, 3 3 E x (0,1), y (1,0), v1 E 1, v2 E 2 G x (1,0), y (0,1), v1 G 2, v2 E 1 2 2 2 1 2 1 F x , , y , , v1 F , v2 F 3 3 3 3 3 3 О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 20 Лекция 2. Биматричные игры Домашнее задание: Составить матрицы выигрышей и решить игру: Завод выпускает автомобили партиями по 100 шт. За каждую а/м завод получает от концерна 1.3 ден. ед. оплаты, из которых 1 ед. составляют премиальные, а 0.3 ден.ед. предназначены для операций технического контроля (ОТК). Завод может выпускать партию а/м с ОТК либо без ОТК, увеличивая сумму премиальных (до 1.3 ден. ед.). Чтобы уменьшить производственный брак, концерн решил привлечь независимую фирму осуществляющую технический контроль за качеством продукции. Стоимость проверки одной а/м составляет 0.12 ден.ед. Если ОТК заводом не проводится, то а/м неисправен с вероятностью 4/5. В случае обнаружения неисправностей завод обязан их устранить, затратив 0.3 ден.ед. и дополнительно заплатить фирме-эксперту 0.2 ден.ед. из своих премиальных. Фирма-эксперт может проверить партию а/м или не проверить ее. Выигрыш завода – сумма оставшихся премиальных, а выигрыш фирмы-эксперта заработанные на проверке деньги. Решить биматричную игру: О.Д. Кичмаренко 5 8 k 4 l 7 1 2l 2k 2 Теория игр: моделирование и решение конфликтных ситуаций 21 Лекция 2. Биматричные игры Выводы: Биматричная игра – модель конфликта, в котором интересы игроков не противоположны: каждый – сам за себя. Биматричными играми можно моделировать решение ситуации в условиях неопределенности, когда достоверно не известно, какое действие выберет соперник. Известны методы эффективного решения игр 2х2 в смешанных стратегиях, для биматричных игр общего вида методы решения не разработаны. В моделях биматричных игр присутствует противоречие между выгодностью и устойчивостью: устойчивые решения не всегда являются выгодными для игроков. Поведение игроков в биматричных играх направлено не на повышение своего выигрыша, а на понижение выигрыша соперника. О.Д. Кичмаренко Теория игр: моделирование и решение конфликтных ситуаций 22