Лекция 4: Смешанные стратегии

реклама
1
МАТРИЧНЫЕ ИГРЫ
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2
Тема 2: Матричные игры
2.1. Равновесная ситуация
2.2. Смешанные стратегии
2.3. Упрощение матричной игры
2.4. Графический метод решения
матричных игр в смешанных стратегиях
2.5. Решение игр 2xn и mx2
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
3
Пусть в игре участвуют два игрока А и В
выигрыш игрока А → аij,
выигрыш игрока В → bj
аij = – bj
Задача игрока А - максимизировать свой выигрыш.
Задача игрока В – минимизировать свой проигрыш
или минимизировать выигрыш первого игрока.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
4
Игру можно представить в виде матрицы строки которой стратегии игрока А, а столбцы – стратегии игрока В.
стратегии игрока В
A
a11
a12
...
a1 n
a 21
a 22
...
a2n
...
...
...
...
a m1
am 2
...
a mn
стратегии
игрока А
Матрица называется платежной матрицей, где
элементы этой матрицы это выигрыши игрока А.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
5
Оптимальной стратегией игрока
в матричной игре называется такая,
которая обеспечивает ему
максимальный выигрыш.
Задача каждого из игроков – найти
наилучшую стратегию игры
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
6
ПРИНЦИП МАКСМИНА:
необходимо выбрать ту стратегию,
чтобы при наихудшем поведении
противника получить максимальный
выигрыш.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
7
Пример.
Платежная матрица имеет следующий
вид
A
7
9
10
3
4
8
7
5
8
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
8
Решение:
Найдем наилучшую стратегию игрока А (строки) – это
минимальное число в каждой строке матрицы
min aij , i
i
1, m
αi
A
7
9 10 7
3
4
8 3
7
5
8 5
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
9
Зная минимальные выигрыши при различных стратегиях
Аi , игрок А выберет ту стратегию, для которой αi
максимально.
max min aij
i
j
αi
7 9 10 7
A
3 4
8 3
7 5
8 5
α=7
Величина α – гарантированный выигрыш игрока А и
называется нижней ценой игры (максимином)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
10
Далее необходимо определить наилучшую стратегию
игрока В (столбцы) – это максимальное число в каждом
столбце матрицы
j
max
7
А= 3
7
βj 7
j
9
4
5
9
,j
1, n
10
8
8
10
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
11
Зная максимальные проигрыши при различных
стратегиях Вj , игрок В выберет ту стратегию, для которой βj
минимально
min max
j
7
А= 3
7
βj 7
i
9
4
5
9
j
10
8
8
10
β=7
Игрок В гарантирует себе проигрыш не выше β. Величина β
называется верхней ценой игры (минимаксом)
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
12
Для матричной игры всегда справедливо
неравенство
Если α = β, то ситуация является равновесной. И
такая игра называется игрой с седловой
точкой.
А пара оптимальных стратегий (Аiопт, Вjопт) –
седловой точкой матрицы.
Если α < β, то игра не имеет седловой точки
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
13
аij = α = β = ν,
где ν называется ценой игры и является
одновременно минимальным в i-й строке и jм столбце
ν - решение матричной игры
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
14
В примере получаем α = β = 7
А=
βj
7
9
10
αi
7
3
4
8
3
7
7
5
9
8
10
5
Cедловая точка матрицы соответствует элементу а11.
Ответ: цена игры (v) = 7
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
15
1) Если
0, то игра выгодна для
игрока А.
2) Если
0 - для игрока В.
3) Если = 0 игра справедлива,
т.е. является одинаково
выгодной для обоих участников
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
2.1. Равновесная ситуация
16
Применение максиминного принципа
каждым из игроков обеспечивает:
 игроку А выигрыш не менее ,
 игроку В проигрыш не больше .
Учитывая что
, целью игрока А
будет в увеличении выигрыша, а для
игрока В - уменьшение проигрыша.
Е.В. Яроцкая, к.э.н., доцент кафедры экономики ТПУ
Скачать