Игры в смешанных стратегиях

реклама
Игры в смешанных стратегиях
Моделирование конфликтных
ситуаций в экономике
Рассмотрим две игры в чистых стратегиях
Ai\Bj
B1
B2
B3
αi
Ai\Bj
B1
B2
B3
αi
A1
-3
4
4
-3
A1
0.7
0.5
0.3
0.3
A2
1
-2
1
-2
A2
0.6
0.9
0.4
0.4
A3
4
4
-2
-2
0.7
0.9
0.4
0.4\0.4
βj
4
4
4
4\-2
βj
α < β игра не устойчивая.
α = β игра устойчивая
Ситуации, в которых α = β, называются седловыми.
Моделирование конфликтных
ситуаций в экономике
Седловых ситуаций (точек) в матрице игры может быть
несколько. Например:
B1 B2 B3 B4 B5 B6 αi
A1 2
3
2
6
2
4
2
A2 1
2
0
0
1
1
0
A3 2
6
2
3
2
7
2
A4 0
5
1
7
1
4
0
βj
6
2
7
2
7
2\2
2
Здесь α=β=2
Оптимальные
стратегии игроков:
А1 и А3; В1,В3 и В5
Вопрос. Как построить игру, чтобы выигрыш был
больше α, а проигрыш меньше β.
Моделирование конфликтных ситуаций
в экономике
1.
Игры в смешанных стратегиях.
Имеем SAc={A1,A2,…,Am}, ScB={B1,B2,…,Bn}, FA(x), FB(y)
Определение. Смешанной называется стратегия
игрока, состоящая в случайном чередовании одной
из своих чистых стратегий.
Смешанная стратегия – дискретная случайная
величина, значениями которой являются номера
чистых стратегий.
Т.е. каждой чистой стратегии ставится в соответствие
вероятность ее появления в игре.
Моделирование конфликтных ситуаций
в экономике
1.
Игры в смешанных стратегиях.
Имеем:
SAc={A1,A2,…,Am},
Р={p1,p2,…,pm}, Σpi = 1
ScB={B1,B2,…,Bn}
Q={q1,q2,…,qn}, Σqi = 1
P и Q будем называть смешанными стратегиями
игроков А и В.
Определение. Множество SA={P(p1,p2,…,pm), Σpi = 1}
называется множеством смешанных стратегий
игрока А.
Моделирование конфликтных ситуаций
в экономике
1.
Игры в смешанных стратегиях.
Свойства множества смешанных стратегий:
-
SA={P(p1,p2,…,pm), Σpi = 1} – бесконечно,
- множество SA={P(p1,p2,…,pm), Σpi = 1} содержит
множество SAc={A1,A2,…,Am}
как частный случай:
А1 = {1,0,0,…,0}, A2={0,1,0,…,0}, A3={0,0,1,0,…,0}
Для смешанной стратегии справедливо равенство:
P = p1A1+p2A2+…+pmAm =
=p1(1,0,…,0)+p2(0,1,0…,0)+…+pm(0,0,…,1) = Σpi Ai
Моделирование конфликтных ситуаций
в экономике
1.
Игры в смешанных стратегиях.
Игра протекает следующим образом:
Если игрок А придерживается одной из своих
смешанных стратегий, то для определения
конкретной чистой стратегии в партии, вначале
запускается генератор случайных чисел и в
соответствии с полученным числом делается ход.
Например. Стратегия игрока А - P = {1/6, 3/6, 2/6}.
1. Бросается «кубик» с гранями {1,2,2,2,3,3}.
2. Если выпал «2», делается ход А2.
Моделирование конфликтных ситуаций
в экономике
2. Геометрическая интерпретация конфигураций
смешанной игры.
Если в качестве единичных орт взять чистые стратегии
А1,A2,…,Аm, тогда множество всех смешанных
стратегий есть симплекс размерностью m-1с
вершинами в точках А1,A2,…,Аm.
A2
Примеры.
p2
A2
pi
pi
0.5
A1
0.5
M =2
A1
p1
A3
m=3
Моделирование конфликтных ситуаций
в экономике
3. Функция выигрыша в смешанных стратегиях.
Игра в смешанных стратегиях есть расширение игры с множества
чистых стратегий на множество смешанных стратегий.
Состояние (PQ) в игре называется ситуацией в смешанных стратегиях.
Вероятность появления в игре ситуации (AiBj) равна произведению piqj.
Следовательно, (piqj) есть вероятность получения игроком А выигрыша
F(AiBj)=aij.
Таким образом, вероятность появления выигрыша aij есть дискретная
случайная величина.
Тогда средний выигрыш в игре есть математическое ожидание
случайной величины aij :
M(x) = ΣΣpiaijqj
Моделирование конфликтных ситуаций
в экономике
3. Функция выигрыша в смешанных стратегиях
Определение. Функция H(P,Q), заданная на множестве
смешанных стратегий SA×SB игроков А и В в ситуации
(P,Q) называется функцией выигрыша игрока А, если
ее значение равно среднему выигрышу в этой
ситуации:
H(P,Q) = ΣΣpiaijqj, PQ є SA×SB
(2.1)
или матричной форме: H(P,Q) = PAQT
(2.2)
Совокупность {SA,SB,H} множеств смешанных стратегий
игроков А и В и функции выигрыша игрока А в
смешанных стратегиях называют смешанным
расширением игры {SAc,SBc,FA}
Моделирование конфликтных ситуаций
в экономике
3. Функция выигрыша в смешанных стратегиях.
Задача. Дана платежная матрица игры 2×3 и две
смешанные стратегии игроков P0={3/8,5/8}, Q0={1/4,0,3/4}
Ai\Bj
B1
B2
B3
A1
0
½
5/6
A2
1
¾
½
Определить выигрыш игрока А в ситуациях:
(P0Q0), (P0B1), (P0B2), (P0B3)
Моделирование конфликтных ситуаций
в экономике
Задача. Решение
1. H P , Q

0


0


0

0
0
2. H P , B1

1
1
5

 
 
0


 4   5 21 5  4  5
3 5
6
 0   


 0    0.625
1
 3   8 32 8  3  8
 8 8  1
4
2  4 

 
 
2
3
5 5
0
  a1i Pi  0   1    0.625
8
8 8
i 1
1
2
3
4
2
3. H P , B2   a 2i Pi

i 1
0
1 3 3 5 21
    
 0.656
2 8 4 8 32
2
5 3 1 5 5
0
4. H P , B3   a 3i Pi       0.625
6 8 2 8 8
i 1
Аналогично можно вычислить выигрыш игроков в
различных ситуациях
Моделирование конфликтных
ситуаций в экономике
4. Основные определения и теоремы.
Теорема 1. Для каждой смешанной стратегии Р игрока А
существует α(Р,SB) = min H(PQ),
a для каждой смешанной стратегии Q игрока В существует
β(Q,SA) = max Н(PQ)
Определение. Число α(Р,SB) называется показателем
эффективности смешанной стратегии Р игрока А
относительно множества смешанных стратегий игрока В.
Если заменить SB на SBс, то получим определение показателя
эффективности смешанной стратегии Р игрока А
относительно множества чистых стратегий игрока В.
Если Р есть Аi, то α(Р,SBс) =min H(PQ) = αi
Моделирование конфликтных ситуаций
в экономике
4. Основные определения и теоремы.
Теорема 2. Показатели эффективности любой
смешанной стратегии Р игрока А
относительно множеств SBс и SB равны
между собой α(Р,SB) = α(Р,SBс).
Расширение множества чистых стратегий
игрока В не изменяет показателя
эффективности игрока А.
Моделирование конфликтных ситуаций
в экономике
4. Основные определения и теоремы.
Определение. Число β(Р,SА) называется показателем
неэффективности смешанной стратегии Q игрока B
относительно множества смешанных стратегий игрока A.
Если заменить SA на SAс, то получим определение показателя
неэффективности смешанной стратегии Q игрока B
относительно множества чистых стратегий игрока A.
Если Q есть Bj, то β(Q,SAс) =max H(PQ) = βj
Справедлива теорема β(Q,SAс) = β(Q,SA)
Моделирование конфликтных ситуаций
в экономике
4. Основные определения и теоремы.
Определение. Нижней ценой (максимином) матричной игры в
смешанных стратегиях называется величина
V = max α(P) = max minH(PQ)
Верхней ценой (минимаксом) матричной игры в смешанных
стратегиях называется величина
V = min β(Q) = min max H(PQ)
Теорема. Для любой конечной матричной игры существуют нижняя и
верхняя границы игры в смешанных стратегиях, т.е. для любой
матрицы игры А существует смешанная стратегия Р0, для которой
V=max α(P)= α(P0) и существует Q0, для которой V=minβ(Q)=
β(Q0)
Частный случай: Р0=Аi, Q0=Bi V и V равны соответственно
максимину и минимаксу игры в чистых стратегиях
Моделирование конфликтных ситуаций
в экономике
4. Основные определения и теоремы.
Теорема. Нижняя цена игры α и верхняя цена
игры β в чистых и нижняя V и верхняя V цены
игры в смешанных стратегиях удовлетворяют
следующему неравенству: α≤V≤V≤β.
Это означает, что в любой ситуации в
смешанных стратегиях (PQ) выигрыш H(PQ)
не ниже показателя эффективности α(P) его
стратегий
Моделирование конфликтных ситуаций
в экономике
5. Решение игры в смешанных стратегиях
Определение. Если нижняя V и верхняя V цены игры в
смешанных стратегиях равны , то их общее значение
V называется ценой игры в смешанных стратегиях, а
стратегии P0 и Q0, для которых выполняется
равенство
V = α(P0) =β(Q0) = H(P0Q0)
называются оптимальными смешанными стратегиями
соответственно игроков А и В.
Оптимальные смешанные стратегии игроков обладают
тем свойством, что, если один из игроков
придерживается своей оптимальной стратегии, то
противнику не выгодно отклоняться от своей
оптимальной стратегии.
Цена игры в смешанных стратегиях: α≤V≤β
Моделирование конфликтных ситуаций
в экономике
5. Решение игры в смешанных стратегиях.
Определение. Полным решением игры в смешанных
стратегиях называется совокупность {SA0, SB0, V}
множеств оптимальных стратегий игроков и цены
игры.
Определение. Любая пара оптимальных стратегий
(P0,Q0) образуют частное решение игры в смешанных
стратегиях.
Теорема фон Неймана. Любая матричная игра имеет
решение в смешанных стратегиях, т.е. существуют
оптимальные стратегии игроков P0, Q0 и цена игры V.
Точка H(P0,Q0) называется седловой точкой матрицы
игры в смешанных стратегиях.
Скачать