Моделирование конфликтных ситуаций в экономике Методы решения игровых задач Моделирование конфликтных ситуаций в экономике 1. Принцип доминирования. Цель. Уменьшить размерность задачи (редуцировать платежную матрицу). Принцип доминирования – один из приемов редуцирования платежной матрицы. Идея принципа – выбросить из рассмотрения те стратегии игроков, которые являются очевидно не выгодными для игроков. Моделирование конфликтных ситуаций в экономике Рассмотрим применение принципа на примере. Пусть матрица игры имеет вид: Аi\Bj B1 B2 B3 А1 -2 1 3 0 1 А2 -1 -4 2 -1 -4 А3 1 -5 6 3 -5 B4 B5 Начнем анализ этой матрицы с позиций игрока В. 1. Значения проигрышей игрока В в столбцах В2 и В5 совпадают. Это означает, что с точки зрения исхода игры стратегии В2 и В5 равноценны и дублируют друг друга. Игроку В не имеет смысла оставлять в своем арсенале обе стратегии. Одну можно исключить. Пусть В. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj B1 B2 B3 B4 А1 -2 1 3 0 А2 -1 -4 2 -1 А3 1 -5 6 3 В результате получена матрица игры на один столбец меньше. Вывод. Матрица игры может содержать дублирующие столбцы (строки). 2. Столбец В3 приносит максимальный проигрыш игроку В при любой стратегии игрока А, т.к. аi3>aij при всех i и j≠3. Такой столбец (стратегию) называют строго доминирующим остальные столбцы. Столбец В3 можно удалить, т.к. разумный игрок этой стратегией никогда не воспользуется. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj B1 B2 B4 А1 -2 1 0 А2 -1 -4 -1 А3 1 -5 3 3. Если сравнить столбцы В1 и В4, то видно, что а14>а11, a24=a21, a43>a31, т.е. в столбце В4 содержатся элементы, которые либо строго больше элементов столбца В1, либо равны соответствующим элементам столбца В1. В этом случае говорят, что столбец (стратегия) В4 не строго доминирует столбец (стратегию) В1. Столбец (стратегию) В4 можно исключить из рассмотрения, т.к. эта стратегия приносит не меньший проигрыш, что и стратегия В1. Моделирование конфликтных ситуаций в экономике Пример (Принцип доминирования, продолжение). Аi\Bj А1 B1 -2 B2 1 А2 -1 -4 А3 1 -5 В результате рассмотрения неэффективности стратегий игрока В, удалось игру размерностью 3×5 уменьшить до размера 2×3. С аналогичных позиций можно рассмотреть эффективности стратегий игрока А, т.е. выявить дублирующие, строго и не строго доминирующие строки (стратегии) игрока А. Вывод. Прежде, чем начинать решение игры, следует по возможности уменьшить ее размерность. Одним из приемов понижения размерности является принцип доминирования. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Ai\Bj B1 B2 A1 a11 a12 A2 a21 a22 Общий вид матрицы игры 2×2 Решению такой игры можно дать наглядную геометрическую интерпретацию. Метод базируется на том, что множество всех смешанных стратегий игроков можно представить в виде отрезка [0,1]. Учитывая минимальную размерность игры, все смешанные стратегии обоих игроков можно разместить на одном отрезке [0,1]. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть игрок А имеет смешанную стратегию Р={p1, p2}. Обозначим p2 через p, учитывая, что p1+p2=1, получим p1=1-p, или P={(1-p), p}. При р=0 Р={1,0} – стратегия А1, при р=1 P={0,1} – стратегия А2. Если точка 0 соответствует стратегии А1, а точка 1 стратегии А2, то устанавливается взаимно однозначное соответствие между точками отрезка [0,1] и множеством смешанных стратегий игрока А. А1 0 А2 р2=р р р1=1-р 1 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть игрок А выбирает свою смешанную стратегию P={1-p, p}, а игрок В чистую стратегию В1. Тогда выигрыш игрока А есть: H(P,B1) = Σpiai1 = p1a11+p2a21=(1-p)a11+pa21= = p(a21-a11)+a11 (6.1) В системе координат (p,H) зависимость (6.1) представляет собой отрезок прямой, заданный на отрезке [0,1], проходящий через точки (0,а11) и (1, а21) Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. Пусть для определенность а11<а21. а21 H(P) а11 Если игрок В придерживается своей чистой стратегии В1, то выигрыш игрока А при всех его смешанных стратегиях будет лежать на отрезке [a11,a21]. Пусть игрок В придерживается чистой стратегии В2. Тогда выигрыш игрока А есть: 0(А1) 1(А2) H(P,B2)=Σpiai2 = p1a12 + p2a22 = (1-p)a12+pa22 = p(a22-a12)+a12 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. H(P) а21 а12 а22 а11 0(А1) 1(А2) Зависимость H(P,B2)=H(P) есть отрезок между точками (0,a12) и (1,a22). Пусть а12>а22. Вопрос. Как определить оптимальную смешанную стратегию игрока А? Показатель эффективности смешанной стратегии P={1-p,p} есть min{H(P,B1),H(P,B2). Графически это нижняя огибающая отрезков а11-а21 и а12-а22. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. а21 H(P) а12 V N а22 α =а11 0(А1) p 1(А2) Оптимальной стратегии игрока А соответствует max α(P) или наивысшая точка на огибающей. В данном случае это точка N пересечение отрезков а11-а21 и а12а22. Абсцисса точки N соответствует оптимальной стратегии P0={1pN,PN} игрока А. Ордината точки N – цена игры V. Показатель эффективности стратегии А1 - α(A1)=min a11,a12=a11, показатель эффективности стратегии А2 - α(A2)=min (a22,a21)=a22. Нижняя цена игры – min(α(A1), α(A2))=a11 Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. А21=β H(P) а12 V N а22 α =а11 0(А1) p 1(А2) Оптимальные стратегии игрока В лежат на верхней огибающей отрезков а11-а21 и а12-а22. Соответственно неэффективности стратегий игрока В и верхняя цена игры соответственно есть: β(В1)=max (a11,a21)=a21, β(В2)=max(a12,a22)=a12, β=min(β(В1),β(В2))=a12. Для нахождения оптимальной смешанной стратегии игрока В необходимо вспомнить, что В=-АТ и провести аналогичные построения. Моделирование конфликтных ситуаций в экономике 2. Геометрический метод решения игры 2×2. H(P) a22=β а11 N а21=α а11 H(P) а11 а12 а12 α=β а21 N a22 а21 а12 p a11 =a21 a22 p P0={0,1} α=β=a12 P0={1,0} Положение оптимальной стратегии зависит от соотношений между компонентами платежной матрицы. Моделирование конфликтных ситуаций в экономике 2.1 Решение игры 2×N Игрок А имеет SA={A1, A2} Игрок В имеет SB={B1,B2,B3,…,Bn} Тогда получим: H(P,B1)=(1-p)a11+pa21=p(a21-a11)+a11 H(P,B2)=(1-p)a12+pa22=p(a22-a12)+a12 H(P,Bn)=(1-p)a1n+pa2n=p(a2n-a1n)+a1n Получаем N отрезков в координатах (р,Н), строим огибающую, ищем наивысшею точку на ней. Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Рассмотрим случай, когда матрица игры не имеет седловой точки. Тогда решение можно получить исходя из геометрического решения. Имеем: H(P,B1) = Σpiai1 = p(a21-a11)+a11 (7.3) H(P,B2)=Σpiai2 = p(a22-a12)+a12 (7.4) Условие наличия цены игры V есть: H(P,B1) = H(PB2) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Приравняв выражения (7.3) и (7.4), получим уравнение, из которого легко вычислить значение р=Р20: p(a22-a12)+a12 = p(a21-a11)+a11 или р(а11+а22-а12-а21)= а11-а12 Откуда следует: р2 = р = 0 а11 – а12 (а22 + а11) – (а12 + а21) р1 = 1-р = 0 а22 – а21 (а22 + а11) – (а12 + а21) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Соответственно для игрока В получим: H(Q,A1)=q1a11+q2a12 = q(a12-a11)+a11 H(Q,A2)=q1a21+q2a22 = q(a22-a21)+a21 Откуда следует: q2 0 = q = a11 – a21 (а22 + а11) – (а12 + а21) V= q10 =1- q = a11a22 – a12a21 (а22 + а11) – (а12 + а21) a22 – a12 (а22 + а11) – (а12 + а21) Моделирование конфликтных ситуаций в экономике 3. Аналитическое решение игры 2×2. Вопрос. При каком условии справедливы полученные соотношения? Очевидно, когда знаменатель не равен 0. (а22 + а11) – (а12 + а21) ≠ 0 (7.5) Равенство нулю выражения (7.5) является необходимым условием наличия седловой точки в матрице игры. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Между матричными играми и линейным программированием существует взаимосвязь, которая состоит в том, что решение любой матричной игры можно свести к решению пары двойственных задач линейного программирования специального вида и, наоборот, любая задача линейного программирования, которая имеет решение, может быть сведена к матричной игре специального вида. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Теорема. Решение матричной игры m×n c матрицей А, элементы которой aij>0, эквивалентно решению следующей пары двойственных задач линейного программирования: m x min i 1 i m aij x 1 i 1 i n y j 1 j max n aij y j 1 1 j Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Поясним теорему, опуская доказательство. Пусть имеем матрицу игры m×n. Оптимальная стратегия P={p1,p2,…,pm} обеспечивает ему выигрыш H(P,Q)≥ V. Если игрок В выбирает чистую стратегию Вj, то выигрыш игрока А есть: H(P,Bj)=Σaijpi=a1jp1+a2jp2+…+amjpm≥ V; Σpi = 1 Получим систему из n неравенств. Моделирование конфликтных ситуаций в экономике p1 a11 p2 a21 ... pn an1 V p 1 a12 p2 a22 ... pn an 2 V .......... .......... .......... ....... p1 a1n p2 a2n ... pn ann V p1 p2 ... pn 1 (7.6) Если V>0, то все неравенства можно разделить на V. Условие V>0 легко достигается путем прибавления к каждому элементу aij константы r>0. Эта операция приведет к смещению цены игры V на r, но не повлияет на выбор оптимальных стратегий. Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. В результате получим: p2 pn p1 ... a n1 1 V a11 V a21 V p p p 1 a12 2 a22 ... n an 2 1 V V V .......... .......... .......... ....... p1 a1n p2 a2n ... pn ann 1 V V V p1 p2 p 1 ... n V V V V (7.7) Моделирование конфликтных ситуаций в экономике 4. Матричные игры и задачи линейного программирования. Вводя переменные x1=p1/v, x2=p2/v,… и, учитывая, что игрок А стремится получить максимальный выигрыш (V=>max или 1/v=>min), получим задачу линейного программирования для игрока А: (Аналогичные рассуждения приводят к двойственной задачи для игрока В) x1+x2+x3+…+xm=>min a11x1+a21x2+…+am1xm ≥ 1 a12x1+a22x2+…+am2xm ≥ 1 y1+y2+y3+…+yn=>max a11y1+a12y2+…+a1nyn ≤ 1 a21y1+a22y2+…+a2nyn ≤ 1 a1nx1+a2nx2+…+amnxm ≥ 1 am1y1+am2y2+…+amnyn ≤ 1 Решения этих задач позволяет найти оптимальные смешанные стратегии игроков А и В. Моделирование конфликтных ситуаций в экономике Пример. Пусть исходная матрица игры имеет вид. А\В В1 В2 В3 αi А\В В1 В2 В3 αi А1 -3 4 4 -3 А1 1 8 8 1 А2 1 -2 1 -2 А2 5 2 5 2 А3 4 4 -2 -2 А3 8 8 2 2 βj 4 4 4 4\-2 βj 8 8 8 8\2 Задачи линейного программирования для игроков А и В имеют вид: Решение есть: Х1+х2+х3 => min y1+y2+y3=>max 1x1+5x2+8x3 ≥ 1 1y1+8y2+8y3≤ 1 8x1+2x2+8x3 ≥ 1 5y1+2y2+5y3≤ 1 8x1+5x2+2x3 ≥ 1 8y1+8y2+2y3≤ 1 Z=0.2045; V1=1/z=4.89; V=V1-4=0.89 x1=0.045; x2=0.106; x3=0.053; p1=0.222; p2=0.519; p3=0.259; q1=0.444; q2=0.037; q3=0.519