Теория игр задачи с решениями

Задание 1. Множества допустимых стратегий игроков: S2={O; P}, S2={O;P}, где О- выбрать орла, Р – выбрать решку. Тогда платежи выглядят так: u1(O,O)=1 u1(P,P)=1 u1(O,P)=-1 u1(P,O)=-1 u2(O,O)=-1 u2(P,P)=-1 u2(O,P)=0 u2(P,O)=0 Данные в виде матрицы: О Р О Р 1; −1 −1; 1 −1; 1 1; −1 1. Проверяем, имеет ли платежная матрица седловую точку Игроки В1 В2 𝑎 = min(𝐴𝑖) А1 1 −1 −1 А2 −1 1 −1 𝑏 = max(𝐵𝑖) 1 1 Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a i) = 1, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 1. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах -1 ≤ y ≤ 1. 2. Находим решение игры в смешанных стратегиях. Для игрока 1 𝑝1 − 𝑝2 = 𝑦 −𝑝1 + 𝑝2 = 𝑦 { 𝑝1 + 𝑝2 = 1 Для игрока 2 𝑞1 − 𝑞2 = 𝑦 −𝑞1 + 𝑞2 = 𝑦 { 𝑞1 + 𝑞2 = 1 y=0 p1=1/2 p2=1/2 Оптимальная смешанная стратегия игрока 1: P(1/2; ½) q1=1/2 q2=1/2 Оптимальная смешанная стратегия игрока 2: Q(1/2; ½) Ответ: y=0; P(1/2; ½); Q(1/2; ½) Задание 2. 0 1 1 0 3. Проверяем, имеет ли платежная матрица седловую точку Игроки А1 А2 𝑏 = max(𝐵𝑖) В1 В2 0 1 1 0 1 1 𝑎 = min(𝐴𝑖) 0 0 Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a i) = 0. Верхняя цена игры b = min(bj) = 1. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 0 ≤ y ≤ 1. Находим решение игры в смешанных стратегиях. Для игрока 1 𝑝2 = 𝑦 { 𝑝1 = 𝑦 𝑝1 + 𝑝2 = 1 Для игрока 2 𝑞2 = 𝑦 { 𝑞1 = 𝑦 𝑞1 + 𝑞2 = 1 Y=1/2 p1=1/2 (вероятность применения 1-ой стратегии). p2=1/2(вероятность применения 2-ой стратегии). Оптимальная смешанная стратегия игрока 1: P=(1/2; ½) q1=1/2 (вероятность применения 1-ой стратегии). q2=1/2(вероятность применения 2-ой стратегии). Оптимальная смешанная стратегия игрока 1: Q=(1/2; ½) Цена игры y=1/2 Ответ: P=(1/2; ½), Q=(1/2; ½), y=1/2 Задание 3. 4  6 3 5   3 7 2 2   1. Проверяем, имеет ли платежная матрица седловую точку. Игроки А1 А2 𝑏 = max(𝐵𝑖) В1 В2 В3 4 −6 3 3 7 2 4 7 3 В4 𝑎 = min(𝐴𝑖) 5 −6 2 2 5 Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a i) = 2. Верхняя цена игры b = min(bj) = 3. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 2 ≤ y ≤ 3. 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. С позиции проигрышей игрока В стратегия B3 доминирует над стратегией B1 (все элементы столбца 3 меньше элементов столбца 1), следовательно, исключаем 1-й столбец матрицы. Вероятность q1 = 0. С позиции проигрышей игрока В стратегия B3 доминирует над стратегией B4 (все элементы столбца 3 меньше элементов столбца 4), следовательно, исключаем 4-й столбец матрицы. Вероятность q4 = 0. В платежной матрице отсутствуют доминирующие строки. Мы свели игру 2 x 4 к игре 2 x 2. −6 7 3 2 Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока 3. Находим решение игры в смешанных стратегиях. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x 2) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем нижнюю границу выигрыша B1NB2. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B 1B1 и B2B2, для которых можно записать следующую систему уравнений: 𝑦 = −6 + (7 − (−6))𝑝2 { 𝑦 = 3 + (2 − 3)𝑝2 p1=5/14 p2=9/14 y=13/14 (цена игры) Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений 𝑦 = −6𝑞1 + 3𝑞2 { 𝑦 = 7𝑞1 + 2𝑞2 𝑞1 + 𝑞2 = 1 q1=1/14 q2=13/14 Ответ: цена игры y=33/14; Q(1/14; 13/14); P(5/14; 9/14) Задание 4. 0 1 A 0  2 1 1 2 0 1 2 0 0 1 1  2  1 1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Игроки 𝐴1 𝐴2 𝐴3 𝐴4 𝑏 = max(𝐵𝑖) 𝐵1 𝐵2 0 1 1 1 0 2 2 0 2 2 𝐵3 𝐵4 1 1 2 1 0 2 0 1 2 2 𝑎 = min(𝐴𝑖) 0 1 0 0 Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(a i) = 1, которая указывает на максимальную чистую стратегию A2. Верхняя цена игры b = min(bj) = 2. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 1 ≤ y ≤ 2. 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы Стратегия A2 доминирует над стратегией A1 (все элементы строки 2 больше или равны значениям 1-ой строки), следовательно, исключаем 1-ую строку матрицы. Вероятность p1 = 0. 1 0 2 1 2 2 0 0 0 1 2 1 С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B4 (все элементы столбца 2 меньше элементов столбца 4), следовательно, исключаем 4-й столбец матрицы. Вероятность q4 = 0. 1 0 2 1 2 2 0 0 0 Мы свели игру 4 x 4 к игре 3 x 3. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I. 3. Находим решение игры в смешанных стратегиях. Математические модели пары двойственных задач линейного программирования можно записать 𝑥1 + 2𝑥3 ≥ 1 𝑥1 + 2𝑥2 ≥ 1 { 2𝑥1 ≥ 1 𝐹 (𝑥 ) = 𝑥1 + 𝑥2 + 𝑥3 → 𝑚𝑖𝑛 𝑦1 + 𝑦2 + 2𝑦3 ≤ 1 2𝑦2 ≤ 1 { 2𝑦1 ≤ 1 𝑍(𝑦) = 𝑦1 + 𝑦2 + 𝑦3 → 𝑚𝑎𝑥 Решаем симплекс-методом. Оптимальный план: y1=1/2; y2=1/2; y3=0 Z(y)=1 Оптимальный план двойственной задачи: x1=1, x2=0, x3=0 F(x)=1 Цена игры g=1/F(x)=1 Оптимальная смешанная стратегия игрока 1: qi=g*xi p1=1 p2=0 p3=0 P(1;0;0) Оптимальная смешанная стратегия игрока 2: qi=g*yi p1=1/2 p2=1/2 p3=0 Q(1/2; ½; 0) Ответ: цена игры g=1; P(1;0;0); Q(1/2; ½; 0) Задание 5. 5  3 6  8 7 4    5 4 8 1  7 5  1 3  1 10 0 2    9  9 7 1 3  6   Критерий Вальда. По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш 𝐴𝑖 П1 П2 П3 П4 П5 𝐴1 5 −3 6 −8 7 𝐴2 7 5 5 −4 8 𝐴3 1 3 −1 10 0 𝐴4 9 −9 7 1 3 П6 4 1 2 −6 min(𝑎𝑖𝑗) −8 −4 −1 −9 Выбираем из (-8; -4; -1; -9) максимальный элемент max=-1 Вывод: выбираем стратегию N=3. Критерий Севиджа. Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается: a = min(max rij) Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации. Находим матрицу рисков. Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы. 1. Рассчитываем 1-й столбец матрицы рисков. r11 = 9 - 5 = 4; r21 = 9 - 7 = 2; r31 = 9 - 1 = 8; r41 = 9 - 9 = 0; 2. Рассчитываем 2-й столбец матрицы рисков. r12 = 5 - (-3) = 8; r22 = 5 - 5 = 0; r32 = 5 - 3 = 2; r42 = 5 - (-9) = 14; 3. Рассчитываем 3-й столбец матрицы рисков. r13 = 7 - 6 = 1; r23 = 7 - 5 = 2; r33 = 7 - (-1) = 8; r43 = 7 - 7 = 0; 4. Рассчитываем 4-й столбец матрицы рисков. r14 = 10 - (-8) = 18; r24 = 10 - (-4) = 14; r34 = 10 - 10 = 0; r44 = 10 - 1 = 9; 5. Рассчитываем 5-й столбец матрицы рисков. r15 = 8 - 7 = 1; r25 = 8 - 8 = 0; r35 = 8 - 0 = 8; r45 = 8 - 3 = 5; 6. Рассчитываем 6-й столбец матрицы рисков. r16 = 4 - 4 = 0; r26 = 4 - 1 = 3; r36 = 4 - 2 = 2; r46 = 4 - (-6) = 10; 𝐴𝑖 П1 П2 𝐴1 4 8 𝐴2 2 0 𝐴3 8 2 𝐴4 0 14 П3 П4 1 18 2 14 8 0 0 9 П5 П6 1 0 0 3 8 2 5 10 𝐴𝑖 𝐴1 𝐴2 𝐴3 𝐴4 П1 П2 4 8 2 0 8 2 0 14 П3 П4 П5 1 18 1 2 14 0 8 0 8 0 9 5 П6 max(𝑎𝑖𝑗) 0 18 3 14 2 8 10 14 Выбираем из (18; 14; 8; 14) минимальный элемент min=8 Вывод: выбираем стратегию N=3. Критерий Гурвица. Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение: max(si) где si = y min(aij) + (1-y)max(aij) При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс). Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1. Рассчитываем si. s1 = 0.2*(-8)+(1-0.2)*7 = 4 s2 = 0.2*(-4)+(1-0.2)*8 = 5.6 s3 = 0.2*(-1)+(1-0.2)*10 = 7.8 s4 = 0.2*(-9)+(1-0.2)*9 = 5.4 𝐴𝑖 П1 П2 𝐴1 5 −3 𝐴2 7 5 𝐴3 1 3 𝐴4 9 −9 П3 6 5 −1 7 П4 −8 −4 10 1 П5 П6 7 4 8 1 0 2 3 −6 max(𝑎𝑖𝑗) 7 8 10 9 min(𝑎𝑖𝑗) −8 −4 −1 −9 y min(aij) + (1 − y)max(aij) 4 5.6 7.8 5.4 Выбираем из (4; 5.6; 7.8; 5.4) максимальный элемент max=7.8 Вывод: выбираем стратегию N=3

Теория игр задачи с решениями

Похожие документы

Разделы

Поддержка

Теория игр задачи с решениями

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib