МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ УО «БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ» Кафедра математических методов в экономике УСРС по дисциплине: Эконометрика и экономико-математические методы и модели на тему: Матричные игры. Статистические игры Студент ФЭМ, 3-й курс, 18ДКУ-1 А.А. Липницкий (подпись) (дата) Руководитель доцент (подпись) (дата) МИНСК 2020 Е.А. Шинкевич Вариант 12 Задача 1. 1. Проверяем, имеет ли платежная матрица седловую точку. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I. В1 4 10 12 3 12 А1 А2 А3 А4 max(Bi) В2 7 5 4 3 7 В3 5 10 12 2 12 В4 8 6 5 4 8 min(Аi) 4 5 4 2 Нижняя цена игры a = max(ai) = 5, верхняя цена игры b = min(bj) = 7. Что свидетельствует об отсутствии седловой точки, так как a ≠ b. Находим решение игры в смешанных стратегиях. 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. Стратегия A1 доминирует над стратегией A4 (все элементы строки 1 больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую строку матрицы. Вероятность p4 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B3 (все элементы столбца 1 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0. С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B4 (все элементы столбца 2 меньше элементов столбца 4), следовательно, исключаем 4-й столбец матрицы. Вероятность q4 = 0.Преобразованная матрица имеет вид: 4 10 12 7 5 4 3. Находим решение игры в смешанных стратегиях графоаналитическим методом: Решим задачу графическим методом. Решение игры проводим с позиции игрока B, придерживающегося максиминной стратегии. 2 Выделяем верхнюю границу выигрыша A1NA2. Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A1A1 и A2A2, для которых можно записать следующую систему уравнений: y = 4 + (7 - 4)q2 y = 10 + (5 - 10)q2 Откуда q1 = 1/4 q2 = 3/4 Цена игры, y = 25/4 Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений, исключив стратегию A3, которая дает явно больший проигрыш игроку A, и, следовательно, p3 = 0. 4p1+10p2 = y 7p1+5p2 = y p1+p2 = 1 или 4p1+10p2 = 25/4 7p1+5p2 = 25/4 p1+p2 = 1 3 Решая эту систему, находим: p1 = 5/8. p2 = 3/8. Ответ: q*=(1/4; 3/4; 0; 0); p*=(5/8; 3/8; 0; 0); v=25/4. Задача 2. После нескольких лет эксплуатации промышленное оборудование оказывается в одном из следующих состояний: 1) оборудование может использоваться в очередном году после профилактического ремонта; 2) для безаварийной работы оборудования в дальнейшем следует заменить отдельные его детали и узлы; 3) оборудование требует капитального ремонта или замены. В зависимости от сложившейся ситуации руководство предприятия в состоянии принять такие решения: 1) отремонтировать оборудование силами заводских специалистов, что потребует, в зависимости от обстановки, затрат, равных 13, 9 или а 15 ден. ед.; 2) вызвать специальную бригаду ремонтников, расходы в этом случае составят 20, 12 или 11 ден. ед.; 3) заменить оборудование новым, реализовав устаревшее оборудование по его остаточной стоимости; совокупные затраты в результате этого мероприятия будут равны соответственно 18, 10 или 14 ден. ед. Указанные выше расходы предприятия включают кроме стоимости ремонта и заменяемых деталей и узлов убытки, вызванные ухудшением качества выпускаемой продукции, простоем неисправного оборудования, а также затраты на установку и отладку нового оборудования. Требуется: 1) придать описанной ситуации игровую схему, установить характер игры и выявить ее участников, указать возможные чистые стратегии сторон; 2) составить платежную матрицу; 3) выяснить, какое решение о работе оборудования в предстоящем году целесообразно рекомендовать руководству предприятия, чтобы минимизировать потери при cледующих предположениях: а) накопленный на предприятии опыт эксплуатации аналогичного оборудования показывает, что вероятности указанных выше состояний оборудования равны соответственно 0,3, 0,45, 0,25; б) имеющийся опыт свидетельствует о том, что все три возможных состояния оборудования равновероятны; в) о вероятностях состояний оборудования ничего определенного сказать нельзя. Указание. В п. 3 следует найти оптимальные чистые стратегии, пользуясь: в п. 3) а) — критерием Байеса, в п. 3) б) — критерием Лапласа, в п. 3) в) — критериями Вальда, Сэвиджа, Гурвица (значение параметра в критерии Гурвица – 0,7). Решение: В игре участвуют 2 игрока, первый – предприятие, второй – природа. Игра является статистической. 4 Возможные стратегии и рассчитанные элементы приведены в платежной матрице: П1 -3 -20 -18 0,3 А1 А2 А3 q П2 -9 -12 -10 0,45 П3 -15 -11 -14 0,25 Критерий Байеса. По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r. Считаем значения ∑(aijpj) ∑(a1,jpj) = 0*0.3 + 6*0.45 + 12*0.25 = 5.7 ∑(a2,jpj) = 17*0.3 + 9*0.45 + 8*0.25 = 11.15 ∑(a3,jpj) = 15*0.3 + 7*0.45 + 11*0.25 = 10.4 Ai A1 A2 A3 pj П1 0 5.1 4.5 0.3 П2 2.7 4.05 3.15 0.45 П3 3 2 2.75 0.25 ∑(aijpj) 5.7 11.15 10.4 Выбираем из (5.7; 11.15; 10.4) максимальный элемент max=11.15 Вывод: выбираем стратегию N=2. Критерий Лапласа. Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.: q1 = q2 = ... = qn = 1/n. qi = 1/3 Ai A1 A2 A3 pj П1 0 5.667 5 0.333 П2 2 3 2.333 0.333 П3 4 2.667 3.667 0.333 ∑(aij) 6 11.333 11 Выбираем из (6; 11.33; 11) максимальный элемент max=11.33 Вывод: выбираем стратегию N=2. 5 Критерий Вальда. По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е. a = max(min aij) Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации. Ai A1 A2 A3 П1 0 17 15 П2 6 9 7 П3 12 8 11 min(aij) 0 8 7 Выбираем из (0; 8; 7) максимальный элемент max=8 Вывод: выбираем стратегию N=2. Критерий Севиджа. Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается: a = min(max rij) Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации. Находим матрицу рисков. Рассчитываем 1-й столбец матрицы рисков. r11 = 17 - 0 = 17; r21 = 17 - 17 = 0; r31 = 17 - 15 = 2; 2. Рассчитываем 2-й столбец матрицы рисков. r12 = 9 - 6 = 3; r22 = 9 - 9 = 0; r32 = 9 - 7 = 2; 3. Рассчитываем 3-й столбец матрицы рисков. r13 = 12 - 12 = 0; r23 = 12 - 8 = 4; r33 = 12 - 11 = 1; Ai A1 A2 A3 П1 17 0 2 П2 3 0 2 П3 0 4 1 Результаты вычислений оформим в виде таблицы. 6 Ai A1 A2 A3 П1 17 0 2 П2 3 0 2 П3 0 4 1 max(aij) 17 4 2 Выбираем из (17; 4; 2) минимальный элемент min=2 Вывод: выбираем стратегию N=3. Критерий Гурвица. Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение: max(si) где si = y min(aij) + (1-y)max(aij) При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс). Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1. Рассчитываем si. s1 =0.7*0+(1-0.7)*12=3.6 s2 =0.7*8+(1-0.7)*17=10.7 s3 = 0.7*7+(1-0.7)*15 = 9.4 Ai A1 A2 A3 П1 0 17 15 П2 6 9 7 П3 12 8 11 min(aij) 0 8 7 max(aij) 12 17 15 y min(aij) + (1-y)max(aij) 3.6 10.7 9.4 Выбираем из (3.6; 10.7; 9.4) максимальный элемент max=10.7 Вывод: выбираем стратегию N=2. Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A2. 7