Загрузил Денис Боровский

Теорія ігор та прийняття рішень. Прийнтяття рішень в умовах невизначеності. Боровський Денис

Боровський Денис
Завдання:
Визначити краще рішення за критеріями: азартного гравця,
мінімаксним критерієм, критерієм Гурвіца, критерієм Севіджа,
критерієм Байєса-Лапласа, критерієм Ходжа-Лемана, критерієм
BL(MM) та критерієм добутку.
Для критеріїв Гурвіца та Ходжа-Лемана необхідні коефіцієнти вказати
самостійно.
Адміністратору театру необхідно вирішити, скільки замовити програмок для
нового спектаклю. Вартість замовлення 200$ плюс 30 центів за штуку.
Програмки продаються по 60 центів за штуку, і до того ж, прибуток від
реклами додатково складе 300 доларів. З минулого досвіду відома
відвідуваність театру:
Відвідуваність 7000
7500
8000
8500
9000
Її ймовірність 0,1
0,3
0,3
0,2
0,1
Очікується, що 40% глядачів куплять програмки. Використовуючи кожне з
восьми правил, визначте, скільки програмок має замовити адміністрація
театру.
Дана модель гри – це модель гри з природою. У якості гравців виступають, з
одного боку, гравець Т — адміністрація театру, якому належить вибрати
одну зі стратегій: — 𝐴1 , 𝐴2 , 𝐴3 , 𝐴4 , 𝐴5 − замовлення програмок, що забезпечує
найбільший дохід, з іншого боку – гравець П, попит (природа), що
характеризується п’ятьма можливими станами: 𝛱1 , 𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 −
об'єктивна реальність, яка не переслідує жодних інтересів. Виграшем гравця
Т буде дохід, який він зможе отримати залежно від попиту.
Уведемо позначення. Нехай 𝑧𝑖 − величина замовлення програмок при виборі
стратегії 𝐴𝑖 , 𝑠𝑗 − попит при стані природі 𝛱𝑗 , 𝑝𝑖 − ціна свіжих булочок,
𝑐 −витрати театру на замовлення однієї програмки (собівартість програмки),
𝑑 − додатковий прибуток від реклами (300$), 𝑘 − вартість замовлення
програмок (200$). Тоді функція виграшу гравця Т при ситуації (𝐴𝑖 , 𝛱𝑗 ) можна
𝑧𝑖 (𝑝 − 𝑐) + 𝑑 − 𝑘,
𝑧𝑖 < 𝑠𝑗
(1)
визначити рівністю:{
𝑠𝑗 (𝑝 − 𝑐) − 𝑐(𝑧𝑖 − 𝑠𝑗 ) + 𝑑 − 𝑘, 𝑧𝑖 ≥ 𝑠𝑗.
Або другу нерівність можна переписати наступним чином так як доданок
𝑐(𝑧𝑗 − 𝑠𝑗 ) має сенс тоді, коли собівартість програмок може змінюватись
(наприклад, залежність від того, скільки програмок вже продали). Якщо ж
собівартість буде однаково для будь-якої кількості, то маємо наступне:
𝑧𝑖 (𝑝 − 𝑐) + 𝑑 − 𝑘,
𝑧𝑖 < 𝑠𝑗
{
(2)
𝑝𝑠𝑗 − 𝑐𝑧𝑖 + 𝑑 − 𝑘, 𝑧𝑖 ≥ 𝑠𝑗.
Очікується, що 40% глядачів куплять програмки. Тоді розподіл
відвідуваності (глядачів, що придбають програмки) та відповідних
ймовірностей становить:
Відвідуваність 2800
3000
3200
3400
3600
Її ймовірність 0,1
0,3
0,3
0,2
0,1
Відповідно, матриця гри прийме наступний вигляд:
Боровський Денис
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝑨𝟏 2800
𝑨𝟐 3000
𝑨𝟑 3200
𝑨𝟒 3400
𝑨𝟓 3600
Використовуючи функцію виграшу (2), для гравця Т, можна визначити
ситуації (𝐴𝑖 , 𝛱𝑗 ). Наприклад, при виборі гравцем стратегії 𝐴1 величина
замовлення програмок становить 𝑧1 = 2800 штук. А при стані природи 𝛱1
попит на програмки буде становити 𝑠1 = 2800 штук. Так як величина
замовлення дорівнює попиту, то отримаємо наступний результат:
(𝐴1 , 𝛱1 ): 0,6 ∙ 2800 − 0,3 ∙ 2800 + 300 − 200 = 940
Тоді при виборі гравцем стратегії 𝐴2 величина замовлення програмок
становить 𝑧2 = 3000 штук. А при стані природи 𝛱1 попит на програмки буде
становити 𝑠1 = 2800 штук:
(𝐴2 , 𝛱1 ): 0,6 ∙ 2800 − 0,3 ∙ 3000 + 300 − 200 = 880
Тоді отримаємо наступну матрицю гри:
𝜫𝟏
𝜫𝟐
𝜫𝟑
𝜫𝟒
𝜫𝟓
2800
3000
3200
3400 3600
940
940
940
940
𝑨𝟏 2800 940
900
900
900
900
𝑨𝟐 3000 880
940
1060
1060 1060
𝑨𝟑 3200 820
880
1000
1120 1120
𝑨𝟒 3400 760
820
940
960
1180
𝑨𝟓 3600 700
КРИТЕРІЙ АЗАРТНОГО ГРАВЦЯ (критерій
оптимізму або максімакс)
Критерій азартного гравця слід використовувати у випадках дуже низького
ризику, а також коли виграш набагато перевищує можливі втрати.
Застосовується при ухваленні рішення в умовах невизначеності. Таким
чином, матрицю гри необхідно доповнити ще одним стовпцем max(𝐴𝑖 , 𝛱𝑗 ), в
𝛱𝑗
який потрібно вказати значення найбільших елементів кожного рядка.
Значення max{max(𝐴𝑖 , 𝛱𝑗 )} (тобто найбільше значення у новому стовбці)
𝐴𝑖
𝛱𝑗
буде оптимальною стратегією. Потім із елементів доданого стовпця потрібно
вибрати найбільший. Рядок, в якому він стоїть і буде оптимальною
стратегією.
У нашому випадку ми повинні дописати стовбець max(𝐴𝑖 , 𝛱𝑗 ), що
𝛱𝑗
складається з найбільших значень елементів кожного рядка. У рядку 𝐴1
можна обрати будь-яке значення, так як усі значення у рядку однакові.
Боровський Денис
Наприклад, візьмемо значення у стовпці 𝛱1 . У рядку 𝐴2 найбільше значення
знаходиться у стовпцях 𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 .Наприклад, візьмемо значення стовпця
𝛱2 . Таким чином будемо мати:
𝑨𝟏
2800
𝜫𝟏
2800
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
𝜫𝟐
3000
940
𝜫𝟑
3200
940
𝜫𝟒
3400
940
𝜫𝟓
3600
940
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
900
1060
1120
1180
𝜫𝒋
940
Обираємо у стовбці max(𝐴𝑖 , 𝛱𝑗 ) найбільше значення, тобто обираємо
𝛱𝑗
max{max(𝐴𝑖 , 𝛱𝑗 )}:
𝐴𝑖
𝛱𝑗
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
𝑨𝟏
2800
940
940
940
940
940
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
900
1060
1120
1180
𝐦𝐚𝐱{𝐦𝐚𝒙(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝜫𝒋
1180
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм азартного гравця найвигідніше використати стратегію 𝐴5 ,
тобто замовити 3600 програмок.
КРИТЕРІЙ МІНІМАКСІВ (МАКСИМІНІВ)
Побудований на консервативній обережній поведінці гравця, приймаючого
рішення. Збігається до найкращої альтернативи з найпоганіших. Якщо
величина (𝐴𝑖 , 𝛱𝑗 ) представляє прибуток, що отримаємо, то відповідно з
максимінним критерієм (також називають критерієм Вальда) у якості
оптимального обирається розв’язок, що забезпечує:
max{min(𝐴𝑖 , 𝛱𝑗 )}.
𝐴𝑖
𝛱𝑗
Якщо величина (𝐴𝑖 , 𝛱𝑗 ) характеризує збитки або втрати, то використовується
мінімаксний критерій:
min{max(𝐴𝑖 , 𝛱𝑗 )}.
𝐴𝑖
𝛱𝑗
Якщо нашу задачу розглядати як задачу на прибуток, то слід використати
максимінний критерій. Тому будуємо ще один стовбець, що складається із
найменших значень у рядках. У рядку 𝐴1 можна обрати будь-яке значення,
так як усі значення у рядку однакові. Наприклад, візьмемо значення у стовпці
Боровський Денис
𝛱1 . У рядку 𝐴2 найменше значення знаходиться у стовпці 𝛱1 . Таким чином
будемо мати:
𝑨𝟏
2800
𝜫𝟏
2800
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
𝜫𝟐
3000
940
𝜫𝟑
3200
940
𝜫𝟒
3400
940
𝜫𝟓
3600
940
𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
880
820
760
700
𝜫𝒋
940
Тепер слід дописати ще один стовбець, у якому буде найбільше значення
серед усіх значень у стовбці min(𝐴𝑖 , 𝛱𝑗 ):
𝛱𝑗
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝐦𝐚𝐱{𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )}
940
𝜫𝒋
𝑨𝟏
2800
940
940
940
940
940
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
880
820
760
700
𝜫𝒋
𝑨𝒊
Таким чином приходимо до висновку, що для адміністрації театру за
максимінним критерієм найвигідніше використати стратегію 𝐴1 , тобто
замовити 2800 програмок.
Якщо ж розглядати цю задачу на втрати, то слід використати мінімаксний
критерій. Тому будуємо ще один стовбець, що складається із найбільших
значень у рядках. У рядку 𝐴1 можна обрати будь-яке значення, так як усі
значення у рядку однакові. Наприклад, візьмемо значення у стовпці 𝛱1 . У
рядку 𝐴2 найбільше значення знаходиться у стовпцях
𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 .Наприклад, візьмемо значення стовпця 𝛱2 . Таким чином будемо
мати:
𝑨𝟏
2800
𝜫𝟏
2800
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
𝜫𝟐
3000
940
𝜫𝟑
3200
940
𝜫𝟒
3400
940
𝜫𝟓
3600
940
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
900
1060
1120
1180
𝜫𝒋
940
Тепер слід дописати ще один стовбець, у якому буде найменше значення
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
940
880
820
760
700
940
900
940
880
820
940
900
1060
1000
940
940
900
1060
1120
960
940
900
1060
1120
1180
940
900
1060
1120
1180
𝜫𝒋
𝐦𝐢𝐧{𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝜫𝒋
900
Боровський Денис
Таким чином приходимо до висновку, що для адміністрації театру за
мінімаксним критерієм найвигідніше використати стратегію 𝐴2 , тобто
замовити 3000 програмок.
КРИТЕРІЙ ГУРВІЦА (критерій песимізмуоптимізму)
Побудований на консервативній обережній поведінці гравця, приймаючого
рішення. Збігається до найкращої альтернативи з найпоганіших. Відповідно
до цього критерію особа, яка приймає рішення, обчислює середньозважене
значення між найкращою та найгіршою можливою виплатою для кожної
альтернативи рішення (серед усіх можливих станів природи для цієї
конкретної альтернативи), а потім обирає рішення, що має найбільше
середньозважене значення. Таким чином, цей метод передбачає, що справи
підуть десь посередині: і не погано, і не добре. Якщо величина (𝐴𝑖 , 𝛱𝑗 )
представляє прибуток, що отримаємо:
max{α max(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) min(𝐴𝑖 , 𝛱𝑗 )}.
𝐴𝑖
𝛱𝑗
𝛱𝑗
Параметр α − показник оптимізму. Якщо α = 0, критерій Гурвіца стає
консервативним, тому що його застосування еквівалентно застосуванню
звичайного мінімаксного критерію. Якщо α = 1, то критерій Гурвіца стає
досить оптимістичним, тому що розраховує на найкращі з найкращих умов.
Ми можемо обрати степінь оптимізму (або песимізму) належним вибором
величини α з інтегрвалу [0,1]. При відсутності яскраво вираженого оптимізму
або песимізму вибір α = 0,5 представляється найбільш розумним.
Якщо величина (𝐴𝑖 , 𝛱𝑗 ) представляє втрати, що отримаємо:
min{α min(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) max(𝐴𝑖 , 𝛱𝑗 )}.
𝐴𝑖
𝛱𝑗
𝛱𝑗
У нашому випадку ми розглядаємо задачу на прибуток, тому слід
розрахувати наступні величини. Нехай показник оптимізму α = 0,5.
Доповнюємо матрицю гри стовбцями: перший складається з найбільших
значень у рядках, другий – з найменших значень у рядках.
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
940
880
820
760
700
𝜫𝟐
3000
940
900
940
880
820
𝜫𝟑
3200
940
900
1060
1000
940
𝜫𝟒
3400
940
900
1060
1120
960
𝜫𝟓
3600
940
900
1060
1120
1180
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
940
900
1060
1120
1180
940
880
820
760
700
𝜫𝒋
𝜫𝒋
Тепер слід для кожної (альтернативи) стратегії гравця Т порахувати:
1
1
𝐴1 : { ∙ 940 + ∙ 940} = 940
2
2
1
1
𝐴2 : { ∙ 900 + ∙ 880} = 890
2
2
Боровський Денис
1
1
∙ 820} = 940
2
2
1
1
𝐴4 : { ∙ 1120 + ∙ 760} = 940
2
2
1
1
𝐴5 : { ∙ 1180 + ∙ 700} = 940
2
2
Знайдемо найбільше значення max{α max(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) min(𝐴𝑖 , 𝛱𝑗 )}. Тоді
𝐴3 : { ∙ 1060 +
𝐴𝑖
𝛱𝑗
𝛱𝑗
матриця гри прийме вигляд:
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
𝜫𝟐
𝜫𝟑
𝜫𝟒
𝜫𝟓 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
2800 3000 3200 3400 3600 𝜫𝒋
940 940 940 940 940
940
940
880 900 900 900 900
900
880
820 940 1060 1060 1060
1060
820
760 880 1000 1120 1120
1120
760
700 820 940 960 1180
1180
700
𝐦𝐚𝐱{𝛂 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) +
𝑨𝒊
𝜫𝒋
(𝟏 − 𝛂) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋)}
𝜫𝒋
940
890
940
940
940
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм Гурвіца найвигідніше використати одну із стратегій 𝐴1 , 𝐴3 , 𝐴4 , 𝐴5
тобто замовити 2800, або 3200, або 3400, або 3600 програмок.
Якщо з змінити показник оптимізму α = 0,17, то отримаємо наступний
результат:
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
𝜫𝟐
𝜫𝟑
𝜫𝟒
𝜫𝟓 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
2800 3000 3200 3400 3600 𝜫𝒋
940 940 940 940 940
940
940
880 900 900 900 900
900
880
820 940 1060 1060 1060
1060
820
760 880 1000 1120 1120
1120
760
700 820 940 960 1180
1180
700
𝐦𝐚𝐱{𝛂 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) +
𝑨𝒊
𝜫𝒋
(𝟏 − 𝛂) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋)}
𝜫𝒋
940
896,6
1019,2
1058,8
1098,4
Тепер приходимо до висновку, що для адміністрації театру за критерієм
Гурвіца найвигідніше використати стратегію 𝐴5 тобто замовити 3600
програмок.
КРИТЕРІЙ СЕВІДЖА
Прагне пом'якшити консерватизм мінімаксного (максимінного) критерію
шляхом заміни матриці платежів (виграшів або програшів) (𝐴𝑖 , 𝛱𝑗 ) матрицею
втрат (штрафів) (𝐴̂
, 𝛱 ) , яка визначається наступним чином:
𝑖
(𝐴̂
𝑖 , 𝛱𝑗 ) {
𝑗
max{(𝐴𝑖 , 𝛱𝑗 )} − (𝐴𝑖 , 𝛱𝑗 ),
𝐴𝑘
(𝐴𝑖 , 𝛱𝑗 ) − дохід
(𝐴𝑖 , 𝛱𝑗 ) − min{(𝐴𝑖 , 𝛱𝑗 )}, (𝐴𝑖 , 𝛱𝑗 ) − втрати.
𝐴𝑘
Критерій Севіджа орієнтує статистику на несприятливі стану природи, тобто.
цей критерій висловлює песимістичну оцінку ситуації.
Боровський Денис
У нашому випадку ми розглядаємо задачу на прибуток, тому побудуємо
матрицю втрат) (𝐴̂
𝑖 , 𝛱𝑗 ) . Знайдемо найбільше значення у стовбцях 𝛱j та
запишемо це у додатковий стовпчик max{(𝐴𝑖 , 𝛱𝑗 )}.
𝐴𝑘
𝑨𝟏
2800
𝜫𝟏
2800
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
𝜫𝟐
3000
940
𝜫𝟑
3200
940
𝜫𝟒
3400
940
𝜫𝟓
3600
940
𝐦𝐚𝐱{(𝑨𝒊 , 𝜫𝒋 )}.
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
940
1060
1120
1180
𝑨𝒌
940
Тепер слід порахувати (𝐴̂
𝑖 , 𝛱𝑗 ).Приведемо кілька прикладів:
(𝐴̂
1 , 𝛱1 ) : {940 − 940} = 0
(𝐴̂
2 , 𝛱1 ) : {940 − 880} = 60
(𝐴̂
3 , 𝛱1 ) : {940 − 820} = 120
(𝐴̂
4 , 𝛱1 ) : {940 − 760} = 180
(𝐴̂
5 , 𝛱1 ) : {940 − 700} = 240
(𝐴̂
1 , 𝛱2 ) : {940 − 940} = 0
(𝐴̂
2 , 𝛱2 ) : {940 − 900} = 40
(𝐴̂
3 , 𝛱2 ) : {940 − 940} = 0
(𝐴̂
4 , 𝛱2 ) : {940 − 880} = 60
(𝐴̂
5 , 𝛱2 ) : {940 − 820} = 120
(𝐴̂
1 , 𝛱3 ) : {1060 − 940} = 120
(𝐴̂
2 , 𝛱3 ) : {1060 − 900} = 160
(𝐴̂
3 , 𝛱3 ) : {1060 − 1060} = 0
(𝐴̂
4 , 𝛱3 ) : {1060 − 1000} = 60
(𝐴̂
5 , 𝛱3 ) : {1060 − 940} = 120
Тоді матриця витрат гри прийме наступний вигляд:
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
0
60
120
180
240
𝜫𝟐
3000
0
40
0
60
120
𝜫𝟑
3200
120
160
0
60
120
𝜫𝟒
3400
180
220
60
0
160
𝜫𝟓
3600
240
280
120
60
0
Побудуємо стовбець, який містить найбільше значення за рядком:
𝜫𝟏
2800
0
60
120
180
240
𝜫𝟐
3000
0
40
0
60
120
𝜫𝟑
3200
120
160
0
60
120
𝜫𝟒
𝜫𝟓
3400
3600
180
240
2800
𝑨𝟏
220
280
𝑨𝟐 3000
60
120
𝑨𝟑 3200
0
60
𝑨𝟒 3400
160
0
𝑨𝟓 3600
Знаходимо найменший елемент стовбця max(𝐴𝑖 , 𝛱𝑗 ):
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
240
280
120
180
240
𝛱𝑗
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
0
60
120
180
240
0
40
0
60
120
120
160
0
60
120
180
220
60
0
160
240
280
120
60
0
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧{𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝜫𝒋
240
280
120
180
240
𝜫𝒋
120
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм Севіджа найвигідніше використати стратегію 𝐴3 , тобто
замовити 3200 програмок.
Боровський Денис
КРИТЕРІЙ БАЙЕСА (статистичний, найбільшого
середнього результату, максимального
математичного очікування)
Значення критерію Байєса – це найбільше значення математичного
очікування виграшу. Як випливає з суті та альтернативних назв цього
критерію, він найкраще відповідає ситуації багаторазової повторюваності,
коли найкращий середній результат приведе до кращого загального
результату. Якщо ситуація вибору рішення буде часто повторюватися за
незмінних умов, то вибір найкращої стратегії за критерієм Байєса
представляється найкращим. В інших випадках цей критерій розумно
використовувати лише як орієнтовний.
Зазначимо, що у цьому критерії використовуються значення ймовірностей
станів. В інших умовах застосовуються тільки значення виграшів.
𝒏
𝐦𝐚𝐱{∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )} , 𝑷(𝜫𝒋 ) − ймовірність 𝒋 − ого стану природи.
𝑨𝒊
𝒋=𝟏
Нехай 𝑃(𝛱1 ) = 𝑃(𝛱2 ) =. . . = 𝑃(𝛱5 ) = 0,2, тоді:
𝑛
∑ 𝑃(𝛱𝑗 )(𝐴1 , 𝛱𝑗 ) = 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 = 940
𝑗=1
𝑛
∑ 𝑃(𝛱𝑗 )(𝐴2 , 𝛱𝑗 ) = 880 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 = 896
𝑛
𝑗=1
∑ 𝑃(𝛱𝑗 )(𝐴3 , 𝛱𝑗 ) = 820 ∙ 0,2 + 940 ∙ 0,2 + 1060 ∙ 0,2 + 1060 ∙ 0,2 + 1060 ∙ 0,2 = 988
𝑗=1
𝑛
∑ 𝑃(𝛱𝑗 )(𝐴4 , 𝛱𝑗 ) = 760 ∙ 0,2 + 880 ∙ 0,2 + 1000 ∙ 0,2 + 1120 ∙ 0,2 + 1120 ∙ 0,2 = 976
𝑗=1
𝑛
∑ 𝑃(𝛱𝑗 )(𝐴5 , 𝛱𝑗 ) = 700 ∙ 0,2 + 820 ∙ 0,2 + 940 ∙ 0,2 + 960 ∙ 0,2 + 1180 ∙ 0,2 = 920
𝑗=1
Матриця гри прийме наступний вигляд:
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
0
60
120
180
240
𝜫𝟐
3000
0
40
0
60
120
𝜫𝟑
3200
120
160
0
60
120
𝜫𝟒
3400
180
220
60
0
160
𝒏
𝒏
𝜫𝟓
3600
∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )
240
280
120
60
0
940
896
988
976
920
𝒋=𝟏
𝐦𝐚𝐱{∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝒋=𝟏
988
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм Байеса найвигідніше використати стратегію 𝐴3 , тобто
замовити 3200 програмок.
1
Слід зазначити , що при 𝑷(𝜫𝒋 ) = , 1 ≤ 𝑗 ≤ 𝑛 критерій Байєса стає
𝑛
критерієм Лапласа.
Боровський Денис
КРИТЕРІЙ ЛАПЛАСА
Опирається на принцип недостатньої підстави, що трактується так: оскільки
розподіл ймовірностей станів 𝑃(𝛱𝑗 ) невідомий, немає жодних причин
вважати їх різними. Отже використовується оптимістичне припущення що
ймовірності всіх стану природи рівні між собою, тобто 𝑃(𝛱1 ) = 𝑃(𝛱2 ) =. . . =
1
𝑃(𝛱𝑛 ) = . Якщо при цьому (𝐴𝑖 , 𝛱𝑗 ) представляє отримуваний прибуток, то
𝑛
найкращим розв’язком є те, що забезпечує
𝒏
𝟏
𝐦𝐚𝐱{ ∑(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊 𝒏
𝒋=𝟏
Матриця гри прийме наступний вигляд:
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝒏
𝒏
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝟏
∑(𝑨𝒊 , 𝜫𝒋 )
𝒏
𝟏
𝐦𝐚𝐱{ ∑(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝒏
0
60
120
180
240
0
40
0
60
120
120
160
0
60
120
180
220
60
0
160
240
280
120
60
0
940
896
988
976
920
988
𝒋=𝟏
𝒋=𝟏
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм Лапласа найвигідніше використати стратегію 𝐴3 , тобто
замовити 3200 програмок.
КРИТЕРІЙ ХОДЖА - ЛЕМАНА
Критерій Байеса-Лапласа дає більш оптимістичні прогнози, ніж максимінний
критерій, проте він передбачає і вищий рівень поінформованості, і
багаторазові реалізації.
Критерій Байеса-Лапласа надійний лише тоді, коли достеменно відомі
ймовірності появи станів зовнішнього середовища, проте на практиці точні
числа, як правило, відсутні. Це послаблює довіру до критерію та змушує
звертатися до більш надійного максимінного критерію, який гарантує певний
мінімум. Цей гарантований мінімум можна спробувати збільшити за рахунок
використання зваженої лінійної комбінації цих критеріїв:
𝒏
𝐦𝐚𝐱{𝑪 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) + (𝟏 − 𝑪) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )}.
𝑨𝒊
𝒋=𝟏
𝜫𝒋
З допомогою параметра З , з одного боку, виражається ступінь довіри до
використовуваному розподілу ймовірностей, з другого – ступінь небажаності
появи дуже малих значень. Оскільки числова оцінка ступеня довіри до
використовуваного розподілу ймовірностей та ступеня небажаності появи
малих значень зазвичай утруднена, вибір параметра 𝐶, як правило,
суб'єктивний. У багатьох випадках вважають, що 𝐶 = 0,5.
Боровський Денис
Нехай у нашій задачі 𝑃(𝛱𝑗 ) = 0,2. Матриця гри буде виглядати наступним
чином:
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
𝒏
𝒏
∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )
𝐦𝐚𝐱{𝑪 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) + (𝟏 − 𝑪) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )}
𝑨𝒊
𝜫𝒋
𝒋=𝟏
𝒋=𝟏
𝑨𝟏
2800
940
940
940
940
940
940
940
940
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
900
940
880
820
900
1060
1000
940
900
1060
1120
960
900
1060
1120
1180
896
988
976
920
896
988
976
920
888
904
868
810
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм Ходжа-Лемана найвигідніше використати стратегію 𝐴1 , тобто
замовити 2800 програмок.
ОБ'ЄДНАНИЙ КРИТЕРІЙ БАЙЕСА-ЛАПЛАСА
ТА МІНІМАКСУ (BL(MM)-критерій)
Правило вибору цього критерію формується в такий спосіб. Матриця рішень
(гри) доповнюється ще трьома стовпцями.
1. Математичне очікування кожного з рядків.
2. Різниця між опорним значенням
max{min(𝐴𝑖 , 𝛱𝑗 )} та найменшим значенням min(𝐴𝑖 , 𝛱𝑗 ) відповідного рядка.
𝛱𝑗
𝐴𝑖
𝛱𝑗
3. Різниці між найбільшим значенням max(𝐴𝑖 , 𝛱𝑗 ) кожного рядка та
𝛱𝑗
найбільшим значенням max[max{min(𝐴𝑖 , 𝛱𝑗 )}] того рядка, в якому знаходиться
значення max{min(𝐴𝑖 , 𝛱𝑗 )}.
𝛱𝑗
𝐴𝑖
𝛱𝑗
𝐴𝑖
Вибираються ті варіанти, рядки яких дають найбільше математичне
очікування. Нехай у нашій задачі 𝑃(𝛱𝑗 ) = 0,2. Матриця гри буде виглядати
наступним чином:
𝜫𝟏
2800
𝜫𝟐
3000
𝜫𝟑
3200
𝜫𝟒
3400
𝜫𝟓
3600
𝒏
∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )
𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )
𝜫𝒋
𝐦𝐚𝐱{𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )}
𝜫𝒋
𝑨𝒊
𝐦𝐚𝐱 − 𝐦𝐚𝐱𝟏
− 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )
𝒋=𝟏
𝜫𝒋
𝑨𝟏
2800
940
940
940
940
940
940
940
940
0
0
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
3000
3200
3400
3600
880
820
760
700
900
940
880
820
900
1060
1000
940
900
1060
1120
960
896
988
976
920
880
820
760
700
880
820
760
700
900
1060
1120
1180
60
120
180
240
-40
120
180
240
Вибираємо з (940; 988; 976; 920) максимальний елемент max = 988.
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм BL(MM) найвигідніше використати стратегію 𝐴3 , тобто
замовити 3200 програмок.
Боровський Денис
КРИТЕРІЙ ДОБУТКІВ
Критерій творів теж застосовується після ухвалення рішення за умов
невизначеності. Це більш нейтральний критерій порівняно з принципом
максиміну та критерієм азартного гравця.
𝑨𝟏
𝑨𝟐
𝑨𝟑
𝑨𝟒
𝑨𝟓
2800
3000
3200
3400
3600
𝜫𝟏
2800
940
880
820
760
700
𝜫𝟐
3000
940
900
940
880
820
𝜫𝟑
3200
940
900
1060
1000
940
𝜫𝟒
3400
940
900
1060
1120
960
𝜫𝟓
3600
940
900
1060
1120
1180
𝐦𝐚𝐱{∏𝒏𝒋=𝟏(𝑨𝒊 , 𝜫𝒋 )}.
𝑨𝒊
733904022400000
577368000000000
918035132800000
838942720000000
611213568000000
Таким чином приходимо до висновку, що для адміністрації театру за
критерієм добутків найвигідніше використати стратегію 𝐴3 , тобто
замовити 3200 програмок.
ВИСНОВОК:
У результаті вирішення статистичної гри за різними критеріями найчастіше
рекомендувалася стратегія 𝐴3 .