Uploaded by Karina Vinichuk

Морозов новый ТИГРы

advertisement
МЕХАНИКА • СЛЕПКОВ АЛЕКСАНДР ИВАНОВИЧ
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ. РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ.
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU.
ФАКУЛЬТЕТ
ВЫЧИСЛИТЕЛЬНОЙ
МАТЕМАТИКИ И
КИБЕРНЕТИКИ
МГУ ИМЕНИ
М.В. ЛОМОНОСОВА
ТЕОРИЯ ИГР И
ИССЛЕДОВАНИЯ
ОПЕРАЦИЙ
МОРОЗОВ
ВЛАДИМИР ВИКТОРОВИЧ
ВМК МГУ
КОНСПЕКТ ПОДГОТОВЛЕН
СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ. РЕДАКТУРУ И МОЖЕТ
СОДЕРЖАТЬ ОШИБКИ.
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ
НА VK.COM/TEACHINMSU.
ЕСЛИ ВЫ ОБНАРУЖИЛИ
ОШИБКИ ИЛИ ОПЕЧАТКИ,
ТО СООБЩИТЕ ОБ ЭТОМ,
НАПИСАВ СООБЩЕСТВУ
VK.COM/TEACHINMSU.
БЛАГОДАРИМ ЗА ОЦИФРОВКУ КОНСПЕКТА
СТУДЕНТА ВМК МГУ
СИНЦОВА МИХАИЛА АРТУРОВИЧА
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Содержание
Лекция I ...............................................................................................................................5
Введение ............................................................................................................................5
Седловая точка и антагонистическая игра .......................................................................6
Существование решения антагонистической игры .....................................................7
Лекция II............................................................................................................................ 12
Условия существования максиминных и минимаксных стратегий при отсутствии
седловых точек ............................................................................................................ 12
Лекция III .......................................................................................................................... 18
Смешанные стратегии .................................................................................................... 18
Смешанное расширение антагонистических игр ....................................................... 20
Использование смешанных стратегий ........................................................................ 20
Смешанное расширение непрерывных игр ................................................................ 23
Лекция IV .......................................................................................................................... 27
Свойства решений в смешанных стратегиях ............................................................. 27
Свойство дополняющей нежёсткости ........................................................................ 29
Лекция V ............................................................................................................................ 34
Методы решения матричных игр ................................................................................... 34
Доминирование строк и столбцов .............................................................................. 34
Графический метод решения матричной игры .......................................................... 37
Сведение решения матричной игры к паре двойственных задач линейного
программирования.......................................................................................................41
Лекция VI .......................................................................................................................... 43
Игры с выпуклой(вогнутой) функцией выигрыша ........................................................ 44
Лекция VII ......................................................................................................................... 49
Многошаговые игры с полной информацией ................................................................ 49
Лекция VIII ....................................................................................................................... 56
Исследование игровых моделей ..................................................................................... 56
Модель «нападение – защита» .................................................................................... 56
Модель дуэли ............................................................................................................... 59
Лекция IX .......................................................................................................................... 64
Неантагонистические игры. Ситуация равновесия в играх многих лиц ...................... 64
3
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Игры двух лиц .............................................................................................................64
Игры многих лиц ......................................................................................................... 67
Лекция X ............................................................................................................................ 73
Биматричные игры ..........................................................................................................73
Метод поиска ситуаций равновесия ...........................................................................76
Доминирование в биматричных играх ....................................................................... 82
Лекция XI .......................................................................................................................... 84
Иерархические игры ....................................................................................................... 84
Равновесие по Штакельбергу...................................................................................... 85
Минимизирующие стратегии...................................................................................... 89
Лекция XII ......................................................................................................................... 92
Теория принятия решений. Многокритериальная или векторная оптимизация .............. 94
Оптимальность по Парето и Слейтеру ...........................................................................96
Лекция XIII ..................................................................................................................... 100
Общая задача принятия решений .................................................................................... 104
Лекция XIV...................................................................................................................... 108
Сравнительная важность критериев............................................................................. 108
Математическая модель операции ............................................................................... 113
Лекция XV ....................................................................................................................... 115
Оптимальные стратегии в операции ............................................................................ 115
Оценки эффективности для чистых стратегий ............................................................ 117
Оценки эффективности для смешанных стратегий ..................................................... 118
Абсолютно оптимальная стратегия .............................................................................. 118
Лекция XVI...................................................................................................................... 122
Необходимое условие оптимальных(максиминных) стратегий ................................. 122
Алгоритм поиска максиминных стратегий .............................................................. 128
Лекция XVII .................................................................................................................... 131
Некоторые задачи оптимального распределения ресурсов ......................................... 131
Алгоритм для нахождения оптимального распределения. Непрерывный случай .. 133
Дискретный случай ................................................................................................... 135
Лекция XVIII................................................................................................................... 140
Задача поиска объекта ............................................................................................... 140
4
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция I
Введение
Основная идея нашего курса заключается в исследовании методов нахождения
оптимальных решений различных задач при помощи математических моделей.
Часто нам будут встречаться игровые задачи с неопределенностями, связанными с
наличием противника(антагониста), как, например, салонные или настольные игры.
При этом противоборствующей стороной не обязательно будет человек – в ряде задач
мы будем «сражаться» с природой.
Позднее мы рассмотрим неантагонистические игры, когда интересы участников не
сталкиваются (например, на равновесные цены).
Дальше мы познакомимся с иерархическими играми: взаимодействие между
начальником и подчиненным и др.
В заключение мы научимся решать задачи т.н. многокритериальной оптимизации,
то есть те задачи, где нет возможности оптимизировать сразу все критерии; на
последней лекции рассмотрим задачу распределения ресурсов.
Таков наш план на этот семестр.
5
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Седловая точка и антагонистическая игра
x  X , y Y F  x, y  X Y
Опр. 1.  x, y   X  Y – седловая точка F на X  Y , если
F  x 0 , y   F  x 0 , y 0   F  x, y 0  x  X , y Y . (1)
Пусть первый игрок выбирает x  X , где X – множество стратегий, второй игрок –
y Y , причем выбор происходит независимо друг от друга; F  x, y  – функция
выигрыша.
Такое описание задает антагонистическую игру   X ,Y , F ( x, y ) .
Опр. 2. Седловая точка – пара стратегий, в которой игрокам не выгодно отклоняться от
своих стратегий.
Опр. 3. Говорят, что антагонистическая игра Г имеет решение, если F  x, y  имеет
седловую точку на X  Y .
Решением является тройка
( x0 , y0 ,V  F ( x0 , y 0 )) ,  x0 , y 0  – седловая точка функции


F. V называется значением или ценой игры, x0 , y 0 – оптимальная стратегия.
Докажем лемму, показывающую корректность определения значения игры.
 

Доказательство: F x* , y  F x* , y*  F x, y* x  X , y Y
(2)

Лемма 1. Пусть функция F имеет две седловые точки x 0 , y 0 , x* , y* .




Тогда F x 0 , y 0  F x* , y* .






F  x 0 , y 0   F  x 0 , y *   F  x* , y *   F  x * , y 0   F  x 0 , y 0 
(1)
(2)
(2)
(1)
На обоих концах неравенства стоят одинаковые члены, а значит справедливо и
6
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ










равенство F x 0 , y 0  F x 0 , y*  F x* , y *  F x* , y 0  F x 0 , y 0 и лемма
доказана.
Опр. 4. Антагонистическая игра называется матричной, если множество стратегий
игроков конечно: Г : X  {1,
, m}, Y  {1, , n} i  X , j Y F (i, j )  aij – элемент
матрицы A  (aij )mn .
Опр. 5. Пара (i 0 , j 0 ) – седловая точка A, если aij0  ai0 j0  ai0 j .
Примеры.
 0 0 0 0
1. A  
 , (i , j )  1, 1 ,  2, 1 ; V  0
 4 0


Пример иллюстрирует, что F x 0 , y 0  V 
 x , y  – седловая точка.
0
0
2. «Орлянка».



1
1  
A
 1 1 



Существование решения антагонистической игры
1-ый игрок:
: x X
W ( x)  inf F ( x, y ) – гарантированный выигрыш.
yY
V  supW ( x)  supinf F ( x, y ) – наилучший гарантированный результат, называемый
xX yY
xX
нижним значением игры.
Опр. 6. Стратегия x 0  X называется максиминной, если inf F ( x 0 , y )  V .
yY
2-ой игрок:
 : y Y
M ( y )  sup F ( x, y )
xX
7
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
V  inf W ( x )  inf sup F ( x, y )
yY
yY xX
Опр. 7. Стратегия y 0 Y называется минимаксной, если sup F ( x, y 0 )  V .
xX
Лемма 2. Для любой антагонистической игры справедливо неравенство V  V .
Мнемоническое правило: «Лучше быть плохим среди хороших, чем хорошим среди
плохих».
Доказательство:
x  X , y  Y inf F  x, y   F  x, y   sup F  x, y   W ( x )  inf F  x, y   sup F  x, y  
yY
yY
xX
xX
V  sup F  x, y   M ( y ) y  Y , значит, V  V и лемма доказана.
xX
Теорема 1.1.
1) F X  Y имеет седловую точку  max inf F  x, y   min sup F  x, y 
xY
yY
yY
( )
xX
Предполагается, что максимумы и минимумы достигаются
2) F ( ) - имеет седловую точку. Тогда
inf F  x 0 , y   V y  Y
 yY
(x ,y ) - седловая точка  
( )
sxuXp F  x, y   V x  X
0
0
Доказательство:
(I) (x 0 ,y0 ) - седловая точка  ( ),(  )
(1)
Л .2
(1)
V  inf sup F ( x, y )  sup F ( x, y 0 )  ( x 0 , y 0 )  inf F ( x 0 , y )  supinf F ( x, y )  V  V
yY xX
yY
xX
xX yY
Концы неравенства совпадают, и тогда оно обращается в равенство:
min
yY
(1)
(1)
max
xX
Л .2
V  inf sup F ( x, y )  sup F ( x, y )  ( x , y )  inf F ( x , y )  supinf F ( x, y )  V  V
yY xX
0
xX
0
0
0
yY
и, значит, выполнено условие ( ) .
8
xX yY
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
(II) ( ) ( x 0 , y 0 ) ( )  ( x 0 , y 0 )  седловая точка F.
( )
( )
( )
F ( x 0 , y 0 )  sup F ( x, y 0 )  V  V  inf F ( x 0 , y )  F ( x 0 , y 0 ).
yY
xX
Концы неравенства совпадают, и тогда оно обращается в равенство:
max
( )
( )
(  ) min
F ( x 0 , y 0 )  sup F ( x, y 0 )  V  V  inf F ( x 0 , y )  F ( x 0 , y 0 ) и ( x 0 , y 0 )  седловая точка F.
xX
yY
Метод нахождения всех седловых точек.
1) Найти все максиминные стратегии: X 0  {x 0  X | (  )}
2) Найти все минимаксные стратегии: Y 0  { y 0 Y | (  )}
Тогда X 0  Y 0 – прямоугольное(!) множество всех седловых точек.
Примеры.
1) F ( x, y)  xy, X=(-,), Y=(-,)
( x0 , y 0 )  (0,0), x  0  0  0  0  y
x  0 inf xy = -
yY
2)
 7 1 4 1 
4 2 3 2 

A
2 2 5 2 


 4 3 7 2 
V  max min a ij  2, i0  2,3  cтроки, в которых это значение достигается
1i 4 1 j 4
Находим минимальные элементы в строках, а затем максимальные среди них.
V  min max a ij  2, j0  2,4
1 j  4 1i  4
Т .о. искомые стратегии: (2,2), (2,4), (3,2), (3,4)
3)
F ( x, y )  2 x 2  3xy  y 2 X= 0,1 , Y= 0,1
I.
V  max min F ( x, y )
0 x 1 0 y 1
9
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
W ( x)  min F ( x, y )  F ( x, y( x))
yY
(Рис. 1)
3
Fy  0  3x  2 y  0 y= x
2
2
3
 2 x, 0  x  3
y( x)  
2
1,
 x 1

3
x


4

 2 9 x  x 9 x 2
2

, 0x
W ( x )  F ( x, y ( x ))  2 x 
2
4
3

2
2 x 2  3x  1,
 x 1

3
2
(Рис. 2)
V  max W ( x)  0, x 0 =0,1
0 x 1
II. V  min max F ( x, y )
0 y 1 0 x 1
Здесь обходимся без дифференцирования, заметив, что функция принимает
наибольшее значение на краях отрезка.
M ( y )  max F ( x, y )  max[ F (0, y ), F (1, y )]
0 x 1
10
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
F (0, y )  y 2 , F (1, y )  2  3 y  y 2 (Рис. 3)
Находим точку пересечения: y 
2
3
2
2 4
V  min M(y)=   
0 y 1
 3 9
11
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция II
Условия существования максиминных и минимаксных стратегий при отсутствии
седловых точек
Пусть Z – подмножество метрического пространства.
Опр. Множество Z – компакт, если z k  Z z kl   z 0  Z


Пусть задана h( x ). Введем обозначение Argmax h( z )  z   Z | h( z )  max h( z )

zZ

zZ
(соответственно Argmin h( z )  z  Z | h( z )  min h( z ) ). Тогда
zZ
zZ
x  X Y ( x )  Argmin f ( x, y )
yY
y Y X( y )  Argmax f ( x, y )
xX
Теорема 1.2.
Пусть F ( x, y )  C ( X  Y ), где X ,Y - компакты метрических пространств.
Тогда справедливы следующие утверждения:
1) W( x)  min F ( x, y ) - непрерывна на X ;
yY
2) x  X Y ( x )  { y ( x )}  y ( x ) - непрерывна.
Доказательство:
F ( x, y )  C ( X  Y )  она равномерно непрерывна:
  0   0 x :  ( x, x 0 )    | F ( x, y )  F ( x 0 , y ) |  y Y
I.
Покажем, что | W ( x)  W ( x 0 ) |  .
y Y ( x) y 0 Y ( x 0 )
W ( x )  W ( x 0 )  F ( x, y )  F ( x 0 , y 0 )  F ( x, y 0 )  F ( x 0 , y 0 )   .
II.
Воспользуемся непрерывностью по Гейне:
xk  x0  X
1
F ( x, y )  C ( X  Y )  F - непрерывна на X  Y
12
1
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Покажем, что y  x k   y  x 0 
0
Предположим, что y ( x k ) 
 y ( x ) . Это означает, что существует такая окрестность U
точки y ( x 0 ) , вне которой находится бесконечно много точек y( x k ) Y \ U (Рис. 4).
Заметим, что Y \ U – замкнутое (как дополнение к открытому множеству U), а
замкнутое подмножество компакта – это компакт. Таким образом, Y \ U – компакт.
Выделим y( x kl )  y Y \ U y  y ( x 0 ) . Фактически, мы докажем, что y Y ( x 0 ) (это
противоречие ввиду условия Y ( x )  { y ( x )} ).
F ( x kl , y ( x kl ))  F ( x kl , y ) y Y
Переходя к пределу, получим F ( x, y)  F ( x 0 , y ) y Y .
Упр. Доказать теорему для M ( x )  max F ( x, y ) (подсказка: M ( x)   min(  F ( x, y )) )
xX
yX
Опр. Антагонистическая игра Г называется непрерывной, если множества X, Y –
параллелепипеды евклидовых пространств, а F  C ( X  Y ) .
Следствие 1(Т1.2). В непрерывной игре всегда существуют максиминные стратегии
первого игрока и минимаксные стратегии второго игрока.
Пример. F ( x, y )  (1  y 2 )( xy  1) 2 , X   1,1 , Y  ( , )
13
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
x  0, y (0)  0
1
x  0, y ( x ) 
x
1, x  0
W ( x)  
0, x  0
Пусть Z – множество в конечномерном евклидовом пространстве.
Опр. Z – выпуклое множество, если z  z  Z x  (0,1) выполнено
 z   (1   ) z   Z .
Опр. Z – выпуклое множество, на котором определена функция h(z). Тогда h(z) –
выпуклая (строго выпуклая) функция, если z  z  Z   (0,1) выполнено
()
h( z  (1   ) z)   h( z)  (1   )h( z) .
Аналогично h(z) – вогнутая (строго вогнутая) функция, если
()
h( z  (1   ) z)   h( z)  (1   )h( z) .
m
Упр. Рассмотрим h( z )   zi2 . Доказать, что h(z) – строго выпуклая.
i 1
Утв. h( z )  С ( Z ), h( z ) – строго выпуклая. Доказать, что минимум достигается в
единственной точке. Подсказка: взять две минимизирующие точки, их полусумма
также будет минимизирующей, получаем противоречие при помощи определения
строго выпуклой функции.
Теорема 1.3 (о достаточных условиях существования седловой точки).
Пусть F(x, y) – определена и непрерывна на X  Y , X  E m , Y  E n
x  X F ( x, y )  y
  седловая точка 2

y Y F ( x, y )  x
Доказательство:
I. Пусть F ( x, y ) удовлетворяет всем условиям и строго выпукла, т.е.
2
 y – функция выпукла по y,  x – функция вогнута по x
14
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
W(r )  min F ( x, y )  F ( x, y( x)) . Вследствие Т1.2 W(x), y(x) – непрерывны.
yY
Возьмем максиминную стратегию x* : W( x* )  max F ( x, y ) . Докажем, что ( x* , y( x* )) –
xX
седловая точка.
x  X , t  (0,1) tx  (1  t ) x*  X
Обозначим y  y(tx  (1  t ) x* ) .
W ( x* )  W (tx  (1  t ) x* )  F (tx  (1  t ) x* , y )  tF ( x, y )  (1  t ) F ( x* , y ) 
t 0
 tF ( x, y )  (1  t )W ( x* )  tF ( x, y )  tW ( x* )  F ( x, y )  W ( x* ) x  X t  (0,1)
t 0
y  y (tx  (1  t ) x* )  y ( x* )
В результате предельного перехода получаем:
F ( x, y( x* ))  W ( x* )  F ( x* , y ( x* ))  F ( x* , y ), x  X , y  Y , что фактически
является определением седловой точки.
II. Рассмотрим теперь общий случай (без предположения о строгости выпуклости).
Используем прием введения возмущенной функции:
Выпукла по y
F ( x, y )  F ( x, y ) 
Строго выпукла по y
n
  y 2j
,  >0
i 1
Строго выпукла по y
Пусть ( x  , y  )  седловая точка F ( x, y ) .
F ( x, y  )  F ( x  , y  )  F ( x  , y ) x  X , y Y (1)
Рассмотрим  k  0  0 . Тогда ( x k , y k )  X Y .


Выделим сходящуюся подпоследовательность: ( x kl , y kl )  ( x 0 , y 0 ) . Имеем:
lim
Fk ( x, y  )  Fk ( x  , y  )  Fk ( x  , y ) 
l
l
l
lim
 F ( x, y 0 )  F ( x 0 , y 0 )  F ( x 0 , y ), x  X , y Y
Утв. 1. Пусть F ( x, y )  C ( X  Y ), где X  E m  выпуклый компакт,
15
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Y  компакт некоторого метрического пространства , и пусть
x  X Y ( x)  { y( x)}
 F ( x, y ) имеет седловую точку ( x* , y( x* ))


y

Y
F
(
x
,
y
)

x

Доказательство полностью повторяет доказательство теоремы 1.
Утв. 2. Пусть F ( x, y )  C ( X  Y ), где Y  E n  выпуклый компакт,
X  компакт некоторого метрического пространства , и пусть
y Y X( y )  {x( y )}
 F ( x, y ) имеет седловую точку ( x( y * ), y * )
x Y F ( x, y ) 
y

Доказательство полностью повторяет доказательство теоремы 1.
Примеры.
1) F ( x, y)  xy, X  [0,1], Y  [0,1]
( x0 , y 0 )  (0,0)
x0  0  Y (0)  [0,1]  y* Y (0) и (x 0 , y* )  (0,1) - не седловая точка
2) F ( x, y )   x2  y 3  y 2 x  4 y  3, X  0,1 , Y  0,1
F
xx  2  0  x
Fyy  6 y  2 x  0   y
M ( y )  max F ( x, y )  F ( x( y ), y )
0 x 1
Fx  0  2x+y2  0  x 
M ( y )  F ( x( y ), y ) 
y2
 0,1
2  
y4
 y3  4 y  3
4
M ( y )  y 3  3 y 2  4  0
y1  1, y2,3  2
(Рис. 5)
1 
( x( y * ), y * )   ,1
2 
16
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Упр. Доказать, что F ( x, y ) :  y ,  x имеет единственную седловую точку.
17
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция III
Смешанные стратегии
Вспомним пример матрицы, не имеющей решений:



1
1  

A 
 1 1 



Пусть X – множество стратегий первого игрока.
Опр. Смешанной стратегией первого игрока  на X называется вероятностное
распределение на множестве X.
Применить смешанную стратегию означает выбрать x  X как реализацию случайной
величины, имеющей распределение  .
Примеры.
1. Пусть X  {1,
m
, m}, p  ( p1,, pm )  P  { p  E m |  pi  1, pi  0 i  1, , m}
i 1
вероятностный вектор. Применить смешанную стратегию – выбрать чистую
стратегию i с вероятностью pi .
1 1
p   ,  – орлянка
2 2
1 5
p   ,  – подбрасывания шестигранного кубика
6 6
 7 5
p  , – ?
 12 12 
2. Пусть X  a, b ,  ( x)  P(  x) – функция распределения.
0, x  a

 ( x)  1, x  b
неубывает и непрерывна справа

18
(Рис. 6)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
  равномерно распределенная на отрезке 0,1 случайная величина
1

0,
0




4

1
1 1
 ( x)   ,   
– обратная функция
2
4
2

1
 1
 ( ), 2    1

Случайная величина  будет иметь распределение  0 ( x ) :
P(  x)  P(  0 ( x))  0 ( x) , 0( x)  0 .
Пусть h( x ) – непрерывна. Тогда справедлива формула:
1
1
1
1 1
0 h( x)d0 ( x)  4h(0)  4 h  2   1 h( x)d0( x)dx
2
3. Пусть X – выпуклый компакт в конечномерном евклидовом пространстве.
Рассмотрим x 0  X . Определим функцию
1, x  x 0

I x0 ( x)  
0

0, x  x
1, x  B
I x 0 ( B)  
, где B  борелевское множество
0,
x

B

Организуем выпуклую комбинацию вырожденных распределений:
x(1) , , x( m)  X
m
   pi I x( i ) , p  P
i 1
19
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Формула осреднения.
Пусть h( x) определена на X . Тогда

m

m

i 1
(i )
 h( x)d  pi I x(i )   pih( x )
X
 i 1
Смешанное расширение антагонистических игр
Смешанное расширение матричной игры.
 : A  (aij )mn
p  P – смешанная стратегия первого игрока


q  ( q1, , qn )  Q  q


m


n
q j  1, q j  0 

j 1


n
A( p, q)   pi aij q j
i 1 j 1
Тогда игра   P, Q, A( p, q) – смешанное расширение,  p0 , q0 ,V  A( p0 , q0 )  – ее
решение, т. е. ( p0 , q0 ) образует седловую точку функции A( p, q) на P  Q .
 p0 , q0 ,V  A( p0 , q0 )  называется решением игры  в смешанной стратегии, ( p0 , q0 ) –
оптимальной смешанной стратегией.
Теорема 1.4 (основная теорема матричных игр).
Всякая матричная игра имеет решение в смешанной стратегии.
m
n
Доказательство: A( p, q)   pi aij q j – линейна, а значит можно считать, что она
i 1 j 1
вогнута по p и выпукла по q. Она определена на произведении выпуклых компактов.
Тогда по Т1.3 A( p, q ) имеет седловую точку.
Использование смешанных стратегий
20
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
A( p, q0 )  A( p0 , q0 )  A( p0 , q) p  P, q Q (опр. седловой точки)
1. Игра повторяется много раз:
A( p, q0 )  V
2. Однократное повторение игры: выигрыши a ij преобразуются в т.н. полезности
этих выигрышей.
Пример.
 10 0 
A

 0 5
1 0
A  
  матрица полезности
0 a
Как же найти полезность a ?
Рассмотрим лотерею, где выигрыш 10 будет с вероятностью a , а выигрыш 0 с
вероятностью (1– a ). Средний выигрыш тогда равен 10 a . Первому игроку задается
вопрос: при каком a он согласен купить этот лотерейный билет? Если игрок согласен
купить билет при:
a
1
– нейтральное отношение;
2
a
1
– осторожное отношение;
2
a
1
– азарт. (Рис 7)
2
21
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
3. Физические смеси.
Рассмотрим пример «игры против природы». Стратегия фермера – посадить одну из
трех культур на участке. Стратегия природы – «выбор» года (нормального,
дождливого, засушливого).
H (hij )33 – функция урожайности.
A(ai hij ) – матрица выручки.
1 1 1
P 0   , ,  – смешанная стратегия.
4 4 2
Вместо того, чтобы «подбрасывать монетку», фермер может разделить участок (рис.
8) на три части.
22
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Смешанное расширение непрерывных игр
Пусть   X ,Y , F ( x, y) , X  a, b , Y  c, d  , F ( x, y) C( X Y ) – непрерывная
антагонистическая игра на прямоугольнике.
 {},  { } - функции распределения.
bd
F ( , )   F ( x, y )d ( x)d ( y )
т. Фубини d

a c
b
c F ( x, y)d ( y)  a F ( x, y)d ( x)
d
F ( x, )   F ( x, y )d ( y )
c
b
F ( , y )   F ( x, y )d ( x)
a
  {},{ }, F ( , )

0
, 0 ,V  F ( 0 , 0 )  ,
( 0 , 0 )  седловая точка F ( , ) на {}  { }
Фактически, нам нужно доказать, что игра  имеет решение.
сл.
Опр. Рассмотрим  k { } . Будем говорить, что  k  0 слабо, если
h( x)  C [a, b]
b
b
a
a
k
0
 h ( x )d ( x )   h ( x )d  ( x )
Теорема Хелли3 (без доказательства). Множество функций распределения { }
сл.
является слабым компактом, т.е.  k { }  kl  0 .
Лемма 3. Пусть Г – непрерывная игра на прямоугольнике. Тогда в этой игре
существуют максиминные и минимаксные смешанные стратегии.
Доказательство: рассмотрим смешанное расширение  и для него выпишем нижнее и
верхнее значение игры.
Эдуард Хелли (1884 – 1943) – австрийский математик, один из основоположников функционального
анализа.
3
23
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
V  sup inf F ( , )
 { } { }
V  inf sup F ( , )
 { } { }
Фактически, лемма утверждает, что sup в первом выражении и inf во втором
достигаются на некоторых смешанных стратегиях  0 и  0 соответственно.
Докажем существование максиминной смешанной стратегии. По определению верхней
грани,  k { }: inf F ( k , )  V . Используя теорему Хелли, получим, что
 { }
сл.
 kl  0 . Возьмем любую   { } . Тогда
b
b
F ( , )   F ( x, )d ( x)   F ( x, )d 0 ( x) в силу непрерывности по x F ( x, ) .
kl
kl
a
a
lim
 { } F ( kl , )  inf F ( kl , )  F ( 0 , )  V   inf F ( 0 , )  V
 { }
 { }
Осталось заметить, что строгое неравенство здесь невозможно, поскольку V – верхняя
грань от нижней грани. Утверждение доказано для максиминных стратегий.
Доказательство для минимаксных стратегий полностью аналогично.
Лемма 4. Пусть функции F ( x, y ), F1 ( x, y ) определены на X  Y , ограниченны и для
них выполнено условие близости:
F ( x, y )  F1 ( x, y )   x  X , y Y (A)
Тогда V  V1   , V  V 1   .
Доказательство: пусть функции h( z ), h1 ( z ) определены на Z , ограниченны и для них
выполнено условие близости: h( z)  h1( z)   z  Z
h1 ( z )    h( z )  h1 ( z )   z  Z
inf h1 ( z )    inf h( z )  inf h1 ( z )   z  Z
zZ
zZ
zZ
inf h( z )  inf h1 ( z )   z  Z
zZ
zZ
То же верно и для верхних граней.
24
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
W1 ( x )
W ( x)
x  X inf F ( x, y )  inf F1 ( x, y )   , что следует из изложенного выше.
yY
yY
V1
V
supW ( x )  supW1 ( x )   и первое утверждение леммы доказано.
xX
xX
Второе доказывается аналогично.
Теорема 1.5 (основная теорема непрерывных игр).
Всякая непрерывная игра Г имеет решение в смешанной стратегии.
Доказательство: нам нужно установить, что F ( , ) имеет седловую точку на
{}{ } .
Из Т1.1 это равносильно доказательству того, что V  V ,
V  max inf F ( , ), V  min max F ( , ) .
{ }  { }
 { } { }
Рассмотрим X  [a, b] , X 
m
X i (рис. 9); Y  [c, d ] , Y 
n
Y j (рис. 10).
j 1
i 1
25
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
( xi , y j )  X i  Y j (рис 11)
Определим ступенчатую функцию:
F1 ( x, y )  F ( x i , y j ), ( x, y )  X i  Y j
  0 F ( x, y)  F1( x, y)   x  X , y Y (1)
Только что мы, к своему удивлению, аппроксимировали непрерывную игру матричной
игрой.
A   aij  F ( xi , y j ) 
mn
Определим отображение   p : pi =  d ( x )  0,
xi
на
Таким образом можно определить { } P
m
p
i 1
i
1.
4
Аналогично для второго игрока:   q : q j =  d ( y )  0,
yj
bd
m

P X i Y
n
j
n
qi  1

j 1

F1 ( , )    F1 ( x, y )d ( x )d ( y )   F ( x , y ) pi q j  A( p, q) (2)
i
j
i 1 j 1
a c
Покажем, наконец, что F ( , ) и F1 ( , ) – близкие функции.
F ( , )  F1 ( , ) 
bd
bd
a c  F ( , )  F1( , )  d ( x)d ( y ) 
 в силу (1)
   F ( , )  F1 ( , ) d ( x )d ( y )    { }  { } и условие (А) выполнено.
a c
Ура!
4
p  P  :   p
26
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция IV
Завершаем доказательство теоремы. Из Л4 следует, что
min из (2) =A( p ,q )
max
p
q
max inf F ( , )  max min F1 ( , )  
{ }  { }
{ }  { }
min sup F ( , )  min max F1 ( , )  
 { }  { }
 { }  { }
max min A( p ,q )
V
qQ pP
Осталось заметить, что по основной теореме матричных игр A( p, q ) имеет седловую
точку, поэтому max min F1( , )  min max F1( , )  V  V  2  V  V и Т1.5
{ }  { }
 { } { }
полностью доказана.
Свойства решений в смешанных стратегиях
Теорема 1.6. Пусть Г – непрерывная игра на прямоугольнике. Тогда
( 0 , 0 ,V ) – решение в смешанных стратегиях 
 F ( x, 0 )  V  F ( 0 , y )  {}  { } .
(*)
Доказательство:
( 0 , 0 ,V ) – решение в смешанных стратегиях  (*)
F ( 0 , )  F ( 0 , 0 )  V  F ( , 0 )  {}  { }    x,   y 
 F ( x, 0 )  V  F ( 0 , y )  {}  { }
(*)  ( 0 , 0 ,V ) – решение в смешанных стратегиях.
Осредним неравенство (*) по  и по  :
F ( , 0 )  V  F ( 0 , )  {}  { }
   0 ,   0
F ( 0 , 0 )  V  F ( 0 , 0 )  F ( 0 , 0 )  V  F ( 0 , 0 ) и достаточность также
доказана.
27
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Теорема 1.7. Пусть имеется игра с матрицей А. Тогда
( p0 , q0 ,V ) – решение в смешанных стратегиях 
 A(i, q0 )  V  A( p 0 , j ) i  1, m j  1, n (*)
Доказательство аналогично Т1.6.
q10
p10
A
qn0
j





i
pn0





m
A  (i, q0 )   aij q0j – скалярное произведение i–ой строки на q 0 .
i 1
n
A  ( p0 , j )   pi0aij – скалярное произведение j–ого столбца на p 0 .
j 1
Пример.
 c1

c
1) A   n


 c2
cn 
cn 1 
c1
cn
n
1
, p  ,

n

c1 
0
ck

1 0 1
1
k 1
,  , q   , , , V 
n
n
n
n
2) F ( x, y)  ( x  y)2  x  y , X  0,1 , Y  0,1
 0 ( x )  x,  0 ( y )  y , V  -
1
– показать самостоятельно.
6
Теорема 1.8. Для непрерывной игры Г справедливы следующие утверждения:
1)  {} inf F ( , )  min F ( , y) ;
 { }
yY
2)  { } sup F ( , )  max F ( x, ) .
xX
{ }
Доказательство:
d
d
c
c
 {}  { } F ( , )   F ( , y )d ( y )   min F ( , y )d ( y )  min F ( , y) 
yY
yY
 inf F ( , )  min F ( , y )  Y  { }  inf F ( , )  inf F ( , )  min F ( , y)
 { }
yY
 { }
 { }
yY
Следствие. Для значения непрерывной игры Г на прямоугольнике справедливо:
28
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
V  inf min F ( , y)  min max F ( x, )
{ } yY
 { } xX
Доказательство: мы знаем, что непрерывная игра Г имеет решение в смешанных
стратегиях, т.е. F ( , ) имеет седловую точку. Тогда, в силу Т1.1:
V  max inf F ( , )  min sup F ( , ) .
{ }  { }
 { }{ }
Далее, используя Т1.8, получим:
V  max min F ( , y )  min max F ( x, ) и следствие доказано.
 { } xX
{ } yY
Теорема 1.8*. Для матричной игры A справедливы следующие утверждения:
1) p  P min A( p, q)  min A( p, j ) ;
qQ
1 j  n
2) q  Q max A( p, q)  max A(i, q) .
pP
1i  m
Доказательство теоремы аналогично Т1.8.
Следствие. Для значения матричной игры А справедливо:
V  max min A( p, j )  min max A(i, q)
pP 1 j  n
qQ 1i  m
Доказательство аналогично доказательству следствия из Т1.8.
Свойство дополняющей нежёсткости
Опр. Будем говорить, что точка x  Sp( ) – спектру функции распределения, если
  0  [a, b]  [a, b] x  [a, b] b  a    (b)   (a )  0
P  ( a ,b]
29
(рис. 12)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Пример. Пусть в точке x0 производная  ( x0 ) существует и положительна. Тогда x0
– точка спектра. (Рис. 13)
Теорема 1.9 (свойство дополняющей нежёсткости).
Пусть ( 0 , 0 ,V ) – решение в смешанных стратегиях непрерывной игры Г на
прямоугольнике. Тогда справедливы следующие утверждения:
1) x  Sp( 0 )  F ( x, 0 )  V ;
2) y  Sp( 0 )  F ( 0 , y )  V .
Доказательство: из (*) следует, что F ( x, 0 )  V  F ( 0 , y ) . Теорема утверждает, что
для точек из спектра это неравенство обращается в равенство. Предположим, что
утверждение неверно, т.е. что  x  Sp( 0 ): F ( x, 0 )  V .
В силу непрерывности по x функции F ( x, 0 ) ,
 a, b x  a, b b  a   F ( x, 0 )  V   V x  a, b .
Из определения спектра следует, что можно выбрать отрезок [a , b] таким образом, что
 0 (b)   0 (a)  0 . Придем к противоречию:
b
b
V 
V
V  F ( , )   F ( x, )d ( x)   F ( x, ) d ( x) 
0
0
0
a
0
0
a
30
0
F ( x,

X /[a ,b]
0
) d 0 ( x ) 
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
b
0
 V   d ( x )  V
0
a
 d
X /[a ,b]
b
0
( x )  V  d 0 ( x )  V
a
 d
X /[ a ,b]
0
( x )  1V  V .
Следствие. Пусть ( 0 , 0 ,V ) – решение в смешанных стратегиях непрерывной игры Г
на прямоугольнике. Тогда справедливы следующие утверждения:
1) F ( x, 0 )  V  x  Sp( 0 ) ;
2) F ( 0 , y )  V  y  Sp( 0 ) .
Теорема 1.10 (свойство дополняющей нежёсткости для матричных игр).
Пусть ( p0 , q0 ,V ) – решение матричной игры A. Тогда справедливы следующие
утверждения:
1) pi0  0  A(i, q0 )  V ;
2) qi0  0  A( p 0 , j )  V .
Доказательство аналогично обоснованию Т1.9.
Стоит заметить, что импликация A(i, q0 )  V  pi0  0 , вообще говоря, не верна. Чтобы
в этом убедиться, достаточно рассмотреть матрицу:
a
A  
a

a
 , V  a и все стратегии являются оптимальными.

a 
Такое экстравагантное название теоремы связано с тем, что если, например, в
равносильности A(i, q0 )  V  pi0  0
pi0  0 (" нежёстко ")  A(i, q0 )  V (" жёстко ") и наоборот,
A(i, q0 )  V (" нежёстко ")  pi0  0 (" жёстко ") .
Следствие. Пусть ( p0 , q0 ,V ) – решение матричной игры A. Тогда справедливы
следующие утверждения:
1) A(i, q 0 )  V  pi0  0 ;
2) A( p 0 , j )  V  qi0  0 .
31
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Примеры.
 1
1) A  
1
 a1
0

2) A  

0
0

1
1 1
, V 0  0, p 0  q0   ,  .

1
2 2
0
0
0
0 
 , a i  0, i  1, n .

0
an 
0
0
ai
0
0
0
0
Если положить 0  ai  1 , то игра имеет следующую интерпретацию: играют
полицейские и преступники. Задача полицейского – поймать преступника.
Их стратегия – идти в n возможных мест. Если они «столкнутся» в i, то a i –
вероятность поймать преступника.
Отметим перво-наперво, что эта игра в чистых стратегиях решения не имеет:
V  max min aij  0 , но V  min max aij  min aij  0 .
1 j  n 1i  n
1i n 1 j n
1 j  n
Найдем решение в смешанных стратегиях. Предположим, что pi0  0, q0j  0 . Тогда
A(i, q 0 )  V , i  1, n ;
ai qi0  V , i  1, n ;
qi0 
V
, i  1, n .
ai
Сложим последнее равенство по всем i:
n
1
V 
k 1 ak
1V 
qi0 
1
ai
1
n
1

k 1 ak
1
n
1

k 1 ak
;
.
Для второго игрока поступаем аналогично.
q0j  0  A( p 0 , j )  V , j  1, n ;
32
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
a j p 0j  V , j  1, n ;
p0j 
1
aj
1
n
1

k 1 ak
.
Равенство qi0  p0j приводит нас к неочевидному выводу: полицейскому следует
идти туда, где вероятность поймать преступника наименьшая. Такая себе
реализация выражения «чтобы поймать преступника, нужно мыслить, как
преступник».
Фактически, нами была решена задача V  max min A( p, j )  max min ai pi 
pP 1 j  n
pP 1 j  n
1
n
1

k 1 ak
1 0
10 0 
3) A  
, A


0 a
 0 5
1
, т.е. первый игрок, будучи не вполне рассудителен,
2
бросает монетку и выбирает любую из двух строчек.
Рассмотрим a  1  V 
33
.
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция V
Методы решения матричных игр
Доминирование строк и столбцов
A  (aij )mn
Как было выяснено ранее, для существования седловой точки необходимо, чтобы
max min aij  min max aij .
Напомним условие (*) из Т1.7: A(i, q0 )  V  A( p 0 , j ) i  1, m j  1, n .
Пусть даны векторы a  (a1,
, al ), b  (b1, , bl ) .
Опр. Будем говорить, что вектор a доминирует вектор b, если ai  bi i  1, l .
Опр. Будем говорить, что вектор a строго доминирует вектор b, если ai  bi i  1, l .
Пусть дан набор векторов a ( i ) , i  1, m некоторого евклидового пространства и пусть
p  ( p1, , pm ) – вероятностный вектор, т.е.
m
pi  1,

i 1
pi  0, i  1, m .
m
Опр. Выпуклой комбинацией векторов a ( i ) с коэффициентами pi называется
pi a ( i ) .

i 1
Теорема 1.11 (о доминировании строк).
Пусть некоторая строка матрицы A доминируется выпуклой комбинацией остальных
строк этой матрицы. Тогда эта строка входит с нулевой вероятностью в некоторую
оптимальную смешанную стратегию первого игрока, и ее можно вычеркнуть.
Если указанное доминирование строгое, то доминируемая строка входит с нулевой
вероятностью в любую оптимальную смешанную стратегию первого игрока.
Доказательство:
пусть строка i1 доминируется выпуклой комбинацией остальных строк. Тогда
m
aij   pi aij , j  1, n,
i i1
m
pi  1,

i i
pi  0, i  i1 (1)
1
34
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Вычеркнем в матрице А i1 строку. Получим в результате матрицу Â с аналогичной
исходной матрице нумерацией строк. ( pˆ , q0 ,V ) – решение в смешанных стратегиях
игры с матрицей Â . В частности, для этой тройки выполнено условие (*). Расширим
вектор p̂ следующим образом: p0  ( pˆ1 , , pˆ i1 1 ,0, pˆ i1 1, , pˆ m ) . Утверждается, что
( p0 , q0 ,V ) является решением игры с матрицей А. Проверим теперь справедливость
условия (*) для ( p0 , q0 ,V ) .
(*) для Aˆ
ˆ ( pˆ , j )  V , j  1, n
1) A( p , j )  A
0
2) i  i1 A(i, q0 )  Aˆ (i, q 0 )
(*) для Aˆ
 V , i  1, m
n
n
j 1
j 1 i i1
3) i  i1 A(i1, q0 )   ai1 j q0j   ( pi qij )q j0   p  ( pi , i  i1 )   Aˆ ( p, q0 )  V
Докажем вторую часть теоремы. Приведенные выше неравенства в своем строгом
варианте остаются справедливыми. Пусть p* – оптимальная смешанная стратегия
первого игрока. Тогда тройка ( p* , q0 ,V ) является решением в смешанных стратегиях
игры с матрицей A. Используем следствие Т1.10: A(i1 , q0 )  V  pi*1  0 .
Полезный пример:
a

A
a

a

 – матрица, содержащая в каждой ячейке элемент a. За счет нестрого
a 
доминирования, вычеркивая все строки, кроме первой, вы потеряете огромное
количество оптимальных стратегий.
Теорема 1.12 (о доминировании столбцов).
Пусть некоторый столбец матрицы A доминирует выпуклую комбинацию остальных
столбцов этой матрицы. Тогда этот столбец входит с нулевой вероятностью в
некоторую оптимальную смешанную стратегию второго игрока, и его можно
вычеркнуть.
Если указанное доминирование строгое, то доминирующий столбец
35
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
входит с нулевой вероятностью в любую оптимальную смешанную стратегию второго
игрока.
Доказательство теоремы сходно с доказательством Т1.11.
Примеры.
3
1
1. A  
2

2
1
3
2
2
5
3 
2

3
5
3
1
0
Видно, что четвертый столбец больше третьего. Вычеркиваем его:
3
1
A
2

2
1
3
2
2
5
3 
2

3
5
3
1
0
Аналогично третья строка больше четвертой строки. Вычеркиваем последнюю
строку:
3
1
A
2

2
1
3
2
2
5
3
1
0
5
3 
2

3
Здесь уже не осталось доминируемых строк и доминирующих столбцов, поэтому
используем доминирование при помощи выпуклых комбинаций:
1
1
 первая строка    вторая строка    третья строка  .
2
2
Тогда вычеркнем третью строку.
3
1
A
2

2
1
3
2
2
5
3
1
0
5
3 
2

3
Видно, что третий столбец доминирует второй.
36
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
3
1
A
2

2
1
3
2
2
5
3
1
0
5
3 
2

3
 3 1
1 1
1 1
Осталась матрица Aˆ  
, pˆ   ,  , qˆ   ,  , V  2 .

2 2
2 2
 1 3
Дополняя векторы нулями, получаем искомое решение:
1 1

1 1

p 0   , ,0,0  , q 0   , ,0,0  , V  2 .
2 2

2 2

Упр. Пусть дана матрица A  (aij )mn , имеющая решение в чистых стратегиях.
Показать, что после вычеркивания доминируемых(-ющих) строк(столбцов), останется
хотя бы одна седловая точка.
Графический метод решения матричной игры
Рассмотрим матрицу размеров m  2 .
A
 a11

a
1 p1  21
p1
a1 j
a2 j
a1n 
, 0  p1  1
a2 n 
Т 1.8
V  max min A( p, j )  max min a1 j p1  a2 j (1  p1 )  ,
pP 1 j  n
0 p1 1 1 j  n
k j  a1 j  a2 j – угловой коэффициент.
37
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
a)
 j1 : k j1  0, l j1 ( p10 )  V
(Рис. 14)
 j2 : k j2  0, l j2 ( p10 )  V
Будем искать оптимальную смешанную стратегию второго игрока:
q0  (0,,0, q* ,0,,0,1  q* ,0,,0),
j1
j2
k j1 q*  k j2 (1  q* )  0, 0  q*  1 , (2)
решение этого уравнения q* всегда найдется. Это следует из
противоположности знаков k j1 и k j2 .
Покажем, что q 0 – искомая смешанная стратегия второго игрока.
 1  p1  1 A( p, q 0 )  V
k j1
k j2
A( p, q )  q l j1 ( p1 )  (1  q ) l j2 ( p1 )  const , l j1 ( p1 )  A( p, j1 )
0
*
*
l j1 ( p10 )  V  l j2 ( p10 )  const  V
b) p10  0 (рис. 15)
 j1 : k j1  0, l j1 (0)  0
A( p, j1 )  l j1 ( p1 )  V , p1  [0,1]
Получим, что (2, j1 ) – седловая точка.
c)
p10  1 (рис. 16)
Наличие седловой точки показывается аналогично.
38
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Рассмотрим теперь матрицу размеров m  2 .
q1
1 q1
 a11 a12 




A   ai1 ai 2 , 0  q1  1,




a

 m1 am 2 
ki1  0, li1 (q10 )  V
(Рис. 17)
ki2  0, li2 (q10 )  V
li ( q1 )
Сл. Т 1.10
V
 min max A(i, q)  min max  ai1q1  ai 2 (1  q1 ).
qQ 1i  m
0 q1 1 1i  m
Аналогично строим оптимальную стратегию первого игрока.
p 0  (0,,0, p* ,0,,0,1  p* ,0,,0),
i1
i2
ki1 p*  ki2 (1  p* )  0, 0  p*  1.
Задача.
 1 2 3 
Решить матричную игру с A  
.
 2 4 1
39
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 p  1 2 3 
A   1 
 (имеется в виду скалярное умножение столбца на столбец)
1  p1   2 4 1 
l1 ( p1 )   p1  2(1  p1 )  2  p1
(рис. 18)
l2 ( p1 )  2 p1  4(1  p1 )  4  6 p1
l3 ( p1 )  3 p1  1(1  p1 )  1  2 p1
l1 ( p1 )  l3 ( p1 )  2  3 p1  1  2 p1  p10 
1
1 7
V  1 2 
5
5 5
1 4
p 0   ,  , q0  ( q* ,0,1  q* ) , k1  3, k3  2
5 5
Составим уравнение (2):
3q*  2(1  q* )  0  q* 
2
 2 3
 q0   ,0, 
5
 5 5
Сделаем проверку условия (*).
A( p 0 , j )  V 
1)
7
j
5
1
 5   1 2 3 
A   

 4  2 4 1
 
5
40
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
A( p 0 ,1) 
1 8 7
2 16 7
3 4 7
  , A( p 0 ,2) 
  , A( p 0 ,3)    ;
5 5 5
5
5 5
5 5 5
1) A(i, q0 )  V 
7
i
5
3
2
0


5
5
 1 2 3 
A

 2 4 1
A(1, q 0 ) 
2 9 7
4 3 7
  , A(2, q 0 )    .
5 5 5
5 5 5
В качестве упражнения транспонируйте матрицу и решите соответствующую
матричную игру.
Упр. Пусть дана матрица A23 . Выписать все оптимальные смешанные стратегии двух
игроков (рис. 19 и 20).
Сведение решения матричной игры к паре двойственных задач линейного
программирования.
A  (aij )mn , V  0
Что, если в матрице А есть отрицательные элементы?
Предлагается ввести матрицу B  (aij  C ), где С – некоторая достаточно большая
41
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
константа. Тогда V ( B )  V ( A)  C и если ( p0 , q0 ,V ( A)) – решение игры с матрицей
А, то ( p0 , q0 ,V ( A)  С ) – решение игры с матрицей B.
Упр. Доказать, что это справедливо. Подсказка: использовать условие (*).
Рассмотрим прием ввода вспомогательной переменной и перехода от минимума к
максимуму.
Идея: 1  min(1,3,5)  max u , т.е. переход от минимума к максимуму состоит в том,
u 1
u 3
u 5
чтобы ввести вспомогательную переменную u и наложить на нее соответствующие
ограничения.
Применим это к максиминной стратегии.
т.1.8
V  max min A( p, j )  max max u
pP 1 j  n
pP u  A( p , j ), j 1,n
42
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция VI
Продолжаем рассматривать задачу сведения к максимуму.
т.1.8
m


 max u  p, u : p  P, A( p, j )   pi aij  u, j  1, n  
u  A( p , j ), j 1, n

i 1

V  max min A( p, j )  max max u
pP 1 j  n
pP
5


p
 u  0, z : zi  i  0, i  1, m,
u



 max
z

 z : zi  0, i  1, m;
m
 zi 
1
m
m
zi 

i 1
pi

i 1
u

1
 
u


m

m

zi aij  1, j  1, n  

i 1

i 1


 z : zi  0, i  1, m;
m
min  zi 
1
z
zi aij  1, j  1, n 

i 1

(I)
i 1
Таким образом, мы свели нашу задачу на максимин к задаче линейного
программирования. Напомним, что она разрешима, так как существует максиминная
стратегия исходной задачи.
Предположим, мы нашли оптимальное решение z0 задачи (I). Тогда можно утверждать,
что мы нашли решение игры и оптимальную смешанную стратегию первого игрока:
V
1
m
zi0

i 1
, p0 =V  z 0
Теперь запишем минимаксную задачу.
т.1.8
V  min max A(i, q) 
qQ 1i  m

1
n
max  w j
w

 w : w j  0, j  1, n;

j 1
w0 : q0 =V  w0
5
В фигурных скобках приводятся соответствующие ограничения.
43
n

aij w j  1, i  1, m 

j 1


(II)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Отметим, что задачи (I) и (II) – взаимно двойственные.
С помощью Т1.10 можно доказать свойство дополняющей нежёсткости для
оптимальных решений этих двух задач:
n
zi0  0   aij w0j  1,
j 1
m
w  0   z a  1,
0
j
i 1
0
i ij
n
aij w0j  1  zi0  0

j 1
m
zi0aij  1  w0j  0

i 1
Упр. Попробуйте доказать это самостоятельно.
Игры с выпуклой(вогнутой) функцией выигрыша
Рассмотрим антагонистическую игру Г  X ,Y , F ( x, y ) .
Опр. Будем говорить, что Г – игра с выпуклой функцией выигрыша, если
F ( x, y ) – непрерывна на X  Y и выполнено:
x  X F ( x, y )  y ,
y Y F ( x, y ) x .
Опр. Будем говорить, что Г – игра с вогнутой функцией выигрыша, если
F ( x, y ) – непрерывна на X  Y и выполнено:
x  X F ( x, y )  y ,
y Y F ( x, y ) x .
Пусть Z – выпуклое множество евклидового пространства.
Опр. z 0  Z – крайняя точка, если 
 z  z  Z ,   (0,1) : z 0   z  (1   ) z (рис. 21)
44
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Как видно из рис. 22, точки в вершинах прямоугольника являются крайними, а,
например, на ребрах – нет.
Другой пример – на рис. 23 все точки дуги – крайние.
Утв. Любой выпуклый компакт в евклидовом пространстве имеет крайнюю точку:
Z ext   .
n
Доказательство: Z  E m . Рассмотрим h( z )   zi2 – строго выпуклую функцию
i 1
(предполагается, что вы доказали это ранее).
Предположим противное: z  z  Z ,   (0,1) : z 0   z  (1   ) z .
h( z0 )  h  z  (1   ) z  h( z)  (1   )h( z)  h( z 0 )  (1   )h( z 0 )  h( z 0 ) –
противоречие. Тем самым утверждение доказано.

Пример. Z   z  E n


n
z
i 1
i

 A, zi  0, i  1, n  , A  0 (рис. 24)


zi  0,,0, A,0,,0 , i  1, n
i
Упр. Доказать, что точки zi и только они являются крайними.
Теорема 1.13 (Каратеодори6). Пусть Z  E m . Тогда
z  Z  z (1) , , z ( k )  Z ext , 1  0, , k  0,
k
k
i 1
i 1
i  1  z  i z(i ) , k  m  1
Константин Каратеодо́ри (1873 – 1950) – немецкий математик греческого происхождения, известен
работами по теории функций, вариационному исчислению, теории конформных отображений, общей
теории меры множеств.
6
45
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
(рис. 25)
Теорему приведем без доказательства.
Лемма 5. Пусть выпуклая функция h ( z ) – определена и непрерывна на некотором
компакте евклидового пространства. Утверждается, что max h( z )  max
h( z ) .
ext
zZ
zZ
Доказательство:  z 0 : h( z 0 )  max h( z) . Ввиду Т1.13,
zZ
k
z 0  i z (i ) ,
i 1
k
i  1, i  0, z (i )  Z ext

i 1
k
 k
(i ) 
h( z )  h  i z   i h z (i )  max h z (i )  h( z 0 )  max h z (i )  h( z 0 )
1i  k
1i  k
 i 1
 i 1
0
 
 
 
и лемма доказана.
Пусть Г – игра с выпуклой функцией F(x,y) по каждой переменной(но не обязательно

по совокупности переменных), X – выпуклый компакт, X ext  x (1) ,
, x(k )  –
конечное множество крайних точек. Также нам понадобится вектор

p  ( p1 , , pk )  P   p  E k

k
p
i 1
i

 1, pi  0, i  1, k 

Рассмотрим функцию ( p, y )   pi F  x ( i ) , y    F ( x, y )d ( x )  F ( , y ) . (1)
k
i 1
X
Она определена на P  Y и является линейной по P и выпуклой по Y. Тогда по Т1.3 она
46
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
имеет седловую точку.
Теорема 1.14. Пусть Г – игра с выпуклой функцией выигрыша F(x,y),
X ext  x (1) ,
, x ( k )  – конечное множество крайних точек. Утверждается, что эта игра
имеет решение в смешанных стратегиях вида:
 0 k 0

0
0
0
0
    pi I x( i ) , y ,V  , где  p , y  - седловая точка функции ( p, y ) , y –
i 1


минимаксная чистая стратегия, V  V  min max F ( x, y ) .
yY
xX
Доказательство: покажем прежде справедливость равенства
Л .5
y Y max ( p, y )  max F ( x, y )  max F ( x ( i ) , y ) .
pP
xX
k
1i  k
т .1.7
(2)
Л .5
max  ( p, y )  max  pi F ( x ( i ) , y )  max F ( x ( i ) , y )  max F ( x, y )
pP
pP
1i  k
i 1
xX
Пусть теперь ( p 0 , y 0 ) – седловая точка функции  ( p, y ) . Тогда
(2)

0
max

(
p
,
y
)
 max F ( x, y 0 )

p

P
xX
min  ( p 0 , y )  max min  ( p, y )  min max  ( p, y )   (2)

yY
yY pP
pP yY
 min max F ( x, y )  V
 yY pP
т .1.1
(1)
min ( p 0 , y )  min F ( 0 , y )  V  max F ( x, y 0 ) 
yY
yY
xX
F ( 0 , y )  V  F ( x, y 0 ) x  X , y  Y
Это неравенство есть условие (*) из Т1.6 для тройки ( 0 , y 0 ,V ) . Теорема доказана.


Пусть Г – игра с вогнутой функцией выигрыша F(x,y), Y ext  y (1) ,, y ( k ) – конечное
множество крайних точек.
Рассмотрим вероятностный вектор q  ( q1 , , qk )  Q и функцию
k
1 ( x, q)   q j F ( x, y ( j ) ) , являющуюся вогнутой по x и выпуклой по q.
j 1
47
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Теорема 1.15. Эта игра имеет решение в смешанных стратегиях вида:
 0 0 k 0

0
0
0
0
 x ,   q j I y( j ) , y ,V  , где  x , q  - седловая точка функции ( x, q) , x –
j 1


максиминная чистая стратегия, V  V  max min F ( x, y )  min F ( x 0 , y ) .
xX
yY
yY
Доказательство можно провести по аналогии с Т1.14.
Пример. F ( x, y )  x 2  3xy  y 2 , X  0,1 Y  0,1
Fxx ( x, y )  2  0 
  F  строго выпукла по обеим переменным
Fyy ( x, y )  2  0 
4
2
V  min max F ( x, y ) = , y 0 
0 y 1 0 x 1
9
3
V  0 V


Найдем  0  p10 I 0  1  p10 I1 .
( p1, y)  p1F (0, y)  1  p1  F (1, y )  p1 y 2  1  p1  (2  3 y  y 2 )
  p10 , y  достигает минимума в точке y  y 0 :   p10 , y   0
  p10 , y   2 p10 y  1  p10   3  2 y   0
y0 
2
2
2
4 0
5

 5
 2 p10   1  p10   3  2    0 
p1  1  p10      0  p10 
3
3
3
3
9

 3
5
9
4
9
 0  I 0  I1 .
48
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция VII
Многошаговые игры с полной информацией
До сего момента мы рассматривали модель антагонистической игры без динамики:
противники не знали о шагах друг друга. В настоящей лекции речь пойдет об играх с
полной информацией.
Пусть игра повторяется Т шагов, t  1, T – номер каждого из шагов. На каждом шаге у
игроков есть т.н. контролируемый фактор: xt и yt . Игроки выбирают альтернативы
(значения) контролируемых факторов. Опишем процесс многошаговой игры с полной
информацией.
Шаг 1. Первый игрок выбирает стратегию x1 U1 , второй игрок, зная выбор
оппонента, выбирает стратегию y1 V1 ( x1 )  V1 ( ) . Пусть игроки выбрали стратегии
x1, , xt 1 и y1, , yt 1 соответственно.
Введем обозначение: xt   x1,
, xt  , yt   y1,, yt  .
Шаг t. Первый игрок выбирает альтернативу xt , при этом ему известны выборы
x
t 1





, yt 1 , x t Ut xt 1, yt 1  Ut ( ) . Второму игроку известны уже xt , yt 1 , он


выбирает yt Vt xt , yt 1  Vt ( ) .

Так игра продолжается, покуда не прошло T шагов, xT , yT
 называется партией игры.


Для любой партии определен выигрыш первого игрока: F xT , yT .
Рассмотрим пример.
Игроки по очереди берут одну либо две спички. Условие таково: кто последний взял
спичку, тот проиграл. Первый игрок, очевидно, проигрывает при n  3k  1, k  0,1,
спичек и выигрывает при n  3k  1 . Какова же стратегия первого игрока?
Предположим, n  23  3 7  2 . Первый игрок берет в этом случае одну спичку, так
как стремится свести число спичек к n  3k  1 .
49
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Упр. Имеются числа от 1 до 9, первый игрок выбирает одно из этих чисел. Второй –
прибавляет к этому число любое из набора. Таким образом на каждом шаге игроки
добавляют по числу из набора к сумме. Проигрывает тот, кто первым достиг или
превысил 100. Какова здесь оптимальная стратегия?
Неформальное определение стратегии – выбор контролируемых факторов в
зависимости от поступающей информации. Формализуем его.


Рассмотрим произвольный шаг t, функцию x  xt xt 1, yt 1 , xt U . Ее можно
подготовить до игры и применять на каждом шаге непосредственной подстановкой.


Аналогично для второго игрока – y  yt xt , yt 1 , yt V .


T
Тогда стратегией первого игрока называется x  xt , t  1, T  X  Vt , x1  x1. 7


t 1
T
Стратегия второго игрока тогда y  yt , t  1, T Y  U t .
t 1
Нам осталось определить только функцию F ( x, y ) . Заметим, что паре стратегий
первого игрока соответствует некоторая партия игры: ( x, y )  ( x, y ) . Это соответствие
устанавливается следующим образом:
1 шаг:
x1  x1,
y1 = y1 ( x1 );
2 шаг: x2  x 2 ( x1, y1 ), y 2 = y 2 ( x2 , y1 );
def
Тогда F ( x, y )  F ( xT , yT ) и   X ,Y , F ( x, y ) .
Рассмотрим частные случаи.
1) Г  , в которой множества U t ( ) и Vt ( ) – конечные;
2) Г , Ut ( )  Ut , Vt ( )  Vt , где Ut , Vt – компакты метрического пространства.
7


означает прямое произведение.
50
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 T
  T

Функция F ( xT , yT )  С  Vt    Vt   .
 t 1   t 1  
Нужно показать, что игры Г  , Г  имеют решения.




Определим стратегию x 0  xt0 , t  1, T , y 0  yt0 , t  1, T .
Начнем с самого последнего выбора – yT0 . Обозначим

 

 

функция Беллмана



yT0  yT0 xT , yT 1 : F xT , yT 1, yT0  min F xT , yT 1, yT  F xT , yT 1
yT VT ( )





xT0  xT0 xT 1, yT 1 : F xT 1, xT0 , yT 1  max F xT , xT , yT 1  F xT 1, yT 1
xT UT ( )
Положим, что уже определены функции yT0 , xT0 ,

, yt01, xt01 , функция Беллмана при
этом равна F ( xt , yt ) и функции yt0 , xt0 определяются по аналогии с вышеизложенными
равенствами. Таким образом определены все функции вплоть до y10 , x10 :
x10 : F  x10   max F  x1  .
x1U1 ( )
Следует отметить, что эти определения корректны для игр Г  и Г  в том смысле, что
все максимумы и минимумы достигаются: в игре Г  оттого, что все множества
конечны, а в игре Г  ввиду непрерывности цепочки функций минимума и максимума.
Определим, наконец, значение игры.
V  max F  x1   max min F  x1, y1  
x1U1 ( )
 max min
x1U1 ( ) y1V1 ( )
x1U1 ( ) y1V1 ( )
max

min F xT , yT
xT UT ( ) yT VT ( )

Теорема 1.16 (Цермело8). Всякая многошаговая игра с полной информацией Г  (или


Г  ) имеет решение в чистых стратегиях: x 0 , y 0 ,V .
Доказательство: нужно показать справедливость следующих утверждений:
 
1) F x 0 , y  V ,  y Y ;
Эрнст Фри́дрих Фердина́нд Це́рмело (1871 – 1953) – немецкий математик, внёсший значительный вклад
в теорию множеств и создание аксиоматических оснований математики.
8
51
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 
2) F x, y 0  V ,  x  X .
Докажем первое неравенство.
  
0

0
 y Y F x , y  F x , y1,

 
0

0
, yT 1, yT  min F x , y1, , y T 1, yT  F x , y1, , y T 1 
yT VT ( )
 
 , x , x , y , , y   min F  x , , x , y , , y  
F  x , y   min F  x , y   F  x   max F ( x )  V и первое утверждение
0
def xT
0
0
 F x , y  max F x1 ,
xT UT ( )
0
1

1
y1V1 ( )
0
1
0
T 1
1
T
0
1
T 1
1
x1U1 ( )
0
1
yT VT ( )
0
T 1
1
T 1
1
доказано.
Второе доказывается подобным образом.
Примеры.
1. Шахматы.


Белые – первый игрок, черные – второй. Ход xt Ut xt 1, yt 1 делают белые,


yt Vt xt , yt 1 – черные.

F xT , yT

1, выиграли белые;

 0, выиграли черные;
1 / 2, ничья.

Т.о. шахматы – игра с полной информацией вида Г  и для нее справедлива теорема
Цермело.
2. Матричная игра.
5

2
A
3

4
3 1
7 2
2 3
0 2
4
0 
3

5
Разобьем строки и столбцы на следующие множества:
M1  1,2, M 2  3,4, M   1,2 9
9
1, 2 – строки(столбцы) 1 и 2
52
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
N1  1,2, N 2  3,4, N    1,2
Рассмотрим двухшаговую игру.
1) Первый игрок выбирает  , т.е. то множество M  , откуда он будет выбирать
строки. Второй игрок выбирает  , зная о выборе  .
2) Первый игрок выбирает i  M  – номер строки, второй игрок выбирает j  N  –
номер столбца, зная о выборе i.
Наша задача – выписать решения игры и все оптимальные стратегии игроков.
Построим дерево этой игры (рис. 26). Выпишем последовательно функции Беллмана:
F ( ,  , i, j )  aij
F ( ,  , i )  max F ( ,  , i, j )
jN 
F ( ,  )  max F ( ,  , i)
iM
F ( )  min F ( ,  )
 1,2
V  max F ( )
 1,2
53
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 


Найдем оптимальные стратегии:  0 , i 0 ( ,  ) ,  0 ( ), j 0 ( ,  , i ) .
F ( 0 )  V  max F ( )  2
 1,2
Найдем i 0 ( ,  ) , при этом можно облегчить себе жизнь, рассмотрев i 0 (2,  ) , т.к. мы
знаем, что первый игрок выберет
  2.
i 0 (2,1)  3, i 0 (2,2)  3 или 4
 0 (1)  2,  0 (2)  1
(*)
Найдем теперь j 0 ( ,  , i ) . Здесь также можно миновать годы монотонных вычислений,
используя (*).
j 0 (1,2, i )  j 0 (1,2,1)  3, j 0 (1,2,2)  3 или 4
j 0 (2,1, i )  j 0 (2,1,3)  2, j 0 (2,1,4)  2
54
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Упр. Попробуйте решить с той же матрицей следующую задачу:
1) Второй игрок выбирает  , первый игрок выбирает  , зная о выборе  .
2) Второй игрок выбирает j  N  , второй игрок выбирает i  M  , зная о выборе j.
Задача. Пусть задана функция F ( x, y )  ( x  y )2 , X  [0,1], Y  [0,1] .
Рассмотрим одношаговую игру с полной информацией: первый игрок выбирает x,
второй – y, зная об x; выигрыш определяется по функции F. (Подсказка: максимин).
Другой вариант этой задачи – когда игроки меняются местами. (Подсказка: минимакс).
55
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция VIII
Исследование игровых моделей
Модель «нападение – защита»
Пусть имеется n пунктов с номерами i  1, n возможного «прорыва» средств нападения
сквозь защитные пункты. Нападение имеет A  0 ресурсов. Стратегией нападения
является x  ( x1 ,

, xn )  X   x

n

i 1

 xi  A, xi  0, i  1, n  .
Защита, в свою очередь, имеет в распоряжении B  0 средств, и распределяет средства
n


защиты в соответствии с вектором y  ( y1 , , yn ) Y   y  yi  B, yi  0, i  1, n  .
i 1


Рассмотрим, как измеряется эффективность средств защиты на i–ом пункте. Пусть i –
количество средств нападения, которое может уничтожить одно средство защиты.
Пусть на пункт i выделяется xi средств нападения и yi средств защиты. Тогда
возможны два случая:
1. xi  i yi  xi  i yi  0 – количество сил, которое прорывается
2. xi  i yi  не прорывается никого
Объединяя, получаем, что на i–ом пункте прорывается max  xi  i yi ,0 .
n
F ( x, y )   max  xi  i yi ,0 – функция выигрыша.
i 1
В результате мы ввели антагонистическую игру   X ,Y , F ( x, y ) в нормальной
форме10.
Заметим, что F ( x, y ) – выпуклая функция как сумма линейных (а значит, выпуклых)
функций.
Без потери общности будем считать, что 1  2 
10
Игроки выбирают стратегии независимо друг от друга.
56
 n  0 .
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Исследуем эту модель.
a) Покажем, что V  max min F ( x, y )  max  A  n B,0 и x(0)  x( n )  (0,
,0, A) , т.е.
yY
xX
все силы направляются на слабейший n-ый пункт.
x  X i0 :
i0 1
xi

i 1 i
i0
B
i 1
xi
i
11
 xi
  , i  1, i0 -1
 i
i0 1

x
y ( x ) : yi ( x )   B   i , i  i0
i 1 i

0, i  i0


1
i

x 
W ( x )  min F ( x, y )  F  x, y ( x )   xi  i  B   i    xi   xi   0 xi  i0 B 

0
0 
yY
i 1 i  i i0 1
i i0
i 1 i

i0 1
n
i0 1
i i0
i 1
n
n
i0 1
  xi   xi  i0 B  A  i0 B  A  n B  max  A  n B,0  min max  A  n yn ,0 
yY
 min F  x( n ) , y   W  x( n ) 
yY
 
Таким образом, мы показали, что W ( x)  W x ( n )
x  X и
min max  A  n yn ,0  max  A  n B,0
yY




B
b) Покажем, что V  min max F ( x, y )  max  A  n
,0 и
yY xX
1 




k 1 k


y 0 : yi0 
B
n
i 
k 1
1
, i  1, n , т.е. чем меньше сил защита направляет на пункт, тем
k
меньше он защищен.
11
Если i0  1 , то первое неравенство отсутствует, если же i0  n  1 , то отсутствует второе неравенство.
57
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Если 1  2 
 n  0 , то yi0 
B
, i  1, n .
n
Отметим, что у множества X, крайними точками являются стратегии
x (i )  (0, ,0, A,0, ,0), i  1, n .
y Y max F ( x, y )  max F  x (i ) , y  (1)
Л .5
yY
1i  n
V  min max F ( x, y )  min max F  x (i ) , y   min max max  A  i yi ,0 
(1)
yY
yY 1i  n
xX
yY 1i  n

 min max  A  min i yi ,0  max  A  max min i yi ,0  max  A  B max min i
yY



y
  p : pi  i  0,
B




1i  n
n
n
pi 

i 1
yi

i 1
B

yY 1i  n

yY 1i  n
yi 
,0 
B 


 1  max  A  B max min i pi ,0 


pP 1i  n




см. лекцию IV, пример 2 


  max  A  B ,0 
  про полицейского и
n


1 

 преступника




k 1 k
и y 0  Bp0 , yi0 
B
n
i 
k 1
1
, i  1, n
k
n
1
k 1
k
Рассмотрим случай: B  A  
, т.е. защита имеет достаточно много сил.
 0 в силу нер-ва 


B
V  max  A  n
,0  0  V  0  V  V  0
1






k 1 k


n
Теперь рассмотрим случай, когда B  A  
k 1
1
k
чистых стратегиях не существует.
58
. Покажем, что для него седловой точки в
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ


0


B
B
B
V  max  A  n
,0  A  n
 A
 A  n B  0  V  max  A  n B   V
1
1 
1





n
k 1 k
k 1 k


Ввиду этого обстоятельства, исследуем игру в смешанных стратегиях.
c) F ( x, y ) – выпуклая и, в соответствии с Т1.14, мы можем заключить, что
V  V , y 0 : yi0 
B
n
i 
k 1
, i  1, n .
1
k
Докажем, что оптимальной смешанной стратегией является:
n
 0   pi0 I xi , pi0 
i 1
1
n
i 
k 1
1
, i  1, n
12
k


(*)
По сути, нам нужно доказать, что F  0 , y  V , y Y .
Приведем очевидное вспомогательное неравенство. Для некоторых ai , i  1, n

n
справедливо:
n

 max ai ,0  max ai ,0 .
 i 1
i 1

ai


0
0
(i )
0
0
0

F  , y   pi F x , y   pi max  A  i yi ,0   max Api  i pi yi ,0 


i 1
i 1
i 1





 max   
n
 i 1
n


n
n
n




yi 





B
0
0
i 1



Api  i pi yi ,0  max A  n
,0  max A  n
,0  V
1
1











k 1 k
k 1 k





Модель дуэли
Пусть расстояние между игроками равно d 0 , каждый дуэлянт имеет в своем
12
Чем менее защищен пункт, тем по нему предпочтительнее нанести удар.
59
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
распоряжении по одному выстрелу. По команде они начинают сближаться и могут
произвести выстрел в любой момент времени. В нашей модели нет барьера между
игроками, который бы ограничивал расстояние. Дуэлянты характеризуются функциями
меткости pi (d ), i  1,2 .13 Будем считать, что эти функции обладают следующими
свойствами: они непрерывны, определены на [0, d 0 ] и убывают, причем
pi (0)  1, i  1,2
(рис. 27)
pi (d0 )  0, i  1,2
Сформулируем модель шумной дуэли.14
Стратегия первого дуэлянта x  X  [0, d0 ] – расстояние, с которого он намечает
сделать выстрел. Аналогично для второго игрока y Y  [0, d0 ] .
Выпишем функцию выигрыша для первого дуэлянта. Будем считать главной его целью
– поразить противника15 с наибольшей вероятностью.
 p ( x), x  y
F ( x, y )   1
1  p2 ( y ), x  y
(рис. 28)
(Отметим, что дуэльная ситуация встречается и в экономике. Пусть объявлен некий
По сути, вероятность того, что игрок поразит противника, стреляя с расстояния d.
Дуэлянты слышат выстрелы друг друга.
15
А не, например, сохранить жизнь.
13
14
60
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
проект, за который борются две фирмы. Его нужно подать не позднее времени Т.
Логично, что чем меньше потрачено времени на выполнение проекта, тем больше
вероятность, что его отклонят. Поэтому эта игра с выбором момента времени.)
d * : p1 (d )  1  p2 (d )
Установим, что решение игры –  d * , d * ,V  p1 (d * )  .
V  max inf F ( x, y )  max min  p1 ( x ),1  p2 ( x )   p1 (d * )
0 x  d 0 0 y  d 0
0 x  d 0
V  min sup F ( x, y )  min max  p1 ( y ),1  p2 ( y )   p1 (d * )
0 y  d 0 0 x  d
0 y  d 0
0
Мы получили, что V  V  p1 (d * ) .
В случае, если p1 (d )  p2 (d ) ,
d * : p1 (d )  1  p2 (d )  p1(d )  1  p1(d )  p1( d ) 
1
2
Теперь рассмотрим модель бесшумной дуэли.
x  X  [0, d 0 ] , y Y  [0, d 0 ]
 p1 ( x ), x  y
(рис. 29)
F ( x, y )  
1  p2 ( y )  p1 ( x ), x  y
Покажем, что в этой модели нет седловой точки в чистых стратегиях.
61
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
V  max inf F ( x, y )  max  p1 ( x) 1  p2 ( x)  
0  x  d 0 0 y  d 0
0 x  d 0
V  p1 (d * )
Справедливость этих равенств почти очевидна. Проверьте самостоятельно.
Итак, мы получили, что V  V .
Рассмотрим пример.
d 0  1, p1 (d )  p2 (d )  1  d
1  x, x  y
(рис. 30)
F ( x, y )  
 y (1  x ), x  y
Подробное исследование можно посмотреть в зеленой книге(нет, не в фильме ), здесь
же приведем результаты.
V  2 1 
1
2
2  2  1

 1 , 0  x  2  2


2
 0 ( x )   4  ( x  1)


1,
2  2  x 1

 2 1 1

 1 , 0  y  2  2


2
 0 ( y )   2  ( y  1)


1,
2  2  y 1

62
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Упр. Проверьте выполнение неравенств (*):
F ( 0 , y )  V  2  1  F ( x, 0 ), x  X , y Y .
63
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция IX
Неантагонистические игры. Ситуация равновесия в играх многих лиц
Игры двух лиц
Пусть x  X – стратегия первого игрока, y Y – второго, и пусть задана ситуация
( x, y)  X Y . Функция выигрыша первого игрока – F ( x, y ) , второго игрока –
G( x, y ) и оба игрока стремятся максимизировать эти функции.
Тогда общая игра двух лиц в нормальной форме – Г  X ,Y , F ( x, y ), G( x, y ) .
Отметим, что в частном случае G( x, y)  F ( x, y) Г является антагонистической
игрой.
Опр. ( x 0 , y 0 ) называется ситуацией равновесия или равновесием по Нэшу16, если
0
0
0

 F ( x, y )  F ( x , y ), x  X

0
0
0

G ( x , y )  G ( x , y ), y Y
В частности, если G   F , ситуация равновесия – это седловая точка. Проверьте это
самостоятельно.
Опр. Г называется биматричной, если для i  X  1,
, m , j Y  1, , n
справедливо представление:
F (i, j )  aij , A   aij 
G(i, j )  bij , B   bij 
mn
mn
Опр. ( x 0 , y 0 ) – ситуация равновесия в биматричной игре, если
aij0  ai0 j0 , i  1, m
bi0 j  bi0 j0 , j  1, n
Джон Форбс Нэш-младший (1928 – 2015) – американский математик, работавший в области теории игр
и дифференциальной геометрии.
16
64
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Судите сами: в матрице A элемент aij является максимальным в j0 – ом столбце, а в
матрице B элемент bij является максимальным в i0 – ой строке.
j0

A  


i0
aij



i0 
, B  




j0
bij





Для того, чтобы продемонстрировать недостатки ситуации равновесия, рассмотрим
примеры.
1. «Семейный спор».
1 0
 2 0
, B  

0 2
 0 1
A
жена
муж
Спорят они о том, куда идти: на футбол(Ф) или в театр(Т).
Ф
Ф
Т
Ф
Т
1 0
Ф  2 0
A 
, B  

Т 0 2
Т  0 1
Жена получает одну единицу удовольствия от похода на футбол, муж – две. С театром,
напротив, жена – две, муж – одну. От похода порознь они, очевидно, удовольствия не
получают.
Ситуаций равновесия здесь две: (ФФ) и (ТТ), и в каждой из них игроки получают
разные выигрыши. В таких случаях говорят, что для реализации ситуации равновесия
необходимо заблаговременно договориться. Игры с приведенным сценарием поведения
называют бескоалиционными.
2. «Дилемма заключенного».
 5
1 
 5 10 
, B  

 10 2 
 1 2 
A
1 заключенный
2 заключенный
У каждого из арестантов есть две возможности: сознаться(Д) или нет(Н).
65
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Д
Н
 5 1 
A Д 
, B 
Н  10 2 
Д
Н
Д  5 10 

2 
Н  1
Тогда имеются три возможности:
либо один сознается, а второй нет, тогда первый получит 10 лет, а другой – 1 год
тюрьмы;
либо они оба не сознаются и получат по 2 года тюрьмы;
либо оба сознаются и получают по 5 лет тюрьмы.
Единственная ситуация равновесия здесь – (ДД). Она обладает следующим
недостатком: существует ситуация (НН), где заключенные оказываются в более
выигрышном положении. В связи с этим можно ввести понятие оптимальности по
Парето17.
Опр. ( x* , y * ) называется оптимальной по Парето, если
*
*

 F ( x, y )  F ( x , y )
и хотя бы одно из этих неравенств строгое.
 ( x, y ) : 
*
*
G
(
x
,
y
)

G
(
x
,
y
)


Упр. Покажите, что в антагонистической игре любая ситуация является оптимальной
по Парето. Подсказка: выигрыши на плоскости будут находиться на прямой G  F  0 .
 2 0 5
 2 2 1
3. A  
, B  

 2 2 3
 0 7 8
(1,1) – единственная ситуация равновесия. Ее недостаток состоит в том, что ее
равновесные стратегии не являются максиминными.
W (1)  min a1 j  0 ;
1 j 3
W (2)  min a2 j  2 – максиминная стратегия.
1 j 3
Аналогично можно показать, что для второго игрока равновесная стратегия
максиминной не является.
Вильфредо Федерико Дамасо Парето (1848 – 1923) – итальянский инженер, экономист и социолог.
Один из основоположников теории элит.
17
66
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Таким образом, фактически, один игрок может безопасно для себя отклониться так,
чтобы навредить второму.
Игры многих лиц
Пусть I  1,
, s, s  2, – множество игроков, xk  X k – стратегия k-го игрока. При
этом возникает набор стратегий x  ( x1 ,
s
, xs )  X   X k , называемый ситуацией18.
k 1
Функция выигрыша k-го игрока – Fk ( x ) , все игроки стремятся максимизировать свой
выигрыш.
Тогда игра многих лиц в нормальной форме – Г  X k ,Yk , Fk ( x), k  I .
Введем полезное обозначение. Пусть x – некоторая ситуация, у k-го игрока есть
стратегия yk  X k . Тогда x yk  ( x1,
, xk 1, yk , xk 1, , xs ) .
Опр. Ситуация x 0  X называется ситуацией равновесия или равновесием по Нэшу,


 
если max Fk x 0 xk  Fk x 0 , k  1, s .
xk X k
Зафиксируем стратегию xl , l  k и определим множество наилучших ответов
X k  xl , l  k   Argmax Fk ( x) .
xk X k
Опр. Ситуация x 0  X называется ситуацией равновесия или равновесием по Нэшу,
если x0 : xk  X k  xl , l  k  , k  1, s .
Теорема 2.1. Пусть X k – выпуклые компакты евклидовых пространств19 и пусть
s


Fk ( x)  С  X   X k  . Тогда
k 1


Fk xk xl , l  k  в игре Г существует ситуация равновесия.
Доказательство:
18
19
В англоязычной традиции – point(точка).
Вообще говоря, разных размеров.
67
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
I. Пусть функции Fk ( x ) удовлетворяют всем условиям и строго вогнуты по xk т.е.
X k  xl , l  k    f k  xl , l  k  X k , где f k  функция наилучшего ответа. Построим


отображение x  f ( x )  f k  xl , l  k  , k  1, s . Оно непрерывно вследствие
непрерывности каждой функции f k  xl , l  k  по Т1.2. Таким образом, мы построили
непрерывное отображение f : X  X .
Приведем без доказательства вспомогательную топологическую теорему.
Теорема Брауэра20(о неподвижной точке).
Пусть задано непрерывное отображение f : X  X , где X – выпуклый компакт
евклидового пространства. Тогда  x0  X : f ( x0 )  x0.


Применим ее: f ( x 0 )  x 0  f k xl0 , l  k  xk0 , k  1, s.
Тем самым мы получили, что xk0 является наилучшим ответом на нулевые стратегии
остальных игроков и x 0 – седловая точка.
II. Рассмотрим теперь общий случай (без предположения о строгости выпуклости).
Введем, как и прежде, возмущенную функцию:
Вогнута по xk
Fk ( x )  Fk ( x ) 
Cтрого вогнута по xk
  xk 
2
,  >0
Строго вогнута по xk
Из (I) следует, что  x  ситуация равновесия в игре с функциями Fk .
Рассмотрим  h  0  0, h  1,2, Тогда возникает последовательность x h  X
соответствующих ситуаций равновесия, принадлежащих выпуклому компакту.
Лёйтзен Э́ гберт Ян Бра́уэр (1881 – 1966) – голландский философ и математик, работавший в таких
областях математики, как топология, теория множеств, математическая логика, теория меры и
комплексный анализ.
20
68
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Выделим сходящуюся подпоследовательность: x h  x0 . Имеем:
h
Fk
x
h

h
xk  Fk
 x  , x  X , k  1, s
h
k
k
lim
h 
 Fk  x 0 xk   Fk  x 0  , xk  X k , k  1, s
Вернемся к играм двух лиц.
Г  X ,Y , F ( x, y), G( x, y) . Множества наилучших ответов для нее:
y Y X ( y )  Argmax F ( x, y )
xX
x  x Y ( x)  Argmax G( x, y)
yY
0
0

 x X(y )
( x0 , y 0 ) : 
0
0

 y Y ( x )
Пусть X ( y)  x( y) , Y ( x)   y( x) , непрерывные по Т1.2.
0
0

 x( y )  x
(x , y ) : 
 получим ситуации равновесия.
0
0

 y( x )  y
0
0
Приведем несколько примеров.
1.
4
3

 4 2
A
2 1

 1 2
5
1
3
5
5
7


4
4
, B  
4
 3


3
8
5
4
7
5
5
4
6
6
2
7
3


6 
X ( j )  Argmax aij
1i  4
Y (i )  Argmax bij
1 j 4
X (1)  1,2, Y (1)  1,4
Выделим прямоугольниками соответствующие максимумы.
69
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
0
0

 i X( j )
Найти ситуацию равновесия  (i , j ) :  0
0

 j Y (i )
0
0
В данном случае таких точек две: (i 0 , j 0 )  (1,1), (3,3) .
2.
F ( x, y)  3x2  2 y 2  7 xy, X  0,1
G( x, y)  4 xy  2 y 2  y, Y  0,1
Fxx  6  0  строго вогнута по x;
Gyy  2  0  строго вогнута по y.
Fx  0   6 x  7 y  0  x 
7
6

 x  6 y, 0  y  7
x( y )  
6
1,
 y 1

7
7
y
6
(рис. 31, 33)
Gy  0  4 x  2 y  1  0  y 
4x 1
2
70
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ

0,

4x 1

y( x)   y 
,
2


1,

1
4
1
3
x
4
4
3
 x 1
4
0 x
(рис. 32, 33)
На пересечении двух графиков на рисунке 33 располагаются 3 точки равновесия.
 x , y   1,1 , 1,1
0
0
Найдем третью:
7 0

0
0
 x y  6 y  x


0
 y x0  4 x  1  y 0

2
 
 
 x , y    167 , 83 
0
0
3. Модель дуополии Курно 21.
Пусть две фирмы производят товар одного и того же вида x  0 , y  0 ;
p( x  y)  a  x  y – цена товара, С – себестоимость производства единицы товара и
затраты равны Cx и Cy . Тогда выигрыши (прибыли) этих фирм будут равны: a  y  c
21
Антуан Огюстен Курно (1801 – 1877) – французский экономист, философ и математик.
71
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
F ( x, y)  P( x  y) x  Cx  (a  x  y  C) x , F x
G( x, y)  P( x  y) y  Cy  (a  x  y  C) y , G  y
a  c  y
, y ac

x( y )  
2
0,
y ac
(рис. 34, 35)
a  c  x
, x ac

y( x)   2
0,
x ac
(рис. 34, 35)

Упр. Найти x 0 , y 0

– ситуацию равновесия и посмотреть, какая будет сумма
x0  y 0 .
Упр. Предположить, что одна фирма является монополистом, т.е. F ( x)  (a  x  C) x ,
и сравнить количество товара и цену в монополии и дуополии.
72
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция X
Биматричные игры
 
Пусть задана биматричная игра  : A  aij
mn
, B   Bij 
mn
.
Построим смешанное расширение биматричной игры.
Пусть первый игрок использует смешанные стратегии p  P , второй – q  Q . Их
m
n
m
n
ожидаемые выигрыши равны A( p, q)   pi aij q j , B( p, q)   pi bij q j , и задано
i 1 j 1
i 1 j 1
смешанное расширение Г  P, Q, A( p, q), B( p, q) .
Так как функция A( p, q ) линейна22 по p, а функция B ( p, q ) линейна по q, то, ввиду
Т2.1, в игре Г всегда существует ситуация равновесия  p 0 , q 0  , которую мы будем
называть ситуацией равновесия в смешанных стратегиях исходной игры Г.
Формально запишем ее определение:
0
0
0

 A( p, q )  A( p , q ) p  P
 p 0 , q0  : 
0
0
0

 B( p , q)  B( p , q ) q  Q


Лемма 1. Для того, чтобы пара p0 , q0 была ситуацией равновесия в смешанных
стратегиях, необходимо и достаточно, чтобы
0
0
0

 A(i, q )  A( p , q ) i  1, m

0
0
0

 B( p , j )  B( p , q ) j  1, n
(*)
Отметим, что если взять B   A , то эти неравенства превратятся в условие (*) для
оптимальных смешанных стратегий в матричной игре.
Доказательство:
1)
 p , q  – ситуация равновесия
0
0
 (*)
Необходимость следует из определения ситуации равновесия (p и q – произвольны).
2) (*) 
22
 p ,q 
0
0
– ситуация равновесия
В частности, вогнута.
73
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Умножим i-ое неравенство на pi  0 и сложим их:
m
pi A(i, q0 )  pi A( p 0 , q 0 ) i  1, m  A( p, q 0 )   pi A( p 0 , q 0 )  A( p 0 , q 0 ) p  P
i 1
Аналогично поступаем со вторым неравенством и лемма доказана.
Теорема 2.2 (свойство дополняющей нежёсткости23).

Пусть p0 , q0

– ситуация равновесия в смешанных стратегиях. Тогда:
1) pi0  0  A(i, q0 )  A( p 0 , q0 ) ;
2) q0j  0  B( p0 , j)  B( p0 , q0 ) .
Доказательство:
По условию,  p 0 , q 0  – ситуация в смешанных стратегиях. Тогда по лемме 1
выполняется (*). Предположим, что  i1 : pi1  0, но A(i, q0 )  A( p0 , q0 ) .
Из (*) следует, что A(i, q0 )  A( p 0 , q0 ) i  1, m . Домножив оба этих неравенства на
pi01 и pi0 соответственно и сложив их по всем i, получим строгое24 неравенство
A( p0 , q0 )  A( p0 , q0 ) , что есть противоречие.
Следствие. Пусть  p 0 , q 0  – ситуация равновесия в смешанных стратегиях. Тогда:
1) A(i, q0 )  A( p 0 , q0 )  pi0  0 ;
2) B( p0 , j)  B( p0 , q0 )  q0j  0 .
Примеры.
1. «Семейный спор»25.
q10 1 q10
1 0
p10  2 0 
,
B



0 1 
0 2
1 p10 
A
Пояснение такого названия уже приводилось в лекции IV при доказательстве аналогичной теоремы.
Сумма нестрогого и строгого неравенств является строгим неравенством.
25
Подробно ситуация описывалась в лекции IX.
23
24
74
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
0  p10  1, 0  q10  1
По свойству дополняющей нежёсткости:
0
0
0
0
0
0


2
 A(1, q )  A( p , q )
 q1  A( p , q )
 2 1
 
 q10  2(1  q10 )  q10 
 q0   , 

0
0
0
0
0
0
3
 3 3


 A(2, q )  A( p , q )
2(1  q1 )  A( p , q )
0
0
0
0
0
0


1
 B( p ,1)  B( p , q )
2 p1  B( p , q )
1 2
 
 2p10  (1  p10 )  p10   p0   , 

0
0
0
0
0
0
3
3 3


 B( p ,2)  B( p , q )
(1  p1 )  B( p , q )
A( p 0 , q 0 )  B( p 0 , q 0 ) 
2
3
Как разрешить этот спор? Используем т.н. физические смеси26. Муж и жена заполняют
каждый свой календарь: по дням они распределяют походы на футбол(Ф) и в театр(Т),
причем со своей вероятностью (рис. 36). При совпадении видов досуга супруги идут
либо на футбол, либо в театр, а в противном случае остаются дома.
2. Биматричная игра с санкциями.
Рассмотрим следующую модель: первый игрок может либо нарушать(Н) некоторые
предписания, либо нет(Б/Н), а второй – наказывать первого, т.е. вводить санкции(С),
или нет(Б/С).
С
A
Б /С
 a1 b1 
 a  b2 
   , B   2

c2  d 2 
Б/Н 
c
d

1
 1
Н
Легко показать, что в чистых стратегиях ситуация не разрешима. Сделайте это
самостоятельно.
Решая игру в смешанных стратегиях, мы получим следующие результаты:
0  p10  1, 0  q10  1
26
См. лекцию III.
75
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
q10 
b1  d1
d 2  c2
, p10 
c1  a1  b1  d1
a2  b2  d 2  c2
Попробуйте также показать это собственноручно.
Можно интерпретировать p10 , q10 как части всего множества правил и санкций
соответственно и решать уже в терминах физических смесей.
Метод поиска ситуаций равновесия
Теорема 2.3.
Пусть X  1,
m, Y  1, n – множества чистых стратегий игроков,  p0 , q0  –
ситуация равновесия в смешанных стратегиях биматричной игры.
Тогда  X 0  X , Y 0 Y , V1,V2 такие, что справедливы следующие системы:
  aij q0j  V1 , i  X 0
 jY 0

0
  qj 1
0
 jY
(1)
  pi0bij  V2 , j Y 0
iX 0

0
  pi  1
0
iX
(2)
Доказательство:


(1) возьмём X 0  i pi0  0 , V1  A( p 0 , q0 ) .
Т 2.2
 aij q0j  A(i, q0 )  A( p0 , q0 )  V1, i  X 0 и второе равенство, очевидно,
jY 0
выполняется.


(2) возьмем Y 0  j q0j  0 , V2  B( p 0 , q0 ) .
 pi0bij  B( p0 , j )
iX 0
Т 2.2
 B( p 0 , q0 )  V2 , j Y 0 и второе равенство, очевидно,
выполняется.
76
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Теорема доказана.
Выпишем неизвестные и матрицы этих систем.
(1) q0j , j Y 0 , V1
A   aij 
iX 0 , jY 0
(2) pi0 , i  X 0 , V2
B   bij 
iX 0 , jY 0
Если эти матрицы – квадратные, то количество уравнений совпадает с количеством
неизвестных, и системы разрешимы. Сформулируем полезное утверждение.
Утв. Найдется такая ситуация равновесия, в которой матрицы A и B являются
квадратными.
Приведем алгоритм поиска некоторых ситуаций равновесия.
1) Перебираем квадратные подматрицы A и B размера k  k , k  2,
.
2) На k-ом шаге имеем квадратные матрицы A и B , решаем для них системы (1) и (2).
3) Если pi0 или q0j – отрицательны, то переходим к следующей, большей подматрице.
Если же pi0 или q0j – неотрицательны, то дополняем их до смешанных стратегий:

p 


0
0
i
, 0 ,p ,
iX 0 iX 0


0
, q  




0
j
, 0 ,q ,
jY 0
jY 0




Осталось проверить справедливость условия (*) при очевидных равенствах
A( p 0 , q0 )  V1, B( p0 , q0 )  V2 :
 A(i, q0 )  V1, i  1, m
27

0
 B( p , j )  V2 , j  1, n
27
Равенство будет достигаться при i  X и j  Y соответственно.
0
0
77
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
4) Перебирая все подходящие подматрицы, находим как можно больше ситуаций
равновесия в смешанных стратегиях.
Рассмотрим частные случаи.
Пусть матрица – размера 2  n .
 a11
 a21
B
a1n 
a2 n 
a1 j
a2 j
A
 b11

b
1 p1  21
b1n 
, 0  p1  1
b2 n 
b1 j
b2 j
p1
Согласно алгоритму, будем перебирать квадратные матрицы размера 2  2 ,
определяемые номерами столбцов j1, j2 .
Начнем с смешанной стратегии второго игрока p10 :
B
 b1 j1

b
1 p10  1 j2
b2 j1 
p10

b2 j2 




b1 j p10  b2 j 1  p10  V1
 1
1
(2) 
 находим p10
0
0
b2 j1 p1  b2 j2 1  p1  V2
Пусть 0  p1  128.

q   0,

0
q*
 a1 j1
 a1 j
 2
A
j1
*
j2

,0, q ,0, ,0,1  q* ,0, ,0 

1 q*
a2 j1 

a2 j2 




a1 j q*  a2 j 1  q*  V1
1
 1
(1) 
 находим q*
*
*
a2 j1 q  a2 j2 1  q  V1
Если 0  q*  1 , то осталось проверить условие (*), т.е. действительно ли оптимальная
28
В противном случае – переходим к следующей подматрице.
78
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
стратегия является равновесной.
 A(1, q0 )  V1
Очевидно, что 
.
0
 A(2, q )  V1
Осталось проверить, что
B( p0 , j)  V2 , j  1, n, j  j1, j2 29
Наконец, если неравенство справедливо, то, моё почтение, ситуация равновесия
найдена.
Взглянем теперь на геометрическое представление этих выкладок.
Введем функцию l j ( p1 )  b1 j p1  b2 j (1  p1 )  B( p, j ) .(Рис. 37)
l j1 ( p1 )  V2
 l j1 ( p1 )  l j2 ( p1 )

l
(
p
)

V
2
 j2 1
(*) l j ( p10 )  V2 , j  j1, j2
Проверяя последовательно все точки излома, получим соответствующие ситуации
равновесия.
29
При j  j1 , j  j2 неравенство переходит в равенство.
79
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Рассмотрим теперь случай с матрицей размеров m  2 .
q1
1 q1
 a11 a12 




A   ai1 ai 2 , 0  q1  1,




a

a
m2 
 m1
 b11 b12 




B   bi1 bi 2 




b

 m1 bm 2 
Здесь функция имеет вид li ( q1 )  ai1q1  ai 2 (1  q1 )  B(i, q) .

li1 ( q1 )  V1
 li1 ( q1 )  li2 ( q1 )


li2 ( q1 )  V1
(*) li ( q10 )  V1, i  i1, i2

i1
i2

p 0   0, ,0, p* ,0, ,0,1  p* ,0, ,0 


 bi11 bi1 2 

 bi 1 bi 2 
2
2


B




bi 1 p*  bi 1 1  p*  V2
2
 1
 p*

*
*
bi11 p  bi2 2 1  p  V2
Пример.
 2 4 5
p1  3 1 0 
, B 


1 p1  0 2 3 
 4 2 1
A
80
(Рис. 38)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
l1 ( p1 )  3 p1

l j ( p1 ) : l2 ( p1 )  p1  2(1  p1 )  2  p1
l ( p )  3(1  p )
1
3 1
1) l1  l2 : 3 p1  2  p1  p10 
q1
1 q1
(рис. 39)
1
2
0
 2 4 5
p1  3 1 0 
, B 


 4 2 1
1 p1  0 2 3 


A
*
*

1
2q  4(1  q )  V1
 2q*  4(1  q* )  4q*  2(1  q* )  q* 
 *
*
2

4q  2(1  q )  V1
 0 1 1
p   , 

2 2

 q0   1 , 1 ,0 
2 2 



2) l1  l3 : p10 
q1
0
1
2
1 q1
2 4 5
1 0
p 3
A
, B  1 
4 2 1
2 3 
1 p1  0


81
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
*
*

2
2q  5(1  q )  V1
*
*
*
*
*

2
q

5(1

q
)

4
q

(1

q
)

q

 *
*
3

4q  (1  q )  V1
 0  2 1
p  , 

 3 3

 q0   2 ,0, 1 
 3 3



3) l2  l3 : p10 
0
1
2
q1 1 q1
2 4 5 
p1  3 1 0 
A
, B 


4 2 1 
1 p1  0 2 3 


*
*

4q  5(1  q )  V1
 4q*  5(1  q* )  2q*  (1  q* )  q*  2 и ситуации равновесия 
 *
*

2q  (1  q )  V1
Доминирование в биматричных играх
Приведем две аналогичные Т1.11 и Т1.12 теоремы.
Теорема 2.4 (о доминировании строк биматричной игры).
Пусть в биматричной игре некоторая строка матрицы A доминируется выпуклой
комбинацией остальных строк этой матрицы. Тогда эта строка входит с нулевой
вероятностью в некоторую равновесную смешанную стратегию первого игрока, и ее
можно вычеркнуть.
Если указанное доминирование строгое, то доминируемая строка входит с нулевой
вероятностью в любую равновесную смешанную стратегию первого игрока.
Теорема 2.5 (о доминировании столбцов биматричной игры).
Пусть некоторый столбец матрицы A доминирует30 выпуклую комбинацию остальных
Лектор здесь сказал, что столбец матрицы должен доминироваться остальными столбцами, однако в
Т1.12 говорится о том, что столбец должен доминировать остальные столбцы. Вероятно, он оговорился.
30
82
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
столбцов этой матрицы. Тогда этот столбец входит с нулевой вероятностью в
некоторую равновесную смешанную стратегию второго игрока, и его можно
вычеркнуть.
Если указанное доминирование строгое, то доминирующий столбец
входит с нулевой вероятностью в любую равновесную смешанную стратегию второго
игрока.
Доказательство обеих теорем повторяет доказательство соответствующих Т1.11 и Т1.12
Рассмотрим пример.
 2 0 8
 2 2 1
, B  

 2 2 8
 0 6 7
A
При вычеркивании первого столбца получилась бы биматричная игра без ситуаций
равновесия в чистых стратегиях, хотя в исходной игре она была. Поэтому, при
использовании доминирования, нужно быть крайне внимательным.
83
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XI
Иерархические игры
Г  X ,Y , F ( x, y), G( x, y)
Будем считать, что X , Y – компакты метрических пространств, функции
F ( x, y), G( x, y) – непрерывны на X Y .
Определим некоторые иерархические игры.
2
1. Игра Г 1 : x  y ,
т.е. первый игрок выбирает x, второй игрок выбирает y, зная о выборе x.
У этой игры есть следующая экономическая интерпретация: первый игрок – центр,
выбирающий цену x некоторой продукции, производимой вторым игроком в
количестве y.
Положим, второй игрок обязательно выберет стратегию
y Y ( x)  Argmax G( x, y) , оптимальную для себя.
yY
W ( x)  min F ( x, y ) – гарантированный выигрыш первого игрока.31
yY ( x )
F1  supW ( x) – наилучший гарантированный выигрыш первого игрока.
xX
Опр. Пусть
  0. Стратегия x  X называется эпсилон-оптимальной, если
W ( x )  F1   .
Пусть Y ( x)   y( x), x  X . В этом случае, по Т1.2, отображение y( x) – непрерывно
и W ( x)  F  x, y( x)  32.
Решить иерархическую игру Г 1 означает найти наилучший гарантированный выигрыш
и указать оптимальную, если она существует, либо эпсилон –оптимальную стратегию.
Считается, что второй игрок себя максимизирует, но его дальнейшее поведение неизвестно: в худшем
случае первый игрок рассчитывает на получение минимума.
32
В этом случае W ( x ) также непрерывна и её максимум достигается.
31
84
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Равновесие по Штакельбергу33
Предположим, как и ранее, что первый игрок сообщает второму x  X , второй
выбирает y Y ( x) – наилучший ответ на x. Условимся теперь, что второй игрок
благожелателен к первому, т.е., выбирая y , он учитывает пожелания первого игрока:
y Y * ( x )  Argmax F( x, y ) .
yY ( x )
В этом случае гарантированный выигрыш первого игрока будет равен
W * ( x)  max F ( x, y ) , а гарантированный выигрыш – F1*  maxW * ( x) .
yY ( x )
xX
Опр. Пара ( x 0 , y 0 ) называется равновесием по Штакельбергу, если
W * ( x )  F1* , y 0 Y * ( x 0 ) .
Лемма 2. В сделанных предположениях в игре существует равновесие по
Штакельбергу.
Доказательство: пусть F1*  supW * ( x ). Рассмотрим последовательность
xX
x k  X : W * ( x k )  F1* .
Ввиду того, что все последовательности x k принадлежат компакту X , без ограничения
общности постулируем, что x k  x 0 . Рассмотрим также y k Y * ( xk ), y k  y 0 .
Покажем, что y 0 Y ( x 0 ) :
G( x k , y )  G( x k , y k ), y Y
Перейдя к пределу, получим G( x 0 , y )  G( x 0 , y 0 ), y Y .
F1*  W * ( x k )  F ( x k , y k )  F ( x 0 , y 0 )  F1*  F ( x 0 , y 0 )
F1*  F ( x 0 , y 0 )
y 0Y ( x0 )
 W * ( x0 )
Генрих фон Штакельберг (1905 – 1946) – немецкий экономист, работавший в области теории
организации промышленности, теории игр и известный как автор модели иерархического
взаимодействия.
33
85
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Строгого неравенства здесь быть не может, т.к. F1* – супремум значений W * ( x 0 ) ,
поэтому F  F ( x , y )
*
1
0
0
y 0Y ( x0 )
 W * ( x 0 ) и лемма доказана.
Примеры.
1)
 3 6 8
 7 4 3


A   4 3 2  , B   7 7 3 
 7 5 4 
 1 1 1 




Решим игру Г 1.
Y (i)  Argmax bij ,
1 j 3
Y (1)  1 34, Y (2)  1,2 , Y (3)  2,3 ;
W (i)  min aij ,
yY (i )
W (1)  3 , W (2)  3 , W (3)  5 ;
F1  3, i 0  1,2 .
Найдем равновесие по Штакельбергу.
Построим Y * (i ) :
Y * (1)  1  W * (1)  3 ,
Y * (2)  1  W * (2)  4 ,
Y * (3)  3  W * (3)  4 ;
F1*  4 .
(i 0 , j 0 )  (2,1), (3,3)
Отметим, что если первый игрок также благожелателен ко второму, то он выберет
(2,1) вместо (3,3) , чтобы второй получил не 1, а 7.
34
Речь про столбцы.
86
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
2)
 F ( x, y )  3x  2 y
, x  0,1 , y  0,1

2
G ( x, y )  ( x  y )
Решим игру Г 1.

1,


Y ( x )  0,1,


0,

1
0 x ;
2
1
x ;
(рис. 40)
2
1
 x  1.
2
W ( x)  min  3x  2 y  (рис. 41)
yY ( x )
F1 
7  1
, x   .
2
2
Найдем равновесие по Штакельбергу.
W * ( x)  min  3x  2 y  , разница между функциями W ( x) и W * ( x ) будет в том, что
yY ( x )
непрерывность в точке
F1 
7
,
2
1
справа сменится на непрерывность слева (см. рис. 41).
2
 x , y    12 ,1
0
0
87
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
3) Первый игрок – центр, выбирающий цену на продукцию x  0, c , второй –
производитель, выбирающий y  0 – количество товара. Функции выигрыша:
F ( x, y)  cy  xy  (c  x) y
G( x, y )  xy  by 2


Найдем Y ( x) : max xy  by 2 .
y 0
Gy  0  x  2b y  0  y 
W ( x )  F  x, y ( x )   ( c  x )
x
x
 0  y( x) 
2b
2b
x
c
c2
 x 0  , F1  W ( x 0 ) 
2b
2
8b
Аналитически мы получили, что посредник, перепродающий продукцию, имеет выгоду
в 100% от суммы: продает по цене с, а покупает по цене
2
c
.
2
1
2. Игра Г 2 : f  y  x  f ( y ), т.е. первый игрок изначально будет иметь
информацию об y, он заготавливает функцию f : Y  X и сообщает второму игроку
значение x  f ( y) .
Экономическая интерпретация этой игры: первый игрок – центр, x – размер премии;
второй игрок – производитель, выпускающий некоторое количество продукции y.
Премия присуждается за выполнение плана по выпуску.
Другая интерпретация – политические игры, где за принятием условий одной стороны
последует некоторая реакция, а за непринятием – наказание.
y Y ( f )  Argmax G( f ( y ), y ) 35
yY
Y ( f ), Y ( f )  
y Y ( f )  
Y( f ) 
Y ,
W ( f )  inf F  f ( y ), y  – гарантированный выигрыш первого игрока.
yY ( f )
35
Возможен случай, когда Y ( f )   , т.е. поведение второго игрока никак не регламентировано.
88
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
F2  sup W ( f ) – наилучший гарантированный выигрыш первого игрока.
f  f 
Опр. Пусть
  0. Стратегия f   f  называется эпсилон-оптимальной, если
W ( f  )  F2   .
Минимизирующие стратегии
Опр. Стратегией наказания называется f H : f H ( y )  Argmin G ( x, y ), y Y .
xX
Пусть G2  max min G( x, y)
yY
xX
D   ( x, y ) G( x, y)  G2 
sup F ( x, y ), D  
K 
D
,
  0:  ( x , y )  D : F ( x , y )  K   ,


x ,
y  y
H


 f ( y ), y  y
f k ( y )  
Покажем, что W ( f k )  K   , т.е. что эта стратегия позволяет получить первому
игроку гарантированный выигрыш K   .
В самом деле, если первый игрок сообщает второму функцию f k , то второй игрок
рассуждает так:



 x ,
y  y   G x , y   G2

,
fk ( y)   H

H
f
(
y
),
y

y

G
f
(
y
),
y

min
G
(
x
,
y
)

G

2
xX



т.е. второй игрок, ввиду своей рациональности, всегда будет выбирать y  y  .
Y  f k    y   , W  f k   F  x , y    K   .
Рассмотрим другую минимизирующую стратегию.
89
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Пусть E  Argmax  min F ( x, y )  – множество максиминных стратегий второго
 xX

yY
игрока,
X ( y )  Argmax F ( x, y ) – множество наилучших ответов первого игрока.
xX
Будем рассматривать ситуацию, когда уже первый игрок благожелателен ко второму:
X k ( y )  Argmax G( x, y ) .
xX ( y )
Теперь определим стратегию функции наилучшего ответа.
f * : f *( y)  X *( y)
G  f * ( y ), y   max G( x, y )  W * ( y) 36
xX ( y )
M  minmax F ( x, y)
yE
xX
Определим стратегию, которая позволяет гарантировать получение величины М.
 f * ( y ), y  E
f M0 ( y )  
H
 f ( y ), y  E
 
Покажем, что W f M0  M .
В самом деле, если первый игрок сообщает второму функцию f M0 , то второй игрок
рассуждает так:



 f * ( y ), y  E  G f * ( y ), y  min G ( x, y )  G2

xX
f ( y)  
, т.е. второй игрок,
H
H
f
(
y
),
y

E

G
f
(
y
),
y

min
G
(
x
,
y
)

G

2
xX
0
M

ввиду своей рациональности, всегда будет выбирать y  E .
Y  f M0   E ,
W  f M0  
36
inf0
 
yY f M  E
F  f * ( y ), y   min F  f * ( y ), y   min max F  x, y   M .
yE
yE
По Л2 она достигает максимума на любом компакте.
90
xX
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Теорема 2.6 (Гермейера37).
В сделанных предположениях в игре Г 2 наилучший гарантированный выигрыш
F2  max  K , M  . При этом, если:
1) K  M , то   0 f ke – эпсилон-  оптимальная стратегия;
2) K  M , то f M0 – оптимальная стратегия.


Прежде, чем доказать теорему, рассмотрим пару x 0 , y 0  Argmax F ( x, y ) .

xX
yY

Может оказаться, что x 0 , y 0  D . Если такое случилось, то
K  F  x 0 , y 0   max F ( x, y ) , т.е. второй игрок настолько эффективно управляет
xX
yY
первым, что заставляет его полностью работать на себя.
Юрий Борисович Гермейер (1918 – 1975) – советский учёный, специалист в области прикладной
математики, исследования операций и теории игр.
37
91
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XII
В конце прошлой лекции была сформулирована теорема Гермейера. Приведём её
доказательство.
Часть теоремы уже была доказана, т.к. мы показали, что K всегда можно достигнуть и
W  f k   K   , W  f M0   M .
Осталось показать, что величину F2 , большую, чем max  K , M  , получить нельзя:
f  f  W ( f )  max  K , M  .
sup G  f ( y ), y   max min G  x, y   G2
xX
yY
yY
Рассмотрим два случая:
1) sup G  f ( y ), y   G2
yY
 f ( y ), y   D , т.к.
Тогда  y 0 Y ( f ) :
0
0


a) y 0 Y ( f )  G f ( y 0 ), y 0  G2 
 f ( y ), y   D ;
0

0

b) Y ( f )  , Y ( f )  Y   y 0 : G f ( y 0 ), y 0  G2 
 f ( y ), y   D .
0
0
W ( f )  inf F  f ( y ), y   F  f ( y 0 ), y 0   K  max  K , M 
yY  f 
D
2) sup G  f ( y ), y   G2
yY






Тогда y 0  E : G f ( y 0 ), y 0  G2 , т.к. G2  min G x, y 0  G f ( y 0 ), y 0 
xX
 sup G  f ( y ), y   G2  G  f ( y 0 ), y 0   sup G  f ( y ), y 
yY
yY
Фактически, мы доказали, что E  Y  f  .
W ( f )  inf F  f ( y ), y   minmax F  x, y   M  max  K , M 
yY  f 
yE
xX
Теорема полностью доказана.
92
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Примеры.
1.
 3 6 8
 7 4 3


A   4 3 2  , B   7 7 3 
 7 5 4 
 4 6 6




Решим игру Г 2 .
G2  max min bij  4, E  1,2
1 j 3 1i 3


D  (i, j ) bij  G2  4
3

A 4

7

6
3
5
38
8
7


2 , B   7


4
4 

4
3
7
3
6
6 


K  max aij  4 39
( i , j )D
M  min max aij  6  K  4  F2  6
jE 1i 3
3, j  1 E

f ( j )  1, j  2  E
(в первой строке, например, 3 X ( j )  Argmax aij )
1i 3
1 (или 2), j  3  E

0
M
2, j  1

f K0 ( j )  1, j  2
1, j  3

2. Знакомая нам задача с центром и производителем. Напомним условие.
Первый игрок – центр, выбирающий цену на продукцию x  0, c , второй –
производитель, выбирающий y  0 – количество товара. Функции выигрыша:
F ( x, y)  cy  xy  (c  x) y;
38
В матрице B мы обвели элементы, строго большие G2  4 , а в матрице А – те же позиционно, что и в
матрице В.
39
Максимум из обведенных элементов матрицы А.
93
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
G( x, y )  xy  by 2 .
Решим игру Г 2 .
G2  max min  xy  by 2   0, E  0
y 0 0 x c
M  min max  y(c  x)   0
y  0 0 x  c


D  ( x, y ) xy  by 2  G2  0
(рис. 42)
c  c2
x
 
K  sup  y(c  x)   max  (c  x)    x 0   
0 x  c b
2
4b
0 x  c
0 y 
x
b




c
c
   y
 , y
f K ( y)   2
2b

0, y  y

Мы получили, таким образом, что в игре Г 2 , в отличие от игры Г 1 , прибыль
производителя близка к нулю.
Теория принятия решений. Многокритериальная или векторная оптимизация
ЛПР – лицо, принимающее решения (не путать с ЛДПР!)
Пусть имеется ЛПР, выбирающее стратегию x  X ,
94
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
W ( x)  W1( x), ,Ws ( x)  – векторная оценка,
Wi ( x), i  1, s, – частный критерий.
В этих условиях необходимо выбрать x  X . Основная трудность здесь в том, что, как
правило, нет x 0 , максимизирующего все частные критерии40, т.е. что
 x0  X : x0  Argmax Wi ( x), i  1, s
xX
Пример.
X  x1, x 2 , x3 , x 4 , W ( x)  W1 ( x),W2 ( x ) 
В этом случае векторные оценки можно изображать на плоскости (рис. 43).
Argmax W1 ( x)  x 3 , x 4 
xX
Argmax W2 ( x)  x1
xX
Эти множества, очевидно, не пересекаются, что есть препятствие на пути поиска
оптимальной стратегии. Познакомимся со способами его преодоления.
Для удобства мы условимся именно максимизировать частные критерии. Если в задаче требуется их
минимизировать, то достаточно будет сменить знак у максимумов на противоположный.
40
95
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Оптимальность по Парето и Слейтеру
Опр. Стратегия x 0  X называется оптимальной по Парето, если
 x  X : Wi ( x)  Wi ( x0 ), i  1, s, W ( x)  W ( x0 ) 41.
Обозначим P( X ,W ) множество всех стратегий из X, оптимальных по Парето по
критерию W.


Для предыдущего примера P( X ,W )  x1, x 3 . Есть простой способ проверить
оптимальность по Парето: строим «уголок» и смотрим, есть ли внутри него другие
42
векторные оценки или нет (см. рисунок). Если их нет, то стратегия оптимальна.
Опр. Стратегия x 0  X называется оптимальной по Слейтеру43, если
 x  X : Wi ( x)  Wi ( x0 ), i  1, s .
Обозначим S ( X ,W ) множество всех стратегий из X, оптимальных по Слейтеру по
критерию W.


Для нашего примера S ( X ,W )  x1, x 3 , x 4 .
Очевидно, что P( X ,W )  S ( X ,W ) .
Хотя бы один частный критерий W ( x ) строго больше соответствующего частного критерия W ( x ) .
42
Лектор, кажется, называет его «артантом». Моя искал, но не понимаю.
43
Мортон Линкольн Слейтер – американский математик, доктор наук.
0
41
96
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Задача «о коробке».
Имеем прямоугольник размера a  b, a  b . Нам необходимо сделать из него коробку
(см. рис. 45).
 a
x  X   0, 
 2
W1 ( x)  (a  2 x)(b  2 x) x  V ( x)  объем коробки;
W2 ( x)  4 x 2  S ( x)  площадь (этот материал можно будет использовать).
(рис. 46)
 a
Утверждается, что P( X ,W )   x* ,  , так как если x  0, x*  , оба критерия
 2
возрастают и это, очевидно, не оптимальный случай.

Задача многокритериальной оптимизации состоит в том, чтобы построить множества
P( X ,W ) и S ( X ,W ) или их аппроксимации.
Когда множество P( X ,W )   ? Сформулируем соответствующую теорему.
Теорема 3.1. Пусть все частные критерии Wi ( x), i  1, s – непрерывны на компакте
X. Тогда P( X ,W )     S ( X ,W )  .
Доказательство: воспользуемся т.н. свёрткой критерия с некоторыми весовыми
коэффициентами. Рассмотрим вектор весовых коэффициентов
97
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ

   1, , s     

s

s
i 1

i 1
 i  1, i  0, i  1, s  , свертку F1 ( , x)   iWi ( x) 44.
Докажем, что   X 1 ( )  Argmax F1( , x)  P( X ,W ) . Пусть это не так, тогда
xX
 x  X1( ) \ P( X ,W )   x : Wi ( x)  Wi ( x), i  1, s, W ( x)  W ( x) 
 домножим каждое неравенство на i и сложим их  F1 ( , x)  F1 ( , x) , что
есть противоречие, т.к. x X 1 ( ) максимизирует свертку, а мы нашли другую
стратегию, дающую большее значение для этой свертки.
Справедливо ли равенство

X1 ( )  P( X ,W ) ? На самом деле, далеко не всегда.
Рассмотрим пример.
W ( x)  W1( x),W2 ( x)  , W1( x)  x1, W2 ( x)  x2 (рис. 47)
F1 ( , x)  1 x1  2 x2
Из рисунка видно, что

X1( )  (0,1), (1,0) , в то время как оптимальными
являются все точки дуги окружности.
44
Функция непрерывна на компакте и ее максимум достигается.
98
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Определим другую свертку:
F2  min iWi ( x ), Wi ( x )  0
1i  s
Упр. Покажите, что если Vi ( x)  Wi ( x)  Ci , i  1, s, то выполнено P( X ,V )  P( X ,W ).
X 2 ( )  Argmax F2 ( , x)
xX
Теорема 3.2. Пусть все частные критерии Wi ( x), i  1, s – положительны и
непрерывны на компакте X.
Тогда

X 2 ( )  S ( X ,W ) . (1)
Доказательство: покажем двустороннее вложение множеств.
1)   X 2 ( )  S ( X ,W )
Пусть это не так, тогда
 x  X 2 ( ) \ S ( X ,W )   x : Wi ( x)  Wi ( x), i  1, s 
 домножим каждое неравенство на i и возьмем минимум от обоих частей 
 F2 ( , x)  F2 ( , x) , что есть противоречие, т.к. x X 2 ( ) максимизирует свертку
F2 ( , x) .
2) x 0  S ( X ,W )  0  : x 0  X 2 ( 0 )
 0 : i0 
1
s
1
Wi ( x )
0
k 1 Wk ( x )
0
0
x  X j : W j ( x)  W j ( x0 )
F2 ( 0 , x)  min i0Wi ( x)   0j W j ( x)   0j W j ( x0 ) 
1i  s
1
s
1

0
k 1 W ( x )
k
Теорема доказана.
99
 min i0Wi ( x 0 )  F2 ( 0 , x 0 )
1i  s
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XIII
Приведем альтернативные формулировки оптимальности по Парето.
Опр. Пусть x, x X . Будем говорить, что стратегия x лучше стратегии x в смысле
Парето, если Wi ( x)  Wi ( x0 ), i  1, s, W ( x)  W ( x0 ) . Обозначение: x ± x.
Опр. Пусть x, x X . Будем говорить, что стратегия x строго лучше стратегии x в
смысле Парето, если Wi ( x)  Wi ( x0 ), i  1, s, W ( x)  W ( x0 ) . Обозначение: x

Пусть X  x1,
x.
, x n  – конечное множество стратегий,  – множество попарно
несравнимых стратегий. Приведем алгоритм поиска  .
 
Шаг 1.   x1
…

Шаг k.   xi1 ,
, xit , t  k
Шаг k+1. Выбираем стратегию x k 1 и сравниваем её со стратегиями из множества  .
a)  x  : x ± xk 1 ;
b)  x  : xk 1 ± x , тогда уничтожаем в множестве  стратегии, хуже x k 1 ,
получаем множество  . Полагаем после этого, что   
x  . Почему это
k 1
множество содержит попарно несравнимые стратегии? Предположим, это не так, тогда:
 x  : x ± xk 1 ± x и, в силу транзитивности, x ± x , что есть противоречие, т.к.
x, x .
с) x k 1 не сравнима ни с какими стратегиями из множества  , тогда
 : x k 1 .
…
100
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Упр. Показать, что после n-ого шага   P( X ,W ) .
Добавим, что этот алгоритм эффективен в том смысле, что не все возможные пары
сравниваются.
Аналогичный алгоритм можно предложить и для нахождения множества стратегий,
оптимальных по Слейтеру. Для этого достаточно заменить
на
.
Пусть X  E m – выпуклый компакт в евклидовом пространстве.
Опр. Будем говорить, что вектор   E m задает в точке x 0  X допустимое или


возможное направление, если  0  0:  0     0 x 0    X .
Рассмотрим пример (рис. 48).
Пусть   x  x 0 . По определению выпуклого компакта,
 x  (1   ) x   X ,
0
0   1



0
 x   ( x  x0 )   X , 0    1




Тогда при  0  1 выполнено условие определения допустимого направления.
Будем использовать обозначение L( x 0 ) – множество всех направлений в точке x 0 .
Теорема 3.3. Пусть все частные критерии Wi ( x), i  1, s – вогнуты на компакте X
евклидового пространства и непрерывно дифференцируемые в некоторой области D .
101
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 

 

Тогда x 0  S ( X ,W )    L x 0 : Wi x 0 ,  0, i  1, s .
(1)
Доказательство:
1) x0  S ( X ,W )  (1)
 x : Wi ( x)  Wi ( x0 ), i  1, s
W   x , x  x   W  x  W  x   0, i  1, s
0
0
i
0
i
45
i
Осталось указать направление, допустимость которого мы уже показали:   x  x 0 .
2) Пусть для x0  X выполнено (1)  x0  S ( X ,W )
По определению допустимого направления,
 0  0:  0     0  x0     X




0i 1








0i 1




Wi  x0     Wi  x 0   46  Wi  x 0  i   ,     Wi  x 0  i   , 

 
 0

Wi  x0  i  ,  Wi  x0  ,  0, i  1, s , т.е. при малых 

(1)

  Wi  x 0  i  ,   0


0


Таким образом, мы получили, что x 0  
x 0 , и теорема доказана.
Рассмотрим частный случай.
Пусть все частные критерии Wi ( x), i  1, s – строго вогнуты на выпуклом компакте X .
Покажем, что P( X ,W )  S ( X ,W ) .
Нам уже известно, что P( X ,W )  S ( X ,W ) . Покажем, что строгого включения быть не
может. Предположим противное:
Известное неравенство, являющееся алгебраической реализацией факта, что касательная в некоторой
точки вогнутой функции лежит выше этой функции.
46
Формула конечных приращений Лагранжа.
45
102
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 x  S ( X ,W ) \ P( X ,W )   x : Wi ( x)  Wi ( x), i  1, s, W ( x)  W ( x)
Рассмотрим
x  x
X .
2
Wi  x
1
 x  x  1
Wi 
 Wi  x   Wi  x  Wi  x , i  1, s , то есть,

2
 2  2
x  x
2
x S ( X ,W ) . Получили противоречие.
Пример.
Пусть даны x1,
, x s – точки на плоскости. Определим критерий расстояния для
некоторой точки x:
Wi ( x)   x  xi , i  1, s
x  x  
W ( x)  
i
i
x  xi
xi  x
, i  1, s – градиент в точке x.
x  xi
Решим задачу для двух точек x1, x 2 .
x 0 не является оптимальной по Слейтеру, если существует направление  ,
образующее острые углы с векторами x0 x1, x0 x 2 (см. рис. 49). Нетрудно показать, что
такое направление найдется для всех x 0 вне отрезка  x1, x 2  . Все точки этого
отрезка, очевидно, оптимальны по Слейтеру, т.к. хотя бы один угол между векторами
будет неострый.
Упр. Попробуйте решить задачу для трех точек x1, x 2 , x3 .
103
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Общая задача принятия решений
Как и прежде, ЛПР выбирает стратегию x  X .
Опр. Бинарным отношением R на множестве X называется R  X  X . Если пара
 x, x  R , то будем говорить, что стратегия
x лучше (или не хуже) стратегии x .
Вместо записи  x, x  R будем использовать xRx , а вместо  x, x  R – xRx .
Опр. Бинарное отношение R на множестве X называется:
1) рефлексивным, если xRx x  X ;
()
2) антирефлексивным, если xRx x  X ;
()
3) симметричным, если xRy  yRx x, y  X ;
()
4) асимметричным, если xRy  yRx x, y  X ;
5) транзитивным, если xRy, yRz  xRz x, y, z  X ;
6) ацикличным, если  x1,, x k  X : x1Rx 2 Rx k Rx1 .
Утв. Из асимметричности следует антирефлексивность, т.к., если отношение не
антирефлексивно, то  x : xRx  xRx , что абсурдно.
Утв. Из ацикличности следует асимметричность, т.к., если отношение не
асимметрично, то  x, y : xRyRx , что есть цикл.
Пример. Сравнение стратегий по векторному критерию в смысле Парето
( )
является транзитивным асимметричным бинарным отношением.
Упр. Докажите, что из антирефлексивности и транзитивности бинарного отношения R
следует его ацикличность.
Опр. Ядром бинарного отношения R на множестве X называется
С  X , R   x  X xRx  xRx
(1)
Опр. Ядром асимметричного бинарного отношения R на множестве X называется
104
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ


С  X , R   x  X  x  X : xRx
(2)
Покажем, что для асимметричных бинарных отношений множества (1) и (2) совпадают:
1) x (1)  x (2)
 асимм.
  xRx
x  (2)   x  X : xRx  (1)
  xRx

2) x (2)  x (1)
x  (2)   xRx  верна импликация xRx  xRx
Примеры.
1. Пусть R  ' ' – асимметричное бинарное отношение, тогда С  X , R   P  X ,W  .
2. Пусть R  '
' – асимметричное бинарное отношение, тогда С  X , R   S  X ,W  .
3. Изоморфизм бинарных отношений и орграфов.

Пусть X  x1,
, x n  – конечное множество. Тогда, соединяя стрелкой некоторые
xi , x j : xi Rx j , получим ориентированный граф.
Задача. Рассмотрим стратегии x1, x 2 , x3 (см. рис. 50). Найдем ядро бинарного
отношения. Поскольку x1Rx 2 Rx1 , отношение не антисимметрично.
 x1  C ( X , R)
 2
2
 x  C ( X , R)  C ( X , R)  x
 x3  C ( X , R)

 
Упр. Попробуйте решить задачу для четырех стратегий, рисунок 51.
105
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Утв. Пусть X – конечно, а бинарное отношение R – ациклично. Тогда C( X , R)   .
Докажите его самостоятельно.
Пример. Приведем таблицу оценок двух школьников.
1
x
x2
Математика Литература
3
5
5
4
Очевидно, эти две стратегии несравнимы в смысле Парето. Попробуем сравнить их,
используя дополнительную информацию о важности предметов. Рассмотрим
некоторые случаи.
1. Математика равноценна литературе.
Введем третьего гипотетического ученика со следующими оценками:
1
Математика Литература
3
5
5
4
4
5
x
x2
x3
Справедливо, что x 2
x3
x1  x 2
x1 .
2. Математика «лучше» литературы.
1
Математика Литература
3
5
5
4
4
5
x
x2
x3
Справедливо, что x 2
x3
x1  x 2
x1 .
Очевидно, литература лучше математики быть не может, т.к. x 2 , x1 в этом случае
будут несравнимы.
Опр. Частные критерии Wi ( x ), W j ( x ) – однородны, если их диапазоны изменений
совпадают:
106
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
max Wi ( x )  max W j ( x ) ;
xX
xX
minWi ( x )  minW j ( x) .
xX
xX
Неоднородные критерии можно сделать однородными, преобразовав W j ( x ) и найдя
соответствующие коэффициенты:
W j ( x )  W j ( x )  
Учитывая это обстоятельство, будем считать в дальнейшем все критерии однородными.
107
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XIV
Сравнительная важность критериев
Формализуем информацию о сравнительной важности или равносильности критериев.
Пусть I  1,
, s – множество номеров критериев, на котором мы задаем бинарные
отношения. Введем некоторые из них.
Отношение равноценности A1 : rAt
1  Wr ( x ) и Wt ( x )  равноценны.
A1 – отношение эквивалентности47.
Отношение сравнительной важности A2 : rA2t  Wr ( x) важнее Wt ( x ).
A2 – асимметрично48, транзитивно.
Отношение транзитивного замыкания
 : rt   rB1i1 ik 1Bk t, Bl  A1 либо A2 , причём A2 встречается хотя бы
единожды.
 – антирефлексивно.
Последнее отношение позволяет получать непротиворечивую информацию от ЛПР.
Рассмотрим евклидово пространство E s с векторными оценками
y  W ( x), y Y  W ( X ) . Определим на этом пространстве бинарные отношения.
Отношение сравнения по Парето P : yPy  yi  yi, i  1, s, y  y .
Введем обозначение y rt – векторная оценка y , в которой r-ая и t-ая компоненты
поменяны местами.
Пусть выполнено rA1t , то есть r и t – равноценны. Тогда
47
48
Т.е. рефлексивно, симметрично и транзитивно.
И антирефлексивно в соответствии с утверждением из предыдущей лекции.
108
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Srt : ySrt y  y   y rt
Пусть выполнено rA2t , то есть r -ый критерий важнее t -ого. Тогда
Trt : yTrt y  y   y rt , yr  yt
Опр. Будем говорить, что две векторных оценки y и y  связаны (зом)бинарным
отношением R тогда и только тогда, когда
z k 1H k y , H i P, Srt : rA1t , Trt : rA2t и  H l  P или Trt
 yH1 z1H 2 z 2
Лемма 1. Введенное бинарное отношение R – транзитивно и ациклично.
Доказательство:
1) Транзитивность: yRyRy  yRy .
Используя определение отношения R, построим две цепочки:
z k 1H k y 
yH1 z1H 2 z 2
y H k 1 z k 1 H k 2 z k 2
z k  q1H k  q y 
Объединяя их, получим искомое:
z k 1H k y H k 1 z k 1H k 2 z k 2
yH1 z1H 2 z 2
z k  q1H k q y   yRy 
2) Ацикличность, от противного: пусть  yH1 z1H 2 z 2
случая:
а)  l : H l  P
s
s
i 1
i 1
 zil 1   zil
z l 1 pz l 
H l  Trt , Srt 
s
s
 y  z
i 1
i
i 1
1
i

s
s
i 1
i 1
 zil 1   zil

s
  yi , что есть противоречие.
i 1
b) i H i  P
109
z k 1H k y . Тогда рассмотрим два
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Без ограничения общности считаем, что H1  Trt
Hl  Sil jl или Til jl
Определим множество I    i i t.
r  I  , т.к. Trt  rA2t  r t
t  I  , т.к. если бы оно принадлежало, то было бы выполнено t t , что неверно в
силу антирефлексивности  .
Покажем, что jl  I   il  I  .
il A1 jl t  il t
Ввиду этой импликации, возможны три случая:
(1) и (2):
il , jl  I  
l 1
l
 H l  Sil jl или Til jl  z H l z 
il , jl  I  
z
iI 
l 1
i
  zil
iI 
(3): il  I  , jl  I   il A2 jl , т.к. если бы il A1 jl , то jl A1il t  jl  I 
Итак, il A2 jl  H l  Til jl  zill1  z ljl1 
 y  z
iI 
i
iI 
1
i

z
iI 
l 1
i
  zil .
iI 
  yi , что есть противоречие.
iI 
Лемма доказана.
Пусть P( X ,W )  x1 ,
, xn  – конечное множество стратегий, оптимальных по Парето.
Рассмотрим P Y    y1  W ( x1 ),
, yn  W ( xn ) – соответствующее множество
векторных оценок. Наша задача состоит в том, чтобы сузить множество P(Y ) , т.е.
построить С  P Y  , R    49 – ядро на множестве векторных оценок P Y  бинарного
отношения R .
Предположим, что все частные критерии равноценны, т.е. A1  I  I , A2   .
49
По ранее доказанному утверждению.
110
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Определим отображение:
y  E s   y   1  y  ,
, s  y   , 1  y    2  y  
 s  y 
Лемма 2. Пусть yPy . Тогда   y  P   y  50.
Доказательство:
1  y   max yi  max yi  1  y 
1i  s
1i  s
Покажем, что i  y   i  y  , i  1, s , то есть, что   y     y . Пусть
 k : k  y   k  y  
yis
yik
s  y  
  k  y    k  y    k 1  y  
s  k 1 компонент
 1  y  
k компонент
всего компонент s  k  1  k  s  1  s . Пришли к противоречию.
Утв. Если A1  I  I , то yRy     y   P   y  .
Доказательство:
1)
yRy     y   P   y 
yRy   yH1 z1H 2 z 2
z k 1H k y , Hi  Trt , т.е.  l : H l  P
Если H l  Sil jl , то z l 1 и z l имеют одинаковые компоненты, просто переставленные
 
 
местами. Поэтому совпадают упорядоченные оценки:  z l 1   z l .
Л2
 
 
Если H l  P , то z l 1 pz l   z l 1  P  z l 

2)

yRy     y   P   y 
Хорошо известно, что упорядочить компоненты можно при помощи простой
перестановки пар:
50
Квадратные скобки в данном случае – просто инструмент выделения.
111
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
ySi1 j1
Sik jk   y  P   y  Sik 1 jk 1
y
Таким образом, утверждение доказано.
Примеры.
1. Построить ядро бинарного отношения для следующих векторов:
y1   3,5,3    y1   5,3,3
y 2   4,4,3    y 2    4,4,3
y 3   5,3,2     y 3    5,3,2 
y 4   2,3,5    y 4    5,3,2 
y 5   4,2,4     y 5    4,4,2 
Сравним оценки:
  y1  P   y 3  ,   y 4 

 
 

  y 2  P   y 5 

 



2
1
Легко видеть, что y и y – несравнимы и C  P Y  , R   y1 , y 2 .

2. P  X ,W   x1 , x 2 , x 3 , x 4

y1   5,5,4,4 
y 2   5,4,5,4 
y 3   5,4,4,5
y 4   4,4,5,5


A1  1,3 ,  3,1   i, i  , i  1,4
A2   2, 4  ,  2,3
Заметим, что:
112
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
y1T24 y 3  y1Ry 3
y1T23 y 2  y1Ry 2
y1T24 y 3S13 y 4  y1Ry 4
C  P Y  , R    y1 , т.е. первый ученик самый лучший.
Математическая модель операции
(осторожно, беспредельное количество определений!)
Опр. Операция – совокупность мероприятий, направленных на достижение некоторой
цели.
Опр. Оперирующая сторона – совокупность лиц (либо одно лицо), стремящихся(-ееся)
в операции к поставленной цели.
Опр. Исследователь операции – участник оперирующей стороны, создающий и
исследующий математическую модель операции, а также дающий рекомендации по
тому, как нужно действовать в данной операции.
Опр. Для достижения цели оперирующая сторона использует активные
средства(ресурсы).
Опр. Контролируемый фактор – величины, значения которых определяются
действиями оперирующей стороны. Обозначение: x  M 0 51.
Опр. Неконтролируемый фактор – величины, влияющие на исход операции, но не
подконтрольные оперирующей стороне. Они подразделяются на неопределенные и
случайные факторы.
Опр. Неопределенный фактор – неконтролируемый фактор, про который известна
лишь его область значений. Обозначение: y  N  N 0 , где N – область
неопределенности.
Неопределенные факторы делятся, в свою очередь, на три группы:
51
Так их обозначает Ю. Б. Гермейер.
113
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
1) субъекты, имеющие собственные интересы;
2) природные неопределенности;
3) неясность цели (пример: неопределенный фактор i в Wi ( x ), i  1, s ).
Опр. Случайный фактор – неконтролируемый фактор, которые являются случайными
величинами. Обозначение: z  Z с законом распределения  ( z )  .
1)    ,  

2)    


ai   ai ( z )d ( z )  ai , i  1, l 

Z
Будем считать, что после окончания операции известны значения
 x, y, z   M 0  N  Z
Опр. Зададим степень соответствия исхода операции поставленной цели функцией
F  x, y, z  , которую назовем критерием эффективности.
114
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XV
Опр. Информационная гипотеза – точное описание того, в какие моменты и какая
информация о неконтролируемых факторах поступает оперирующей стороне.
Опр. Стратегия – выбор контролируемых факторов в зависимости от поступающей
информации о неконтролируемых факторах. Формально, это функция x : N  Z  M 0 .
Примеры.
1. Никакой дополнительной информации не ожидается:
x  x  M0 , M  M0
2. В момент начала операции52 y становится известным:
y  N x : N  M 0 , обозначим M u множество таких функций.
3. В момент начала операции известна информация и об y , и о z :
y, z  N  Z x : N  Z  M 0 , обозначим M множество таких функций.
4. Для некоторого вектора y   y1 ,
, yn  известна только сумма
n
y
j 1
j
:
 n

x  y   f   y j  , причем множество таких функций M : M 0  M  M u
 j 1 
Оптимальные стратегии в операции
Рассмотрим подход Гермейера, основанный на т.н. принципе гарантированного
результата.

Для стратегии x  M определим оценку эффективности W x – гарантированную
величину значения критерия.
Примеры.
52
После момента исследования!
115
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
1. Вспомним игру Г1 , где первый игрок сообщал второму стратегию x , второй
выбирал стратегию из множества лучших ответов y Y ( x )  Argmax G( x, y ) , при
yY
этом W ( x )  min F ( x, y ) . Важно отметить, что принцип гарантированного результата
yY ( x )
здесь не исключает риск, так как второй игрок обязательно будет выбирать
стратегию из множества Y ( x) .
2. Более тривиальный пример: игрок, в зависимости от прогноза погоды, решает, взять
ему с собой на улицу зонтик или нет. Понятно, что риск здесь также присутствует,
потому что прогноз погоды может оказаться неверным.
Опр. Стратегия x 0  M называется оптимальной, если справедливо:
 

W x 0  max W x  F2 ( M ) 53
xM
Пример.
У инвестора есть k акций, которые он желает продать. Торги происходят в течение
i  1,, n  k дней. В i -ый день стоимость акций равна yi , i  1, n . Его
контролируемые факторы:
1, акция продана,
xi  
0, акция не продана,
xi ( yi ) – сама стратегия.
Предположим, что yi – неопределенные факторы, такие, что:


N  yi a  yi  b, i  1, n

M0   x

n
x
i 1
i

 k , xi  0,1

n
F ( x, y )   xi yi – выручка
i 1
53
Если максимум не достигается, то можно ввести понятие  - оптимальной стратегии(см. лекцию XI)
116
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
min F ( x, y )  k  a
yN
Рассмотрим другой критерий:
F1 ( x, y ) 
F ( x, y )
 1,
max F ( x, y )
xM 0
то есть сумма, которую получает инвестор сравнивается с той суммой, которую бы
получил инвестор, если бы знал все цены.
Оценки эффективности для чистых стратегий
Выпишем явную форму для оценки эффективности стратегий. Для этого сделаем
некоторые предположения:
1) y  N – либо природная неопределенность, либо стратегия противника
Fn ( x, y, z )   F ( x, y, z ) , имеющего противоположные интересы;
2) противник не знает реализацию случайной величины z ;
3) оперирующая сторона разрешает осреднение критерия по случайности (по закону
распределения  ).
В таком случае формула для оценки эффективности записывается так:



W x  inf inf  F x  y, z  , y, z d ( z )
yN  
(1)
Z
Если бы противник знал реализацию z , то формула изменилась бы так:



W  x  inf  inf F x  y, z  , y, z d ( z )
 
Z
yN


Покажем, что W x  W  x , т.е. что если противник знает больше, то оценка
эффективности уменьшается:
y  N  
 F  x  y, z  , y, z  d ( z )   inf F  x  y, z  , y, z  d ( z )
Z
Z
yN
Беря нижнюю грань по   от обеих частей неравенства, получаем искомое.
117
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Оценки эффективности для смешанных стратегий
Предположим, что M  M 0 , Fг  M 0  – наилучший гарантированный результат.
Опр. Смешанной стратегией  на множестве M 0 называется вероятностное
распределение на этом множестве.
W    inf inf 
yN  
 F  x , y , z  d  ( x )d  ( z )
(2)
Z M0
Если противник знает реализацию z , то:
W     inf  inf
 
Z
yN
 F  x , y , z  d  ( x )d  ( z )
M0
Упр. Пусть y   y1 , y2   N  N1  N 2 , где y1 – природная неопределенность, y2 –

стратегия противника, знающего z . Выпишите в этих условиях W x .
Абсолютно оптимальная стратегия
 

Оптимальная стратегия x 0  M определяется как W x 0  max W x , при этом
xM
оценка эффективности соответствует (1).
Допустим, что закон распределения случайного фактора  известен. Определим
осредненный критерий:
x : N  Z  M0




F x, y ,   F x  y , z  , y , z d  ( z )
Z


W x  inf F x, y ,
yN

(1)
Опр. Абсолютно оптимальной стратегией xa  M называется



F xa , y,  max F x, y,
xM

y  N
Положим, что M 0  M  M u . Тогда
118
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ


max F x, y ,  max F  x, y , 
xM
(3)
xM 0





 x  M F x, y ,  F x ( y ), y ,  max F  x, y ,   max F x, y , 




xM 0
xM

max F x, y ,  F x ( y ), y ,  max F  x, y ,   max F x , y ,
xM
xM 0
xM



Очевидно, здесь можно неравенство заменить на равенство и (3) обосновано.
Равенство (3), вообще говоря, может быть не выполнено для M  M u . Рассмотрим
пример.
F ( x, z )  ( x  z )2 , M 0  0,1 , Z  0,1
x : Z  M0
2
 1

 1

2
max     x  z  dz   0  max    x( z )  z dz 
0 x 1
xM
 0

 0



Теорема 3.4. Пусть  x a  M . Тогда x a – оптимальная стратегия и

Fг  M   inf max F x, y ,
yN xM

(4)
Доказательство:







 
 x  M W x  inf F x, y ,  inf max F x, y ,  inf F x a , y,   W x a
yN
yN xM
yN
Рассмотрим частные случаи.
Теорема 3.5.
1) Если y  N достигается max F  x, y,  , то
xM 0
Fг  M u   inf max F  x, y,  .
yN xM 0
(5)
2) Если y  N , z  Z достигается max F  x, y ,  , то
xM 0
 
Fг M  inf  max F  x, y , z  d ( z ) .
yN
Z
xM 0
(6)
Доказательство:
119
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ


(3)


1) x a : x a ( y ) : F x a ( y ), y , = max F  x, y ,   = max F x, y,  , y  N
xM 0
xM u
Мы получили, что стратегия x a – абсолютно оптимальна, а значит, по Т3.4,


(3)
Fг  M u   inf max F x, y, = inf max F  x, y, 
yN xM u
yN xM 0


2) x a : x a ( y , z ) : F x a ( y , z ), y , z = max F  x, y , z  , y  N , z  Z
xM 0
Стратегия x a будет абсолютно оптимальной, если мы докажем, что




F x a , y, = max F x, y, =  max F  x, y, z  d ( z )
xM

Z

xM 0


(7)
 x  M F x, y,   F x( y , z ), y , z d ( z )   max F  x, y , z  d ( z ) 
Z

Z


xM 0

  F x a ( y, z ), y, z d ( z )  F x a , y,  , y  N
Z
Применяя теперь Т3.4, получим:
 
(4)


(7)
Fг M  inf max F x, y,  inf  max F  x, y, z  d ( z ) и теорема доказана.
yN xM
yN
Z
xM 0
Пример.
i  M 0  1,2,3, j  N  1,2,3,4
 F  i, j  
34
 1 2 5 2 
  3 2 1 2 


 4 2 3 1


a) M  M 0 , Fг  M 0   max min F (i, j )  1, i0  3
1i 3 1 j  4
В множестве M 0 нет абсолютно оптимальных стратегий. В самом деле, если бы она
была:
ia : F  ia , j   max F (i, j ), j  1,4, т.е.
1i 3
F  ia , j   F (i , j ), i  1,3, j  1,4
120
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
У нас нет такой строки ia , которая доминировала бы остальные строки.
b) M  M u , т.е. ожидается полная информация о неопределенном факторе j
i : N  M 0 , коих будет в данном примере – 34 .
По Т3.5, Fг  M u   min max F (i, j )  2
1 j  4 1i  3



F i  j  , j   2, j  1,4
i 0 : W i 0  min F i 0  j  , j  2
1 j  4
0
i 0 (1)  2,3
i 0 (2)  1,2,3
i 0 (3)  1,3
i 0 (4)  1, 2
Всего – 24 оптимальные стратегии.

ia ( j ) : max F (i, j )  F ia ( j ), j
1i 3

ia (1)  3
ia (2)  1,2,3
ia (3)  1
ia (4)  1,2
Всего – 6 абсолютно оптимальных стратегий.
121
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XVI
Продолжаем рассматривать примеры. Напомним условие.
i  M 0  1,2,3, j  N  1,2,3,4
 F  i, j  
34
 1 2 5 2 
  3 2 1 2 


 4 2 3 1


c) Пусть N  N1  N2 , N1  1,2, N2  3,4 . Предположим, что вначале
оперирующей стороне будет известно, какому множеству принадлежит j  N1 или N 2 .
i , j  N 1
i : i( j)   1
i2 , j  N 2
ia1  3, ia2  1 – абсолютно оптимальная стратегия и по Т3.4
Fг  M   min max F (i, j )  2
1 j  4 1i  3


F i 0  j  , j  2, j  1,4
i10  2,3 ; i20  1
Необходимое условие оптимальных(максиминных) стратегий
Предположим, что случайный фактор z отсутствует, при этом
F ( x, y ), x  M  M 0 , y  N ,
W ( x )  min F ( x, y ) – оценка эффективности,
yN
x 0 : W  x 0   max W ( x ) .
xM 0
Пусть x   x1 ,
, xm   E m , h( x) – функция многих переменных.
Опр. Производной по направлению   E m называется
122
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
lim
h  x     h  x 
x 0 


dh  x 
  h  x  ,   54
d
Пример.
x  E1 , W ( x )  min  x,1  x 
(рис. ниже)
  (1)
  (1)
1
dW  
 2   1
d
1
dW  
 2   1
d   
Теорема 3.6.
Пусть D  E m , N – компакт метрического пространства;
F  x, y  , Fxi  x, y  , i  1, m – непрерывны на D  N . Тогда
x  D   E m 
54
m
dW  x 
 min i Fxi  x, y , N ( x)  Argmin F ( x, y )
yN ( x )
d
yN
i 1
Последние скобки – скалярное произведение.
123
(1)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
m
 F   x, y    , F   x, y   , т.е. скалярное
Альтернативная запись суммы –
i
i 1
xi
x
произведение  на градиент или, фактически, производная по направлению.
Доказательство: x  D   E m рассмотрим
k  0  ,
x k  x   k , k  1,2,
xik  xi   ki , i  1, m
Покажем, что существует lim
W  xk   W  x 
k
k 
, выражающийся формулой (1).
Рассмотрим последовательность yk  N  xk  , y  N ( x) . Тогда
W x
0
k
  W  x   F  x , y   F  x, y   F  x , y   F  x , y   F  x , y   F  x, y  
k
k
k
k
k
F  x , y   F  x, y 
k
 
55
 x
k
i
i 1
k
m
i 1
Переходя к пределу, получим:
lim
k 
k
m
 i Fxi  x, y  y  N ( x )
i 1
В силу того, что неравенство выполнено для y ,
lim
k 
W  xk   W  x 
k
 min
yN ( x )
m
 F   x , y 
i 1
i
(2)
xi
Доказав аналогичное неравенство для нижнего предела:
55
k
 xi  Fxi  x   k  xk  x  , y 
 i Fxi  x  k  xk  x  , y 
W  xk   W  x 
k
k
m
k

k
Формула конечных приращений Лагранжа.
124

КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
lim
W  xk   W  x 
k
k 
 min
yN ( x )
m
 F   x , y  ,
i
i 1
(3)
xi
получим, что нижний предел больше верхнего предела или равен ему, а значит предел
последовательности существует и равен выражению из условия теоремы.
Докажем (3). По определению нижнего предела,
 kl , l  1,2, : lim
W  xk   W  x 
k
k 
 lim
W  x kl   W  x 
k
l 
l
 
k
Возьмем y kl  N x kl . Тогда y l  y *  N ( x ) , т.к.
F  x kl , y kl   F  x kl , y  y  N , и, переходя к пределу при фиксированном y ,
F  x, y *   F  x, y 
W  x kl   W  x 
k


F  x kl , y kl   F  x , y * 
k
l
F  x kl , y kl   F  x, y kl 
k

F  x kl , y kl   F  x , y kl   F  x , y kl   F  x , y * 
k
l

 i Fxi x  kl  x kl  x  , y kl
m
i 1
l
0
l

Переходя к пределу, получим:
lim
W  xk   W  x 
k 
k
 i Fxi  x, y *   min
m
i 1
yN ( x )
m
 F   x, y  и (3) доказано.
i 1
i
xi
Теорема полностью доказана.
Отметим частный случай.
N ( x)   y( x), F ( x, y )  y
W ( x)  F  x, y( x)  – дифференцируема, т.к.
Пример.
x   x1 , x2 
125
d
W ( x )  Fxi  x, y ( x ) 
dxi

КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
W  min f j ( x ), f1 ( x )  x12  x22 , f 2 ( x )  3x22 , f 3 ( x)  cos  x1   3x2
1i 3
x 0  1, 1 ,   1,1

d
W ( x 0 )  min0  , f j  x 0 
jN ( x )
d
f1  x 0   2, f 2  x 0   3,

f 3  x 0   4
N  x 0   3


f 3 x 0    0,3   , f 2  x 0   3 
Следствие Т3.6.
d
W ( x0 )  3
d
Пусть M 0  D  E m , при этом x 0  M 0 – максиминная стратегия и
выполнены все условия исходной теоремы. Тогда
sup min0 i Fxi  x 0 , y   0 ,
  x 0  yN  x  i 1
m
(4)
A  x 0  – множество всех направлений  , которые допустимы в точке x 0 .
Доказательство:
  A  x 0    0  0 :  0     0
x
0
    M 0
0
W  x     W  x 0 
dW ( x 0 )
 lim
0
 0 
d

0
126
(рис. ниже)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 F   x , y   0

m
Из (1) следует, что min0

yN x
0
i 1
i
xi
 , и, ввиду справедливости
неравенства для  ,
sup min0 i Fxi  x 0 , y   0 . Лемма доказана.
  x 0  yN  x  i 1
m
Теорема 3.7.
Пусть M 0  a, b  D , N – компакт метрического пространства;
F  x, y  , Fx  x, y  – непрерывны на D  N . Тогда для максиминной стратегии
x 0  M 0 справедливо одно из следующих утверждений:
a)
x0  a или x 0  b ;
 
b)  y1  y 2  N x 0 ;
c)
N  x 0    y1, Fx  x 0 , y1   0 .
Эти условия являются, по сути, обобщением поиска максимума у функции одной
переменной на отрезке: он достигается либо в точке, где производная равна 0, либо на
краях отрезка.
Доказательство: если выполнено a) или b), то теорема справедлива. Рассмотрим случай,
когда a) и b) не выполнено и необходимо выполнение с).
Если не выполнено а), то a  x0  b .
 
Если не выполнено b), то N x 0   y1  .
 : 1  Fx  x 0 , y1   0


0
1
  Fx  x , y   0
0
1
 :  1  Fx  x , y   0 
127
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Следствие Т3.7.


Пусть N  y  E n c j  y j  d j , при этом существуют частные
производные Fyj  x, y  на M  N при всех j  1, n и выполнены все условия
исходной теоремы. Тогда для максиминной стратегии из отрезка справедливо либо 1),
либо 2):
 Fx  x 0 , y1  x 0  a  x 0  b   0

1)  y  N  x  : 
0
1
1
1
 Fyj  x , y  y j  c j  y j  d j   0, j  1, n
1
0
 Fy  x 0 , y1  y1j  c j  y1j  d j   0, j  1, n
 j

2)  y1  y 2  N  x 0  :  Fyj  x 0 , y 2  y 2j  c j  y 2j  d j   0, j  1, n

0
1
0
2
 F  x , y   F  x , y 
Доказательство:
по условию Т3.7, выполнено одно из условий a), b), c). Покажем, что
a)  c)  1)
Первое уравнение системы, очевидно, выполняется.


min F x 0 , y1 y j  F  x 0 , y1  , y j  y1j
c j  y j d j
F – дифференцируема на отрезке и минимум достигается либо на краях отрезка, либо
во внутренней точке, где производная равна нулю.
b)  2)
Первые два равенства выполнены ввиду аналогичных рассуждений. Последнее также




 
выполнено, так как F x 0 , y1  F x 0 , y 2  W x 0 .
Алгоритм поиска максиминных стратегий


1) Решить систему из n  1 уравнений относительно x 0 , y1j , j  1, n


2) Решить систему из 2n  1 уравнений относительно x 0 , y1j , y 2j , j  1, n
*
*
Пусть M 0 , N – множества, появляющиеся в результате решений систем 1) и 2). Тогда
128
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
x 0  max* min* F ( x, y )
xM 0 yN
Пример.
F ( x, y )    x  y  y 3  , M 0   1,1 , N   1,1
2
(рис. 55)
3
Мы будем стараться минимизировать отклонение x от функции  ( y )  y  y .
 1 
, x  0
 
3



  1 
N ( x )   
, x  0
3



 1 
  , x  0
  3 
 1 
y  N ( x) Fx( x, y )  2  x  y  y 3   0  M 0*  1,0, N *  

 3
129
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 F  x, y  
xM * , yM *
2
 
2 
  1 

3
 
2

 2 

 
  3 

2
2 
 
  1  3 

 
2
2  

 1 
 
3 

2 
 2  
0

   x 0
 3
2
2  

 1 

3  

130
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XVII
Некоторые задачи оптимального распределения ресурсов
Пусть имеется i  1, n пунктов, по которым оперирующая сторона распределяет ресурс
в количестве A  0 , fi (t ) – функция эффективности вложения ресурса в i -ый пункт,
распределение ресурса задается вектором x   x1 ,
, xn  , xi – количество ресурсов,
направляемых в i -ый пункт.
Мы будем рассматривать два типа задач: в одних ресурс будет непрерывным
(бесконечно делимым), в других – дискретным (штучным).

M0   x

n
x
i 1
i

 A, xi  0, i  1, n  – для непрерывных задач;



M 0  x  M 0 xi  , i  1, n – для дискретных задач.
Рассмотрим первую задачу оптимального распределения ресурсов.
max min f i  xi   min f i  xi0  ,
xM 0 1i  n
1i  n
I
т.е. оперирующая сторона пытается максимизировать минимальный эффект отложения
по всем пунктам.
Будем считать, что f i  t  – определена, возрастает и непрерывна на отрезке 0, A ,
f1  0  f 2  0 
 f n  0 , т.е. первый пункт – слабейший.
Теорема 3.8 (принцип уравнивания).
В сделанных предположениях пусть x 0 является оптимальным распределением
ресурса в задаче (I). Тогда необходимо и достаточно, что
 f1  x10  = = f k  xk0   f k 1  0  ,
 1 k  n 
0
 xi  0 i  k  1, n
131
(1)
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
При этом, если f1  0 
 f n  0 , то k  n . Оптимальное распределение ресурсов в
задаче (I) единственно.
Смысл этой теоремы в том, чтобы распределить ресурсы между k слабейшими
пунктами с одинаковыми эффектами отложения.
Доказательство:
x 0 – оптимальное распределение в (I)  (1)
Заметим, что это распределение существует ввиду непрерывности функции f i  t  .
 k : f k  0   min fi  xi0   f k 1  0 
1i  n
(2)
xi0  0 i  k  1, n
От противного:  i1  k  1:
xi0  0
 xi01   , i  i1

z : zi   0

, i  i1
 xi 
n 1

f i  zi   f i  xi0  , i  i1
 


fi1 zi1  fi1 xi01    fi1  0   f k 1  0   min fi  xi0  , i  i1
(2)
1i  n
 
0
Тогда min f i  zi   min f i xi , что противоречит определению x 0 .
1i  n
1i  n
 
 
0
0
Докажем теперь, что f i xi  min f i xi , i  1, k , также от противного:
 
1i  n
 i1  k : f i1 xi01  min f i  xi0   f k  0   f i1  0   xi01  0
(2)
1i  n
132
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
 xi01   , i  i1

Аналогично вводим z : zi  

0
, i  i1
 xi 
n 1

f i  zi   f i  xi0  , i  i1
 


fi1 zi1  f i1 xi01    56  min f i  xi0  , i  i1
1i  n
 
Тогда min f i  zi   min f i xi0 , что противоречит определению x 0 .
1i  n
1i  n
x 0 – оптимальное распределение в (I)  (1)
x  M 0 , x  x 0
min f i  xi   min f i  xi0 
1i  n
1i  n
x  x 0   j : 0  x j  x 0j
min f i  xi   f j  x j   f j  x 0j   min f i  xi0 
(1)
1i  n
1i  n
Единственность получается из этого же неравенства: для любого другого
распределения значение будет строго меньше, чем максимальное значение минимума.
Теорема доказана.
Алгоритм для нахождения оптимального распределения. Непрерывный случай
Решаем систему с k  1 неизвестными:
 f i  xi0   С , i  1, k

 k 0
  xi  A
 i 1
Понятно, что xi  0 . Прекращаем вычисление, если выполнено условие
0
оптимальности: C  f k 1  0 .
56
При малом  сохраняется строгое неравенство(в силу непрерывности функции).
133
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Рассмотрим теперь дискретную задачу:
max min f i  xi   min f i  xi* 
xM 0 1i  n
 I 
1i  n
Пусть f i  t  – возрастающая функция дискретного аргумента.
x  M 0 определим I  x   Argmin fi  xi  , I  x  – число элементов в этом
1i n
конечном множестве.
Теорема 3.9.
В сделанных предположениях пусть x * является оптимальным распределением
 
ресурса в задаче  I  , причем I x*
– минимально среди всех оптимальных
распределений. Тогда необходимо и достаточно:
x*j  0  min f i  xi*   f j  x*j  1
(3)
1i  n
Можно также написать, что выполнено
f j  x*j  1  min f i  xi*   f j  x*j  1 , т.е. при положительном вложении эффекты
1i  n
близки к минимуму.
Доказательство:
 
x * – оптимальное распределение, причем I x* – минимально  (3)
От противного:  j : x*j  0
f j  x*j  1  min f i  xi*   f j  xl* 
1i  n
 x*j  1, i  j

z : zi   xl*  1, i  l
 x* , i  j, l
 i
min f i  zi   min f i  xi* 
1i  n
1i  n
I  z   I  x* 
x 0  оптимальное
распределение

min f i  zi   min f i  xi* 
1i  n
1i  n
l , что противоречит условию теоремы.
134
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
x * – оптимальное распределение  I   (3)
x  M 0 , x  x*  j : x j  x*j  x j  x*j  1
min f i  xi   f j  x j   f j  x*j  1  min f i  xi* 
(3)
1i  n
1i  n
Теорема доказана.
Упр. Придумайте пример, когда в задаче  I  оптимальное распределение x * не
единственно.
Дискретный случай
Выбирается некоторое распределение ресурса x (1)  M 0 . Его можно взять
произвольным, но чаще выбирают x 0 для непрерывного случая и округляют его
должным образом.
Пусть на k -ом шаге получено распределение x ( k ) . Тогда мы проверяем для него
выполнение условия (3):
min f i  xi( k )   f j  x (jk )  1
1i  n
Если условие выполнено, то x ( k ) – оптимально. В противном случае
f j  x (jk )  1  min f i  xi( k ) 
1i  n
Определим
x ( k 1) : xi( k 1)
 x (jk )  1, i  j

  xl( k )  1, i  l
 x ( k ) , i  j, l
 i
1)
I  x ( k )   1  min fi  xi( k 1)   min fi  xi( k )  ;
2)
I  x( k )   2  min fi  xi( k 1)   min fi  xi( k )  ,
1i n
I  x ( k 1)   I  x ( k ) 
1i n
1i n
1i n
l
135
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Шаг 2) повторится не более чем n раз57, после этого значение минимума возрастет.
Пример. Пусть n  4, A  10 . Будем решать задачу поиска max min ixi2 .
xM 0 1i n
f i  t   it 2 , f i  0   0, i  1,4
 0
C
i  x 0  2  C , i  1,4
xi 
, i  1,4

i

i
10

 
 xi0 
, i  1,4
 4 0
4
4
1
C
x

10
 k

i 
 10
 k 1
 
k
k 1
k
k 1
Решим теперь дискретную задачу.
x10  3.59, x20  2.54, x30  2.07, x40  1.8
x (1)   4,3,2,1
i  xi(1)  1
i  xi(2)  1
xi(2)
i  xi(2) 
9
3
9
4
18
8
3
18
8
2
12
3
2
12
3
1
4
0
2
16
4
i
xi(1)
i  xi(1) 
1
4
16
2
3
3
4
2
2
2
2
Для последних двух столбцов выполняется неравенство (3): 9  8,3,4 , поэтому
x*   3,3,2,2 
Рассмотрим задачу максимизации суммарной эффективности по всем пунктам:
max  f i  xi    f i  xi0 
xM 0
n
n
i 1
i 1
 II 
Можно сказать, что это капиталистический принцип: максимизируются накопления, но
57
Алгоритм конечен.
136
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
при этом возникает бедность.
Интерпретируем эту задачу как оптимальное распределение капитала A между n
пунктами, при этом fi  xi  – прибыль от вложения в i -ый пункт.
Будем считать, что f i  t  – дифференцируема на отрезке 0, A , но не обязательно
возрастает.
Теорема 3.10 (лемма Гиббса58).
Пусть x 0 – оптимальное распределение ресурсов в задаче  II  . Тогда
 f i  xi0    , если xi0  0

: 
0
0
 f i  xi    , если xi  0
(1)
Если функции f i  t  – вогнуты, то (1) – достаточное условие оптимальности.
Если f1 0   f 2  0  
 f n  0  ,  f i   0   0, i  1, n , то
 xi0  0, i  1, l
l:  0
 xi  0, i  l  1, n
Используя интерпретацию f i  t  как величину прибыли, можно сказать, что при
 
положительных вложениях нормы прибыли f i  xi0 должны совпадать.
Доказательство:
x 0 – оптимальное распределение ресурсов в задаче  II   (1)
i : xi0  0
j  i     fi  xi0     f j  x 0j    
 f x 
k i , j
k
0
k
Можно написать необходимое условие оптимальности в виде:    0  0 .
Джоза́йя Уи́ллард Гиббс (1839-1903) - американский физик, физикохимик, математик и механик, один
из создателей векторного анализа, статистической физики, математической теории термодинамики.
58
137
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
   0    fi  xi0   f j  x 0j   0
f j  x 0j   f i  xi0 
(2)
Аналогично из x 0j  0 можно получить
f j  x 0j   f i  xi0 
(3)
 
 
(2) и (3)  f j x 0j  f i xi0  
Функции f i  t  – вогнуты и выполнено условие (1)  x 0 – оптимальное
распределение ресурсов в задаче  II 
Фактически, нам нужно доказать, что
x  M 0 , x  x 0
 fi  xi    fi  xi0   0
n
n
i 1
i 1
f i  xi    f i  x     f i  xi   f i  xi0     f i  xi0  xi  xi0  

i 1
i 1
i 1
i 1
n
n
n
n
0
i
  xi0  0   xi  xi0   0, xi0  0  f i  xi0         xi  xi0     A  A  0


i 1
n
Осталось доказать последнее утверждение теоремы. От противного:
x0 :  i : xi0  0, но xi01  0
138
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
fi  xi0   fi  0    fi 1  xi01   fi 1  0 , но тогда производные не упорядочены.
(1)
(1)
Пришли к противоречию. Теорема доказана.
139
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Лекция XVIII
Задача поиска объекта
Рассмотрим пример на использование леммы Гиббса.
Предположим, необходимо осуществить поиск объекта в некоторой области (разбитой
на подобласти). Время поиска ограничено и равно A . Если объект находится в i-ой
области, то условная вероятность его обнаружения в течение времени t равна
1  eit , i  0
Пусть pi  0 – априорная вероятность того, что объект находится в i-ой области и
пусть x   x1 ,
, xn   M 0 – вектор распределения времени поиска. Максимизируется
 p 1  e    max
n
при этом полная вероятность обнаружения объекта:
i 1
 i xi
i
xM 0
f i (t )  pi 1  e  i xi 
Эти функции являются вогнутыми, так как fi (t )  pi i e
 i xi
и вторая производная,
очевидно, отрицательна.
Без потери общности, можно считать, что производные в нуле упорядочены:
fi  0  pi i и p11  p2 2 
 pn n .
Применим тогда лемму Гиббса.
 pi i e  i xi   , i  1, l
 l

0
 xi  A
 i 1
0
Получаем l  1 уравнений и неизвестных.
Решаем их, учитывая второе условие теоремы:
f n  0 
 fl1  0  pl 1l 1  
Нам осталось рассмотреть последнюю задачу максимизации суммарной эффективности
140
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
для дискретного случая:
max  f i  xi    f i  xi* 
xM 0
n
n
i 1
i 1
 II 
Потребуем следующее условие:
 0  t  A, t 
f i  t   f i  t  1  f i  t  1  f i  t  , i  1, n 59
(2)
Лемма. Пусть f i  t  удовлетворяет условию (2). Тогда:
1) t  t0 f i  t   f i  t0    f i  t0  1  f i  t0    t  t0  ;
2) t  t0 f i  t   f i  t0    f i  t0   f i  t0  1   t  t0  .
Доказательство:
1) t  t0 f i  t   f i  t0   f i  t   f i  t  1  f i  t  1  f i  t  2  

 f i  t0  1  f i  t0    f i  t0  1  f i  t0    t  t0 
2) t  t0 f i  t0   f i  t   f i  t0   f i  t0  1  f i  t0  1  f i  t0  2  

 f i  t  1  f i  t    f i  t0   f i  t0  1   t0  t 
Теорема 3.11 (критерий Гросса60).
Пусть x * – оптимальное распределение ресурсов в задаче  II  . Тогда необходимо и
достаточно, что
x*j  f j  x*j   f j  x*j  1  max  fi  xi*  1  fi  xi*   
1i n
(3)
Фактически, это дискретный принцип уравнивания для дискретных производных.
 




 
Действительно, f j x*j  f j x*j  1    f j x*j  1  f j x*j , т.е. дискретная
По сути, это дискретная производная.
Бенеди́кт Хайма́н Гро́сс (1950) - американский математик, занимается изучением теории чисел и
теоремой Гросса-Загье.
59
60
141
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
производная близка к  .
Доказательство:
x * – оптимальное распределение ресурсов задачи  II   (3)
Пусть (3) не выполнено. Тогда
 j : x*j  0  f j  x*j   f j  x*j  1  max  fi  xi*  1  fi  xi*   f l  xl*  1  f l  xl* 
1i n
 x*j  1, i  j

z : zi   xl*  1, i  l
 x* , i  j, l
 i
f j  x*j   f l  xl*   f l  xl*  1  f j  x *j  1 , что есть противоречие, т.к. суммарный
zl
zj
эффект возрастет, хотя x – оптимальное распределение ресурсов.
*
Пусть для некоторого x * выполнено (3)  x * – оптимальное распределение ресурсов
задачи  II 
x  x* , x  M 0
 fi  xi    fi  xi*   0
n
n
i 1
i 1
Нам достаточно показать справедливость неравенства
fi  xi   fi  xi*     xi  xi*  , i  1, n ,
(4)
поскольку суммирование по i и даст нам искомое неравенство.
Воспользуемся доказанной леммой:


0

xi  xi* f i  xi   f i  xi*   f i  xi*  1  f i  xi*   xi  xi*     xi  xi* 



0
0  xi  xi* f i  xi   f i  xi*   f i  xi*   f i  xi*  1  xi  xi*     xi  xi* 
Тем самым неравенства (4) доказаны и теорема справедлива.
142
КОНСПЕКТ ПОДГОТОВЛЕН СТУДЕНТАМИ, НЕ ПРОХОДИЛ
ПРОФ РЕДАКТУРУ И МОЖЕТ СОДЕРЖАТЬ ОШИБКИ
СЛЕДИТЕ ЗА ОБНОВЛЕНИЯМИ НА VK.COM/TEACHINMSU
ТЕОРИЯ ИГР И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
МОРОЗОВ ВЛАДИМИР ВИКТОРОВИЧ
Алгоритм нахождения оптимального распределения ресурсов в задаче  II  .
Возьмем, вообще говоря, произвольное61 распределение x1 . Положим, на k -ом шаге мы
проверяем условие (3). Если оно выполнено, то оптимальное распределение найдено. В
противном случае:
x kj  0  f j  x kj   f j  x kj  1  max  fi  xik  1  fi  xik   f l  xlk  1  f l  xlk 
1i n
x ( k 1) : xi( k 1)
 x*j  1, i  j

  xl*  1, i  l
 x* , i  j, l
 i
f j  x kj   f l  xlk   f j  x (jk 1)   f l  xl( k 1) 
Упр. Сформулируйте необходимое и достаточное условие оптимальности для
n
min  f i  xi  при условии, что функции fi  xi  – выпуклы.
xM 0
61
i 1
0
Лучше взять округленное решение x непрерывной задачи.
143
ФАКУЛЬТЕТ
ВЫЧИСЛИТЕЛЬНОЙ
МАТЕМАТИКИ И
КИБЕРНЕТИКИ
МГУ ИМЕНИ
М.В. ЛОМОНОСОВА
Download