Экзаменационная работа по курсу с решениями задач

advertisement
Экзаменационная работа по курсу с решениями задач.
«Теория игр и экономическое моделирование», 2011 год
Время выполнения: 2 часа 50 минут.
Привожу ответы с краткими решениями.
Требуется еще объяснить, откуда что берется подробно!
Задача 1. Рассмотрим следующую игру в развернутой форме.
(1.1) Постройте нормальную форму этой игры для игроков 1 и 2 и найдите все равновесия
Нэша (РН) в чистых и смешанных стратегиях.
Решение. Есть два РН в чистых стратегиях (L,b) и (R,a).
a
b
L 2/3, 2/3 4/3, 4/3
R 4/3, 4/3 2/3, 2/3
Есть еще одно РН в смешанных стратегиях
{(1/2, 1/2), (1/2, 1/2)}.
(1.2) Найдите все совершенные байесовские равновесия (СБР) (в чистых и смешанных
стратегиях) и приведите ответ в следующем формате:
№ СБР стратегия стратегия представления
игрока 1 игрока 2
игрока 2
Решение.
№ СБР
стратегия
стратегия представления
игрока 1
игрока 2
игрока 2
L
b
(1/3,2/3)
R
a
(1,0)
1/2 L+1/2 R 1/2 a+1/2 b
(1/2,1/2)
1
2
3
В смешанном СБР 3 игроку 2 на 2-точечном информационном множестве должно быть все
равно, что выбирать. Это может быть только при представлениях (1/2,1/2). При какой смешанной
стратегии игрока 1 могут возникнуть такие представления у игрока 2? Обозначим через  ( L)  p
вероятность выбора L игроком 1. Тогда по условию согласования представлений и стратегий
2
1
1
3
3
2
должно быть выполнено p    p 
.
Задача 2. Два инвестора одновременно вкладывают средства в совместный проект. Если
инвестор i вкладывает xi , а его партнер j инвестирует x j , то выигрыш инвестора i определяется
по формуле i xi x j  xi3 . Здесь  i — приватный параметр инвестора i , о котором его партнер
думает как о случайной величине, равномерно распределенной на отрезке [0, 1]. Это описание
ситуации является общей информацией. Найдите симметричное равновесие Байеса- Нэша в классе
стратегий xi  a  b i .
Решение. Пусть пара стратегий ( x1* , x2* ) является РБН, причем x*i  a  b i , поскольку мы
ищем симметричное РБН. Ожидаемый выигрыш i от инвестиций xi при известном  i равен
U ( xi ,i )  i xi E[ x*j ]  xi3 .
Найдем xi* (i ) из условия 1-го порядка (при каждом  i нужно максимизировать выигрыш
игрока i по xi ) :
xi* (i ) 
Отсюда
a0
получаем
E ( x*j ) 
E[b i ]  bE[ i ] 
xi* (i ) 
2
9
2b
x*i
и
. Из b 
E[ x*j ]
3
3
E[ x*j ]
i .
3
 b i ,
b
причем
получаем b 
2
E ( x*j )
3

2b
9
E[ x*j ]
3
.
Но
, значит, b 
тогда
2
9
. Итак,
i .
Задача 3. Сигнальная реклама. Компания «Глоток» представляет новый напиток
типичному потребителю. Напиток может быть Хорошим или Плохим. Априорная вероятность
Хорошего напитка равна 0.6. Зная, каким получился новый напиток, компания выбирает уровень
рекламы: массированная реклама с затратами c или минимальная реклама с нулевыми затратами.
Наблюдая уровень рекламной активности, но, не зная качества нового напитка, типичный
потребитель решает, покупать ли ему этот продукт. С учетом цены на продукт будем считать, что
выигрыш потребителя от покупки равен +1, если напиток Хороший, и 1 , если Плохой. Если
потребитель не купит напиток, то его выигрыш равен 0. Если напиток Хороший и типичный
потребитель купит его, то фирму ожидает большой доход R . Если напиток Плохой, но типичный
потребитель его все-таки купит, то фирму ожидает меньший доход r . Если типичный потребитель
не купит напиток, то доход компании равен 0. Предполагается, что o  r  c  R .
(а) Сформулируйте соответствующую сигнальную игру и изобразите ее графически.
(R-c,1)
[ p]
(-с,0)
(-с,0)
Хор
[q]
Пас
(0,0)
0.6
Н
П
0
0.4
К
Н
Акт
Г
Н
П
(r-c,-1)
(R,1)
К
К
К
(r,-1)
Г
[1  p ]
Акт
Плох
Пас
[1  q]
Н
(0,0)
(б) Найдите выявляющее совершенное байесовское равновесие (СБР) в этой игре.
Есть два кандидата на СБР: искреннее или лживое.
В искреннем СБР «Глоток» активно рекламирует Хороший напиток и пассивно — Плохой.
Автоматически p  1, q  0 . На активную рекламу потребитель отвечает покупкой, а на
пассивную – отказом. «Глотку» не выгодно отклоняться ни при каком качестве напитка. Получили
искреннее СБР.
В лживом СБР «Глоток» активно рекламирует Плохой напиток и активно Хороший. Значит,
p  0, q  1 . Потребитель покупает при пассивной рекламе и не покупает при активной. Но
«Глотку» при плохом напитке выгодно отклониться на пассивную рекламу, чтобы получить r  0 .
Значит, лживого СБР при данных параметрах нет.
(в) Найдите скрывающее СБР в этой игре.
Есть два потенциальных скрывающих СБР: с активной или пассивной рекламой, независимо
от качества напитка.
При активной рекламе p  0.6 . Ожидаемый выигрыш от покупки равен 0.2, что больше 0,
поэтому при активной рекламе потребитель покупает напиток. Однако эту конструкцию нельзя
продлить до СБР. По условию r  c  0 , поэтому в случае Плохого напитка «Глотку» более
выгодна пассивная реклама, которая дает неотрицательный выигрыш.
При пассивной рекламе q  0.6 . Ожидаемый выигрыш от покупки для потребителя снова
равен 0.2, поэтому он покупает. Отклоняться в сторону активной рекламы «Глотку» не выгодно
при любом p и любой реакции потребителя на активную рекламу. Получили СБР.
(г) Найдите СБР, если вероятность Хорошего напитка равна 0.4.
На выявляющие СБР такое изменение не влияет. Искреннее СБР сохраняется.
В скрывающих равновесиях теперь потребитель не будет покупать напиток, поскольку его
ожидаемый выигрыш от покупки равен –0.2.
При активной рекламе, достроить скрывающее СБР нельзя, поскольку при Плохом напитке
«Глотку» выгодна пассивная реклама: c  0  r .
При пассивной рекламе нужно, чтобы потребитель не хотел купить напиток также и при
активной рекламе. Тогда «Глоток» не будет отклоняться при Хорошем напитке. Этого можно
достигнуть при p  0.5 . Итак, получили нулевое (пассивная реклама и нет покупок) скрывающее
СБР. Ненулевых СБР в этом случае нет.
(д) Найдите СБР, если 0  c  r  R , а вероятность Хорошего напитка равна 0.6.
Теперь искреннее выявляющее СБР вылетает, поскольку «Глотку» становится выгодным
при Плохом напитке использовать активную рекламу: r  c  0 . Лживое СБР нет по нем же
причинам, что и раньше: при плохом качестве выгодно переходить на пассивную рекламу .
Возникает скрывающее СБР с активной рекламой при q  0.5 . Скрывающее СБР с
пассивной рекламой теперь получается при любом p , поскольку потребитель будет покупать и
при пассивной рекламе, а переходить на активную рекламу «Глотку» нет смысла.
Задача 4. У предпринимателя есть рисковый проект, для реализации которого нужно
вложить 100,000. В случае успеха проект принесет доход 300,000, а в случае неудачи — 0. Оба
варианта считаются равновероятными. Предприниматель может быть либо богатым с состоянием
1,000,000 или бедным с состоянием 0. В любом случае (в силу некоторых причин) он не может
инвестировать свои деньги в этот проект, но может взять кредит у банка. Банк готов дать кредит
под рисковый проект, но под специально назначенную им процентную ставку  . Заняв 100,000,
предприниматель по завершению проекта должен вернуть банку 100000  (1   ) , если у него есть
столько денег. В противном случае он отдает все, что у него есть.
Порядок ходов
1. Банк назначает ставку  .
2. Предприниматель решает, брать ли кредит. Если он берет 100,000, то вкладывает деньги в
проект.
3. По завершению проекта становится известным, привел ли он к успеху и происходит
расплата банком.
а) Найдите СПРН для случая полной информации о состоянии предпринимателя.
Богатый предприниматель всегда возвращает кредит, а его ожидаемая прибыль от проекта
равна
1
0.5  300000  (1   ) 100000  0 при   ,
2
1
поэтому для богатого предпринимателя банк может назначить   .
2
Бедный предприниматель может вернуть деньги только в случае успеха проекта. Его
ожидаемый выигрыш равен 0.5  (300000  (1   ) 100000)  0 при   2 , поэтому для бедного
предпринимателя банк назначит   2 .
б) Пусть размер состояния предпринимателя — это его приватная информация. Банк не
знает точно размера состояния предпринимателя. Вероятность обращения в банк за рисковым
кредитом богатого предпринимателя оценивается величиной ¼ . Найдите СБР.
Богач будет брать кредит до ставки 0.5, а бедняк — до ставки 2.
1
Если   , то выигрыш банка U ( ) будет равен
2
1
3 1
1
100000  (1   )   (  100000  (1   )   0)  100000 
4
4 2
2
5
5 3
 100000  (1   )  100000   100000  100000 
8
8 2

При
3
4
1
2
1
100000  0.
16
   2 выигрыш банка U ( ) составляет
1
1
3
2
2
8
 ( 100000  (1   )   0)  100000  (  1)100000
Максимум достигается при   2 . В итоге получаем не эффективное СБР: банк назначает
ставку 2, от которой богатый предприниматель отказывается, а бедный соглашается, при этом
ожидаемый выигрыш банка составляет 37500, что по доходности меньше 50%, а вовсе не утроение
капитала... Это пример «плохого отбора» в играх с приватной информацией: банку хочется
работать с богатым, а приходится с бедным.
Задача 5. В игре участвуют Судья и Истец. Истцу был нанесен некоторый моральный
ущерб. Степень ущерба v является приватной информацией истца. Судья верит, что v
равномерно распределено на {0, 1,…, 99} (т.е. он полагает, что вероятность события v  i равна
1/100). Истец может без затрат предъявить истинную величину v Судье. Последовательность
действий следующая. Сначала Истец принимает решение, предъявлять ли величину v судье. Затем
судья дает Истцу компенсацию R . Выигрыш Истца равен R  v , а выигрыш Судьи равен
(v  R ) 2 . Все это описание является общей информацией. Найдите совершенное Байесовское
равновесие.
Решение. Стратегия Истца есть функция от его приватной информации: s(v) со значениями
v (открыться Судье) или N (не открываться). Стратегия Судьи есть функция R() , заданная на
множестве {N , 0,1,
, 99} . В РБН ( s* , R* ) при откровенности Истца Судья в силу своих
предпочтений всегда выбирает компенсацию R* (v )  v . Если Истец не хочет иногда выявлять
свою приватную информацию ( s* (v)  N хотя бы для одного v ), то предпочтения Судьи диктуют
R* ( N )  E[v | s* (v)  N ] .
В РБН Истец должен дать наилучший ответ на стратегию Судьи R* для каждого v . Отсюда
следует, что в РБН Истец будет открываться при v  R* ( N ) и не будет открываться при v  R* ( N ) .
Но тогда ясно, что в СБР R* ( N )  0 . В противном случае, Судья знает, что Истец будет молчать
для малых значений ущерба, а значит, понижая компенсацию при молчании Истца, Судья может
увеличить свой выигрыш (уменьшить проигрыш).
Итак, в РБН Судья не дает компенсации «в темную», но справедлив с искренним Истцом.
Истец либо искренен всегда ( s* (v)  v ), либо скромно молчит, лишь при v  0 . Формально
имеется ровно два РБН, которые, по сути, эквивалентны.
Download