15 - ifmo-bachelor-year-2004

advertisement
15. Теория экономических механизмов. Эффективные и оптимальные механизмы.
Конструкция механизмов Викри-Кларка-Гровса. Принцип эквивалентности
доходности. Теоремы о невозможности: теорема Гиббарда-Саттертуэйта, теорема
Вильямса, теорема Робертса
Введение
Дизайн механизмов – раздел теории игр, который изучает взаимодействие между
агентами, при котором каждый агент пытается выбрать стратегию, максимизирующую его
собственную прибыль; подход, позволяющий создать такой механизм взаимодействия,
при котором эгоистические действия каждого агента в сумме приведут к решению,
оптимальному с точки зрения общей целевой функции.
Главный пример – аукционы.
Постановка задачи: в игре участвуют агенты, у игры есть различные исходы, у каждого
агента есть некий набор действий, которые он может предпринимать. Более формально:
есть тип агента  i   для i-того агента. У игры есть набор исходов O, и для каждого
агента каждый исход означает какую-то прибыль; так появляется функция полезности
u i (o,  i ) - для соответствующего типа и исхода. Агент предпочитает один исход другому,
если функция полезности для первого больше.
Стратегия агента – это план, который полностью описывает его поведение во всех
возможных состояниях окружающего мира.  i - множество всех стратегий агента i,
s i ( i )   i - его стратегия.
Равновесие Нэша – если каждый агент при данных стратегиях других агентов выбирает
для себя оптимальную стратегию. Т.е. ни один агент не может увеличить выигрыш,
изменив своё решение в одностороннем порядке, когда другие агенты не меняют решения.
Эффективные и оптимальные механизмы
- две трактовки «хорошести» механизма. Первый хорош для агентов. Такой механизм
максимизирует всеобщее счастье, т.е. суммарный доход всех агентов. Второй хорош для
продавца и максимизирует его суммарный доход.
Конструкция механизмов Викри-Кларка-Гровса
VCG (Vickrey-Clarke-Groves) – эффективный механизм с правилом платежа
M V : X  RN :
M iV ( x)  W (a i , x i )  Wi ( x)
W - суммарное счастье всех агентов
Wi суммарное счастье всех агентов без i-того
иксы - значения ценности агента
Он эффективный, т.е. правило распределения Q уже задано: Q * ( x)  arg max Q
N
Q x
j 1
i
i
.
Это значит, что M iV - разница между общим счастьем при наименьшей возможной ставке
агента i и счастьем всех остальных агентов при текущей ставке. То есть, грубо говоря,
насколько агент суммарно сделал хуже другим.
Теоремы о невозможности
1) Функция социального выбора называется диктаторской, если существует такой агент i,
что для всех   
f ( )  {x  X |u i ( x,  i )  u i ( y,  i ) äëÿ âñåõ y  X }
Проще говоря, функция социального выбора всегда выбирает один из вариантов,
оптимальных для i-того агента.
2) Обозначим через P множество всех линейных порядков на O, через R i - множество
порядков, которые может реализовать агент i.
3) Стратегия называется доминантной, если она максимизирует ожидаемую прибыль
агента для всех возможных стратегий других игроков.
Теорема Гиббарда-Саттертуэйта: множество возможных исходов O конечно и состоит не
менее, чем из 3-х элементов, все исходы реализуются: f ( )  O , и каждый агент может
реализовать любое рациональное множество предпочтений: Ri  P . Тогда функция
социального выбора правдиво реализуема (участнику выгодно говорить правду) в
доминантных стратегиях iff она диктаторская.
Множество типов V называется неограниченным, если каждый агент теоретически может
присвоить каждому исходу любое вещественное число.
Теорема Робертса: Пусть | O | 3 и V неограниченно. Тогда для каждой правдиво
реализуемой функции социального выбора f существуют неотрицательные веса k1 ,..., k N ,
не все равные нулю, и константы C x , x  O , для которых для всех v V
N
f (v)  arg max xO { k i v i ( x)  C x }
i 1
Related documents
Download