Коллективные решения: современное состояние и перспективы Ф.Т.Алескеров

advertisement
Коллективные решения:
современное состояние
и перспективы
Ф.Т.Алескеров
НИУ ВШЭ
alesk@hse.ru
Семинар факультета БИ, Москва 10.06.2010
1
План доклада
•
•
•
•
•
•
•
•
•
•
•
История
Модели агрегирования
Задача индивидуального выбора
Аксиоматический синтез процедур
а) локальные процедуры
б) нелокальные процедуры
Модели выбора на мажоритарном графе
Механизмы
Оценки влияния участников и формирование коалиций
Эксперименты
Приложения
2
История (Плутарх «Жизнеописания»)
•
"Кто подавал голос за избрание, просто бросал хлебный шарик, но кто
желал сказать "нет",  предварительно сильно сдавливал его в руке. Если
таких находили хоть один, просившему о своем избрании отказывали в его
просьбе..."
•
“Выборы происходили следующим образом. Когда народ успевал
собраться, выборные запирались в одной комнате соседнего дома, где не
могли никого видеть, так же, как никому нельзя было видеть их. До них
могли доноситься только крики собравшегося народа: как в этом случае,
так и в других он решал избрание криком. Избираемые выходили не все
сразу, но поодиночке, по жребию и шли молча через все собрание. У тех,
кто сидел запершись в комнате, были в руках дощечки для письма, на
которых они отмечали только силу крика, не зная, к кому он относится. Они
должны были записать лишь, как сильно кричали тому, кого выводили
первым, вторым, третьим и т. п. Того, кому кричали чаще и сильнее
объявляли избранным.”
3
Модели агрегирования
A – множество альтернатив, A = {x1, …, xm}, m >=3
N = {1, …, n} – множество участников, n >= 3
{мнения участников об альтернативах из A}1n
коллективное решение
•
•
•
•
Три модели
{Pi }1n –> P
{Ci(.)} –> C(.)
{Pi} –> C(.)
Функции группового выбора
Функциональные правила
Соответствия группового выбора
Другие приложения: {ui(.)} –> u(.)
{ui(.)} –> C(.)
4
Задача индивидуального выбора
• Pi - линейные порядки
• P – линейный порядок
acyclic
частичный порядок
ациклическое отношение
произвольное
transitive
Транзитивность
Запрещено
Пример частичного порядка
5
Функции выбора
C: 2A -> 2A with X  2 A
C( X )  X
предъявление,
допустимое множество
Рациональный выбор
C( X )  y  X
X
C( X )  y  X
x  X
x  X
P
т.ч.
xPy
т.ч. u( x)  u( y)
C(*)
B
C
П
п
6
Аксиоматический синтез процедур
7
Ограничения на правила
8
Функции группового выбора
{Pi } -> P
• Локальность
xPy = F (x Pi y) IIA
x
x
y
z
y
w
x
y
x
y
x
y
y
w
y
x
x
x
y
z
IIA – Arrow (1951)
9
Нормативные условия
1.
Ненавязанность NI
x, y Pi  т.ч.
Pi
2.
т.ч.
Монотонность
xPy
xP y
M
x
x
x
y
y
3.
Нейтральность
y
x
y
x
y
x
y
x
y
Ne
Имена альтернатив не имеют значения
4.
Анонимность
An
Имена участников не имеют значения
5.
Принцип Парето
P
x
x
y
x
x
y
y
y
Правила, удовлетворяющие Ni, M, Ne, P
w4
P1
w1
Qr=B

с
P2
W3
W2
 

 
 

    Pi     Pi     Pi 
P
P

i
 iw   iw
 

 
 1   2   iw3   iw4 
P   Pi
- федерация
w iw
 1
P   Pi
- олигархия
iw
w 1
P  Pi*
- диктатор
Анонимность - k-большинство
11
Ограничения рациональности
• Qr – линейные порядки LO
• Qr – частичные порядки PO
• Qr – ациклические отн. AC
• Теорема
AC

C
collegium

SC
Brown (1975)
+
PO
olygarchy
ananimity
Gibbard (1969)
LO
dictator

Arrow (1951)
12
Нелокальные процедуры (пример)
качество восприятия телевизионной программы
= качество изображения + качество звука
Изображени
е
5
Звук
5
Качество
восприятия
10
3
7
10
1
9
10
Верно ли это?
13
Аксиоматический синтез процедур
• N критериев, m альтернатив
• Каждая альтернатива оценивается,
используя трехградационную шкалу
(хороший, средний, плохой – 3,2,1), т.е.
x=(x1,x2,…,xn)
• Мы строим результирующее
ранжирование альтернатив
14
Аксиомы
• Парето оптимальность
x, y  A i 1,..., n : xi  yi и i0 : xi0  yi0   ( x)   ( y)
• Парная взаимозаменяемость
x, y  A i, j 1,...n : xi  yi x j  y j и k  i, j xk  yk   ( x)   ( y)
• Некомпенсируемость
x  A  ((c,...,c))> (x), где c  {2,..., m}, x : i0 {1,..., n} xi0  c
• Снижение размерности
x, y  A i xi  yi   ( x)   ( y )   ' ( x1...xi 1 , xx 1...xn )   ' ( y1... yi 1 , y x 1... yn )
где  ' - сужение
 на подпространство (n  1)
15
Теорема о представлении
• Единственной процедурой, которая
удовлетворяет этим аксиомам,
является пороговое (lexmin) правило
т.е. вектор с большим числом единиц,
хуже (располагается в ранжировании
ниже), чем вектор с меньшим числом
единиц, иначе сравниваем количество
двоек и т.д.
16
Выбор на мажоритарном графе
1-й изб.
2-й изб.
3-й изб.
А
С
В
В
А
A
С
В
C
В
:
А
С
17
Парадокс Кондорсе
1-й изб.
2-й изб.
3-й изб.
А
С
В
В
А
C
С
В
A
В
:
А
С
18
Различные концепции решений
• Ядро (von Neumann – Morgenstern)
Множество недоминируемых элементов в

• Непокрытое множество (Miller)
• Доминирующее множество (Miller, Fishburn, Schwartz)
B
y  B
19
Различные концепции решений
• Слабоустойчивое множество (Aleskerov&Kurbanov)
x
z
y
• k-устойчивое множество (Aleskerov&Subochev)
x
y
z3
z
z1
z2
Манипулирование при голосовании
• Предпочтения участников
•
•
Группа 1
(3 чел.)
Группа 2
(2 чел.)
Группа 3
(2 чел.)
И
С
П
с
П
И
С
п
С
П
И
и
Если в качестве правила голосования используется правило
относительного большинства голосов, то кандидат И получит 3
голоса и будет избран, поскольку кандидаты П и С получат только
по два голоса. При манипулировании будет избран C 4-мя
голосами.
Исследование степени манипулируемости процедур агрегирования
21
Механизмы
• Какой должна быть процедура, чтобы
участникам было невыгодно искажать
свои мнения? (Маскин)
• Ответ: Федерации q-Паретовских
правил
22
Механизмы
s
F    (I , q I )
q - федерация
F   (I , q I )
q - олигархия
t 1 I t
I 
F   (
i , qi )
F   (
i ,0)
q - диктатор
диктатор
23
Механизмы
• Экономическая наука, в большей своей части, объясняет
и описывает существующие институты и предсказывает, к
чему приводят эти институты.
• Конструирование экономических механизмов, наоборот,
имея в виду некоторую цель, пытается построить
необходимые институты.
Пример: продажа радиочастот
- компании хотят купить лицензию
- правительство хочет продать и выручить
побольше
24
Английский аукцион
• Аукцион с правилом высшей цены
(английский аукцион) работать не будет
участники
Готовы
заплатить
Объявлен.
цена
Объявлен.
цена’
1
10
5
6
2
8
4
6
3
7
3
5
4
5
2
4
5
4
1
3
25
Аукцион второй цены (Vikri)
• Участники объявляют свои цены, выигрывает
предложивший максимальную цену, но платит он
следующую по величине цену
участник
готов заплатить
1
10
2
8
3
7
4
5
5
4
• Выгодно ли занизить цену?
26
Влияние в выборных органах
• Парламент с 99 местами. Правило принятия
решений – простое большинство, т.е. 50 голосов.
3 партии: A – 33 места, B – 33 места, C – 33 места.
Выигрывающие коалиции А+В, А+С, В+С, А+В+С.
• Распределение мест изменилось: A и B имеют по 48
голосов, C - 3 голоса. Однако, выигрывающие коалиции
те же, т.е. каждая партия равным образом влияет на
решение.
27
Индекс Банцафа
bi - число коалиций, в которых партия i ключевая,
тогда индекс Банцафа
bi
 (i) 
bj
j
28
Пример
В парламенте 100 мест, 3 партии A, B, С имеют 50, 49 и 1 место.
Правило принятия решений – простое большинство. Тогда
выигрывающие коалиции A+В, A+С, A+B+С.
Партия А является ключевой во всех трех коалициях. Тогда
3
3
 ( A) 

3 11 5
Партии B и C являются ключевыми в одной коалиции каждая, т.е.
1
1
 ( B)   (C ) 

3 11 5
29
Communists
Liberal-Democrats
Russia Regions
0
Yabloko
Agrarians
30
oct.03
may.03
feb.03
nov.02
jun.02
mar.02
dec.01
sep.01
may.01
dec.00
sep.00
may.00
jan.-feb.00
oct.99
jul.99
apr.99
jan.99
oct.98
jul.98
apr.98
jan.98
oct.97
jul.97
apr.97
jan.97
oct.96
jul.96
apr.96
jan.96
oct.95
jul.95
apr.95
jan.95
oct.94
jul.94
apr.94
jan.94
Banzhaf index
Power distribution of some parties in Russian parliament (1994-2003)
0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
А что если не все коалиции
возможны?
В предыдущем примере с тремя партиями А (50 мест), В (49 мест) и С (1
место) предположим, что партии А и В в коалицию не вступают. Тогда
2
2
 ( A) 

2 1 3
1
1
 (C ) 

2 1 3
 ( B)  0
или даже
1
1
 ( A) 

11 2
 ( B)  0
.
1
1
 (C ) 

11 2
31
Интенсивность вхождения в коалицию
pij -желаниеi -того участника войти в коалицию с j -тым
pij  p ji
Интенсивность предпочтения
коалицию 
f (i,  )  

j
i -того участника войти в
pij
 1
Интенсивность предпочтения j -тых по вхождению
f (i,  )  

j
i
-ого в 
p ji
 1
32
Интенсивность
i   f (i,  )
.

Индекс влияния (аналог индекса Банцафа)
i
 (i) 
 i
33
Индекс согласованности
cq1 , q2   1 
q1  q2
max q1 ,1  q1 , q2 ,1  q2 
C =1, если позиции групп совпадают ( q1= q 2 ), и =0,
если позиции противоположны (e.g., q1 =0
и q 2 =1).
34
1 , если , c(q1 , q2 )  0.4
pij   , в противном случае
0
Далее рассчитываем f  , (i,  ) , f  (i,  ) , f (i,  ) и  (i ) .
35
Распределение влияния крупных объединений
(КПРФ, Единство, «Народный Депутат»), сценарий
0.4
Приложения
• Многокритериальные модели (принятие
решений – много задач)
• Механизмы в прикладных задачах (аукционы,
конкурсы, распределение студентов по ВУЗам, …)
• Распределение влияния (I – IV Думы РФ, царские
Думы, МВФ, Рейхстаг 1919-1933, эффективность банков,…)
• Мультиагентные системы (управление транспортом)
• Эксперименты
37
Благодарю за внимание
38
Download