МАТЕМАТИКА ВЫБОРОВ Гасников А.В., доцент кафедры МОУ ФУПМ МФТИ Черноусова Е.О., аспирант кафедры ИС ВЦ РАН 2 ПЛАН ВЫСТУПЛЕНИЯ 1. Этап предвыборной кампании, влияние СМИ на общественное мнение 2. Опросы общественного мнения 3. Возможные особенности результатов голосования 3 ЧЕСТНАЯ ЖЕРЕБЬЕВКА Пусть в некоторой телевизионной программе (согласно предвыборной кампании) n партиям разрешается в течение фиксированного времени выступить с агитационной речью. Выбор того, в каком порядке будут выступать представители n партий, решается жеребьевкой. Предложите процедуру честной жеребьевки. 4 НЕДОВЕРЧИВЫЕ ИГРОКИ Два игрока (А и В) хотят сыграть в орлянку. У каждого их них есть монета. Но они не доверяют друг, подозревая, что у соперника несимметричная монета. Как быть? Решение: Кинуть обе монеты сразу: если обе монеты выпали орлом или обе решкой, то выиграл игрок А, если по-разному – то игрок В. Если обе монеты независимы и хотя бы одна из них симметрична, то вероятность выигрыша в такой игре равна ½. Пусть игрок А знает, что его монета симметрична ( p A 1 2 ), но не знает pB . Тогда вероятность выигрыша для игрока А равна p A pB (1 p A )(1 pB ) 1 pB 1 (1 pB ) 1 2 2 2 ЧЕСТНАЯ ЖЕРЕБЬЕВКА 5 Перестановкой на n элементах называется биекция множества 1, 2,..., n на себя: n i1, i2 ,..., in n ( j ) i j . Число различных перестановок равно n! Случайная перестановка. Вероятность реализации конкретной перестановки равна 1/n! (равномерная мера на множестве всех перестановок длины n). Пусть есть некоторый набор перестановок 1n , n2 ,..., nk . Известно, что хотя бы одна их них случайная. Тогда перестановка, получающаяся в результате последовательного перемножения каждой из них (не важно, в каком порядке), будет случайной. ЧЕСТНАЯ ЖЕРЕБЬЕВКА 6 Решение: Представитель каждой партии приносит на телевизионную программу некоторую перестановку; эти конверты одновременно вскрываются в присутствии всех участников и затем последовательно (скажем, в алфавитном порядке названий партий) выполняются указанные в них перестановки. Процедура гарантирует, что если хотя бы одна из партий соблюдает правила (ее перестановка случайна), то результат жеребьевки будет честным. КАЖДЫЙ ПО ОТДЕЛЬНОСТИ – ПРОТИВ, А ВСЕ ВМЕСТЕ – ЗА (ИЛИ НАОБОРОТ) 7 Осторожная привычка людей(избирателей) вести себя «как все». Предлагается для обсуждения простая версия подобного механизма. Считается, что индивидуум (i), принимая решение, руководствуется: 1) личным (априорным) отношением к данному вопросу - ai ; 2) отношением к этому вопросу окружающих его субъектов (коллектива). Финальное, апостериорное отношение, сформировавшееся после общения с коллективом, определяется числом pi зависит от пп. 1, 2. i - мера независимости индивидуума - вероятность, что в конкретной ситуации индивидуум ведет себя как независимый. 8 Будем считать, что влияние каждого j-го члена коллектива на данного i-го индивидуума не зависит от влияния любого другого из остальных членов и определяется числом ij - вероятность, что i-ый поступит также как j-ый. ii 0 По формуле полной вероятности: N pi aii (1 i ) ij p j j 1 Или в матричной форме: p a I N p ТЕОРЕМА Решение p всегда существует, неотрицательно и каждое pi не превосходит единицу. Решение p единственно, если не все i 0 9 СТАДО БЕЗ ВОЖАКА Все i 0 (т.е. все индивидуумы абсолютно зависимы) I N p 0 Так как det I N 0 , решение существует и неединственное. Несмотря на неопределенность состояния коллектива, индивидуумы ведут себя как единое целое: все pi равны между собой, т.е. индивидуумы подражают друг другу. Коллектив легко выводится из такого «безразличного» состояния любым провоцирующим действием (малым возмущением одного их параметров i ). Пусть j 0 , тогда по теореме решение системы p a I N p единственно: у всех индивидуумов pi a j (т.е. поведение jго индивидуума копируют все). Дурная овца все стадо портит (русская поговорка) 10 ТОК-ШОУ N Пусть pi aii (1 i ) 1 ij N 1 j 1 N 1 ij N 1 p j 1 j p j , i 1,..., N . - математическое ожидание доли индивидуумов – зрителей в студии - (помимо i-го), перешедших в данное состояние. Решение такой системы (при больших значениях N ): N 1 i pi aii N N i a j 1 N j 1 N j N j , j M N a j 1 N j j 1 j j M p j - математическое ожидание числа индивидуумов, перешедших в j 1 данное состояние. 11 ТОК-ШОУ Пусть выступают два оппонента: у первого - a1 1, 1 0 ; у второго a2 0, 2 0 . У зрителей в студии все i 0 , а разброс мнений достаточно широк, т.е. ai разные. В результате зрители разделится на две части (в независимости от своих априорных убеждений) в отношении 1 : 2 . 12 МОДЕЛЬ ВЛИЯНИЯ ТЕЛЕВИЗОРА НА МНЕНИЕ ЛЮДЕЙ Элементарная общественная ячейка (коллектив взаимных влияний) - семья N 1 ij j 0 N Модель: pi aii (1 i ) pj Параметры: телевизор: 0 p0 a0 1 остальные члены семьи: pi p, i , ai a p a 1 1 N 1 p N M Na 1 N 1 N 1 M 4a 1 при N 4 получаем p 4 1 3 Решение: p 13 МОДЕЛЬ ВЛИЯНИЯ ТЕЛЕВИЗОРА НА МНЕНИЕ ЛЮДЕЙ Пусть было три этапа предвыборной кампании. 1 2 1) Положим , p (0) 0 , a (0) 0 , тогда p (1) 0.2 ; 2) Положим a (1) p (1) , тогда p (2) 0.36 ; 3) Положим a (2) p (2) , тогда p (3) 0.48; 14 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL Пусть в некоторой области прошел второй тур выборов. Выбор был между двумя кандидатами (А и В). Сколько человек надо опросить на выходе с избирательных участков, чтобы определить процент проголосовавших за кандидата А с точностью 1% и с (доверительной) вероятностью не менее 0.95. Решение: Пусть число жителей города, участвующих в голосовании, равно N. Из них M человек проголосовало за кандидата А. Обозначим за n – общее число опрошенных человек (в ходе exit-polla), среди них m – число отдавших свой голос за кандидата А. m M P 0.01 1 0.95 n N 15 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL При фиксированном n случайная величина m (число отдавших свой голос за кандидата А среди опрошенных) имеет CMm CNnmM гипергеометрическое распределение . CNn Формула Стирлинга: N ! 2N Ne1 1 o( N ) N Если n o Nn N , то C . n! n N Тогда гипергеометрическое распределение G M , N , n аппроксимируется m nm M M CM CN M mM биномиальным Bi , n C 1 n n N N CN N m nm . 16 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL Граница Чебышева: P E n X i DX i 1 P p 2 n n M M 1 m M N N P 0.01 2 n 0.01 n N 0.25 n 0.01 2 1 0.95 n 50000 D 2 0.25 n 0.01 2 17 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL Граница Чернова: n P X i ( p )n exp 2 2 n i 1 n X i i 1 P p 2exp 2 2 n n m M 2 P 0.01 2exp 2 0.01 n n N 2exp 2 0.01 n 1 0.95 n 10000 2 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL Центральная предельная теорема n X np x t2 i 1 2 P i 1 2 () 1, ( x) e dt npq 2 M mn n n N P 0.01 2 0.01 1 M M M M n M 1 M 1 1 N N N N N N n X i np n i 1 P 2(1 ()) 1.96 0.01 1.96 n 9600 npq M M 1 N N 18 19 СОЦИОЛОГИЧЕСКИЙ ОПРОС ИЛИ EXIT POLL Заметим, что результат задачи не зависит от общего числа избирателей, кроме как от условия n o N . Если хотим сделать более грубую оценку доли проголосовавших за кандидата А, например, с точностью всего 5%, то достаточно опросить всего ~390 человек!!! n M N M 1 N 0.05 1.96 n 390 Но возникает вопрос репрезентативности выборки из опрошенных избирателей. 20 АНАЛИЗ СТАТИСТИЧЕСКИХ РЕЗУЛЬТАТОВ И СПЕЦИФИКА, В Т.Ч. НЕОДНОРОДНОСТЬ, ДАННЫХ Для условного соответствия тенденциям в электоральном поведении населения можно выделить: А) «городские» участки; Б) «сельские» участки; В) «особые» участки (больницы, тюрьмы, дома престарелых, военные городки); 21 ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА n - последовательность независимых одинаково распределенных с.в. Dk 2 0 n k E k d 2 1 n N (0,1) k N E k , n n k 1 n Рассмотрим n , n , где n : Be(0.35) , n : Be(0.5) k 1 d 120 100 50 90 45 80 40 70 35 80 60 30 50 60 25 40 20 40 30 15 20 10 20 10 5 0 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 22 ПОЯВЛЕНИЕ «ПИКОВ» ПРИ МАЛЫХ РАЗМЕРАХ ИЗБИРАТЕЛЬНОГО УЧАСТКА Повторяемость определенных долей явки/голосов избирателей: 180 160 140 120 100 80 60 40 20 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 23 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 1. П.С.Краснощеков, А.А.Петров «Принципы построения моделей» Изд. 2-е – М.: ФАЗИС: ВЦ РАН 2000. 2. А.Шень «Вероятность: примеры и задачи» - М.: МЦНМО, 2007 3. Материалы из «Живого журнала» 24 СПАСИБО ЗА ВНИМАНИЕ! 25 numb_s_uik=10000; size_s_uik=unidrnd(500, numb_s_uik, 1); javka_temp=unifrnd(0.6, 0.9, numb_s_uik, 1); javka_s_uik=binornd(size_s_uik, javka_temp); itog_javka=javka_s_uik./size_s_uik; golos_temp=unifrnd(0.6, 0.9, numb_s_uik, 1); golos_s_uik=binornd(javka_s_uik, golos_temp); I_s=hygernd(size_s_uik,golos_s_uik,javka_s_uik); hist(I_s./javka_s_uik,1000)