Лекция 2. Мажоризация (в формате MS-Word 98

advertisement
1
11.09.07
Мажоризация
Кривая Лоренца
Макс Ото Лоренц (Lorenz M.O., 1876–1959)
 Социальная справедливость
 ТВ
 Контрпример
 Кривая Лоренца (1905)
Принцип Пигу–Дальтона
Дальтон Эдвард Хью Джон Нил, барон (Dalton H., 1887–1962)
 Перераспределение доходов (Пигу 1912, Дальтон 1920)
 Трансформации
Лемма. Если yi<yj и yj–yi, то существует 01, такое, что yi+=(1-)yj+yj,
yj–=yi+(1–)yj.

Доказательство.  
.
y j  yi
Мажоризация
Определение. Бинарное отношение
называется отношением предпорядка, если
выполняются свойства
1. a a (рефлексивность);
2. если a b и b c, то a c (транзитивность).
Определение. Бинарное отношение
называется отношением порядка, если
выполняются свойства
1. a a (рефлексивность);
2. если a b и b c, то a c (транзитивность);
3. если a b и b a, то a=b (антисимметричность).
Пусть x=(x1,…,xn) – вектор. Обозначим x=(x(1),…,x(n)) вектор, компоненты которого
x(1)…x(n) есть компоненты вектора x, упорядоченные по возрастанию. Аналогично
обозначим x=(x[1],…,x[n]) вектор, компоненты которого x(1)≥…≥x(n) есть компоненты
вектора x, упорядоченные по убыванию.
Определение. Вектор x мажорирует вектор y, если
k
x
i 1
(i )
k
  y( i ) , k=1,…,n–1;
i 1
n
n
i 1
i 1
 x(i )   y(i ) .
На протяжении всей лекции запись y x обозначает, что вектор x мажорирует
вектор y.
 Предпорядок на всем пространстве и порядок на конусе
Лемма. Отношение мажорирования является предпорядком.
1  1
1
1

1 1

,...,
, 0  ...  , , 0,..., 0  1, 0,..., 0  .
Пример.  ,...,  
n   n 1
n 1 
n
2 2




l
 
l
Пример. Если m≥l и c≥0, то  c,..., c , 0,..., 0   c,..., c , 0,..., 0  .


m
m
  l раз

m раз


147345525 01.20.2016
2
1
1
 1 , то  ,...,   a1 ,..., an  1, 0,..., 0  .
n
n
i 1
1
1
( x1  c,..., xn  c)
( x1 ,..., xn ) .
Пример. Если c≥0, то n
n
 xi  nc
 xi
Пример. Если ai≥0 и
n
a
i
i 1
i 1
Эквивалентность двух подходов
Определение. Трансформацией называется линейное преобразование с матрицей T
вида T=E+(1–)Q, где 01, E – единичная матрица, а матрица Q получается из
единичной перестановкой одной пары строк.
Лемма Мюрхеда (1903, 1934). Если x y, то вектор x можно получить из вектора y
с помощью не более чем n–1 трансформаций.
Доказательство. Не ограничивая общности, можем считать, что x1≥…≥xn, y1≥…≥yn
и xy.
 Гистограмма
Тогда в силу последнего условия определения мажоризации найдется такой номер
l, что yl>xl. Пусть i – наибольший из таких номеров.
Тогда найдется номер m>i, для которого ym<xm. В противном случае
n
x  y
p i
i 1
i 1
p 1
p 1
n
p
p i
p
и
 x p   y p , что противоречит условию x y. Пусть j – наименьший из таких номеров.
Выберем =min{yi–xi,xj–yj} и положим zi=yi–, zj=xj+, zk=yk для всех ki,j. В силу
выбора величины  компоненты вектора z упорядочены в невозрастающем порядке. По
той же причине вектор z мажорирует x.
Остается провести индукцию по числу несовпадающих компонент у векторов.
Усреднения
Харди Годфри Харолд (Hardy G.H.,1877–1947)
Литлвуд Джон Идензор (Littlewood J.E.., 1885–1977)
Пойа Дьердь (Polya G., 1887–1985)
Определение. Квадратная матрица P=(pij) порядка n называется дважды
стохастической, если pij≥0 для всех i и j,
n
p
ij
i 1
 1 для всех j и
n
p
j 1
ij
 1 для всех i.
Теорема. Квадратная матрица P является дважды стохастической тогда и только
тогда, когда yP y для всех векторов y.
Доказательство. Докажем сначала достаточность. Пусть e – вектор, все
компоненты которого равны 1. Из условия eP e следует равенство eP=e, значит, суммы
элементов по столбцам равны 1. Взяв вектор ei=(0,…,0,1,0,…0), из условия eiP ei
получим что сумма элементов в i-ой строке равна 1, а наименьший элемент
неотрицателен.
Докажем необходимость. Пусть x=yP. Не ограничивая общности, можем считать,
что компоненты обоих векторов упорядочены в невозрастающем порядке. Имеем
k
k
n
j 1
j 1 i 1
n
 x j   yi pij   yiti ,
i 1
где
k
0  ti   pij  ti  1 и
j 1
147345525 01.20.2016
n
t
i 1
i
k.
3
Следовательно,
k
n
k
n
k
n


x

y

y
t

y

y
t

y

y
k

ti  







j
j
i i
j
i i
j
k 
j 1
j 1
i 1
j 1
i 1
j 1
i 1


k
k
  ( yi  yk )(ti  1) 
i 1
n
 t ( y  y )  0.
i  k 1
i
i
k
Равенство проверяется просто.
Теорема. Условие x y выполняется тогда и только тогда, когда существует
дважды стохастическая матрица P, для которой x=yP.
Доказательство. Необходимость следует из леммы Мюрхеда и того факта, что
произведение двух дважды стохастических матриц снова дважды стохастическая матрица.
Докажем достаточность. Так как свойство дважды стохастичности не меняется при
перестановке строк и столбцов, можем считать, что x1≥…≥xn, y1≥…≥yn. Тогда имеем
 k

 k

x1  ...  xk    pi1  y1  ...    pik  yk 
 i 1 
 i 1

k
k
 k

 k



   pi1  y1  ...    pik 1  yk 1   k   pi1  ...   pik 1  yk 
i 1
i 1
 i 1 
 i 1



k
k




   pi1  ( y1  yk )  ...    pik 1  ( yk 1  yk )  kyk 
 i 1 
 i 1

 ( y1  yk )  ...  ( yk 1  yk )  kyk  y1  ...  yk .
Равенство при k=n устанавливается даже проще.
Следствие. Если вектор x получается из вектора y с помощью трансформации, то
x y.
Индексы неравенства
Шур Исай (Schur I., 1875–1941)
Определение. Функция f называется выпуклой по Шуру, если f(x)f(y) для всех
x y.
Теорема. Пусть I – открытый интервал действительной прямой, и пусть функция
f :I 
дифференцируема. Для того, чтобы функция f была выпуклой по Шуру
необходимо и достаточно, чтобы выполнялись условия
1. функция f симметрическая на In;
 f f 

 0 для всех z из In.
2.  zi  z j  
 z z 
j 
 i
Следствие. Если функция g выпукла на интервале I действительной прямой, то
n
n
функция f ( x1 ,..., xn )   g ( xi ) выпукла по Шуру на In.
i 1
Свойства выпуклости по Шуру
Лемма. Если функция f выпукла по Шуру и c>0, то функция cf выпукла по Шуру.
Лемма. Если функции f и g выпуклы по Шуру, то и функция f+g выпукла по Шуру.
Лемма. Если функция f : 
не убывает, ф функция g выпукла по Шуру, то
функция f g выпукла по Шуру.
Лемма. Если функции f1,…,fk выпуклы по Шуру, то и функции min f i и max f i
1 i  k
выпуклы по Шуру.
147345525 01.20.2016
1 i  k
4
Лемма. Если функции f1,…,fk выпуклы по Шуру и неотрицательны, то функция
k
f
i 1
i
выпукла по Шуру.
Лемма. Если функция f выпукла по Шуру, то для любого t функция
1, если f ( x)  t ,
выпукла по Шуру.
gt ( x)  
 0, если f ( x)  t
Пример. Пусть x 
1 n
1 n
x
.Дисперсия
i
 ( xi  x)2
n i 1
n i 1
и коэффициент вариации
1 n
 ( xi  x)2
n i 1
являются выпуклыми по Шуру.
x
Использовавшиеся
n

log xi


1 n
i 1

 log xi  n
n i 1 


экономистами
1 n
(log xi  log x)2

n i 1
функции
и
2


 выпуклыми по Шуру не являются.



n
Пример. Сумма квадратов
n
x
i 1
2
i
и функция Симпсона
 x ( x  1)
i 1
1
i
 n

x

i   xi  1 
i 1
 i 1

n
выпуклы по
Шуру.
n
Пример. Энтропия  xi log xi вогнута по Шуру.
i 1
1 n n
 xi  x j выпукла по Шуру.
2n2 x i 1 j 1
 Геометрическая интерпретация.
Пример (Минимальное большинство). Если x определяет кривую Лоренца,
задаваемую функцией h, то функция h–1(0.5) выпукла по Шуру
Пример (-уровень). В тех же обозначениях h() выпукла по Шуру.
Пример. Коэффициент Джини
Пример (Мера бедности по Фишлоу).
n
 max l  x , 0
i 1
i
выпукла по Шуру при
любом уровне бедности l.
Пример. Коэффициент Шутца
 xi  x 
 выпуклый по Шуру.
x 
xi  x 

Пример. Пусть x    xi , x    xi . Тогда
xi  x
xi  x
x x x
выпуклы по Шуру.
, ,
x x x
n
Пример. Мера по Дальтону
147345525 01.20.2016
U ( x )
i 1
i
nU ( x )
вогнута по Шуру, если U вогнута.
5
Пример. Мера по Аткинсону 1 
1
n
x  U ( xi )
.
i 1
Неравенство Мюрхеда
Мюрхед Роберт Франклин (Muirhead R.F.,1860–1941)
Пусть a и x – два n-мерных вектора. Обозначим Oa ( x) 
1
xia11  ...  xiann , где

n!
суммирование ведется по всем перестановкам (i1,…in) чисел (1,…,n).
Теорема. Если a и b – векторы с неотрицательными компонентами и a b, то для
любого вектора x с неотрицательными компонентами Oa(x) Ob(x).
Доказательство. В силу леммы Мюрхеда теорему достаточно доказать для случая,
когда векторы a и b отличаются только в двух компонентах. Не ограничивая общности,
можем считать, что это первая и вторая компоненты. Тогда
1
1
Ob ( x)  Oa ( x)   xib11 xib22 xib33 ...xibnn  xia11 xia22 xia33 ...xiann   xib11 xib22 xib33 ...xibnn  xia11 xia22 xib33 ...xibnn 
n!
n!
1
1
  xib11 xib22  xia11 xia22 xib33 ...xibnn 
xib11 xib22  xia11 xia22  xib21 xib12  xia21 xia1 2 xib33 ...xibnn .

n!
2n !
b1 b2
Достаточно доказать, что xi1 xi2  xia11 xia22  xib21 xib12  xia21 xia1 2  0 . По условию найдутся








числа c,p,q такие, что b1=c+p, b2=c–p, a1=c+q, a2=c–q, причем p  q . Не ограничивая
общности можем считать, что p и q неотрицательны. Тогда
xib11 xib22  xia11 xia22  xib21 xib12  xia21 xia1 2  ( xi1 xi2 )c  p  x i2 p  xi22 p  xi1p  q xi2p  q  xi1p  q xi2p  q  
 1

c p
pq
pq
p q
p q
 ( xi1 xi2 ) ( xi1  xi2 )( xi1  xi2 )  0.
Теорема. Если a и b – векторы с неотрицательными компонентами и неравенство
Oa(x)Ob(x) выполняется для любого вектора x с неотрицательными компонентами, то
a b.
Доказательство. Достаточно рассмотреть случай, когда компоненты векторов a и
b упорядочены в невозрастающем порядке, и положить x1=…xk=x, xk+1=…=xn=1 и
устремить x к бесконечности.
Неравенство Карамата
Лемма о трех хордах. Если f – выпуклая функция, то для любых z<y<z
f ( y )  f ( z ) f ( x)  f ( z ) f ( x)  f ( y )
выполняется неравенство
.


yz
xz
x y
Доказательство. Оба неравенства элементарными преобразованиями приводятся к
виду
(x–z)f(y)(x–y)f(z)+(y–z)f(x).
Последнее
неравенство
в
свою
очередь
эквивалентно
неравенству
yz
f(x+(1–)z)(x)+(1–)f(z) при  
.
xz
Следствие. Если f – выпуклая функция, то для любых x1≥x2, y1≥y2, x1y1, x2y2
f ( x1 )  f ( y1 ) f ( x2 )  f ( y2 )

выполняется неравенство
.
x1  y1
x2  y2
147345525 01.20.2016
6
k
Лемма (преобразование Абеля). Пусть Ak   ai . Тогда имеет место тождество
i 1
n 1
n
 a b   A (b
k 1
k k
k 1
k
k
 bk 1 )  Anbn .
Доказательство.
a1b1  a2b2  ...  an 1bn 1  anbn  A1b1  ( A2  A1 )b2  ...  ( An 1  An 2 )bn 1  ( An  An 1 )bn 
 A1 (b1  b2 )  A2 (b2  b3 )  ...  An 1 (bn 1  bn )  Anbn .
Теорема. Если f – выпуклая функция и x y, то
n

i 1
n
f ( xi )   f ( yi ) .
i 1
Доказательство. Не ограничивая общности, можем считать, что числа xi и yi
упорядочены в невозрастающем порядке и xkyk.
k
k
f ( yk )  f ( xk )
Положим Dk 
, X k   xi , Yk   yi .
yk  xk
i 1
i 1
По условию Yk≥Xk, Xn=Yn. В силу следствия леммы о трех хордах Dk≥Dk+1.
Следовательно,
n 1
 (Y
k 1
k
 X k )( Dk  Dk 1 )  ( X n  Yn ) Dn  0 .
Применяя преобразование Абеля, получим
n
(y
k 1
k
 xk ) Dk  0 , что и требовалось
доказать.

Необходимость этого условия
Примеры
Пример (Неравенство Иенсена). Если f – выпуклая функция, то имеет место
n
 n 
f ( xi )

  xi 
i 1
неравенство
 f  i 1  .
n
 n 




1
1
1
1
1
1




 .
Пример.
a  b b  c c  a 2a 2b 2c
n
n
1
Пример.  ai    n2 .
i 1
i 1 ai
Пример (Неравенство Швейцера, 1914). Если 0makM для всех k=1,…,n, то
2
n
n
1
2 (m  M )
.
a


n

i 
4mM
i 1
i 1 ai
Найдутся единственное число [m,M) и единственное целое число l, для
n
которых  ai  (n  l  1)m    lM .
i 1
 картинка
Тогда вектор (M ,..., M ,  , m,..., m) мажорирует вектор (a1,…,an).
l
n l 1
 Двойственность
Следовательно, достаточно доказать неравенство
 l
1 n  l  1  (m  M ) 2
(lM    (n  l  1)m)   
.

m 
4mM
M 
147345525 01.20.2016
7
Левая часть как функция  выпукла, поэтому достигает максимума на конце
отрезка [m,M]. Значит достаточно доказать неравенство
2
 k n  k  (m  M )
.
(kM  (n  k )m)  


m 
4mM
M
Слева стоит квадратный трехчлен с отрицательным старшим коэффициентом. В
силу симметрии его максимум достигается при k=n/2.
Пример (Неравенство Сегё). Если f – выпуклая функция и a1≥a2≥…≥a2n–1≥0, то
f(a1)–f(a2)+f(a3)–…+f(a2n–1)≥f(a1–a2+a3–…+a2n–1).
Вектор (a1,a3,…,a2n–1) мажорирует вектор (a2,a2,…,a2n–2,a), где a= a1–a2+a3–…+a2n–1.
В самом деле, возможны два случая:
 найдется номер l, для которого a2l–1≥a2l≥a≥a2l+1;
 найдется номер l, для которого a2l–1≥ a≥a2l≥ a2l+1
В обоих случаях утверждение проверяется попарным сравнением.
Остается применить неравенство Караматы.


Геометрическая интерпретация мажорирования
Вывод теоремы Биркгофа из теоремы Радо (Маршалл, Олкин стр. 31).
Задачи
1. Докажите, что если x y и компоненты вектора y расположены в невозрастающем
порядке, то найдутся числа c1,…,cn–1 такие, что y1≥c1≥y2≥…≥cn–1≥yn и x c.
2. Докажите, что если x y и 01, то x+(1–)y x+(1–)y.
3. Пусть функция h : k  не убывает по каждому из своих аргументов, а функции
gi : n 
(i=1,…,k) выпуклы по Шуру. Докажите, что функция
f ( x1 ,..., xn )  h( g1 ( x1 ,..., xn ),..., gk ( x1 ,..., xn )) выпукла по Шуру.
4. Пусть функция h : n  не убывает по каждому из своих аргументов и выпукла
по Шуру, а функции gi : 
(i=1,…,k) выпуклы. Докажите, что функция
f ( x1 ,..., xn )  h( g1 ( x1 ),..., g k ( xn )) выпукла по Шуру.
5. Пусть функция h : n 
не возрастает по каждому из своих аргументов и
выпукла по Шуру, а функции gi : 
(i=1,…,k) вогнуты. Докажите, что
функция f ( x1 ,..., xn )  h( g1 ( x1 ),..., g k ( xn )) выпукла по Шуру.
Литература
1. Маршалл А., Олкин И. Неравенства: теория мажоризации и ее приложения.М.:
Мир, 1983.
2. Харди Г.Г., Литлвуд Д.Е., Полиа Г. Неравенства. М.: КомКнига, 2006.
3. Мулен Э. Кооперативное принятие решений: Аксиомы и модели. М.: Мир.1991.
4. Храбров А.И. Элементарное введение в теорию мажоризации // Петербургские
олимпиады школьников по математике 2000–2002. СПб.: Невский Диалект. 2006.
147345525 01.20.2016
Download