МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ Эконометрический анализ

advertisement
Эконометрический анализ факторов,
влияющих на уровень счастья россиян
Ткаченко Андрей
Email:tkachenko.av.87@gmail.com
Национальный Исследовательский
Университет Высшая Школа Экономики
Введение
1) Актуальность проблемы в России и других странах.
2) Проблемы при оценке счастья:
• Субъективность оценки
• Не поддается измерениям
• Сильная изменчивость за короткий промежуток времени
• Зависимость от других скрытых неизмеряемых факторов
Цель работы: наиболее точное объяснение показателя уровня счастья
через иные внешние факторы, поддающиеся оценке.
Структура работы
•
•
•
•
•
•
•
Введение
Обзор литературы
Описание данных и переменных
Предварительный анализ факторов
Системы уравнений, объясняющие уровень счастья
Упорядоченные модели множественного выбора
Порядковые модели, описывающие уровень счастья в разрезе
финансового положения
• Заключение
Обзор литературы
Иностранные публикации:
• Истерлин Ричард. 1970 - средний уровень счастья не сильно меняется в
зависимости от среднего дохода на душу населения, по крайней мере для тех
стран, где уровень дохода позволяет человеку обеспечить себя самым
необходимым.
• Винховен и Хагерти 2003 - пришли к выводу, что парадокса Истерлина нет
• Стивенсон и Волферс 2008 - показана взаимосвязь между счастьем и
логарифмом дохода
• Истерлин Р. 2010 – подтверждает результаты работы за 1970 г.
Отечественные работы
• Л.Б. Косовой 1993 - отсутствие материального благополучия определяет
недовольство жизнью сильнее, чем что-либо другое, но не является
достаточным основанием ощущения удовлетворенности. При материальном
благополучии удовлетворенность жизнью определяется социальными
факторами: положением в обществе, отношением в семье, кругом общения
• Гуриев и Журавская - во всех странах c развитой экономикой уровень счастья
с возрастом сначала падает – до 38-40 лет – после чего начинает расти. А вот в
переходных экономиках и, в частности в России, уровень счастья монотонно
падает с возрастом.
Данные и переменные
В данной работе в качестве входных данных была выбраны базы данных РМЭЗ - Российского
мониторинга экономического положения и здоровья населения за 2008 г.
Объясняемая переменная. Одним из пунктов этого опросника является следующий: «Насколько
Вы удовлетворены своей жизнью в целом в настоящее время?», где респондент выбирал
один из пяти возможных вариантов: 1 - Полностью удовлетворен, 2 - Скорее удовлетворен, 3 И да, и нет, 4 - Не очень удовлетворен, 5 - Совсем не удовлетворен. Эту переменную мы и
выбираем в качестве объясняемой.
Объясняющие переменные. В модели были включены переменные, характеризующие:
• гендерную принадлежность и возраст
• финансовую удовлетворенность респондента
• наличие работы и её показатели
• обеспокоенность не обеспечить себя самым необходимым или потерять работу (при её
наличии)
• факторы, описывающие уровень образования респондента, такие как: количество лет
образования, наличие школьного аттестата и ВУЗ-овского диплома
• факторы семейного положения: наличие супруга, наличие и количество детей, время,
проводимое с семьей
• самооценку показателя здоровья, измеряемую от очень хорошей (значение соответствующей
переменной равно 1) до очень плохой (значение соответствующей переменной равно 5)
• тип населенного пункта, в котором проживает респондент, и другие региональные признаки:
валовый региональный продукт, средний доход по региону, стоимость потребительской
корзины, уровень безработицы и т.д.
Выборки
Невозможно использовать полный объем данных (14028 наблюдений) по
причинам:
• по некоторым вопросам не было ответов, либо ответы были неадекватны
• в базе в том числе содержатся данные по людям, возраст которых не
превышает 5-и лет
Выделены две выборки:
• В первую выборку вошли все респонденты, возраст которых более 14 лет,
имеющие ненулевое количество лет школьного образования. При таких
ограничениях получили выборку объемом 11314 наблюдений.
• Вторая выборка обладает теми же ограничениями, что и первая с
добавлением дополнительного условия, что респондент имеет работу и
поэтому в выборку включаются переменные, описывающие некоторые её
характеристики, такие как: удовлетворенность работой, доход,
обеспокоенность потерять её. В эту выборку попало 5788 наблюдений.
Вторая выборка является подмножеством первой.
Необходимость использования двух выборок заключается в том, что в первую из
них попали те респонденты, которые могли не иметь работы и, соответственно,
удовлетворенность работой, заработная плата и другие факторы, связанные с
работой, для таких респондентов были пропущены. Однако, при оценке
удовлетворенности жизнью, такие люди также представляют интерес.
Предварительный анализ
Ранговая корреляция Спирмена факторов:
• удовлетворенность фин. положением (1 – полностью удовл., 5 – полностью не удовл.)
• оценка здоровья (1 – очень хорошее, 5 – очень плохое),
• обеспокоенность не обеспечить себя необходимы (1 – максимальная, 5 – минимальная)
life_satisf
-------------+----------life_satisf |
1.0000
fin_satisf |
0.5325*
health_estim |
0.2818*
nerv_nes | -0.2976*
status
age
gender
educ
diploma
sch_certif
marit1
marit2
marit3
child_num
have_child
life_satisf
-----------|
0.0496*
|
0.1898*
| -0.0586*
| -0.1327*
| -0.0888*
| -0.0520*
| -0.0765*
| -0.0663*
|
0.1549*
|
0.0783*
|
0.0821*
home_time
care_time
empl
unempl
potr_bas
have_job
job_satisf
nerv_job
inc_bas
exper
life_satisf
----------|
0.0133
| -0.0720*
| -0.0331*
|
0.0611*
| -0.0114
| -0.1409*
|
0.3375*
| -0.1102*
| -0.2078*
|
0.0171
В целом, все указанные факторы могут рассматриваться как регрессоры, объясняющие
уровень счастья. Наиболее весомый вклад, который мы будем рассчитывать как
предельный эффект каждой переменной для всех категорий life_satisf, могут оказать
финансовая удовлетворенность и оценка здоровья.
Системы уравнений
Поскольку факторы финансовой удовлетворенности и обеспокоенности не обеспечить
себя необходимым, которые мы хотим использовать в качестве регрессоров моделей,
в свою очередь сами могут быть зависимы от других переменных, то их
использование может привести к смещенным оценкам. Поэтому рассматривается
система уравнений для бинарных переменных:
• ls (удовлетворенность жизнью),
• fs (удовлетворенность финансовым положением) ,
• nn (обеспокоенность не обеспечить себя самым необходимым).
Общий вид системы
Y1=1, если Y1*>0 и 0 в противном случае.
Y2=1, если Y2*>0 и 0 в противном случае.
Здесь Y1* ,Y2* - латентные переменные, X1, X2 – матрицы регрессоров, α, β1, β2, ρ –
оцениваемые параметры, где ρ – коэффициент корреляции ошибок ε1 и ε2, таких что
(ε1, ε2) ~ N(0,0,1,1, ρ).
Результаты оценивания системы уравнений (ls и fs)
samp1==1
---------------------------------------------Variable |
m1
m2
-------------+-------------------------------ls
|
age | .06139912***
.04106097***
age2 | -.00062059***
-.00038026***
gender | -.03517062
-.02504953
educ | -.03300758***
-.02901426***
have_job | -.33331784***
-.22341335***
marit2 | -.22902763***
-.2050772***
have_child | -.04450669
-.08140641*
he1 | -.23211479***
-.26202643***
he3 | .33643978***
.37844161***
fs |
1.2510631***
_cons | -.94909213***
-1.5358667***
-------------+-------------------------------fs
|
age | .06219331***
.0617335***
age2 | -.00069082***
-.00068278***
gender | -.04090582
-.04069078
educ | -.01889817***
-.0177001***
have_job | -.3574336***
-.34470389***
marit2 | -.12845249***
-.13272225***
have_child | .05129198
.05281184
inc_reg | 1.624e-06
-4.362e-06
st1 | -.01744355
-.03760513
_cons | -.46826778***
-.39567517***
-------------+-------------------------------atrho21
|
_cons | .67409154***
-.00262584
----------------------------------------------
samp2==1
---------------------------------------------Variable |
m3
m4
-------------+-------------------------------ls
|
age | .04554688***
.02310417**
age2 | -.00047854***
-.00019459
gender | -.11221403***
-.09393761**
educ | -.05573502***
-.03902588***
marit2 | -.25180456***
-.18255061***
have_child |
.0184991
-.04098474
he1 | -.28961739***
-.24783549***
he3 | .26674676***
.19793824**
fs |
1.63775***
_cons | -.59378379***
-1.4516845***
-------------+-------------------------------fs
|
age | .05825374***
.05912113***
age2 | -.00068929***
-.00069816***
gender | .09930812***
.11961537***
educ | -.0106272
-.00181577
marit2 | -.1567593***
-.15391289***
have_child | .11691572**
.12839543**
inc_bas | -.00002854***
-.00003372***
nj1 | .17216268***
.2090194***
nj3 |
-.001805
-.00132366
js1 | -.30596367***
-.36960888***
js3 | .23528916***
.42943928***
_cons | -.38451303*
-.49167819**
-------------+-------------------------------atrho21
|
_cons | .52467197***
-.32048594***
----------------------------------------------
Результаты оценивания системы уравнений (ls и nn)
samp1==1
---------------------------------------------Variable |
m1
m2
-------------+-------------------------------ls
|
age | .06204588***
.05823727***
age2 | -.00064012***
-.00059967***
gender | -.02745813
-.00835353
educ | -.03223097***
-.03010775***
have_job | -.32731205***
-.3276593***
marit2 | -.23433046***
-.24651838***
have_child | -.04994455
-.06779472*
he1 | -.30141703***
-.30643378***
he3 | .42701681***
.43015798***
nn |
-.44611314***
_cons | -.93473632***
-.7927005***
-------------+-------------------------------nn
|
age | -.03864497***
-.03828824***
age2 | .00039661***
.00039028***
gender | .18044354***
.17993449***
educ | .01280427***
.01223835***
have_job | .02971831
.02175651
marit2 | -.04591911
-.04596797
have_child | -.12667622***
-.12556056***
inc_reg | .00001463***
.00001707***
st1 | .24178972***
.24731988***
_cons | -.49523101***
-.52236999***
-------------+-------------------------------atrho21
|
_cons | -.25991463***
-.04791858
----------------------------------------------
samp2==1
---------------------------------------------Variable |
m3
m4
-------------+-------------------------------ls
|
age | .04505189***
.03572444***
age2 | -.00048158***
-.00036823***
gender | -.10172745***
-.06112766
educ | -.05599951***
-.04932063***
marit2 | -.25675564***
-.27648464***
have_child | .01744386
-.01230082
he1 | -.35187659***
-.32821751***
he3 |
.3327496***
.30373515***
nn |
-.76341845***
_cons | -.54879334**
-.30388597
-------------+-------------------------------nn
|
age | -.0291329***
-.02966041***
age2 | .00034656***
.00035478***
gender | .14746024***
.13794017***
educ | .01947953**
.01436626*
marit2 | -.0937549*
-.09998775**
have_child | -.11629774*
-.12279929**
inc_bas | 7.881e-06***
9.893e-06***
nj1 | -.40143412***
-.42200361***
nj3 | .95528264***
.92919052***
js1 | .31297959***
.34701295***
js3 | -.05254222
-.16059425**
_cons | -1.0774312***
-1.0010311***
-------------+-------------------------------atrho21
|
_cons | -.1470278***
.22527215***
Упорядоченные модели множественного выбора
Общий вид уравнения
Yi* = XiT β + ui, i=1,…,n.
Yi = j, если Cj-1 ≤ Yi* ≤ Cj, j=1,…,5;
где Xi - регрессоры, Yi* - латентная переменная, Cj – границы для Yi*, при переходе
через которые происходит соответствующий скачок Yi, C0=-∞, C5=+∞. Предполагается,
ошибка ui имеет логистическое распределение F(u)=eu/(1+ eu).
Полученные результаты
•
•
•
•
•
Возраст входит в модель нелинейно, точка экстремума age*=55.4
факторы хорошего благосостояния, хорошего здоровья, хорошего
образования, наличия супруга и детей делают человека более
удовлетворенным жизнью
Количество детей входит в модель нелинейно, точка экстремума child*=4.1
факторы наличия работы, удовлетворенности ею и низкой обеспокоенности
потерять её повышают вероятность человека принадлежать категории
счастливых людей
региональные признаки: валовый региональный продукт на душу населения,
средний доход на душу населения по региону, уровень безработицы и
занятости значимы.
Порядковые модели в разрезе финансового положения
Всего выделяются три категории удовлетворенности финансовым положением:
• удовлетворенные материальным положением (модель m1)
• неудовлетворенные материальным положением (модель m3)
• промежуточная категория (модель m2)
Результаты оценивания
-------------------------------------------------------------Variable |
m1
m2
m3
-------------+-----------------------------------------------life_satisf |
age | .04360563***
.0643146***
.06651861***
age2 | -.00034032**
-.00058599***
-.00058789***
gender | .13891581
-.01481
.00909493
educ | -.0075192
-.04277152***
-.03528787***
marit1 | -.34035391*
-.16410137
.24608882
marit2 | -.26340678*
-.37700173***
-.41540893***
have_child | -.35347252**
-.20214264**
-.01995613
have_job | -.0853867
-.22869388***
-.31275671***
he1 | -.2538819***
-.55396054***
-.33400663***
he3 |
1.078039***
.53899955***
.39941541***
nn1 | .00817933
.34404909***
.71228999***
nn3 | -.52901195***
-.35608035***
-.34861855**
st1 | 1.0182085***
.34995473
-.0893959
st2 | 1.1734075***
.23851067
-.12025736
st4 | 1.1300412***
.21257976*
-.10316292
inc_reg | -.00002048
-.00004228***
-.00004675***
empl | .00619528
.00813253
.01422418
unempl | -.03053039
.00640294
.01189535
-------------+------------------------------------------------
Порядковые модели, в разрезе финансового положения
Интерпретация результатов
• Возраст входит нелинейно. Экстремумы age1*=66.9, age2*=55.3,
age3*=56.1 для моделей m1, m2, m3 соответственно.
• Образование значимо только в m2 и m3.
• Фактор наличия супруга(и) значим в m2 и m3.
• Наличие детей значимо в m1 и m2.
• Здоровье значимо во всех группах.
• Наличие работы значимо лишь в m2 и m3.
• Из региональных признаков значимы тип населенного пункта
для группы m1 и среднедушевой доход населения в группах m2
и m3
Заключение
Основные значимые факторы
•
•
•
•
удовлетворенность респондента финансовым состоянием
оценка его здоровья
обеспокоенность не обеспечить себя самым необходимым
возраст, который входит в модели нелинейно. Точка экстремума
в среднем 56, а для финансово удовлетворенных 67.
• семейное положение и внутренняя структура семьи. Наиболее
сбалансированы те семьи, финансовая удовлетворенность
которых не высока, но и не низка. Количество детей входит в
модели нелинейно, точка экстремума равна 4.
• Уровень образования значим для всех людей, кроме финансово
удовлетворенных
• Региональные признаки также значимы для всех респондентов.
.
Благодарю за внимание!
Download