Двунаправленная модель с фиксированными эффектами

advertisement
Модели и методы
прикладного анализа
территориальных систем.
Коломак Евгения Анатольевна
д.э.н., профессор
Организация курса и оценивание
• Курс включает 2 части: теоретическую и
практическую.
• В конце курса – зачет
(недифференцированный).
Чтобы получить зачет необходимо:
1. Сдать практическое задание
2. Получить не меньше 40 баллов за теоретическую
контрольную.
Аппарат прикладного анализа
пространственных аспектов развития
• Эмпирические методы: описательная
статистика, эконометрические модели
• Балансовые модели: модели региона,
мультирегиональные модели.
• Оптимизационные модели: модели региона,
мультирегиональные модели.
• Имитационные модели: модели
региональной системы.
• Теория графов и сетей.
Статические и динамические
Эмпирические методы.
Описательная статистика
•
•
•
•
Таблицы
Диаграммы
Графики
Карты
Описательная статистика. Таблицы.
Индексы промышленного производства
Год
2000
2001
2002
2003
2004
2005
2006
107,5
106,9
104,1
107,5
108,3
104,8
106,2
109,0
119,5
95,5
114,9
107,9
101,5
104,0
104,9
106,4
106,4
106,7
103,7
104,8
105,8
103,1
114,0
103,5
105,8
105,4
99,9
103,9
107,8
103,7
96,8
103,4
103,9
103,1
102,7
111,7
107,1
103,8
107,7
107,2
101,6
110,2
105,1
106,3
104,0
105,6
106,4
103,3
104,4
105,2
102,8
101,2
105,3
106,1
108,3
112,0
106,8
104,6
103,8
107,0
104,7
106,8
107,2
113,7
111,6
105,4
109,7
110,0
108,9
108,5
107,9
112,7
107,8
110,7
128,5
106,1
100,6
109,9
110,8
109,2
111,8
105,0
96,2
102,7
109,2
107,5
101,6
107,4
103,4
103,7
105,7
Сибирский федеральный округ
Республика Алтай
Республика Бурятия
Республика Тыва
Республика Хакасия
Алтайский край
Красноярский край
Иркутская область
Кемеровская область
Новосибирская область
Омская область
Томская область
Читинская область
Описательная статистика. Таблицы.
1999
2000
2001
2002
2003
2004
2005
2006
2007
Валовой региональный продукт на душу населения, тыс. руб.
Минимум
17.2
25.6
38.6
50.4
55.9
73.4
83.5
106.1
143.9
Максимум
180.7
339.3
420.0
535.0
659.3
832.2
1171.6
1389.9
1480.9
Среднее
50.9
74.8
93.8
114.1
138.9
175.0
213.5
259.0
328.3
Стандартное
отклонение
27.3
54.1
65.3
82.2
100.6
129.2
172.6
200.4
238.8
Описательная статистика. Диаграммы.
Описательная статистика. Графики
Описательная статистика. Графики
Описательная статистика. Графики
Описательная статистика. Графики
Описательная статистика. Графики.
Описательная статистика. Графики.
Описательная статистика. Карты.
Описательная статистика. Карты.
Описательная статистика. Карты.
Описательная статистика. Карты.
Описательная статистика. Карты.
Описательная статистика. Карты.
Описательная статистика. Карты
Характеристики межрегионального
неравенства
Для представления информации о
межрегиональном неравенстве используют:
1) графическую форму (плотность
распределения, функция распределения,
кривая Лоренца);
2) характеристики разброса (размах
вариации, стандартное отклонение, к-т
вариации);
3) индексы (к-т Джини, индекс Тейла).
Индекс Тэйла
𝑅
𝑌𝑟
𝑌𝑟
𝑙𝑛
𝑌 𝑌 𝑅
𝑇=
𝑟=1
𝑇 = 𝑇𝑏𝑒𝑡𝑤𝑒𝑒𝑛 + 𝑇𝑤𝑖𝑡ℎ𝑖𝑛
𝑀
𝑇𝑏𝑒𝑡𝑤𝑒𝑒𝑛 =
𝑌𝑚 𝑌𝑚 /𝑅𝑚
𝑙𝑛
𝑌/𝑅
𝑚=1 𝑌
𝑀
𝑇𝑤𝑖𝑡ℎ𝑖𝑛 =
𝑌𝑚
𝑇𝑚
𝑚=1 𝑌
𝑇𝑚 =
𝑅𝑚
𝑌𝑟
𝑌𝑟
𝑙𝑛
𝑌𝑚 /𝑅𝑚
𝑟=1 𝑌𝑚
Пространственная концентрация числа
предприятий
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1995
1996
1997
1998
1999
2000
2001
2002
T
2003
Tw
2004
Tb
2005
2006
2007
2008
2009
2010
Эконометрические методы. МНК
i =1,..,n – индекс региона
yi – наблюдения над зависимой переменной в регионе i,
xi – вектор наблюдений над независимыми переменными в регионе i.
T
i
i
i
y  x  e
β - вектор коэффициентов регрессии, ei – ошибка регрессии, xiT –
транспонированный вектор наблюдений над независимыми
переменными в регионе i.
 x1i 
 
xi   ... 
x 
 ki 
 1 
 
   ... 
 
 k
Метод наименьших квадратов
В матричном виде:
y  X  e
где y  ( y1 ,..., yn )T
 x1T 
 
X   ... 
 xT 
 n
e  (e1 ,..., en )T
xi1=1 для i=1,…,n , в этом случае β1 является
константой
Метод наименьших квадратов
Метод наименьших квадратов (Ordinary Least Squares - OLS)
ˆ
OLS
 arg min 
yˆi  xiT ̂
n
T
2
(
y

x

)
 i i
i 1
ˆOLS  ( X T X )1 X T y
eˆi  yi  yˆi
Оценки метода наименьших квадратов являются несмещенными линейными
оценками с минимальной дисперсией, если верны следующие предположения о
стохастической структуре модели:
• E(ei)=0
• E(ei2)=σ2
• E(eiej)=0 для всех i≠j
• rk X=k<n
• xj – детерминированы
Оценки метода наименьших квадратов имеют нормальное распределение, если
дополнительно выполнено условие о явной форме ошибок: ei ~N(0, σ2)
Метод наименьших квадратов
VarˆOLS   2 ( X T X ) 1
Ковариационная матрица
Оценка дисперсии ошибок
1 n 2
s 
eˆi

n  k i1
σ2:
2
Стандартная ошибка коэффициента регрессии
Коэффициент детерминации
RSS
eˆT eˆ yˆ T yˆ
R 1
1 T  T
TSS
y y y y
2

se (ˆ j )  s ( X T X ) 1
2
adj
R

eˆT eˆ (n  k )
 1 T
y y (n  1)
RSS – сумма квадратов ошибки регрессии, TSS – сумма квадратов
центрированных значений зависимой переменной
МНК. Тестирование гипотез.
ei ~N(0, σ2)
Линейная гипотеза относительно коэффициентов:
H 0 : R  r
где R – матрица размерности qxk, а r – вектор размерности qx1.
Пример:
1  2

 2   3  0
1 0 0 

R  
0
1

1


 1 
 
   2 
 
 3
 2
r   
0
Статистика для проверки гипотез
или
( Rˆ  r )T ( R( X T X ) 1 RT ) 1 ( Rˆ  r )
F
~ Fq,n-k
qs 2
(eˆ rT eˆ r  eˆT eˆ) q
F
eˆT eˆ (n  k )
~ Fq,n-k
МНК. Тестирование гипотез.
ei ~N(0, σ2)
Наиболее часто тестируемые гипотезы:
1. Проверка на значимость регрессионной модели в целом
H 0 :  2  ....   k  0
(TSS  RSS ) (k  1) yˆ T yˆ (k  1)
R2 n  k
F
 T


2
ˆ
ˆ
RSS (n  k )
e e (n  k ) 1  R k  1
2.
Проверка гипотезы о значении отдельного коэффициента
H 0 :  j   (j 0)
ˆ j   (j 0)
se ( ˆ j )
 t nk
ˆ
tn  k ˆ
tn  k 
ˆ
ˆ


s
(

)

q
;


s
(

)

q
 j e j 1 j e j 1 
2
2

Эконометрические методы.
Панельные данные
Пусть i=1,…,n – индекс региона, t=1,…,T – индекс
момента времени, тогда
yit – наблюдения над зависимой переменной в
регионе i в год t,
xit – вектор наблюдений над независимыми
переменными в регионе i в год t.
Имеем дело с панельными данными.
Панельные данные представляют собой наблюдения
над однородными объектами в течение
определенного периода времени. Панельные
данные объединяют кросс-секции и временные
ряды.
Линейная модель панельных
данных
Линейная панельная модель
yit  xitT   uit
i – индекс региона, t – индекс момента времени, β – вектор коэффициентов
регрессии, xitT – транспонированный вектор наблюдений над k независимыми
переменными.
 x1it 
 
xit   ... 
x 
 kit 
 1 
 
   ... 
 
 k
Однонаправленная модель ошибки: uit  i  it
μi – ненаблюдаемые региональные эффекты, υit – остаточные
идиосинкратические компоненты.
Двунаправленная модель ошибки:
uit  i  t  it
λt – ненаблюдаемые временные эффекты.
Линейная модель панельных
данных
• Предполагается, что μi, λi и υit являются
независимыми одинаково распределенными
величинами с нулевой средней и постоянной
дисперсией σμ2, σλ2 и συ2 соответственно.
• Региональные и временные эффекты могут
трактоваться как фиксированные, в этом
случае оценивается модель с
фиксированными эффектами,
Однонаправленная модель с фиксированными
эффектами. Постановка.
В модели региональные эффекты μi предполагаются фиксированными
неизвестными параметрами, поэтому в ошибке остается только
идиосинкратическая компонента.
Пусть i=1,…,n, t=1,…,T, υit ~ (0, συ2)
yit  i  x   it
T
it
В сумме все региональные эффекты повторяют константу, поэтому
необходимо избавляться либо от константы, либо от одного
индивидуального эффекта
Однонаправленная модель с фиксированными
эффектами. Постановка.
Модель в векторной форме
Для i-го объекта:
 yi1 
 
yi   ... 
y 
 iT 
yi  iT i  X i   i
 xiT1 
 i1 
 
 
X i   ...  i   ... 
 xT 
 
 iT 
 iT 
1
 
iT   ...
1
 
Модель в матричной форме:
 y1 
 
y   ... 
y 
 n
 X1 
 
X   ... 
X 
 n
 1 
 
   ... 
 
 n
 iT 0

 0 iT
D
... ...

0 0

y  D  X  


0

... ... 

0 ... iT 
0
 1 
 
   ... 
 
 n
Однонаправленная модель с фиксированными
эффектами. Постановка.
По предположению υit не зависят от регрессоров и υit ~ (0,
συ2) независимые одинаково распределенные
величины, следовательно ковариационная матрица
ошибок имеет идеальную структуру. В данном случае
оценки метода наименьших квадратов β и μ будут
несмещенными и эффективными.
Необходимым техническим условием является, чтобы
матрица (DX) имела полный ранг (n+k). Это означает,
что:
 матрица X не должна включать константу;
 матрица X не должна содержать переменные
неменяющиеся во времени;
 T должно быть не меньше 2, чтобы региональные
эффекты были идентифицируемы.
Однонаправленная модель с фиксированными
эффектами. Оценка.
Чтобы снизить размерность, можно использовать преобразование
данных.
Преобразование состоит в вычитании среднего значения по времени из
каждого наблюдения.
Оценивается следующая система:
yit  yi  xit  xi   it  i
T
1
yi   yit
T t 1
1 T
xi   xit
T t 1
1 T
i    it
T t 1
Оценки μi равны оценкам метода наименьших квадратов в регрессии
ˆ i  yi  xiT ˆ
Однонаправленная модель с фиксированными
эффектами. Свойства оценок.
Асимптотические свойства оценок при n   и
фиксированном T различные.
Оценки ˆ j являются асимптотически нормальными и
 
состоятельными, т.е. ˆ 
n
ˆ j   (j 0)
se ( ˆ j )

 N (0,1)
n 
Следовательно, можно проводить стандартное
тестирование в отношении этих оценок.
Оценки же  i несостоятельны. Причина в том, что их
количество растет пропорционально n.
Однонаправленная модель с фиксированными
эффектами. Тестирование.
Нулевая гипотеза H :   
Пусть  it~N 0,  2 ,

RSS  RSS  n  1
тогда F 
~F
0
1
2
 ......   n  0
r
,
RSS nT  n  k 
где RSSr – сумма квадратов остатков в
регрессии без региональных эффектов
n 1,nT  n  k
yit    x   it
T
it
Двунаправленная модель с фиксированными
эффектами. Постановка.
В двунаправленной модели ошибка включает наряду с
региональными временные эффекты:
uit  i  t  it
yit    i  t  xitT   it
где i=1,…,n, t=1,…,T, υit ~ (0, συ2) - независимые одинаково
распределенные величины.
В этой модели константа дублируется дважды: как сумма
всех μi как сумма всех λt.
Пусть
n  0
и
T  0
Двунаправленная модель с фиксированными
эффектами. Постановка.
Матричная запись
y    inT  D   D   X  
 1 


   
 
 n1 
 1 


   
 
 T 1 
 iT 0

 0 iT
D  
... ...

0 0

0 ... 0 

0 ... 0 
... ... iT 

0 ... 0 
I T 1




 0 ... 0 
D   ... ... ... 


I T 1


 0 ... 0 


Благодаря предположению о структуре ошибок, метод наименьших квадратов
будет давать несмещенную и эффективную оценку.
Необходимым условием получения оценки является равенство ранга матрицы
регрессоров (n+T-1+k). Это означает, что:
 матрица X не должна содержать переменные неменяющиеся во времени;
 матрица X не должна содержать переменные общие для всех объектов в
каждый отдельный момент времени
Если эти условия выполнены, то модель можно оценивать методом наименьших
квадратов, но можно использовать и преобразование данных.
Двунаправленная модель с фиксированными
эффектами. Оценка.
Оценка ˆ является оценкой МНК на данных преобразованных
таким образом, чтобы исключить региональные и временные
эффекты, уравнения модифицируются:
yit  yi  yt  y  ( xit  xi  xt  x )T   it  i  t  
1 T
yi   yit
T t 1
1
y
nT
T
n
 y
t 1 i 1
it
1 T
xi   xit
T t 1
1 n
yt   yit
n i 1
1 T
i    it
T t 1
1 n
t  it
n i1
1
x
nT
T
n
 x
t 1 i 1
it
1 n
xt   xit
n i1
1
 
nT
T
n

t 1 i 1
it
Двунаправленная модель с фиксированными
эффектами. Свойства оценок.
Дисперсия ошибки:
ˆ2 
RSS
nT  n  k  T  1
Асимптотически оценка ˆ является состоятельной и нормальной
при фиксированном T и n   .
Оценки региональных эффектов при n   и фиксированном T
являются несостоятельными, так как их количество растет
пропорционально размеру выборки.
Оценки временных эффектов при n   и фиксированном T могут
быть состоятельными относительно друг друга. Но так как они
связаны с несостоятельными оценками региональных эффектов
через константу, то их свойства страдают тоже.
Оценками константы, индивидуальных эффектов и временных
эффектов можно пользоваться как состоятельными при n  
и T  .
Двунаправленная модель с фиксированными
эффектами. Тестирование.
1. Тестирование на отсутствие региональных и временных
эффектов
H 0 : 1   2  ......   n1  1  2  ......  T 1  0
RSS
F
 RSS
 n  T  2
Пусть  it ~ N 0,    , тогда
~ FnT 2,nT nk T 1 где
RSS nT  n  k  T  1
RSSr – сумма квадратов остатков в регрессии без
T
региональных и временных эффектов yit    xit   it
2. Тестирование на отсутствие региональных эффектов
2
F
RSS

 RSS n  1
RSS nT  n  k  T  1
r
r
H 0 : 1   2  ......   n1  0
~F
n 1,nT  n  k T 1
,
где RSSr из
yit    t  xitT   it
Двунаправленная модель с фиксированными
эффектами. Тестирование.
3. Тестирование на отсутствие временных эффектов
H 0 : 1  2  ......  T 1  0
F
RSS

 RSS T  1
RSS nT  n  k  T  1
r
~
FT 1,nT nk T 1
где RSSr – сумма квадратов остатков в панельной регрессии
с фиксированными региональными эффектами
yit    i  xitT   it
Литература по панельным данным:
• Коломак Е.А. Панельные данные: методы эконометрического
анализа. Учебное пособие. Новосибирск. 2011.
• Анатольев С.А. Курс лекций по эконометрике для
подготовленных.
www.nes.ru/russian/research/abstracts/2003/Anatolyev-r.htm
• Магнус Я.Р., Катышев П.К., Пересецкий А.А. «Эконометрика.
Начальный курс», Москва: «Дело», 2005.
• Эконометрика, ред. И.И.Елисеева, Москва: «Финансы и
статистика», 2005.
• Baltagi B.H. “Econometric Analysis of Panel Data”, John Wiley and
Sons, 2001.
• Wooldridge J.M. “Econometric Analysis of Cross Section and Panel
Data”, MIT Press, 2002
Статистические пакеты
• STATA
• EViews
Download