Последствия ошибок в спецификации моделей

реклама
Последствия ошибок в
спецификации
моделей
Замещающие
переменные
Последствия ошибок спецификации
модели
Возможные ошибки спецификации модели:
1. Неправильный выбор вида уравнения
регрессии
2. В уравнение регрессии включена лишняя
(незначимая) переменная
3. В уравнении регрессии пропущена значимая
переменная
Последствия ошибок спецификации
модели
1. Неправильный выбор вида функции в уравнении
Пусть на первом этапе была сделана спецификация
модели в виде:
y  fF (x; a0 , a1 )  u 

M(u | x)  0


M(u 2 | x)  σ u2

(1.1)
в которой функция fF(x,a0,a1) выбрана не верно
Предположим, что yT=fT(x,a0,a1) – правильный вид
функции регрессии
Тогда справедливо выражение:
f x,a ,a   f x,a ,a   φx   0
T
0
1
F
0
1
(1.2)
Последствия ошибок спецификации
модели
Из выражения (1.2) следует:


M f T x ,a0 ,a1  f F x ,a0 ,a1 

 

 M f T x ,a0 ,a1  M f F x ,a0 ,a1  M φx   0
(1,3)
Иными словами, математические ожидания эндогенной
переменной, полученные с помощью функций fT и fF не
совпадают, т.е. первая предпосылка теоремы ГауссаМаркова M(ulx)=0 не выполняется
Следовательно, в результате оценивания такой модели
параметры а0 и а1 будут смещенными
Последствия ошибок спецификации
модели
Симптомы наличия ошибки спецификации первого типа:
1. Несоответствие диаграммы рассеяния,
построенной по имеющейся выборке виду функции,
принятой в спецификации
2. В динамических моделях длительно
сохраняется знак у смежных (по номеру t уравнений
наблюдений) значений оценок случайных возмущений
Именно этот симптом и улавливается статистикой
DW Дарбина–Уотсона!
В силу данного обстоятельства тесту Дарбина–
Уотсона в эконометрике придается большое значение.
Пример исправления ошибки первого
типа
Задача. Построить модель относительной стоимости
подержанных автомобилей фирмы Ситроен
Продажа
p
%
Колтво
лет
Продажа
p
%
Колво
лет
Продажа
p
%
Колво
лет
1
100
0
9
52
3
17
42
6
2
80
1
10
57
3
18
40
6
3
76
1
11
50
4
19
40
6
4
80
1
12
50
4
20
37
7
5
70
2
13
45
4
21
37
7
6
65
2
14
50
5
22
33
7
7
60
2
15
45
5
23
35
8
8
49
3
16
45
5
24
37
8
25
32
9
Пример исправления ошибки первого
типа
1. Линейная модель
2. Нелинейная модель
t
p  a0 ea1 ( 1  u )
ln p   lna0   a1 t  ε
ln p   4.39  0.113t  ε
p  76.882  5.933t  u
2.46 0.504 5.4
2
R  0.87
0.04  0.007  0.08 
DW  1.79  DL  1.44
1  u 
p  80.64 e
 0.113 t
2
R  0.92
DW  1.79  Du  1.44
120
120
100
100
80
80
60
60
40
40
20
20
0
0
0
2
4
6
8
10
0
2
4
6
8
10
Последствия ошибок спецификации
модели
2. В уравнение регрессии включена лишняя переменная
Пусть на этапе спецификации в модель включена
«лишняя» переменная, например, X2
y  a0  a1  x1  a2  x 2  u 

M u | x1 , x 2   0


M u 2 | x1 , x 2   σ u2

(2.1)
«Правильная» спецификация должна иметь вид:
y  a0  a1  x1  u 

M u | x1   0


M u 2 | x1   σ u2

(2.2)
Последствия ошибок спецификации
модели
Последствия:
1. Оценки параметров а0, а1, а2 останутся
несмещенными, но потеряют свою эффективность
(точность)
2. Увеличивается ошибка прогноза по модели
~y  ~a  ~a  x  ~a  x
0
0
1 1,0
2
2,0
как за счет ошибок оценок коэффициентов и σu, так и
за счет последнего слагаемого
Это особенно опасно при больших абсолютных
значениях регрессора
Последствия ошибок спецификации
модели
Диагностика:
В моделях множественной регрессии необходимо
для каждого коэффициента уравнения проверять
статистическую гипотезу H0: ai=0
Вспомним, что для этого достаточно оценить дробь
Стьюдента
~
a
t 2  ~2
Sa
2
и сравнить ее значение с критическим значением
распределения Стьюдента, которое вычисляется по
значению доверительной вероятности и значению
степени свободы 2 = n – (k+1)
Последствия ошибок спецификации
модели
3. В модели не достает важной переменной

M u | x1   a0  a1  x1  a2  x 2   a0  a1  x1   a2  x 2  0
Последствия такие же, как и в первом случае: получаем
смещенные оценки параметров модели.
Для устранения необходимо вернуться к изучению
особенностей поведения экономического объекта,
выявить опущенные переменные и дополнить ими
модель
Вот тут и возникают неприятности!
Замещающие переменные
Проблемы в использовании переменных:
1. Не возможно получение данных по
переменной
2. Не возможно измерить количественно
переменную
Такие ситуации характерны для переменных
социально-экономического характера (качество
образования и т.п.)
Выход из ситуации – подбор переменной заместителя
Замещающие переменные
Определение. Переменные, которые вводятся в
эконометрические модели вместо тех переменных,
которые не поддаются измерению, называются
замещающими.
Требование. Замещающая переменная должна
коррелировать с переменной, которую она замещает.
Если Cor(x,xpr)=1, то xpr – называют совершенным
регрессором
В качестве замещающей переменной часто
используется время и лаговые переменные
Замещающие переменные
Пример. Рассмотрим модель связывающую расходы
потребителей на питание (y) с личным располагаемым
доходом (х) и относительной ценой продовольствия (р)
logy   b0  b1logx   b2 logp  ε
(4.1)
Предположим, что нет доступа к данным о
располагаемом личном доходе (х)
Если эту переменную не учитывать, то оценки
оставшихся параметров будут смещенными, а
соответствующие тесты не корректны
Предположим, что log(x) имеет временной тренд
Замещающие переменные
Тогда уравнение (4.1) можно записать в виде:
y  b0  b2 logp  b3 t  ε
Регрес Оценки коэффициентов
соры
b1
b2
b3
Log(x), 0.64
log(p) (0.03)
Log(p),
t
Log(p)
-0.48
(0.12)
-0.47
(0.13)
2.04
(0.33)
R2
0.99
0.023
(0.001)
0.98
0.63
Замещающие переменные
В общем случае, пусть «правильная» модель:
y  a0  a1 x1  a2 x2  ...  ak xk  u
(4.2)
Предположим, что х1 не доступна для наблюдений
Введем переменную z, которая связана с х1
X 1  λ  μz
(4.3)
где: λ и μ неизвестные коэффициенты
y  a0  a1 λ  a1μz  a2 x2  ...  ak x k  u
После оценки модели (4.4) нет формальной
возможности получить значения λ, μ, а1
(4.4)
Проблемы с использованием
замещающих переменных
Пример построения производственной функции Кобба-Дугласа
Индексы реального объема производства,
Спецификация модели
в промышленности США в 1899-1922 гг.
a 1a 
Год
Y
K
L
Год
Y
K
L
1899
100 100 100
1911
153 216 145
1900
101 107 105
1912
177 226 152
1901
112
114
110
1913
184 236 154
1902
122 122
118
1914
169 244 149
1903
124 131 123
1915
189 266 154
1904
122 138
116
1916
225 298 182
1905
143 149 125
1917
227 335 196
1906
152 163 133
1918
223 366 200
1907
151 176 138
1919
218 387 193
1908
126 185 121
1920
231 407 193
1909
155 198 140
1921
179 417 147
1910
159 208 144
1922
240 431 161
Yt  a0 K t 1 Lt 1 1  ut 
lnYt   lna0   a1 lnK t   1  a1 lnLt   ln1  u  
Y 
K 
ln t   b0  a1 ln t   ε
 Lt 
 Lt 
Оценка модели
InYt /K t   0,02836  0,2007  ln K t /Lt   ε t 
0,017  0,039 
0,048 

t  0, 1, 


R 2  0,56; DW  1,32
[dL; dU] = [1,26; 1,44]
Проблемы с использованием
замещающих переменных
Проверка адекватности модели
Для проверки адекватности взяты данные за 1922г
(Y1922 = 240; K1922 = 431; L1922 = 161).
Для этого вычисляем величины
x 0  1n(K 1922/L 1922 )  0,9847; q 0  0,29;
S y 0  0,048  1  q 0  0,0545
и делаем точечный прогноз значения
y0 = ln(Y1922 /L1922) = 0,399:
Критическое значение критерия Стьюдента
tкрит(0.99,21)=2.8 Тогда доверительный интервал:
y 0  y~0  t крит  Sy 0  0,0734; y 0  y~0  t крит  Sy 0  0,3786.
Построение функции Кобба-Дугласа
Модель оказалась не адекватной
Дальнейшие возможности:
- проверить возможность исключения незначимых
параметров
-попытаться изменить вид модели
- исследовать возможность включения
дополнительной переменной
Делаем все по порядку
Построение функции Кобба-Дугласа
1. Проверка возможности исключения параметров
InYt /K t   0,02836  0,2007  ln K t /Lt   ε t 
0,017  0,039 
0,048 
Проверяем статистическую гипотезу Н0: bi=0, tкрит(0.95,21)=2.1
t0 
b0
σb
0

0.02836
 1.67  t крит  2.1
0.017
t1 
b1
σb

0.201
 25.6  t крит  2.1
0.039
1
Вывод: b0=ln(a0)=0,следовательно, a0=1
Построение функции Кобба-Дугласа
Исследуется спецификация модели вида:
Yt  K t
a1
Lt
1a 
1
1  ut 
Yt 
 Kt 
ln
  a1 ln
ε
 Lt 
 Lt 
(5.2)
Оценка модели (5.2) по тем же данным есть:
In(Yt /K t )  0,2522  ln(K t /Lt )  ε t
(0,023)
(0,050)
t  0, 1, 
R 2  0,51; DW  1,26





Построение функции Кобба-Дугласа
Проверка адекватности модели (5.2)
Вновь вычисляются необходимые величины:
x 0  1n(K 1922/L1922)  0,9847; q 0  0,21;
S y0  0,050  1  q 0  0,055
~
~
y 0  1n(Y1922 / L1922)  0,2522  x 0  0,248.
Сделаем точечную проверку адекватности для
доверительных вероятностей 0.99 и 0.95
tкрит(0.99,21)=2.8, tкрит(0.95,21)=2.1
t
0

~
y0  y
0
σy
0
0.399  0.248

 2.74
0.055
Построение функции Кобба-Дугласа
2. Введем дополнительную переменную
Модели (5.1) и (5.2) не учитывают влияние технического
прогресса на уровень выпуска продукции
Учтем это влияние с помощью замещающей
переменной t – время следующим образом
Введем переменную Et –эффективность единицы труда
Et зависит от квалификации, образования и др. личных
качеств работников
Простейшая модель технологического процесса
t


E t  E 0 1 g
(5.3)
Построение функции Кобба-Дугласа
С учетом технологического процесса спецификация
модели принимает вид:
Yt  a0  e a3 t  K ta1  L1t- a1  (1  ut )

a0  0; 0  a1  1;
(5.4)


t  0, 1, 
где: a3 = (1-a1) · ln(1+g)  0
В логарифмическом виде модель (5.4) имеет вид:
ln(Yt /Lt )  1n(a0 )  a1  ln(K t /Lt )  a3  t  ε t 

E( ε t | K t , Lt , t)  0


E( ε 2 t | K t , Lt , t)  σ 2


t  0, 1, 

(5.5)
Построение функции Кобба-Дугласа
Оценка модели (5.5) по тем же данным приняла вид:
ln(Yt /Lt )  0,0046  0,094  ln(K t /Lt )  0,0120  t  ε t
(0,018)
t  0, 1, 
R 2  0,67
(0,12)

(0,0048) (0,043) 




(5.6)
Из (5.6) легко видеть, что оценки коэффициентов
b0=ln(a0) и а1 оказались незначимыми (гипотезы Н0:b0=0
и H0:a1=0 не отвергаются исходными данными)
Но это приводит к абсурду: можно не затрачивая ни
капитал ни труд производить продукцию
Построение функции Кобба-Дугласа
Вопрос. Почему статистические данные «не пустили» в
модель время как заместитель технического прогресса?
Ответ. Переменная К (капитальные затраты) так же
являются функцией времени.
В результате введения в модель еще переменной
времени привело к мультиколинеарности матрицы
коэффициентов наблюдения (матрица Х)
Выражение

a
x x  x
T
1
T

Y
стало не устойчивым из-за неустойчивости обратной
матрицы
Построение функции Кобба-Дугласа
Вывод. Последствием неаккуратного использования
замещающих переменных приводит к нарушению
обязательного условия МНК о не вырожденности
матрицы коэффициентов уравнений наблюдений
При использовании замещающих переменных
необходим предварительный анализ степени
корреляции между экзогенными переменными
Построение функции Кобба-Дугласа
3. Проверка возможности изменить вид модели
Откажемся от жесткого условия линейной однородности
(а1+а2=1) производственной функции
Тогда модель примет вид:
a
a
Yt  a0 K t 1 Lt 2 1  ut 
lnYt   lna0   a1 lnK t   a2 lnLt   ln1  u  
(5.7)
Оценка модели (5.7) в конечном итоге получилась
следующей:
y t  K 0t .23 L0t .81 1  u  R 2  0.96
Скачать