Эконометрика - Семёнычев В.К.

advertisement
Эконометрика
Лекции
Авторский текст:
проф. Семёнычев Валерий Константинович
Самара, 2007 г.
«Существует только то, что можно измерить»
Эконометрика
Экономика
Метрика (измерение)
Макроэкономика
Микроэкономика - основы образования экономиста
Эконометрика
Экономическая теория
Эконометрика
Математика
Математическая экономика
Статистика Математическая статистика
Экономическая статистика
В централизованной экономике, эконометрика не изучалась, в отличие, скажем, от
балансовых или оптимизационных методов: межотраслевого баланса и линейного программирования. Причинно-следственными связями занимается экономическая теория, а
связями без выявления их причин - эконометрика. Набор статистических методов, используемых для наблюдения за ходом развития экономики, её анализа (моделирования) и её прогнозов называется эконометрикой.
Иллюстрация задач эконометрики на примере. Предложена модель функции потребления: ln C   0  1 ln Y   2 ln P ,
где C – потребление некоторого пищевого продукта на душу населения в некотором году;
Y – реальный доход на душу населения в некотором году;
P – индекс цен на этот продукт, скорректированный (дефлированный) на общий индекс стоимости жизни (относительный уровень цен);
i - параметры.
Задача «параметризации» модели - определение  : 1.измерение Y , P (насколько корi
ректно измерены данные, представляют ли они то, что должны представлять по нашему
мнению? 2. Погрешность измерения Y , P и С аддитивна или мультипликативна ? 3. Какой
метод использовать для параметризации – МНК?
Задача «спецификации» модели: 1. Нет ли переменных, которые следовало бы дополнительно включить в уравнение (например, цены на непродовольственные товары)?
2. Не следует ли исключить из уравнения некоторую переменную? 3. Верно ли то, что модель линейная (верны ли теоретические предпосылки модели)? 4. Является ли модель
полной? Может быть необходимо учесть и уравнение предложения, кроме уравнения
спроса? 5. Достаточно ли изучать макроэкономическое уравнение или необходимы такие
индивидуальные (микроэкономические) данные для поставленной задачи? 7. Может быть
нужно выделить факторы, которые зависят непосредственно от принятия управленческих
решений данным объектом хозяйствования (предприятием, регионом), и влияние факторов, которые от менеджмента на данном хозяйствующем объекте не зависят? 8. Модель
является статической. Возможно, более подходящей была бы динамическая модель.
Например, можно предположить, что прошлогодний доход может влиять на текущий уровень потребления.
Примеры: «автомобиль- зеркало заднего вида», «поиски у фонаря»
2
Регрессии
Парные
Множественные
Линейные по параметрам
Линеаризируемые
Нелинейные (существенно или внутренне нелинейные)
Пространственные (все переменные являются параметрами)
Трендовые (переменой является время)
Пространственно-временные (введение в пространственную
регрессию фактора времени)
Каноническая структура регрессий
Y  D   - аддитивная
Y  D    Y  D  (1   ) - мультипликативная
Y - наблюдаемая компонента (статистические данные);
D - ненаблюдаемая детерминированная компонента;
 - ненаблюдаемая стохастическая компонента (условия Гаусса – Мар-
кова, гетероскедастичность!).
Парные регрессии (общее количество моделей около 100)
1. Моделирование неслучайной компоненты алгебраическими
полиномами:
Моделирование неслучайной компоненты линейной функцией:
Y  A  Bx    МНК
D  A  Bx  
.
Y  ( A  Bx)  (1   )  ?
Модель линейна по параметрам и по переменным
Y  ( A  Bx)  (1   )  A  Bx   ( A  Bx)
   ( A  Bx) - гетероскедастическая стохастическая компонента (класси-
ческий МНК применять нельзя).
3
Демонстрация и методы компенсации (или коррекции) гетероскедастичности
e
0
Y
e
0
Y
e
0
Y
Взвешенный МНК (постулирование закона изменения дисперсии  (но
параметры A и B - неизвестны) и др.
Моделирование неслучайной компоненты параболой
D  A  Bx  Cx2
 A  Bx  Cx 2    аддитивная структура

Y 
( A  Bx  Cx 2 )  (1   )  мультипликативная структура
Модель линейна по параметрам, нелинейна по переменным.
4
y
x
Для аддитивной структуры вхождения стохастической компоненты и
при выполнении условий Гаусса-Маркова применим МНК:
  2  (Y  A  Bx  Cx 2 )2  Q( A, B, C ) ;
i
i
i
i
i
i
 Q
 0
 A

 Q

* * *
 0  A , B , C
 B

 Q
 0
 C
Можно свести задачу к множественной линейной регрессии, если ввести
обозначения: x 2  z (линеаризирующее преобразование), что дает
y  A  Bx  Cz  
Для мультипликативной структуры будем иметь гетероскедастическую стохастическую компоненту:
Y  ( A  Bx  Cx 2 )  (1   )  A  Bx  Cx 2   ( A  Bx  Cx 2 )
5
2.Моделирование неслучайной компоненты обобщенной обратной
1
функцией D 
A  Bx
При аддитивной структуре стохастической компоненты будем иметь
1
Y
  z 
A  Bx
1
 A  Bx  ( A  Bx)
Y
Обычно предлагают использовать линеаризирующее преобразование
1
z
и применять МНК к выражению Z  A  Bx   , что неверно, т.к. ознаY
чает по сути принятие неканонической (просто «удобной») структуры
Y
1
.
A  Bx  
При мультипликативном вхождении стохастической компоненты
Y
1
1

(1   ) 

A  Bx
A  Bx A  Bx
имеем гетероскедастическую стохастическую компоненту (взвешенный
МНК).
Y
Y
A>0
B>0
1/B
A>0
B<0
{
1/A
X
-A/B
X
Y
Y
A<0
B>0
-A/B
A<0
B<0
X
X
1/A
1/A
6
3. Моделирование неслучайной компоненты обратной функцией
При аддитивной стохастической компоненте будем иметь
Y  A
B
 
x
Ax  B
 x,
1
 z  Y  A  Bz+
x
x
После данного линеаризирующего преобразования модель является линейной по параметрам. Стохастическая компонента – гомоскедастична,
можно применять МНК.
При мультипликативной стохастической компоненте
Y  (A 
B
)(1   )  A 
x
B
 A  
x
B
 .
x
Стохастическая компонента   A   
B
  является гетероскедастичной,
x
нужно использовать специальные методы сглаживания.
A>0
B>0
Зависимость между объемом выпуска X и
средними фиксированными издержками Y.
A
X
Зависимость между доходом X и спросом
на блага Y (например, на товары первой необходимости либо товары относительной роскоши); это так называемые функции Торнквиста
A>0
B<0
A
(в этом случае x  
B
- минимально необходиA
мый уровень дохода)
-B/A
X
Y
A<0
B>0
X
Кривая Филлипса, определяющая зависимость между уровнем безработицы X и
процентным изменением заработной платы Y.
При этом точка пересечения прямой с осью
OX - естественный уровень безработицы.
A
7
4. Моделирование неслучайной компоненты степенной функцией
Y  Ax

  e

Y  Ax  

Y  Ax  
Y  Ax
(1)
(2)
 3
* *
*
Для (1): l n Y  l n A   l n x   Y  A   x  ; Y*  l n y, A*  l n A, x*  l n x
Одно из условий (Гаусса-Маркова) для несмещенности, эффективности, состоятельности МНК оценок А* и  парной линейной регрессии является нормальный закон распределения стохастической компоненты,   ln e ,
следовательно, e - должна иметь логнормальное распределение. Данное
условие является существенным ограничением для возможности применения
операции логарифмирования.
Для (2): ln Y  ln A   ln x  ln  . При этом  должно быть неотрицательным:
также имеется ограничение для возможности применения операции логарифмирования.
lnε
ε
Для (3): ln Y  ln( Ax    ) .
Данную модель зачастую считают естественной в экономической практике. Однако в
этом случае прием логарифмирование для линеаризации и сведения задачи к парной линейной регрессии вообще не работоспособен,
необходимо обращение к другим методам.
8
5. Моделирование неслучайной компоненты логистическими кривыми (логистами)
В качестве экономических моделей, особенно в инновационной экономике, широко употребляют логистические модели (логисты, S-образные
модели, модели роста, модели жизненного цикла).
Некоторые примеры логистических процессов:
- изменение спроса на товары, обладающие способностью достигать некоторого
уровня насыщения; доля насыщения рынка новыми товарами и услугами, в том числе
описание числа пользователей российского Интернета; рост населения страны в страховых исследованиях; развитие биологических популяций; развитие тех или иных показателей технологических нововведений; динамика антисоциального поведения (коллективного протеста, тактики террористов, распространения наркотиков) и др.
1,2
1
0,8
0,6
0,4
0,2
0
0
2
4
6
8
10
12
14
16
18
20
Возможные виды логист
Технологический параметр
Технологический скачок
Технологический разрыв
Жизненный цикл технологии
Логистическая динамика замены технологий
9
Наиболее популярные модели логист:
1. D 
1

A  A exp  t
0
1
1

- модель Верхулста (Перла-Рида);
2.Обобщенная логистическая модель
1
, где обычно
m
A   Ai exp i t
0 I 1
t
3. D  A  BC - модель Гомперца;
D


m  3;
4. D  C 1  1   t   exp   t   - модель Рамсея.
Пример: Модель Верхулста для детерминированной компоненты: D 
1
 t
A0  A1e 1
В известном методе параметризации считают стохастическую компоненту мультиплика1
тивной, но по отношению к одному из слагаемых знаменателя: Y 
.
1t 
A Ae
e
0
1
Затем переходят к обратным значениям выборки определяемого параметра
1
 z , по-
D
1t
 e . Затем, считая A
0
 t
известной, используют прием логарифмирования для z  A  A e 1 , что дает парную
0
1
1
линейную регрессию ln T  ln A   t   (где T   A0 ) и возможность получения
1
Y
МНК-оценок.
Недостатки:- нелинейное преобразование исходной выборки (как результат – низкая точность моделирования и, особенно, прогнозирования), необходимость априорного знания
A0 (часто это информативный параметр), необходимость условия мультипликативности
лучают обобщенную показательную функцию z  A  A e
0
1
стохастической компоненты и ее логнормального закона распределения.
Вместо канонических структур, принятых в эконометрике,
Y
1
1t
  или Y 
1
1t
(1   )
A0  A1e
A0  A1e
в данном случае используют искусственную структуру вхождения стохастической компоненты:
10
6. Моделирование неслучайной компоненты гиперболическими
полиномами
m 1
1
1
,  T4k  
- равносторонняя гипербола;
Y 
i
А0 А1(k  )
i 0 А t
i
1
1
1
T5 


- квадратичная гипербола.
k A
2
A
(
k

)
A
(
k

)
0
1
2
7. Моделирование неслучайной компоненты дробно-рациональными функциями
D  A t  A  A /t ;
1
0
3
1
D
;
2
A t AtA
2
1
0
A
D  0  A - в случае «пространственной» динамики моделирует спрос на
2
A t
1
определенный вид товаров или услуг от уровня доходов потребителей: функция Торнквиста на товары относительной роскоши (товары второй необходимости), например,
дорогие продукты питания.
A t2  A t
1 - функция Торнквиста на малоценные товары.
D 2
2
t A
0
A t
D  0 - функцияТорнквиста на товары первой необходимости (например,
tA
1
на основные продукты питания).
A t2  A t
1 - функция Торнквиста на предметы роскоши.
D 0
tA
2
Функции Торнквиста являются упрощенными моделями спроса. Спрос
Гиффена.
11
Модели экономической (пространственной и временной)
динамики
Примеры пространственной динамики: спрос в функции цены;
объемы продаж в функции рекламного бюджета, объем привлекаемых банком средств в
функции нормы затрат на привлекаемые средства и т.д.
Примеры временной динамики: ежегодные, ежеквартальные, ежемесячные или
ежедневные данные по прибыли, остаткам на счетах банка, данные на кв. метр жилья,
объемы перевозок авиакомпании, показатели качества добываемой бокситовой руды, данные по ВНП, ВВП, объему экспорта, инфляции и т.д.
Равномерная дискретизация  Решетчатые функции
Y , Y ,Y , Y
t 1 t t 1 t  2
x , x ,x ,x
t 1 t t 1 t  2
Левая первая разность
yk
Y  Y  Y
k
k
k 1
}y
k+1
{
yk-1
Правая первая разность
Y  Y
Y
k 1 k
Симметричная первая разность
k-1
x
Y  Y
Y
k
k 1 k 1
k+1
Y
Y '  lim
t 0 t
2Y  Y  Y
 Y Y
Y
Y
 Y  2Y
Y
k
k
k 1
k
k 1 k 1 k  2
k
k 1 k  2
Динамические модели - используют не только текущие значения переменных, но и некоторые предыдущие по времени значения, а также само
время.
t  k  - временные ряды или
t  kh - пространственные ряды динамики  
1
2 f макс
.
12
Частота дискретизации гармонического сигнала
меньше частоты Найквиста
Частота дискретизации гармонического сигнала
равна частоте Найквиста
Частота дискретизации гармонического сигнала
больше частоты Найквиста
13
Временные ряды. Лаги в экономических моделях
При анализе многих экономических показателей (особенно в макроэкономике) часто используются ежегодные, ежеквартальные, ежемесячные и
ежедневные данные.
В этом случае следует упорядочить данные по времени их получения и
построить так называемые временные ряды.
Динамические модели
Модели с распределенными лагами
авторегрессионные модели
Модели с распределенными лагами. Лаговые переменные – переменные,
влияние которых характеризуется определенным запаздыванием. Это модели, содержащие в качестве лаговых переменных лишь независимые переменные.
Yk    0 xk  1xk 1 
  k xk l   k
Авторегрессионные модели. Это модели, уравнения которых в качестве
лаговых объясняющих переменных включают значения зависимых переменных.
Yk     xk   yk 1   k
Причин наличия лагов в экономике достаточно много, и среди них можно
выделить следующие:

Психологические причины – обычно выражаются через инерцию в поведении
людей. Например, люди тратят свой доход постепенно, а не мгновенно. Привычка
к определенному образу жизни приводит к тому, что люди приобретают те же блага в течение некоторого времени даже после падания реального дохода.

Технологические причины – например, изобретение персональных компьютеров не привело к мгновенному вытеснению ими больших ЭВМ в силу необходимости замены соответствующего программного обеспечения, которое потребовало
продолжительного времени.

Институциональные причины – например, контракты между фирмами, трудовые договоры требуют определенного постоянства в течение времени контракта.

Механизм формирования экономических показателей – например, инфляция во многом является инерционным процессом, денежный мультипликатор также проявляет себя на определенном временном интервале.
14
Оценка моделей с лагами в независимых переменных
Y    x   x

k
0 k
1 k 1
Y    x   x

k
0 k
1 k 1
 x
  - конечное число слагаемых;
e k e
k
  - бесконечное число слагаемых.
k
При конечном числе лагов – можно использовать замену переменных и
МНК.
x*  x , x*  x
,
0
k
1
k 1
, x*  x
e
k e
Y     x*   x* 
k
0 0 11
  x*  
e e k
- множественная линейная регрессия.
При бесконечном числе лагов необходимо последовательно увеличивать число слагаемых для того, чтобы остановиться на адекватном конечном
числе и затем осуществить замену переменных и МНК.
Декомпозиция рядов динамики
Учет сезонной и циклической компонент в ряде временной динамики
Аддитивный ряд динамики
Y T C  S  ,
k
k
k
k
k
Мультипликативный ряд динамики Yk  Tk  Ck  Sk   k ,
Аддитивно-мультипликативный ряд динамики
Y  {T  C }  S   или Y  T  C  S   .
k
k
k
k
k
k
k k
k
k
Критерием декомпозиции может быть и уровень компонент ряда: k  Tk , Sk  Tk , k  Sk , k  Ck .
Учет календарной и инфляционной компонент
Y T C  S  K  I 
k
k
k
k
k
k
k
или
Y  T C  S  K  I  .
k
k k k
k k k
15
Параметрические модели сезонных (циклических)
Компонент
S  A sin( k    )
3
где A3 – амплитуда гармоники,  = 2 /  – её частота, T - период,
- начальная фаза.

Sk  A0 / 2    Ar cos r k   Br sin r k  
r 1
где

,
n
n
n
2  Y cos k 
2  Y sin k 
 Yk
k
k
, n  T  , r  1, 2,3,...,
А  k 1 , Ar  k 1
, Br  k 1
0
n
n
n
Модели эволюции амплитуд
S  A ( k)sin( k    )
3

r
Sk  A0 / 2    Ar cos r k   Br sin r k  ( k  )
r 1
S  A  e k  sin( k    )
3
Y  D (1  D  sin( k    ))
k
k
Обобщенные параметрические модели авторегрессиискользящего среднего (ARMA-модели) (более 120 моделей)
Известно несколько видов авторегрессионных моделей:
- собственно модели авторегрессии (AR - auto regressive);
- модели скользящего среднего (MA - moving average);
- авторегрессии - скользящего среднего (ARMA – autoregressive moving average);
- модели авторегрессии - проинтегрированного скользящего среднего (ARIMA - autoregressive integrated moving average);
- модели авторегрессии с условной гетероскедастичностью (ARCH - autoregressive
conditional heteroscedasticity);
- расширения указанных выше авторегрессионных моделей: обобщенная авторегрессионная условно гетероскедастическая модель (GARCH – generalized autoregressive conditional heteroscedasticity model), интегрированная обобщенная авторегрессионная условно
гетероскедастическая модель (IGARCH - integrated generalized autoregressive conditional heteroscedasticity model) и др.
p
g
Y   i Y
   i
k i 1 k i i 1 k i
16
Моделирование неслучайной компоненты суммой линейного тренда и
гармоникой
Y  A k   A  A cos  k       .
1
0
3
k
k
- исходная модель
При k  4 сконструируем обобщенную параметрическую модель авторегрессии –скользящего среднего четвертого порядка:

 

Y  Y
 2Y
Y
2 Y
Y
Y
Y
 ,
1 k 1
k
k 2 k 3
k 1 k 2 k 3
k 4
k
где  k  1 k 1  2k 2  k 3   2 k 1  k 2  k 3   k 4 , . .
1  2 cos  .


1o  arg min M o {Yk  1 Yk 1  2Yk 2  Yk 3 
1


2 Y
Y
Y
Y
}.
k 1 k 2
k 3
k 4
 o  1/   arccos 1o / 2  2 n,

где

n  0,1, 2,... .
Сравнение значений R2 от числа наблюдений для
методов классической сезонной декомпозиции
и авторегрессии
1
0,9
0,8
0,7
R2
0,6
0,5
0,4
0,3
24
27
30
33
36
39
42
45
48
число наблюдений
метод авторегрессии
метод сезонной декомпозиции
17
Моделирование неслучайной компоненты суммой линейного тренда и двух гармоник
Y  A k   A  A sin( k    )  A sin( k    )  
1
0
3
1
1
6
2
2
k
k
- исходная модель
При k  6 сконструируем обобщенную параметрическую ARIMA - модель
Y  2Y
 3Y
 4Y
 3Y
 2Y
Y

k
k 1
k 2
k 3
k 4
k 5 k 6
(   )(Y
 2Y
 2Y
 2Y
Y
)
1
2 k 1
k 2
k 3
k 4
k 5
  (Y
 2Y
Y
)  ,
1 2 k 2
k 3 k 4
k
где 1  2cos 1, 2  2cos 2 ,  k - новая стохастическая компонента.
Придем к нормальной СЛАУ второго порядка.
Валовой сбор зерна по Самарской области в 1953 - 2005 гг. (в хозяйствах всех категорий; в весе после доработки)
4500
4000
3500
3000
2500
2000
1500
1000
500
0
1953 г.
1
9
6
3
г
.
1
9
7
3
г
.
1
9
8
3
г
.
1
9
9
3
г
.
2
0
0
3
г
.
Реальная выборка валового сбора зерна объёмом N = 8, её моделирование и
ошибка прогноза на один шаг
3000
2500
2000
Реальная выборка
Полученная
выборка
Прогноз
1500
1000
50
0
0
0
2
4
6
8
10
18
Моделирование содержания Al2O3 в нефелиновой среде
суммой линейной фнкции и гармоники
19
Моделирование неслучайной компоненты ряда динамики суммой логисты Рамсея, двух гармоник и линейной функции
Y  C (1  (1   k )e k  )  A3k   A2  sin(1k   1 )  
k
k
Результаты моделирования динамики изменения стоимости
строительно-монтажных работ в Самарской области за 2004 - 2006 гг.
20
Результаты моделирования динамики роста цен на бензин в 2004 – 2005 гг. логистой с линейным и синусоидальным трендами. Коэффициент детерминации
R 2  0.8959
Адекватность и точность модели
Точность модели характеризует ее близость расчетных наблюдений (модельных) с фактическими на интервале наблюдений (аппроксимации).
Точность найденной регрессии может оцениваться: D - размерная величина; R 2 - нормированная величина (0--1).
y  b0  b1 xi
21
Характеристики качества прогнозирования
1. Абсолютная ошибка прогноза:
 k  Yk  Yk* ,
*
где Yk - фактическое значение показателя на k -ое наблюдение; Yk - прогнозное значение
показателя на k -ое наблюдение;
2. Средняя абсолютная ошибка прогноза:
l

 Yk  Yk*
  k 1
l
,
где l – период упреждения («горизонт» прогноза);
3. Среднеквадратическая ошибка прогноза:
l
* 2
(Yk  Yk )

^
  k 1
.
l
Значения вышеперечисленных характеристик зависят от масштаба измерений, который может уменьшить объективность оценок.
Для того чтобы избежать этого, используют относительные характеристики ошибки прогноза:
4. Относительная ошибка прогноза:
*
Yk  Yk
k 
100% ;
Yk
5.Среднюю относительную ошибку прогноза (или среднеабсолютную
процентную) или MAPE – оценку:
*
 1 l Yk  Yk
  
100% ;
l k 1 Yk
6. Коэффициенты несоответствия (коэффициенты Тейла):
l
l
* 2
* 2
 (Yk  Yk )
 (Yk  Yk )
k 1
KT 1  k 1
KT 2 
;
.
l 2
l 2
l
*
2
 Yk
 Yk   (Yk )
k 1
k 1
k 1
22
Рекомендуемая литература
1. Эконометрика/Под ред. И.И.Елисеевой. - М.: Финансы и статистика, 2005. - 575 с.
2. Экономико-математические методы и прикладные модели/Под
ред. В.В.Федосеева. - М.: ЮНИТИ-ДАНА, 2005. - 304 с.
3. Янч Э. Прогнозирование научно-технического прогресса. - М.: Прогресс, 1974. – 380 с.
4. Твисс Б. Прогнозирование для технологов и инженеров. Практическое руководство для принятия лучших решений. Н.Новгород: Парсек - НН, 2001. - 256 с.
5. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. - М.: Финансы и статистика, 2003. 416 с.
6. Демиденко Е.З. Линейная и нелинейная регрессии. - М.: Финансы и статистика, 1981. - 302 с.
7. Бородич С.А. Эконометрика. - Минск: Новое знание. 2001.- 408 с.
23
Download