Uploaded by aladeya

Эконометрика вопросы для подготовки к экзамену

advertisement
1 Определение эконометрики. Предмет и методы эконометрики.
Эконометрика — это раздел экономики, занимающийся разработкой и применением
статистических методов для измерений взаимосвязей между экономическими переменными
Предмет эконометрики - изучение численных и количественных связей в экономике с целью
выявления зависимостей между различными экономическими переменными.
Методы эконометрики включают в себя статистические методы, математическое моделирование,
анализ временных рядов и другие методы.
2 Классификация моделей и типы данных.
ОСНОВНЫЕ КЛАССЫ МОДЕЛЕЙ
1. Регрессионные модели с одним уравнением - в таких моделях зависимая переменная - это функция
от независимых переменных, параметров и случайной составляющей
У = f(X,Β)+ξ = f(x1,x2,x3,…,xk; β1,β2,…,βk) + ξ
У – регрессант, зависимая переменная;
x1,x2,x3,…,xk – регрессоры, независимые переменные;
β1,β2,…,βk – параметры модели;
ξ – случайная составляющая
В зависимости от вида функции f(X,Β) различают линейную и нелинейную.
В зависимости от числа переменных различают парную и множественную регрессионную модель.
Парная линейная регрессия:
Y = α + βх + ξ (2 фактора)
Множественная линейная модель
Y = α + β1х1 + β2х2 +…+ βkхk + ξ
2. Системы регрессионных уравнений - модель состоит из регрессионных уравнений и тождеств,
каждое уравнение может включать в себя кроме объясняющих и объясняемые переменные из
других уравнений системы. Мы имеем набор взаимосвязанных переменных.
QDT - объем спроса в момент времени t.
QST – предложение товара в момент времени t.
pt , pt-1 – цены на товар в период времени t и t-1.
yt – совокупный или национальный доход в момент времени t.
QST =α0+α1 pt +α2 pt-1 +ξ1
QDT = β0+β1 pt +β2 уt +ξ2
QDT = QST = Q*
3. Модели временных или динамических рядов
модели тренда: T(t) = α+βt+ξ
модели сезонности: Y = f(t,β)+ξ
тренд-сезонные модели:


аддитивная Y(t)=T(t)+S(t)+ ξ
мультипликативная Y(t)=T(t)*S(t)*ξ
Типы данных используемых в эконометрике
1. Пространственные - набор показателей экономических переменных, полученный в
один и тот же период времени, но по разным объектам.
2. Временные - ряд значений некоторого экономического показателя, расположенных в
хронологической последовательности.
3. Панельные - набор показателей экономических переменных за некоторые промежутки
времени по нескольким объектам.
3 Этапы построения эконометрической модели.
1. Постановочный - формируется цель исследования, набор участвующих в модели экономических
переменных.
В качестве цели эконометрического моделирования обычно рассматривают:



анализ исследуемого экономического объекта (процесса);
прогноз его экономических показателей;
имитацию развития объекта при различных значениях экзогенных переменных,
выработку управленческих решений.
2. Априорный - проводится анализ сущности изучаемого объекта, формирование и формализация
априорной, т.е. известной до начала моделирования, информации
3. Параметризация - осуществляется моделирование, т.е. выбор общего вида модели и выявление
входящих в нее связей.
Основная задача: выбор вида функции f(X) в качестве эконометрической модели, в частности,
обоснование возможности использования линейной модели как наиболее простой.
4. Информационный - сбор необходимой статистической информации — наблюдаемых значений
экономических переменных.
5. Идентификация модели - оценка параметров модели и ее статистический анализ
6. Верификация модели





истинность модели;
адекватность модели;
спецификация, идентификация;
точность расчетов по данной модели;
соответствие построенной модели моделируемому реальному экономическому объекту
или процессу.
4 Модель парной регрессии.
Простейшая регрессионная модель:
Y= α + βx + U
Y - зависимая переменная, объясняемая, регрессант
х – независимая переменная, объясняющая, регрессор
α и β — параметры модели
U – случайная составляющая
Задача регрессионного анализа состоит в нахождении оценок α и β и в определении положения
регрессионной прямой по известным или наблюденным значениям X и Y при неизвестных
значениях U
5 Случайный член, причины его существования.
1. Не включение объясняющих переменных
Соотношение между Y и X - очень большое упрощение. Существуют и другие факторы, влияющие
на Y, которые не учтены в модели. Влияние этих факторов приводит к тому, что наблюдаемые
точки лежат вне прямой.
•
Невозможность измерения
•
Слабое влияние фактора
•
Отсутствия опыта или знаний
2. Агрегирование переменных
Во многих случаях зависимость — это попытка объединить вместе некоторое число
микроэкономических соотношений. Отдельные соотношения имеют разные параметры, любая
попытка определить соотношение между ними является лишь аппроксимацией.
3. Неправильное описание структуры модели
Если зависимость относится к данным о временном ряде, то значение Y может зависеть не от
фактического значения Х, а от значения, которое ожидалось в предыдущем периоде.
Если ожидаемое и фактическое значения тесно связаны, то будет казаться, что между Y и X
существует зависимость, но это будет лишь аппроксимация.
4. Неправильная функциональная спецификация
Функциональное соотношение между Y и X математически может быть определено неправильно.
Истинная зависимость может не являться линейной, а быть более сложной.
5. Ошибки измерения
Если в измерении одной или более взаимосвязанных переменных имеются ошибки, то
наблюдаемые значения не будут соответствовать точному соотношению.
Случайная компонента является суммарным проявлением всех факторов. Если бы случайной
компоненты не существовало, то мы бы знали, что любое изменение Y вызвано только
изменением X и смогли бы точно вычислить β.
6 Условия нормальной линейной регрессии (Гаусса-Маркова)
Для того чтобы регрессионный анализ, основанный на обычном МНК, давал наилучшие
результаты, случайный член должен удовлетворять четырем условиям, известным как условия
Гаусса—Mapкова.
1. Математическое ожидание случайной компоненты в любом наблюдении должно быть
равно нулю. Иногда величина случайной компоненты будет положительной, иногда
отрицательной, но она не должена иметь систематического смещения ни в одном из двух
возможных направлений.
Фактически если уравнение регрессии включает константу, то можно предположить, что это
условие выполняется автоматически, так как роль константы состоит в определении любой
систематической тенденции в поведении Y, которую не учитывают объясняющие переменные,
включенные в уравнение регрессии.
2. Дисперсия
случайной компоненты должна быть постоянна для всех
наблюдениях. Иногда случайная компонента будет больше, иногда меньше, однако не
должно быть априорной причины для того, чтобы она порождала большую ошибку в одних
наблюдениях, чем в других.
Если это условие выполняется, то говорят, что дисперсия ошибки гомоскедастична, если
нет, то - гетероскедастична.
3. Данное условие предполагает отсутствие систематической связи между значениями
случайной компоненты в любых двух наблюдениях. Например, если случайная компонента
велика и положительна в одном наблюдении, это не должно обусловливать
систематическую тенденцию к тому, что она будет большой и положительной в следующем
наблюдении.
Или большой и отрицательной, или малой и положительной, или малой и отрицательной
Случайные компоненты должна быть абсолютно независимы друг от друга.
Выполнение данного условия гарантирует отсутствие автокорреляции. В противном
случае, говорят, что случайная компонета автокоррелирована.
4. Случайная компонента должна быть распределена независимо от объясняющих
переменных.
7 Метод наименьших квадратов.
МНК является наиболее популярным методом нахождения оценок неизвестных параметров.
Критерий выбора наилучших параметров: минимизация суммы квадратов остатков.
Остаток или отклонение (е) – разница между наблюдаемым значением переменной Y и ее
теоретическим значением
в каждом наблюдении, т.е. при каждом значении X.
Метод наименьших квадратов используется дважды:
1) При определении приведенной формы модели и нахождении на ее основе оценок эндогенной
переменной
2) При определении структурных коэффициентов структурного сверхидентифицируемого
уравнения на основе оценок эндогенных переменных.
Двухшаговый метод наименьших квадратов является наиболее общим и широко
распространенным методом решения системы одновременных уравнений. Для точно
идентифицируемых уравнений ДМНК дает тот же результат, что и КМНК
8 Свойства коэффициентов регрессии.
Свойства коэффициентов регрессии
Коэффициенты регрессии, полученные методом наименьших квадратов (МНК), обладают
следующими свойствами:
Несмещенность (Unbiasedness): Оценки коэффициентов регрессии являются несмещенными, то
есть их математическое ожидание равно истинным значениям параметров. Это означает, что при
достаточно большом числе наблюдений оценки будут в среднем равны истинным параметрам:
Эффективность (Efficiency): Оценки коэффициентов имеют минимальную возможную дисперсию
среди всех несмещенных линейных оценок. Это свойство гарантируется при выполнении условий
Гаусса-Маркова.
Состоятельность (Consistency): Оценки коэффициентов являются состоятельными, то есть при
увеличении объема выборки они стремятся к истинным значениям параметров:
Нормальность (Normality): При условии нормальности случайного члена
ε оценки коэффициентов имеют нормальное распределение. Это свойство важно для проведения
статистических тестов и построения доверительных интервалов.
Линейность (Linearity): Оценки коэффициентов являются линейными функциями наблюдаемых
значений зависимой переменной
9 Нелинейная регрессия. Методы линеаризации.
Нелинейная регрессия используется, когда зависимость между переменными не является
линейной. Уравнение нелинейной регрессии может иметь вид:
Методы линеаризации
Для упрощения анализа нелинейных моделей часто применяются методы линеаризации,
позволяющие преобразовать нелинейную модель в линейную форму. Основные методы
линеаризации включают:
Методы оценки параметров в нелинейной регрессии:
Метод Ньютона-Рафсона: Итеративный метод, использующий производные функции для
нахождения минимальных значений.
Метод наименьших квадратов: Итерированный метод, применяемый для нелинейных моделей,
минимизирующий сумму квадратов отклонений.
Метод Марквардта-Левенберга: Комбинация метода градиентного спуска и метода наискорейшего
спуска.
Нелинейные модели сложнее в анализе и требуют более сложных методов оценки параметров,
однако они позволяют лучше описывать сложные зависимости между переменными.
В нелинейной регрессии параметры модели не могут быть оценены аналитически, как в линейной
регрессии, и требуют применения итеративных методов оптимизации для нахождения
оптимальных значений параметров. Некоторые из наиболее распространенных методов оценки
параметров в нелинейной регрессии включают:
1. Метод наименьших квадратов (МНК) с применением итерации: данный метод является
аналогом МНК в линейной регрессии, но требует многократного итеративного обновления
значений параметров модели до достижения оптимального приближения к истинным значениям
параметров.
2. Метод Ньютона-Рафсона: данный метод является итеративным методом оптимизации, который
использует информацию о производных и вторых производных функции потерь для обновления
параметров модели. Этот метод может быть эффективен, но требует вычислительной сложности в
работе с матрицами.
3. Метод градиентного спуска: этот метод оптимизации использует градиент функции потерь для
поиска минимума функции. Он подходит для нелинейных моделей с большим количеством
параметров и сложных функций потерь.
4. Метод Левенберга-Марквардта: данный метод сочетает в себе метод Ньютона-Рафсона и метод
градиентного спуска, что делает его более устойчивым к наличию локальных минимумов в
функции потерь.
5. Метод случайного поиска: данный метод основан на использовании случайных значений для
обновления параметров модели и может сходиться к оптимальным значениям в зависимости от
характеристик функции потерь и данных.
10 Функциональная спецификация модели парной регрессии.
Функциональная спецификация модели парной регрессии включает выбор формы уравнения
регрессии и идентификацию зависимой и независимой переменных. Общая форма модели парной
регрессии:
Выбор зависимой переменной: Определение переменной, которую мы хотим объяснить или
предсказать.
Выбор независимой переменной: Определение переменной, которую мы будем использовать для
объяснения зависимой переменной.
Определение функциональной формы: Решение, будет ли модель линейной или нелинейной. В
случае линейной регрессии мы предполагаем линейную зависимость между переменными.
Проверка предположений модели: Убедиться, что модель удовлетворяет условиям ГауссаМаркова (линейность параметров, нулевое среднее значение ошибки, гомоскедастичность и
отсутствие автокорреляции).
11 Интерпретация линейного уравнения регрессии.
12 Определение тесноты связи между факторами: линейный коэффициент корреляции,
коэффициент детерминации.
Анализ показателей тесноты связи
В качестве меры тесноты связи используется линейный коэффициент корреляции. Линейный
коэффициент корреляции, или коэффициент корреляции Пирсона, измеряет степень линейной
связи между двумя переменными. Его значения находятся в диапазоне от -1 до
r
xy  x y
 x y
 x  x 2  (x ) 2
где
 y  y 2  (y ) 2
rϵ[-1;1]
d – коэффициент детерминации
Коэффициент детерминации показывает на сколько процентов изменение Y обусловлено
изменением х.
d  r 2  100%
13 Оценка тесноты связи в нелинейной регрессионной модели.
Два коэффициента
измерения тесноты
связи:
(η) – теоретическое
корреляционное
отношение:
 2 ост
R  1 2
 общ
 факт

 2 общ
2
 общ   факт   ост
2
2
R – индекс
корреляции:
2
 2 ост  0
R 1
 2 ост   2 общ
R0
Коэффициенты корреляции должны быть подвергнуты оценке статистической значимости.
R2
n  m 1
Fфакт 
*
2
m
1 R
n – объем выборки, m – число параметров при регрессре х.
для объяснения возможности применения линейной функции. Чем больше кривизна линии регрессии,
тем
r 2  R2
Близость этих показателей означает, что можно использовать линейную функцию.
На практике пользуются таким правилом:
2
2
Если ( R  r )  0,1 , то предположение о линейной связи считается оправданным.
В противном случае проводится оценка значимости различия между этими коэффициентами,
вычисленными по одними и тем же данным.
В этом случае используется t-критерий Стъюдента.
R2  r 2
t факт 
se( R  r )
( R 2  r 2 )  ( R 2  r 2 ) * (r  ( R 2  r 2 ))
se( R  r )  2 *
n
tфакт  tкр 
различие существенны и замена нелинейной функции линейной невозможна.
На практике пользуются правилом: если:
t факт  2
то различие считается несущественным и можно использовать линейную функцию
даже если нелинейность обоснована эконометрически.
14 Оценка существенности параметров и статистическая проверка гипотез. t-критерий Стьюдента.
Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются
или нет данные наблюдений и выдвинутая гипотеза. Эта задача решается с помощью
специальных методов математической статистики – методов статистической проверки гипотез.
Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза
Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то время как в
действительности верна альтернативная гипотеза.
Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному
риску.
Последствия указанных ошибок неравнозначны. Что лучше или хуже – зависит от конкретной
постановки задачи и содержания нулевой гипотезы.
Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому
стремятся минимизировать потери от этих ошибок.
При этом одновременное уменьшение вероятностей данных ошибок невозможно, так как задачи их
уменьшения являются конкурирующими.
Снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить
другую.
Основной принцип проверки статистических гипотез можно сформулировать так:

если наблюдаемое значение критерия (вычисленное по выборке) принадлежит
критической области, то нулевую гипотезу отклоняют.

если же наблюдаемое значение критерия принадлежит области принятия гипотезы, то
нулевую гипотезу не отклоняют.
Точки, разделяющие критическую область и область принятия гипотезы, называют критическими.
В основу определения критических точек и критической области положен принцип практической
невозможности маловероятных событий.
Статистическая значимость коэффициента регрессии проверяется с помощью t-критерия
Стьюдента.
Для этого сначала необходимо определить остаточную сумму квадратов:

2
ост.


   yi  yi 



2
Ее среднее квадратическое отклонение:
 

2
ост.
n2
Критическое значение t-статистики определяется из таблицы распределения данной случайной
величины при заданном уровне значимости α и числе степеней свободы (n-2), где n – размер
выборки.
Если |tb|>tкр, то нулевая гипотеза отвергается и принимается альтернативная гипотеза о
статистической значимости коэффициента регрессии с вероятностью (1- α)
В противном случае, говорят, что «нет оснований отвергать нулевую гипотезу»: коэффициент
регрессии статистически незначим.
Для парной регрессии более важным является анализ статистической значимости коэффициента
b, так как именно в нем скрыто влияние объясняющей переменной Х на зависимую переменную Y.
15 Взаимосвязь t-статистики и F-статистики для парной регрессии.
Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам
определяется как:

2
фактор.
2
r
n  2
Fф.  2 n  2 
2
 ост.
1 r
Взаимосвязь t-статистики и F-статистики для парной регрессии
В модели парной регрессии существует тесная взаимосвязь между t-статистикой и F-статистикой.
Оба статистических критерия используются для проверки гипотез о значимости коэффициентов
регрессии, но они имеют различные формы применения:
t-статистика
t-статистика используется для проверки значимости отдельных коэффициентов. Как было
рассмотрено выше, она проверяет, значимо ли отклонение каждого отдельного коэффициента от
нуля.
F-статистика
F-статистика используется для проверки значимости всей модели в целом. Она проверяет,
объясняют ли независимые переменные значительную часть вариации зависимой переменной по
сравнению с моделью без независимых переменных (т.е. средней значением зависимой
переменной).
16 Коэффициент эластичности. Его смысл и определение.


Эластичность - степень изменения зависимой переменной в ответ на изменение
другой, независимой переменной.
Средний коэффициент эластичности показывает, на сколько процентов в среднем по
совокупности изменится результат y от своей средней величины при изменении
фактора х на 1% от своего среднего значения
x
Э  f ( x)
f ( x)
df
x
Э
*
dx f ( x)
f ( x)  yˆ  a  b * x
в отдельной точке:
xi
xi
Э  b*  b*
yˆ i
a  b * xi
x
Э  b*
a  b* x
- средний теоретический коэффициент эластичности
17 Оценка статистической значимости уравнения в целом. F-критерий Фишера.
Большинство эконометрических моделей требуют многократного улучшения и уточнения.
Для этого необходимо проведение соответствующих расчетов, связанных:
•
с установлением выполнимости или невыполнимости тех или иных предпосылок;
•
анализом качества найденных оценок;
•
достоверностью полученных выводов
Проверку статистической гипотезы осуществляют на основании данных выборки. Для этого
используют специально подобранную случайную величину (статистику, критерий), точное или
приближенное значение которой известно.
t - случайная величина распределена
по закону Стьюдента;
F - случайная величина распределена по закону Фишера.
Основной принцип проверки статистических гипотез можно сформулировать так:


если наблюдаемое значение критерия (вычисленное по выборке) принадлежит
критической области, то нулевую гипотезу отклоняют.
если же наблюдаемое значение критерия принадлежит области принятия гипотезы, то
нулевую гипотезу не отклоняют.
Оценка статистической значимости постороенной модели регрессии в целом производится с
помощью F-критерия Фишера. В качестве нулевой гипотезы используется утверждение о
незначимости коэффициента детерминации:
H0 : r 2  0
Соответственно, альтернативная гипотеза - коэффициент детерминации статистически значим:
H1 : r 2  0
Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам
определяется как:
2
 фактор
r2
.
n  2 
n  2
Fф. 
2
2
 ост.
1 r
Фактическое значение сравнивается с табличным значением случайной величины,
распределенной по закону Фишера.
Если Fфактич. > Fкрит., то нулевая гипотеза о незначимости коэффициента детерминации
отвергается и принимается альтернативная гипотеза – коэффициент детерминации статистически
значим.
В противном случае, нулевая гипотеза не отвергается.
18 Модель множественной регрессии.
Множественная регрессия – уравнение связи с несколькими независимыми переменными:
Можно записать линейную модель множественной регрессии в двух видах:
yi  1   2 xi 2  3 xi 3  ...   k xik  U i
i  1; n
yi  1 xi1   2 xi 2  3 xi 3  ...   k xik  U i
если xi1=1,
для любого i = [1;n]
Гипотезы, лежащие в основе множественной модели, являются естественным обобщением
модели парной регрессии:
1. Спецификация модели:
yi  1 xi1   2 xi 2  ...   k xik  U i
. xi1, xi2… xik - детерминированные величины xS=(x1S,
x2S…xnS)T линейно независимо в Rn
2
3.
E (U i )  0
2
E (U i )   2
E (U t ,U s )  0, t  s
2
U ~N(0, σ )
i
U i  N (0,  2 )
Если выполняются эти условия, то модель называется нормальной линейной регрессией.
Интерпретация множественного уравнения регрессии.
y    1 x1   2 x2  ...   k xk  u
yˆ  a  b1 x1  b2 x2  ...  bk xk
yˆ  116,7  0,112x1  0,739x2
x1 – доход потребителя (руб.)
х2 – цена продукта питания (руб.)
Y – расход на питание (руб.)
Коэффициенты регрессии b – показатели силы связи, характеризующие абсолютное изменение
результативного признака Y (в его единицах измерения) при изменении факторного признака х на
1 единицу своего измерения и при фиксированном влиянии остальных факторов, включенных в
модель.
Коэффициент а показывает совокупное влияние прочих факторов, не включенных в модель.
Используя коэффициенты регрессии можно рассчитать частные коэффициенты эластичности. Как
правило их рассчитывают для средних значений факторов:
xj
Э j  bj *  bj *
y
xj
k
a   bj x j
j 1
Частные коэффициенты эластичности имеют тот же смысл, что и обычные, добавляется лишь
ограничение на фиксированное значение остальных факторов.
Все коэффициенты регрессии должны быть подвергнуты оценке статистической значимости.
Процедура проверки такая же как и в парной линейной регрессии.
19 Ограничения модели множественной регрессии.
Мультиколлинеарность
Мультиколлинеарность возникает, когда независимые переменные сильно коррелированы друг с
другом. Это приводит к нестабильности оценок коэффициентов регрессии и затрудняет
интерпретацию результатов.
Неправильная спецификация модели
Неправильная спецификация модели может произойти в случае:



Пропуска важных независимых переменных.
Включения нерелевантных переменных.
Неправильного выбора функциональной формы модели.
Гетероскедастичность означает, что дисперсия случайного члена 𝜀 не является постоянной для
всех наблюдений. Это может привести к неэффективным оценкам коэффициентов и неверным
выводам.
Автокорреляция возникает, когда ошибки модели коррелированы между собой. Это часто
встречается в временных рядах и может приводить к неверным оценкам стандартных ошибок и
тестам значимости.
Линейность. Модель множественной регрессии предполагает линейную зависимость между
зависимой и независимыми переменными. В случае нелинейных зависимостей результаты могут
быть неверными.
Проблемы данных
Отбросы и выбросы: Наличие аномальных наблюдений может сильно влиять на оценки
коэффициентов.
Неполные данные: Пропущенные значения могут вызвать смещение оценок и потери информации.
Оценка модели
Модель множественной регрессии является мощным инструментом анализа, но требует
тщательной проверки предположений и корректного выбора переменных для получения надежных
и значимых результатов.
20 Идентификация параметров множественной регрессии МНК.
22 Показатели тесноты связи во множественном регрессионном анализе - парные и частные
коэффициенты корреляции.
23 Мультиколлинеарность и пути ее разрешения.
Мультиколлинеарность (коллинеарность)– ситуация, когда регрессоры тесно связаны между
собой. Если объясняющие переменные связаны строгой функциональной зависимостью, то
говорят о совершенной мультиколлинеарности.
Y  a  b1 x1  b2 x2  b3 x3
где Y - общая величина расходов на питание;
x1 - заработная плата;
x2 - доход, получаемый вне работы;
x3 - совокупный доход.
Для оценки мультиколлинеарности составляется и анализируется матрица парных коэффициентов
корреляции.
Мультиколлинеарность может затруднять интерпретацию модели, но существует множество
методов для ее диагностики и устранения, которые позволяют получить более надежные и
интерпретируемые результаты.
25 Стандартизированное уравнение множественной регрессии.
Существует другой подход к построению множественной регрессии – уравнение регрессии в
стандартизированном масштабе. Для этого введем стандартизированные переменные
Z y , Z x1 ,..., Z xk
Zy 
Z xk 
( y  y)
y
( xk  x )
x
k
Для этих переменных среднее значение равно 0, а среднее квадратическое отклонение равно 1.
Z y  b1Z x1  b2 Z x2  ...  bk Z xk  U
К этому уравнению можно применить МНК. Система:
ryx1  1   2 rx1 x2   3 rx1x3  ...   k rx1xk
ryx2  1rx2 x1   2   3 rx2 x3  ...   k rx2 xk
...
ryxk  1rxk x1   2 rxk x2   3 rxk x3  ...   k
β – стандартизированные коэффициенты регрессии.
Данные коэффициенты сравнимы между собой и можно ранжировать факторы по силе
воздействия на результат.
Стандартизированный коэффициент регрессии – показывает, на сколько средних квадратических
отклонений изменится результат, если соответствующий фактор изменится на 1 сигма при
неизменной величине остальных факторов.
Пример: Пусть функция издержек производства Y (тыс.руб.) характеризуется уравнением вида:
Yˆ  200  1,2 x1  1,1x2
где x1 – основные производственные фонды (тыс.руб.) x2 – численность занятых в производстве
(чел.)
Построим уравнение в стандартизированном масштабе:
Z y  0,5  Z x1  0,8 Z x2
26 Коэффициент множественной корреляции, скорректированный коэффициент множественной
корреляции, множественный коэффициент детерминации.
Коэффициент множественной корреляции используется для оценки тесноты связи между
зависимой переменной и всеми регрессорами, включенными в модель.
R
 2 факт
 2 ост
 1 2
2
 общ
 общ
R  0;1
R2 – коэффициент множественной детерминации
R 2 *100  доля вариации у, обусловленная включенными в модель факторами
(1  R 2 ) *100  доля вариации Y, обусловленная не включенными в модель факторами.
Скорректированы коэффициент множественной корреляции.
Коэффициент R2 показывает качество подгонки регрессионной модели к наблюдаемым значениям
уi.
Если R2 = 0, то регрессионная модель не улучшает качество прогноза по сравнению с
тривиальным (прогнозное значение зависимой переменной равно ее среднему значению).
Если R2 =1, то регрессия точно подогнана. Все остатки еi =0.
При добавлении объясняющей переменной в уравнение регрессии R2 никогда не уменьшается, а
обычно увеличивается. Если взять число регрессоров = числу наблюдений, всегда можно
добиться, что R2 =1. Однако это не означает, что данная модель имеет экономический смысл.
Такой недостаток R2 можно исправить, налагая штраф за введение дополнительного регрессора
на величину коэффициента корреляции. Такой коэффициент называют скорректированным
коэффициентом множественной корреляции.
n 1
k
2
R  1  (1  R )
R 
(1  R 2 )
n  k 1
n  k 1
2
2
Проверка статистической значимости множественного коэффициента корреляции осуществляется
также как и в парном анализе. Фактическое значение статистики Фишера определяется по
формулам:
R2
nk
Fф 
*
1 R2 k 1
R2 k
Fф 
(1  R 2 )
(n  k  1)
27 Оценка статистической значимости множественных коэффициентов регрессии, t-критерий
Стьюдента.
28 Модели с переменной структурой (фиктивные переменные).
Как правило независимые переменные имеют непрерывные области измерения (возраст, стаж,
денежные доходы, уровень безработицы).
Однако, существуют переменные которые могут принимать два значения или в общем случае
дискретное множество значений.
Необходимость в таких переменных возникает в тех случаях, когда требуется учесть влияние
качественных признаков (пол, национальность, уровень образования и т.д).
Для того чтобы вести такие переменные в регрессионную модель, им должны быть присвоены те
или иные цифровые метки, т.е. качественные переменные необходимо преобразовать в
количественные.
Такого вида сконструированные переменные в эконометрике принято называть фиктивными
переменными.
Например, рассмотрим модель формирования заработной платы (Y) от количества отработанных
часов (X1) и стажа работы (X2).
y    1 x1   2 x2  U
Зависит ли заработная плата от пола работника?
На практике используется два метода моделирования:
1. Регрессия строится для каждой качественно отличной группы единиц совокупности, т.е.
для каждой группы в отдельности;
2. Общая регрессионная модель строится для совокупности в целом. В этом случае в
регрессионную модель вводятся фиктивные переменные, т.е. строится модель с
переменной структурой.
y    1 x1   2 x2  1d1  U
Ведем переменную d1, присвоив ей значения по следующему правилу:
d1 = 1, если работник мужчина;
d1 = 0, если работник женщина;
Тогда ожидаемое значение заработной платы при одинаковых значениях количества
отработанных часов и стажа будет:
Для мужчин
Yˆ  a  b1 x1  b2 x2   1
Для женщин
y  a  b1 x1  b2 x2
Заработная плата мужчин и женщин отличается на величину γ.
Проверив с помощью t-статистики значимость коэффициентов регрессии, можно определить,
имеет ли место дискриминация по половому признаку.
Если коэффициент γ статистически значим, то очевидно, что есть различия в оплате труда мужчин
и женщин при прочих равных условиях. Если этот коэффициент положителен, то дискриминация в
пользу мужчин, если отрицателен – в пользу женщин.
Переменные такого типа во всем остальном не отличаются от обычных непрерывных регрессоров
для оценивания уравнения с фиктивными переменными МНК коэффициент при фиктивной
переменной интерпретируются также как и при остальных регрессорах.
Качественные различия можно формализовать с помощью любой переменной принимающей два
значения не обязательно 0 и 1.
30 Нелинейные модели множественной регрессии: виды нелинейности.
Нелинейные модели регрессии используются, когда зависимость между зависимой и
независимыми переменными не может быть адекватно описана линейной функцией. Эти модели
позволяют учитывать более сложные взаимосвязи.
Данная модель не является линейной функцией относительно X (производная зависимой
переменной Y по X, указывающая на изменение Y по отношению к изменению X, будет зависеть от
X:
dY
 A X  1
dX
т.е. не будет константой, что присуще только нелинейным моделям)
Стандартным и широко используемым подходом к анализу функций данного рода в эконометрике
является логарифмирование по экспоненте (по основанию е = 2,71828...). Такие логарифмы
называются натуральными логарифмами и обозначаются ln X, ln Y.
ln Y  ln A   ln X
Данная модель является линейной моделью. Если все необходимые предпосылки классической
линейной регрессионной выполнены, то по МНК можно определить наилучшие линейные
несмещенные оценки коэффициентов
Y   0  X  
*
Примеры моделей 1 класса:
Y    1 x   2 x 2  U
*
Y  

x
U
Вторая группа
нелинейных моделей
(нелинейные по
оцениваемым
параметрам)
Могут быть
линеаризованы, т.е.
приведены к линейному
виду и оценены МНК.
Внутренне линейные
Не приводятся к
линейному виду и не
могут быть оценены МНК.
Внутренне нелинейные
К моделям первой группы относятся
- степенная функция:

Y    X U
показательная функция:
Y     U
x
экспоненциальная функция:
Y e
   x
U
Во всех примерах после логарифмирования получим линейные относительно параметров функции
и можем оценить их параметры МНК.
К моделям второй группы относятся:

Y    X U
Y     U
x
   x
Y e
U

Y      x U
В всех приведенных примерах функции нельзя линеаризовать и следовательно
идентифицировать параметры МНК.
В таких случаях используют итерационные процедуры оценки нелинейных регрессий или
специальные методы.
32 Понятие временного ряда, элементы ряда.
Временной ряд — это последовательность наблюдений за изменением какого-либо показателя во
времени. Наблюдения фиксируются через равные интервалы времени, такие как дни, месяцы,
кварталы или годы. Временные ряды используются для анализа тенденций, сезонных колебаний и
других временных закономерностей.
Элементы временного ряда





Тенденции, которая характеризует общую динамику исследуемого явления или процесса.
Аналитическая тенденция – это некоторая функция времени, называемая трендом (T).
Периодической или циклической составляющей, которая характеризует периодические
или циклические колебания анализируемого явления. Колебания – это отклонения
фактических значений от значений тренда. Например, продажи некоторых товаров
подвержены сезонным колебаниям.
Сезонными колебаниями являются периодические колебания, имеющие отдельный и
постоянный период, который равен годовому промежутку. Колебания конъюнктуры
происходят в условиях больших экономических циклов, период таких колебаний как
правило равен нескольким годам.
Случайной составляющей, являющейся результатом воздействия многих случайных
факторов
33 Основные модели временных рядов.
Временные ряды используются для анализа и прогнозирования данных, зависящих от времени.
Существует несколько основных моделей временных рядов:
34 Оценивание параметров моделей временных рядов.
Оценивание параметров моделей временных рядов в эконометрике является процессом оценки
неизвестных параметров модели на основе имеющихся данных временного ряда. Здесь несколько
ключевых методов оценки параметров моделей временных рядов в эконометрике:
1. Метод наименьших квадратов (МНК): Один из основных методов оценки параметров моделей
временных рядов. При использовании этого метода параметры модели подбираются таким
образом, чтобы минимизировать сумму квадратов разностей между фактическими и
предсказанными значениями.
2. Метод максимального правдоподобия (MLE): Другой широко используемый метод для оценки
параметров временных рядов в эконометрике. Он стремится максимизировать вероятность
получения фактических данных при заданной модели.
3. Метод обобщенного метода моментов (GMM): Этот метод также используется для оценки
параметров моделей временных рядов. Он основан на минимизации расстояния между
теоретическими и эмпирическими моментами выборки.
4. Метод максимального правдоподобия в пространстве состояний (State Space Maximum
Likelihood): Этот метод применяется для оценки параметров моделей пространства состояний,
которые могут быть использованы для анализа и прогнозирования временных рядов.
5. Метод устойчивых оценок ковариации (Heteroskedasticity-robust Estimation): Для учета
гетероскедастичности в данных временных рядов применяются методы устойчивых оценок
ковариации, такие как метод Робастные стандартные ошибки.
6. Метод анализа спектральной плотности (Spectral Density Estimation): Используется для оценки
параметров моделей временных рядов на основе их спектральной плотности.
35 Оценка значимости параметров моделей временных рядов
Оценка значимости параметров моделей временных рядов в эконометрике играет важную роль,
поскольку позволяет определить, какие параметры действительно влияют на поведение
временного ряда и с какой степенью уверенности. Здесь несколько ключевых методов для оценки
значимости параметров моделей временных рядов:
1. t-статистика: Один из наиболее распространенных методов для оценки значимости параметров
моделей. Статистика t вычисляется как отношение оценки параметра к его стандартной ошибке.
Если значение t-статистики значительно отличается от нуля, то параметр считается значимым.
2. p-значение: Другой распространенный метод для оценки значимости параметров. P-значение
указывает на вероятность получить такое или еще более экстремальное значение статистики,
если нулевая гипотеза (о равенстве параметра нулю) верна. Если p-значение меньше уровня
значимости (обычно 0.05), параметр считается значимым.
3. Доверительные интервалы: Оценка значимости параметров также может быть выполнена путем
анализа доверительных интервалов для параметров модели. Если доверительный интервал не
содержит нуля, это указывает на значимость параметра.
4. F-статистика: Для множественной регрессии F-статистика может использоваться для оценки
значимости параметров модели в целом. Она показывает, насколько объясненная модель
различается от модели без параметров.
5. Информационные критерии: Информационные критерии, такие как AIC (Критерий Акаике) и BIC
(Критерий шурина), могут быть использованы для выбора наиболее значимой модели на основе
баланса между точностью и сложностью.
Оценка значимости параметров моделей временных рядов помогает выявить важные факторы,
влияющие на временной ряд, и улучшить точность моделирования и прогнозирования.
Download