Эконометрика - Институт управленческих технологий и

Министерство сельского хозяйства Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Самарская государственная сельскохозяйственная академия» Кафедра «Статистика и экономический анализ» КОНСПЕКТЫ (ТЕЗИСЫ) ЛЕКЦИЙ по дисциплине «Эконометрика» по направлению: 080100.68 «Экономика» Кинель 2010 Тема 1. Сущность и задачи науки «Эконометрика» 1. Место и роль эконометрики в экономической науке и практике. 2. Виды эконометрических моделей. 3. Этапы эконометрического моделирования. 4. Классификация видов эконометрических переменных и типов данных. 1. Термин «эконометрика» имеет в своей основе два слова: «экономика» и «метрика» (от гр, metron — "метод расчета определения расстояния между двумя точками в пространстве"). В общем случае эконометрику можно определить как науку об экономических измерениях. Эконометрика - это наука, которая на основе статистических данных количественно характеризует взаимозависимые экономические явления и процессы. Предмет исследования эконометрики - это массовые экономические процессы и явления. Предметы исследования эконометрики и статистики очень схожи, тем более что большинство эконометрических методов изучения социально - экономических закономерностей позаимствованы из статистики. Однако специально для эконометрики были разработаны некоторые дополнения методов, которые не применяются в статистике. Цель эконометрики - это количественная характеристика экономических закономерностей, выявляемых экономической теорией в общих чертах. Эконометрика как наука является следствием междисциплинарного подхода к изучению экономики. На современном этапе своего развития эконометрика представляет собой сочетание трех наук: 1) экономической теории; 2) математики, 3) математической и экономической статистики. Помимо вышеназванных дисциплин, одним из основных факторов развития эконометрики является развитие компьютерных технологий и специализированных пакетов прикладных программ. Следовательно, эконометрика с помощью статистических и математических методов анализирует экономические закономерности, доказанные экономической теорией. Задачи, решаемые с помощью эконометрики, классифицируются по трем признакам: 1) по конечным прикладным целям: а) задачи прогноза социально-экономических показателей, характеризующих состояние и развитие изучаемой системы; б) задачи моделирования возможных вариантов социальноэкономического развития системы для определения параметров, которые оказывают наиболее сильное влияние на состояние системы в целом; 2) по уровню иерархии: а) задачи макроуровня (страна а целом); б) задачи мезоуровня (уровень отраслей, регионов); в) задачи микроуровня (уровень фирмы, семьи, предприятия); 3) по области решения проблем изучаемой экономической системы: а) задачи изучения рынка; б) задачи изучения инвестиционной, социальной, финансовой политики; в) задачи изучения ценообразования; г) задачи изучения распределительных отношений; д) задачи изучения спроса и потребления; е) задачи изучения отдельно выделенного комплекса проблем, Решение перечисленных задач эконометрики осуществляется с использованием математических моделей, построенных на основе эмпирических данных. 2. Существует три основных класса эконометрических моделей. 1. Модели временных рядов представляют собой зависимость результативной переменной от переменной времени или переменных, относящихся к другим моментам времени. Модели временных рядов, в которых результативная переменная зависит от времени: 1) модель тренда (зависимость результативной переменной от трендовой компоненты); 2) модель сезонности (зависимость результативной переменной от сезонной компоненты); 3) модель тренда и сезонности. Модели временных рядов, в которых результативная переменная зависит от переменных, датированных другими моментами времени: 1) объясняющие вариацию результативной переменной в зависимости от предыдущих значений факторных переменных - модели с распределенным лагом; 2) объясняющие вариацию результативной переменной в зависимости от предыдущих значений результативных переменных - модели авторегрессии; 3) объясняющие вариацию результативной переменной в зависимости oт будущих значений факторных или результативных переменных - модели ожидания. Модели временных рядов могут быть построены по стационарным и нестационарным временным рядам. Для стационарного временного ряда характерны постоянные во времени средняя, дисперсия и автокорреляция. 2. Регрессионные модели с одним уравнением, в которых результативная (зависимая) переменная у может быть представлена в виде функции факторных (независимых) переменных. По количеству факторных переменных регрессионные модели делятся на парные (с одной переменной) и множественные регрессии. По виду функции регрессионные модели делятся на линейные и нелинейные регрессии. 3. Системы одновременных уравнений, которые описываются системами взаимозависимых регрессионных уравнений. Системы состоят из тождеств и регрессионных уравнений, каждое из которых может включать в себя как факторные переменные, так и результативные переменные из других уравнений системы. Отличие тождеств от регрессионных уравнений заключается в том, что их вид и значения параметров известны. Регрессионные уравнения, входящие в состав системы, называются поведенческими уравнениями. Значения параметров этих уравнений являются неизвестными и подлежат оцениванию. Примером системы одновременных уравнений служит модель спроса и предложения, состоящая из трех уравнений: (уравнения предложения, уравнения спроса, тождества равновесия). 3. В эконометрическом моделировании наиболее распространенными являются следующие эконометрические модели: 1) модели потребительского и сберегательного потребления; 2) модели взаимосвязи риска и доходности ценных бумаг; 3) модели предложения труда; 4) макроэкономические модели (модель роста); 5) модели инвестиций. Этапы эконометрического моделирования. 1. Постановочный этап, на котором определяются конечные цели и задачи исследования, а также число включенных в модель факторных и результативных экономических переменных. Цели эконометрического исследования: 1) анализ изучаемого экономического процесса (явления, объекта); 2) прогноз экономических показателей, характеризующих изучаемый процесс (явление, объект); 3) моделирование поведения процесса при различных значениях факторных переменных; 4) формирование управленческих решений. Количество переменных, включенных в эконометрическую модель, не должно быть слишком большим и должно быть теоретически обоснованным. В модели должна отсутствовать функциональная или тесная корреляционная связь между факторными переменными, что может привести к явлению мультиколлинеарности. 2. Априорный этап, на котором осуществляется теоретический анализ сущности изучаемого процесса, а также формализуется априорная информация. 3. Этап параметризации, на котором происходит выбор общего вида модели, а также определяется состав и формы формирующих ее связей. Задачи, решаемые на этапе параметризации: 1) задача выбора наиболее подходящего вида функциональной зависимости результативной переменной от факторных переменных. При возникновении ситуации выбора между линейной и нелинейной формами зависимости предпочтение всегда отдается линейной форме как более простой; 2) задача спецификации модели: а) аппроксимация математической формой обнаруженных связей и соотношений между параметрами модели; б) определение зависимых и независимых переменных: в) выражение исходных предпосылок и ограничений модели. 4. Информационный этап, на котором собирается требуемая статистическая информация и осуществляется анализ качества собранных данных. 5. Этап идентификации модели, на котором реализуется статистический анализ модели и происходит оценивание ее параметров. 6. Этап оценки качества модели, на котором проверяются достоверность и адекватность модели. Созданная модель должна быть адекватна реальному экономическому процессу. При неудовлетворительном качестве модели возвращаются ко второму этапу моделирования. 7. Этап интерпретации результатов моделирования. 4. В эконометрике применяется два основных типа выборочных данных: 1) пространственные; 2) временные. Пространственные данные - это совокупность экономической информации, характеризующей разные объекты и полученной за определенный период или момент времени. Пространственные данные являются выборочной совокупностью из некоторой генеральной совокупности (например, совокупность различной информации по какому-либо предприятию - размер основных фондов, численность работников). Временные данные - это совокупность экономической информации, характеризующей определенный объект, но за различные периоды времени. Отдельный временной ряд можно считать выборкой из бесконечного ряда значений показателей во времени (например, данные о динамике фондовых индексов). Существуют определенные отличия временного ряда или ряда динамики от пространственной выборки: 1) элементы ряда динамики естественным образом упорядочены во времени в отличие от пространственных данных; 2) элементы ряда динамики не являются статистически независимыми в отличие от элементов случайной пространственной выборки, т.е. они подвержены зависимости между прошлыми и настоящими наблюдениями временного ряда (автокорреляции); 3) элементы ряда динамики не являются одинаково распределенными величинами. Набор переменных - это совокупность экономической информации, характеризующей изучаемый процесс или объект. В эконометрической модели используются: 1) результативные (зависимые) переменные, которые в эконометрике называются объясняемыми переменными, 2) факторные (независимые) переменные, которые в эконометрике называются объясняющими переменными. Среди экономических переменных, включенных в эконометрическую модель, выделяют: 1) экзогенные (независимые) переменные, значения которых задаются извне. В определенной степени данные переменные являются управляемыми; 2) эндогенные (зависимые или взаимозависимые) переменные (у), значения которых определяются внутри модели; 3) лаговые (экзогенные или эндогенные) переменные, которые относятся к предыдущим моментам времени и находятся в уравнении с переменными, относящимися к текущему моменту времени. Например: х лаговая экзогенная переменная, у - лаговая эндогенная переменная; 4) предопределенные (объясняющие) переменные, к которым относятся лаговые (xt-1,), текущие (х) экзогенные переменные и лаговые эндогенные переменные (уt-1). Основная цель эконометрического моделирования - это характеристика значений одной или нескольких текущих эндогенных переменных в зависимости от значений предопределенных (объясняющих) переменных. 1. 2. 3. 4. 1. 2. 3. 4. Вопросы для самоконтроля Дайте определение эконометрики. Перечислите основные задачи, решаемые с помощью эконометрики. Назовите основные классы эконометрических моделей. Перечислите основные этапы эконометрического моделирования. Рекомендуемая литература Арженовский С.В., Федосова О.Н. Эконометрика: Учебное пособие /Рост. гос. экон. универ. Ростов н/Д., 2002. - 102 с. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1997. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005.-576с. Эконометрика: Учебник /Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2002.-480 с. Тема 2. Парная регрессия и корреляция 1. 2. 3. 4. 5. 6. Спецификация модели. Линейная регрессия и корреляция: смысл и оценка параметров. Оценка значимости параметров линейной регрессии и корреляции. Интервальный прогноз на основе линейного уравнения регрессии. Нелинейная регрессия. Корреляция для нелинейной регрессии. Средняя ошибка аппроксимации. 1. Любое эконометрическое исследование начинается со спецификации модели, т. е. с формулировки вида модели исходя из соответствующей теории связи между переменными. В первую очередь из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. В этом случае нужно знать, какие остальные факторы предполагаются неизменными, возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной. Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых: yj  ~ y xj   j где у, — фактическое значение результативного признака; ухj — теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т. е. из уравнения регрессии; Ej - случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии. Случайная величина  , или возмущение, включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных. К ошибкам спецификации будет относиться не только неправильный выбор той или иной математической функции для ~y x , но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной. Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего работает с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики. Использование временной информации также представляет собой выборку из всего множества хронологических дат. Изменив временной интервал, можно получить другие результаты регрессии. Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки — увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов. Приведем еще один пример: в настоящее время органы государственной статистики получают балансы предприятий, достоверность которых никто не подтверждает. Последующее обобщение такой информации может содержать ошибки измерения. Исследуя, например, в качестве результативного признака прибыль предприятий, мы должны быть уверены, что предприятия показывают в отчетности адекватные реальной действительности величины. Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели. В парной регрессии спецификация модели связана с выбором вида математической функции, а в множественной — также с отбором факторов, включаемых в модель. 2. Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида: ~ yx  a  b * x   Уравнение такого вида позволяет по заданным значениям фактора х иметь теоретические значения результативного признака подстановкой в него фактических значений фактора х. Построение линейной регрессии сводится к оценке ее параметров — а и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбрав на графике две точки, провести через них прямую линию, затем по графику найти значения параметров. Параметр а определим как точку пересечения линии регрессии с осью оу, а параметр b оценим исходя из угла наклона линии регрессии как dy/dx, где dy — приращение результата у, a dx — приращение фактора х. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). Можно воспользоваться следующими формулами для определения параметров значений а и b: a  y  bx b  ( x  x )( y  y) (x  x) 2 b yx  y * x x2  x 2 Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Знак при коэффициенте регрессии b показывает направление связи: при b > 0 — связь прямая, а при b < 0 — связь обратная. Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях. Формально а — значение у при х = 0. Если признак-фактор x не имеет и не может иметь нулевого значения, то трактовка свободного члена а не имеет смысла. Параметр а может не иметь экономического содержания. Попытки экономически интерпретировать параметр а могут привести к абсурду, особенно при а<0. Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора. Иными словами, вариация результата меньше вариации фактора — коэффициент вариации по фактору х выше коэффициента вариации для результата у: Vх> Vу. Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy . Имеются разные модификации формулы линейного коэффициента корреляции, например: rxy   (( x  x )( y  y ))  ( y  y) *  ( x  x ) 2 x  (x  x) n 2 или 2 y  rxy  b  ( y  y) n 2 x y Как известно, линейный коэффициент корреляции находится в границах - 1 < rxy < 1. Если коэффициент регрессии b > 0, то 0 < rxy < 1, и, наоборот, при b<0 - 1<rxy<0. Следует иметь в виду, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствия связи между признаками. При иной спецификации модели связь между признаками может оказаться достаточно тесной. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции r2xy, называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака: r 2 yx   2 y объясн.  2 y общ Соответственно величина 1 - r2 характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов. Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные. Линейный коэффициент корреляции как измеритель тесноты линейной связи признаков логически связан не только с коэффициентом регрессии b, но и с коэффициентом эластичности, который является показателем силы связи, выраженным в процентах. При линейной связи признаков X и у средний коэффициент эластичности в целом по совокупности определяется как Эb x y т. е. его формула по построению близка к формуле линейного коэффициента корреляции ryx  b x y Несмотря на схожесть этих показателей, измерителем тесноты связи выступает линейный коэффициент корреляции (ryx), a коэффициент регрессии (b) и коэффициент эластичности (Э) — показатели силы связи: коэффициент регрессии является абсолютной мерой, так как имеет единицы измерения, присущие изучаемым признакам у и х, а коэффициент эластичности — относительным показателем силы связи, потому что выражен в процентах. 3. После того как уравнение линейной регрессии найдено, проводится оценка значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии в целом дается с помощью Fкритерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части — «объясненную» и «остаточную»: ( y  y)  ( ~y 2 x  y) 2  ( y  ~ yx )2 Любая сумма квадратов отклонений связана с числом степеней свободы df {degrees of freedom), т.е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет n-2. Число степеней свободы для общей суммы квадратов определяется числом единиц, и поскольку мы используем среднюю вычисленную по данным выборки, то теряем одну степень свободы, т. е. dfобщ = п - 1. Итак, имеем два равенства: 1) ( y  y) 2  ( ~y x  y) 2  ( y  ~y x ) 2 2) п - 1 = 1 + (n - 2). Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы D. Dобщ  ( y  y)  n 1 2 ; Dфакт (~ y   x 1  y) 2 ; Dост (y  ~ y )   2 x n2 Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения, т. е. критерий F: F Dфакт Dоcт Если нулевая гипотеза Но справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если Но несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Табличное значение F-критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение Fотношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи. Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: Fфакт < Fтабл , Н0 не отклоняется. Величина F-критерия связана с коэффициентом детерминации r2. Тогда значение F-критерия можно выразить следующим образом: F r2 (n  2) 1 r 2 В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: тb и та. Стандартная ошибка коэффициента регрессии параметра тb рассчитывается по формуле:  ( y  ~y ) /( n  2)  (x  x) 2 mb  x 2 Отношение коэффициента регрессии к его стандартной ошибке дает tстатистику, которая подчиняется статистике Стьюдента при (n-2) степенях свободы. Эта статистика применяется для проверки статистической значимости коэффициента регрессии и для расчета его доверительных интервалов. Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т. е. определяют фактическое значение t-критерия Стьюдента, которое затем сравнивают с табличным значением при определенном уровне значимости а и числе степеней свободы (n - 2). tb  b mb Стандартная ошибка параметра а определяется по формуле: ma   ( y  ~y ) 2 x n *  (x  x) 2 x * n2 2 Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции тr: mr  1 r 2 n2 Фактическое значение t-критерия Стьюдента определяется: tr  ryx 1 r 2 * n2 Таким образом, проверка гипотез о значимости коэффициента регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии. 4. В прогнозных расчетах по уравнению регрессии определяется предсказываемое ур значение как точечный прогноз ух при хр = хк, т. е. путем подстановки в линейное уравнение регрессии соответствующего значения х. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки ух, т. е. m~y x и соответственно мы получаем интервальную оценку прогнозного значения у*: ~ y x  m~y x  y *  ~ y x  m~y x m~y  Dост * 1  n ( xk  x ) 2 (x  x)2 Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении хk характеризует ошибку положения линии регрессии. Величина стандартной ошибки myx достигает минимума при хk = х среднему и возрастает по мере того, как «удаляется» от х среднего в любом направлении. Иными словами, чем больше разность между хk и х среднего, тем больше ошибка myx , с которой предсказывается среднее значение у для заданного значения xk.Можно ожидать наилучшего результата прогноза, если признак-фактор ч находится в центре области наблюдения x, и нельзя ожидать хороших результатов прогноза при удалении xk от х среднего. Если же значения xk оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько xk отклоняется от области наблюдаемых значений фактора х. Для прогнозируемого значения (у теор) 95-%-ные доверительные интервалы при заданном xk определяются выражением: ~ y x k  t табл * m~y x Интервал достаточно широк прежде всего за счет малого объема наблюдений. При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза значения фактора Х. Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также анализа динамики данного фактора. 5. Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций. Различают два класса нелинейных регрессий: • регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам; • регрессии, нелинейные по оцениваемым параметрам. Примером нелинейной регрессии по включенным в нее объясняющим переменным могут служить следующие функции: • полиномы разных степеней: y = a + b*x + c*x2+е равносторонняя гипербола у = а + b/x+е. К нелинейным регрессиям по оцениваемым параметрам относятся функции: • степенная у = а • хb • е; • показательная у = а • bx • е; • экспоненциальная у = еa + Ьх • E. Нелинейная регрессия по включенным переменным не имеет никаких сложностей для оценки ее параметров. Они определяются, как и в линейной регрессии, методом наименьших квадратом (МНК), ибо эти функции линейны по параметрам. Среди нелинейных функций, которые могут быть приведены к линейному виду, в эконометрических исследованиях очень широко используется степенная функция у = а • хb • е. Это связано с тем, что параметр b в ней имеет четкое экономическое истолкование, т. е. является коэффициентом эластичности. Это значит, что величина коэффициента b показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Э (b  2cx) x a  bx  cx 2 Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции (R) R  1  ( y  ~y )  ( y  y) 2 x 2 Величина данного показателя находится в границах: О  R  1; чем ближе к единице, тем теснее связь рассматриваемых при признаков, тем более надежно найденное уравнение регрессии. Поскольку в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации. Оценка статистической значимости индекса корреляции проводится так же, как и оценка значимости коэффициента корреляции. Индекс детерминации R2 используется для проверки статистической значимости в целом уравнения нелинейной регрессии по F-критерию Фишера. F R2 n  m 1 * 2 m 1 R где п — число наблюдений; т - число параметров при переменных х. Величина т характеризует число степеней свободы для факторной суммы квадратов, а (n-m-1) — число степеней свободы для остаточной суммы квадратов. Для степенной функции ух = а • хb значение т = 1 и формула Fкритерия примет тот же вид, что и при линейной зависимости: F R2 * (n  2) 1 R2 Для параболы: F R2 n3 * 2 2 1 R Индекс детерминации R2 можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминации г2 меньше индекса детерминации R2. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если величина (R2—r2) превышает 0,1, то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различия между R2 и r2, вычисленных по одним и тем же исходным данным, через t-критерий Стьюдента: t m R r  2 * R2  r 2 m R r ( R 2  r 2 )  ( R 2  r 2 ) 2 * (2  ( R 2  r 2 )) n Если tфакт > tтабл, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Практически если величина t < 2 , то различия между R и r несущественны, и, следовательно, возможно применение линейной регрессии, даже если есть предположения о некоторой нелинейности рассматриваемых соотношений признаков фактора и результата. 6. Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии, т. е y и ух. Чем меньше эти отличия, тем ближе теоретические значения к эмпирическим данным, тем лучше качество модели. Величина отклонений фактических и расчетных значений результативного признака (у - ух) по каждому наблюдению представляет собой ошибку аппроксимации. В отдельных случаях ошибка аппроксимации может оказаться равной нулю. Отклонения (у - ~y x ) несравнимы между собой, исключая величину, равную нулю. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям. Поскольку (у - ух) может быть величиной как положительной, так и отрицательной, ошибки аппроксимации для каждою наблюдения принято определять в процентах по модулю. Отклонения (у — ух) можно рассматривать как абсолютную ошибку аппроксимации, а (y  ~ yx ) *100 y как относительную ошибку аппроксимации. Для того чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, находят среднюю ошибку аппроксимации как среднюю арифметическую простую. A (y  ~ yx ) 1 * *100 n y Возможно и другое определение средней ошибки аппроксимации: A 100 * y  ( y  ~y ) 2 x n Вопросы для самоконтроля 1. Как рассчитываются параметры парной линейной регрессии? 2 .Как провести оценку статистической значимости параметров уравнения парной регрессии? 3. Поясните смысл коэффициента корреляции, как оценить его значимость? 4. Что такое коэффициент детерминации? Что он показывает? 5. Как определяется число степеней свободы для факторной и остаточной сумм квадратов? 6. Как используется F – критерий Фишера для оценки статистической надежности результатов регрессионного моделирования? 7. Приведите ряд моделей, нелинейных относительно: переменных, оцениваемых параметров. 8. Дайте определение бета–коэффициента. Поясните его смысл. 9. Дайте определение коэффициента эластичности. Поясните его смысл. Как определяется коэффициент эластичности по разным видам регрессионных моделей? Рекомендуемая литература 1. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. – М.: Финансы и статистика, 2001. 2. Общая теория статистики. Статистическая методология в изучении коммерческой деятельности: Учебник / Под. ред. О.Э.Башиной, А.А.Спирина.-М.: Фин. и стат.,2000.-440 с. 3. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. М.: Финансы и статистика, 2005.-576с. 4. Практикум по эконометрике: Учеб. пособие /И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2004.-192с. 5. Общий курс высшей математики для экономистов: Учебник / Под. ред.В.И.Ермакова.-М.:ИНФРА-М,2001.-656с. Тема 3. Множественная линейная регрессия и корреляция 1. Понятие множественной регрессии и классическая линейная модель множественной регрессии. Спецификация модели. 2. Оценка параметров уравнения множественной регрессии методом наименьших квадратов. 3. Множественная и частная корреляция. 4. Оценка надежности результатов множественной регрессии и корреляции. 5. Регрессионные модели с переменой структурой (фиктивные переменные). 6. Проверка модели на наличие гетероскедастичности (метод ГольдфельдаКвандта). 1. Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Например, при построении модели потребления того или иного товара от дохода исследователь предполагает, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер семьи и ее состав. Вместе с тем исследователь никогда не может быть уверен в справедливости данного предположения. Для того чтобы иметь правильное представление о влиянии дохода на потребление, необходимо изучить их корреляцию при неизменном уровне других факторов. Решение такой задачи предполагает отбор единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Этот путь приводит к планированию эксперимента — методу, который используется в химических, физических, биологических исследованиях. Экономист в отличие от экспериментатора-естественника лишен возможности регулировать другие факторы. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии у = а + bх * хх + b2 * х2 + ... + bр * хр + е. Такого рода уравнение может применяться при изучении потребления. Тогда коэффициенты bj — частные производные потребления у по соответствующим факторам xj. b1  dy dy dy , b2  , bp  dx1 dx2 dx p Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное воздействие их на моделируемый показатель. Построение уравнения множественной регрессии начинается с выбора спецификации модели. Она включает в себя два вопроса: отбор факторов и выбор вида уравнения регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя c другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: 1) быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то нужно придать ему количественную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается место нахождения недвижимости: районы могут быть проранжированы; 2) не должны быть коррелированы между собой и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда rуч1 < rХ1Х2, для зависимости у = а + bх * xj + b2 * х2 + е, может привести к нежелательным последствиям — система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются неинтерпретируемыми. Так, в уравнении у = а + Ьх * хх + Ьг *х2 + е предполагается, что факторы хх и х2 независимы друг от друга, т.е.. rx1x2. = 0. Тогда можно говорить, что параметр bх измеряет силу влияния фактора х1 на результат у при неизменном значении фактора х2. Если же rx1x2 = 1, то с изменением фактора х1, фактор х2 не может оставаться неизменным. Отсюда bх и b2 нельзя интерпретировать как показатели раздельного влияния х1 и х2 на у. Включаемые во множественную регрессию факторы должны объяснить вариацию зависимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других не учтенных в модели факторов оценивается как (1-R2) с соответствующей остаточной дисперсией S2. При дополнительном включении в регрессию (р+1) фактор коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор хр,, не улучшает модель и является лишним. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента. Несмотря на то, что теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов проводится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно проводится в две стадии: на первой отбираются факторы исходя из сути проблемы; на второй — на основе матрицы показателей корреляции и определения t-статистики для параметров регрессии. Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если rxixj  0.7 Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, т.е.. Rxixj= 0, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам: • затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл; • оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между ними была бы единичной, поскольку все недиагональные элементы были бы равны нулю. Если же между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и надежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов. Отбор факторов, включаемых в регрессию, является одним и из важнейших этапов практического использования методов регрессии. Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии:  метод исключения;  метод включения  шаговый регрессионный анализ. При отборе факторов рекомендуется пользоваться следующим правилом:число включаемых факторов обычно в 6—7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной вариации очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а F-критерий меньше табличного значения. Как и в парной зависимости, используются разные виды уравнений множественной регрессии: линейные и нелинейные Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функции. В линейной множественной регрессии ух = а + bх * хх + b2 * х2 + ... + bр * хр параметры при х называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне. (функция потребления) Свободный член уравнения множественной линейной регрессии ее (параметр а) вбирает в себя информацию о прочих не учитываемых в модели факторах. Его величина экономической итерпретации не имеет. Формально его значение предполагает то значение у, когда все х = 0, что практически не бывает. В степенной функции b1 b2 bp ~ y x  a * x1 * x2 ... * x p коэффициенты bj являются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменяется результат с изменением соответствующего фактора на 1 % при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления. Стандартные компьютерные программы обработки регрессионного анализа позволяют перебирать различные функции и выбрать ту из них, для которой остаточная дисперсия и ошибка аппроксимации минимальны, а коэффициент детерминации максимален. Однако чем сложнее функция, тем менее интерпретируемы ее параметры. 2. Параметры уравнения множественной регрессии оцениваются как и в парной регрессии, методом наименьших квадратов. При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии. Ее решение может быть осуществлено методом определителей. Возможен и иной подход к определению параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе: t y  1 * t x1   2 * t x 2  ...   p * t x p   где ty, tx1,…txp- стандартизированные переменные ty  y y y , t xi  xi  xi  xi для которых среднее значение равно нулю: ty=txi=0, среднее квадратическое отклонение равно единице (сигмы), В-стандартизированные коэффициенты регрессии Применив МНК к уравнению множественной регрессии стандартизованном масштабе, после соответствующих преобразований получим систему нормальных уравнений вида ryx1  1   2 * rx 2 x1   3 * rx 3 x1  ...   p * rxpx1 ryx 2  1 * rx 2 x1   2   3 * rx 3 x 2  ...   p * rxpx 2 ryx p  1 * rxpx1   2 * rxpx 2   3 * rxpx3  ...   p Решая ее методом определителей, найдем параметры — стандартизованные коэффициенты регрессии. Стандартизованные коэффициенты регрессии показывают на сколько сигм изменится в среднем результат, если соответствующий фактор Xj изменится на одну сигму при неизменном среднем уровне других факторов. В силу того, что все переменные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между собой. В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции. Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты «чистой» регрессии bt связаны со стандартизованными коэффициентами регрессии Bt, а именно bi   i y  xi Это позволяет от уравнения регрессии в стандартизированном масштабе переходить к уравнению регрессии в натуральном масштабе переменных. Параметр а определяется как a  y  b1 * x1  b2 * x2  ... b p *x p Содержание стандартизованных коэффициентов регрессии позволяет использовать их при отсеве факторов — из модели исключаются факторы с наименьшим значением B. 3. Ранжирование факторов, участвующих в множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии. Эту же цель можно достичь с помощью частных коэффициентов корреляции для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при отборе факторов: целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции. Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель. Если выразить остаточную дисперсию через показатель детерминации 2 Sост   y2 (1  r 2 ) , то формула коэффициента частной корреляции примет вид: ryx 2 x1  1  1  R yx2 1x 2 1  ryx2 1 Данные показатели частной корреляции принято называть коэффициентами (индексами) частной корреляции первого порядка, ибо они фиксируют тесноту связи двух переменных и закреплении (элиминировании влияния) одного фактора. Если рассматривается регрессия с числом факторов р, то возможны частные коэффициенты корреляции не только первого, но и второго, третьего, ..., (р — 1) порядка, т. е. влияние фактора х1 можно оценить при разных условиях независимости действия других факторов: ryx1 x 2 -при постоянном действии фактора х2; ryx1 x 2 x 3 - при постоянном действии факторов х2 и х3; ryx1 x 2... xp - при неизменном действии всех факторов, включенных в уравнение регрессии. Сопоставление коэффициентов частной корреляции разных порядков по мере увеличения числа включаемых факторов показывает процесс «очищения» связи результативного признаке с исследуемым фактором. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, ryx1 x 2 — коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции более высоких порядков можно найти через коэффициентной корреляции более низких порядков по рекуррентной формуле: ryxi x1x 2... xp  ryxi x1x 2... xp 1  ryxp x1x 2... xp 1  rxixp x1x 2... xp 1 2 2 (1  ryxp  x1x 2... xp 1 ) * (1  rxixp x1x 2... xp 1 ) При двух факторах и i = 1 данная формула примет вид: ryx1 x 2  ryx1  ryx 2 * rx1x 2 (1  ryx2 2 ) * (1  rx21x 2 ) Соответственно при i = 2 и двух факторах частный коэффициент корреляции у с фактором х2 можно определить по формуле ryx 2 x1  ryx 2  ryx1 * rx1x 2 (1  ryx2 1 ) * (1  rx21x 2 ) Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так, можно исчислить три частных коэффициента корреляции второго порядка: ryx1 x 2 x 3 ; ryx 2 x1x 3 ; ryx 3 x1x 2 каждый из которых определяется по рекуррентной формуле. Например, при i=1 имеем формулу для расчета: ryx1 x 2 x 3  ryx1 x 2  ryx 3 x 2 * rx1x 3 x 2 (1  ryx2 3 x 2 )(1  rx21x 3 x 2 ) Рассчитанные по рекуррентной формуле частные коэффициенты корреляции изменяются в пределах от —1 до +1, а по формулам через множественные коэффициенты детерминации от 0 до 1. Сравнение их друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Частные коэффициент корреляции, подтверждают ранжировку факторов по их воздействию на результат, на основе стандартизованных коэффициентов регрессии (B-коэффициентов) в отличие от последних дают конкретную меру тесноты связи каждого фактора с результатом в чистом виде. В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов. Так, при построении многофакторной модели, например методом исключения переменных на первом шаге определяется уравнение регрессии с полным набором факторов и рассчитывается матрица частных коэффициентов корреляции. На втором шаге отбирается фактор с наименьшей и несущественной по t-критерию Стьюдента величиной показателя частной корреляции. Исключив его из модели, строят новое уравнение регрессии. Процедура продолжается до тех пор, пока не окажется, что все частные коэффициенты корреляции существенно отличаются от нуля. Если исключен несущественный фактор, то множественные коэффициенты детерминации на двух смежных шагах построения регрессионной модели почти не отличаются друг oт друга. 4. Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера: F Dфакт Dост  R2 n  m 1 * 2 m 1 R Dфакт - факторная сумма квадратов на одну степень свободы; R2 — коэффициент (индекс) множественной детерминации; n — число наблюдений; т — число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов); Dост, - остаточная сумма квадратов на одну степень свободы. Оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности введения его в модель. Мерой для оценки включения фактора в модель служит частный F-критерий, т. е. Fxi Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на одну степень свободы по регрессионной модели в целом. С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор хi- был введен в уравнение множественной регрессии последним. Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину Fxi, можно определить и t-критерий для коэффициента регрессии при i-м факторе, tbi, а именно tbi  Fxi . Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула t bi  bi mbi где bi, - коэффициент чистой регрессии при факторе xi mbi - средняя квадратическая ошибка коэффициента регрессии bi,. Для уравнения множественной регрессии ~y  a  b1 x1  b2 x2  ...b p x p средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле: mbi   y 1  R yx2 1... xp  x1 1  R 2 xix1... xp * 1 n  m 1 Где  y — среднее квадратическое отклонение для признака у; Ryx2 1... xp — коэффициент детерминации для уравнения множественной регрессии;  x1 - среднее квадратическое отклонение для признака х ,; i 2 Rxix1... xp - коэффициент детерминации для зависимости фактора хi со всеми другими факторами уравнения множественной регрессии; n-m-1 — число степеней свободы для остаточной суммы квадратов отклонений. Если величина частного F-критерия выше табличного значения, то это означает одновременно не только значимость рассматриваемого коэффициента регрессии, но и значимость частного коэффициента корреляции. Проверка надежности парных линейных коэффициентов корреляции при помощи t-критерия Стьюдента производиться по формуле: t yx1  где mr  ryx1 mr 1  ryx2 1 n  2 1 Проверка надежности частных коэффициентов корреляции проводиться по формулам: t yx1 x 2  ryx1 x 2 mr где mr  1  ryx2 1 x 2 n  m 1 5. В большинстве случаев в модель регрессии включаются количественные факторные переменные. Однако при проведении некоторых исследований может возникнуть необходимость во включении в модель регрессии качественных факторных переменных. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, возраст, климатические условия, принадлежность к определенному региону. Для того, чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные необходимо преобразовать в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. Качественные признаки могут приводить к неоднородности исследуемой совокупности, что может быть учтено при моделировании двумя путями: • регрессия строится для каждой качественно отличной группы единиц совокупности, т.е. для каждой группы в отдельности, чтобы преодолеть неоднородность единиц общей совокупности; • общая регрессионная модель строится для совокупности в целом, учитывающей неоднородность данных. В этом случае в регрессионную модель вводятся фиктивные переменные, т.е. строится регрессионная модель с переменной структурой, отражающей неоднородность данных. Фиктивная переменная – это атрибутивная, или качественная, факторная переменная, которая представлена с помощью определенного цифрового кода. Модель регрессии, включающая в себя в качестве факторной переменной фиктивную переменную, называется моделью регрессии с переменной структурой. В качестве примера модели регрессии с переменной структурой можно привести модель регрессии размера заработной платы от стажа работников с различным образованием (среднее, среднее специальное и высшее). Для включения факторной переменной в модель регрессии используются только две фиктивные переменные, потому что количество фиктивных переменных в модели регрессии должно быть на единицу меньше чем значений качественной переменной. Общий вид модели с фиктивной переменной: Y=a+bx+cz2+e Система уравнений для нахождения параметров линейной модели с фиктивной переменной составляется при помощи метода наименьших квадратов.  y  na  b x  c  z ,  2  yx  a  x  b x  c  zx,  2  yz  a  z  b xz  c  z . Решив систему, получаем уравнение регрессии. Далее проверяется значимость найденного уравнения и делается вывод о том, улучшился ли результат модели с введением в нее фиктивной переменной (R2). 6. Гетероскедастичность - это предположение о неоднородности дисперсий случайных ошибок модели регрессии. Случайная ошибка модели регрессии - это величина отклонения в модели линейной множественной регрессии:   y  ~y где  - остатки модели регрессии. Одно из условий нормальной линейной модели множественной регрессии заключается в том, что дисперсия случайной ошибки модели регрессии является постоянной для всех наблюдений. Данное условие называется гомоскедастичностью дисперсий случайных ошибок модели регрессии. Гомоскедастичность - это предположение о постоянстве дисперсии случайной ошибки е: для всех i наблюдений модели регрессии. Но на практике условие гомоскедастичности случайной ошибки, или остатков модели регрессии, не всегда выполняется. Последствия гетероскедастичности остатков модели регрессии: 1) оценки нормальной линейной модели регрессии остаются несмещенными и состоятельными, но теряется эффективность; 2) появляется вероятность неверного вычисления оценок стандартных ошибок коэффициентов модели регрессии, что может привести к утверждению неверной гипотезы о значимости коэффициентов регрессии и значимости модели регрессии в целом. Обнаружить гетероскедастичность остатков модели регрессии можно путем проверки гипотез. При малом объеме выборки, что наиболее характерно для эконометрических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта. Для того, чтобы оценить нарушение гомоскедастичности, необходимо провести параметрический тест, который включает в себя несколько этапов: 1 этап. Упорядочение n наблюдений по мере возрастания переменной x. 2 этап. Исключение из рассмотрения С центральных наблюдений; при этом (nC):2>p, где p – число оцениваемых параметров. Из экспериментальных расчетов, для случая одного фактора рекомендовано при n=30 принимать C=8. 3 этап. Разделение совокупности из (n-C) наблюдений на две группы (соответственно с малыми и большими значениями фактора x) и определение по каждой из групп уравнений регрессии. 4 этап. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: R=S1:S2, где S1>S2. При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию с (n-C-2p):2 степенями свободы для каждой остаточной суммы квадратов. Если Fфакт>Fтеор, то основная гипотеза отклоняется, и в основной модели регрессии присутствует гетероскедастичность, зависящая от факторной переменной x. Если Fфакт<Fтеор, то основная гипотеза принимается, и гетероскедастичность в основной модели регрессии не зависит от факторной переменной х. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий Вопросы для самоконтроля 1. В чем состоит спецификация модели множественной регрессии? 2. Сформулируйте требования, предъявляемые к факторам для включения их в модель множественной регрессии. 3. К каким трудностям приводит мультиколлинеарность факторов и как они могут быть преодолены? 4. Что означает взаимодействие факторов и как оно может быть выражено графически? 5. При каких условиях строится уравнение множественной регрессии с фиктивными переменными? 6. Сформулируйте основные предпосылки применения МНК для построения регрессионной модели. 7 .Как можно проверить наличие гомо– или гетероскедастичности остатков? 8 .В чем суть обобщенного метода наименьших квадратов? 1. 2. 3. 4. Рекомендуемая литература Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005.-576с. Практикум по эконометрике: Учеб. пособие /И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2004.-192с. Елисеева И.И., Юзбашев М.М. Общая теория статистики. – М.: Финансы и статистика, 2000. Тема 4.Системы эконометрических уравнений 1. Общие понятия о системах эконометрических уравнений. 2. Структурная и приведенная формы модели. 3. Проблемы идентификации модели. 4. Оценивание параметров структурной модели (косвенный, двухшаговый и трехшаговый метод наименьших квадратов). 5. Применение систем эконометрических уравнений (модель Кейнса, модель Клейна). 1. Объектом статистического изучения в социальных науках являются сложные системы. Измерение тесноты связей между переменными, построение изолированных уравнений регрессии недостаточны для описания таких систем и объяснения механизма их функционирования. При использовании отдельных уравнений регрессии, например, для экономических расчетов в большинстве случаев предполагается, что аргументы (факторы) можно изменять независимо друг от друга. Однако это предположение является очень грубым: практически изменение одной переменной, как правило, не может происходить при абсолютно неизменности других. Ее изменение повлечет за собой изменения во всей системе взаимосвязанных признаков. Следовательно, отдельно взятое уравнение множественной регрессии не может характеризовать истинные влияния отдельных признаков на вариацию результирующей переменной. Именно поэтому в экономических, биометрических и социологических исследованиях важное место заняла проблема описания структуры связей между переменными системой так называемых одновременных уравнений или структурных уравнений. Например, если изучается модель спроса как соотношение цен и количества потребляемых товаров, то одновременно для прогнозирования спроса необходима модель предложения товаров, в которой рассматривается также взаимосвязь между количеством и ценой предлагаемых благ. Это позволяет достичь равновесия между спросом и предложением. В еще большей степени возрастает потребность в использовании системы взаимосвязанных уравнений, если мы переходим от исследований на микроуровне к макроэкономическим расчетам, Модель национальной экономики включает в себя следующую систему уравнений: функции потребления, инвестиций, заработной платы, тождество доходов и т.д. Это связано с тем, что макроэкономические показатели, являясь обобщающими показателями состояния экономики, чаще всего взаимозависимы. Так, расходы на конечное потребление в экономике зависят от валового национального дохода. Вместе с тем величина валового национального дохода рассматривается как функция инвестиций. Система уравнений в эконометрических исследованиях может быть построена по-разному. Возможна система независимых уравнений, когда каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х:  y1  a11 x1  a12 x2  ...a1m xm   1 ,  y  a x  a x  ...a x   ,  2 21 1 22 2 2m m 2  .............................................  y n  a n1 x1  a n 2 x2  ...a nm x m  n , Набор факторов xi в каждом уравнении может варьировать. Отсутствие того или иного фактора в уравнении системы может быть следствием как экономической нецелесообразности его включения в модель, так и несущественности воздействия на результативный признак (незначимо значение t-критерия или частного F-критерия для данного фактора). Примером такой модели может служить модель экономической эффективности сельскохозяйственного производства, где и качестве зависимых переменных выступают показатели, характеризующие эффективность сельскохозяйственного производства,- продуктивность коров, себестоимость 1 ц молока, а в качестве факторов - специализация хозяйства, количество голов на 100 га пашни, затраты труда и т. п. Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно. Для нахождения его параметров используется метод наименьших квадратов. По сути каждое уравнение этой системы является уравнением регрессии. Поскольку никогда нет уверенности, что факторы полностью объясняют зависимые переменные, в уравнениях присутствует свободный член а0. Так как фактические значения зависимой переменной отличаются от теоретических на величину случайной ошибки, в каждом уравнении присутствует величина случайной ошибки. В итоге система независимых уравнений при трех зависимых переменных и четырех факторах примет вид:  y1  a01  a11 x1  a12 x 2  a13 x3  a14 x4   1 ,   y2  a02  a21 x1  a22 x 2  a23 x3  a24 x4   2 ,  y  a  a x  a x  a x  a3 x   , 03 31 1 32 2 33 3 14 4 3  3 Однако если зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении, то исследователь может строить модель в виде системы рекурсивных уравнений:  y1  a11 x1  a12 x2  ...  a1m xm   1 ,  y  b y  a x  a x  ...  a x   , 21 1 21 1 22 2 2m m 2  2  y3  b31 y1  b32 y 2  a31 x1  a32 x2  ...  a3m xm   3 , ...............................................   y n  bn1 y1  bn 2 y 2  ...  bnm1 y n 1  a n1 x1  a n 2 x2  ...  a nm xm   n . В данной системе зависимая переменная у включает в каждое последующее уравнение в качестве факторов все зависимые переменные предшествующих уравнений наряду с набором собственно факторов х Примером такой системы может служить модель производительности труда и фондоотдачи вида:  y1  a11 x1  a12 x2  a13 x3   1 ,   y2  b21 y1  a21 x1  a22 x2  a23 x3   2 . y1- производительность труда; y2- фондоотдача; x1- фондовооруженность труда; x2- энерговооруженность труда; x3- квалификация рабочих. Каждое уравнение может рассматриваться как самостоятельное, и его параметры определяются методом наименьших квадратов. Наибольшее распространение в экономических исследованиях получила система взаимозависимых уравнений. В ней одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других уравнениях – в правую часть системы:  y1  b12 y 2  b13 y3  ...  b1n y n  a11 x1  a12 x2  ...  a1m xm   1 ,  y  b y  b y  ...  b y  a x  a x  ...  a x   ,  2 21 1 23 3 2n n 21 1 22 2 2m m 2  ...................................................................................  y n  bn1 y1  bn 2 y 2  ...  bnm1 y n1  an1 x1  a n 2 x2  ...  a nm xm   n , Система взаимозависимых уравнений получила название система совместных, одновременных уравнений. Тем самым подчеркивается, что в системе одни и те же переменные у одновременно рассматриваются как зависимые в одних уравнениях и как независимые в других. В эконометрике эта система уравнений называется также структурной формой модели. В отличие от предыдущих систем каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК неприменим. С этой целью используются специальные приемы оценивания. 2. Система совместных, одновременных уравнений (или структурная форма модели) обычно содержит эндогенные и экзогенные переменные. Эндогенные переменные обозначены в приведенной ранее системе одновременных уравнений как y. Это зависимые переменные, число которых равно числу уравнений в системе. Экзогенные переменные обозначаются обычно как x. Это предопределенные переменные, влияющие на эндогенные переменные, но не зависящие от них. Простейшая структурная форма модели имеет вид:  y1  b12 y2  a11x1  1 ,   y2  b21 y1  a22 x2   2 Классификация переменных на эндогенные и экзогенные зависит от теоретической концепции принятой модели. Экономические переменные могут выступать в одних моделях как эндогенные, а в других — как экзогенные переменные. Внеэкономические переменные (например, климатические условия) входят в систему как экзогенные переменные. В качестве экзогенных переменных могут рассматриваться значения эндогенных переменных за предшествующий период времени (лаговые переменные). Так, потребление текущего года (у,) может зависеть не только от ряда экономических факторов, но и от уровня потребления в предыдущем году (yt-1). Структурная форма модели позволяет увидеть влияние изменений любой экзогенной переменной на значения эндогенной переменной. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно заранее иметь целевые значения эндогенных переменных. Структурная форма модели в правой части содержит при Iэндогенных и экзогенных переменных коэффициенты bt и aj (bt - коэффициент при эндогенной переменной, aj - коэффициент при экзогенной переменной), которые называются структурными коэффициентами модели. Все переменные в модели выражены в отклонениях от среднего уровня, т. е. под х подразумевается x  x , а под у — соответственно y  y . Поэтому свободный член в каждом уравнении системы отсутствует. Использование МНК для оценивания структурных коэффициентов модели дает, как принято считать в теории, смещение и несостоятельные оценки. Поэтому обычно для определения структурных коэффициентов модели структурная форма модели преобразуется в приведенную форму модели. Приведенная форма модели представляет собой систему линейных функций эндогенных переменных от экзогенных:  y1   11 x1   12 x2  ...   1m xm ,  y   x   x  ...   x ,  2 21 1 22 2 2m m  .........................................  y n   n1 x1   n 2 x2  ...   nm xm , По виду приведенная форма модели ничем не отличается от системы независимых уравнений, параметры которой оцениваются традиционным методом наименьших квадратов. Применяя МНК можно оценить σ, а затем оценить значения эндогенных переменных через экзогенные. Коэффициенты приведенной формы модели представляют собой нелинейные функции коэффициентов структурной форм. Рассмотрим это положение на примере простейшей структурной модели, выразив коэффициенты приведенной формы модели (σij) через коэффициенты структурной модели (aj и bi). Для упрощения в модель не введены случайные переменные. Для структурной модели вида:  y1  b12 y2  a11 x1 ,   y2  b21 y1  a22 x2 Приведенная форма модели имеет вид:  y1  11x1  12 x2   y2   21x1   22 x2 В которой y2 из первого уравнения структурной модели можно выразить следующим образом: y2  y1  a11 x1 b12 Тогда система одновременных уравнений будет представлена как: y1 a11x1   y2  b 12  y  b y  a x  2 12 1 22 2 Отсюда имеем равенство: y1  a11 x1  b21 y1  a22 x2 b12 Или y1  a11x1  b12b21 y1  b12a22 x2 Тогда: y1  b12b21 y1  a11x1  b12a22 x2 Или a11 a b x1  22 12 x2 1  b12b21 1  b12b21 Таким образом, мы представили первое уравнение структурной формы модели в виде уравнения приведенной формы модели: y1  y1  11x1  12 x2 Из уравнения следует, что коэффициенты приведенной формы модели представляют собой нелинейные соотношения коэффициентов структурной формы модели, т. е.  11  a b a11  12  22 12 x2 1  b12b21 1  b12b21 и Аналогично можно показать, что коэффициенты приведенной формы модели второго уравнения системы (σ21 и σ22) также нелинейно связаны с коэффициентами структурной модели. Для этого выразим переменную y1 из второго структурного уравнения модели как: y1  y 2  a22 x2 b21 Запишем это выражение y1 в левой части первого уравнения структурной формы модели: y 2  a22 x2  b12 y 2  a11 x1 b21 Отсюда: a11b21 a22 x1  x2 1  b12b21 1  b12b21 Что соответствует уравнению приведенной формы модели: y2  y2   21x1   22 x2 Т.е.  21  a11b21 a22 и 22  1  b12b21 1  b12b21 3. При переходе от приведенной формы модели к структурной исследователь сталкивается с проблемой идентификации. Идентификация это единственность соответствия между приведенной и структурной формами модели. Рассмотрим проблему идентификации для случая с двумя эндогенными переменными. Пусть структурная модель имеет вид:  yˆ1  b12 y 2  a11 x1  a12 x2  ...  a1m xm ,   yˆ 2  b21 y1  a21 x1  a22 x2  ...  a2 m xm , Где y1 и y2-совместные зависимые переменные. Из второго уравнения можно выразить y1 следующей формулой: y1  a y 2 a21 a  x1  22 x2  ...  2 m xm b21 b21 b21 b21 Тогда в системе имеем два уравнения для эндогенной переменной у1 с одним и тем же набором экзогенных переменных, но с разными коэффициентами при них:  yˆ1  b12 y 2  a11 x1  a12 x2  ...  a1m xm ,  a2 m y 2 a21 a22  y   x  x  ...  xm 1 1 2  b21 b21 b21 b21  Наличие двух вариантов для расчета структурных коэффициентов в одной и той же модели связано с неполной ее идентификацией. Структурная модель в полном виде, состоящая в уравнении системы из п эндогенных и т экзогенных переменных, содержит п(п - 1 + т) параметров. Так, при п=2 и m=3 полный вид структурной модели составит:  yˆ1  b12 y2  a11 x1  a12 x2  a13 x3   yˆ 2  b21 y1  a21 x1  a22 x2  a23 x3 Как видим, модель содержит восемь структурных коэффициентов, что соответствует выражению п (п - 1 + т). Приведенная форма модели в полном виде содержит пт параметров. Для нашего примера это означает наличие шести коэффициентов приведенной формы модели. В этом можно убедиться, обратившись к приведенной форме модели, которая иметь вид:  y1  11 x1  12 x2  13 x3 ,   y2   21 x1   22 x2   23 x3 ,  Действительно, она включает в себя шесть коэффициентов ij На основе шести коэффициентов приведенной формы модели требуется определить восемь структурных коэффициентов рассматриваемой структурной модели, что, естественно, не может привести к единственности решении. В полном виде структурная модель содержит большее число параметров, чем приведенная форма модели. Соответственно п (п - 1 + т) параметров структурной модели не могут быть однозначно определены из пт параметров приведенной формы модели. Для того чтобы получить единственно возможное решение для структурной модели, необходимо предположить, что некоторые из структурных коэффициентов модели в виду слабой взаимосвязи признаков с эндогенной переменной из левой части системы равны нулю. Тем самым уменьшится число структурных коэффициентов модели. Так, если предположить, что в нашей модели a13=0 и a21=0, то структурная модель примет вид:  yˆ1  b12 y2  a11 x1  a12 x2 ,   yˆ 2  b21 y1  a22 x2  a23 x3 В такой модели число структурных коэффициентов не превышает число коэффициентов приведенной модели, которое равно шести. Уменьшение числа структурных коэффициентов модели возможно и другим путем: например, приравниванием некоторых коэффициентов друг к другу, т. е. путем предположений, что их воздействие на формируемую эндогенную переменную одинаково. На структурные коэффициенты могут накладываться, например, ограничения вида bij+aij=0. С позиции идентифицируемости структурные модели можно разделить на три вида:  Идентифицируемые;  Неидентифицируемые;  Сверхидентифицируемые. Модель идентифицируема, если все структурные ее коэффициенты определяются однозначно, единственным образом по коэффициентам приведенной формы модели, т. е. если число параметров структурной модели равно числу параметров приведенной формы модели. В этом случае структурные коэффициенты модели оцениваются через параметры приведенной формы модели и модель идентифицируема. Рассмотренная выше структурная модель с двумя эндогенными и тремя экзогенными (предопределенными) переменными, содержащая шесть структурных коэффициентов, представляет собой идентифицируемую модель. Модель неидентифицируема, если число приведенных коэффициентов меньше числа структурных коэффициентов, и в результате структурные коэффициенты не могут быть оценены через коэффициенты приведенной формы модели.. Структурная модель в полном виде, содержащая п эндогенных и т предопределенных переменных в каждом уравнении системы, всегда неидентифицируема. Модель сверхидентифицируема, если число приведенных коэффициентов больше числа структурных коэффициентов. В этом случае на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента. В этой модели число структурных коэффициентов меньше числа коэффициентов приведенной формы. Так, если в структурной модели полного вида предположить нулевые значения не только коэффициентов а13 и а21, но и a22=0, то система уравнений станет сверхидентифицируемой.  yˆ1  b12 y 2  a11 x1  a12 x2 ,   yˆ 2  b21 y1  a 23 x3 В ней пять структурных коэффициентов не могут быть однозначно определены из шести коэффициентов приведенной формы модели. Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически решаема, но требует для этого специальных методов исчисления параметров. Структурная модель всегда представляет собой систему совместных уравнений, каждое из которых необходимо проверить на идентификацию. Модель считается идентифицируемой, если каждое уравнение системы идентифицируемо. Если хотя бы одно из уравнений системы неидентифицируемо, то и вся модель считается неидентифицируемой. Сверхидентифицируемая модель содержит хотя бы одно сверхидентифицируемое уравнение. Выполнение условия идентифицируемости модели проверяется для каждого уравнения системы. Для того чтобы уравнение было идентифицируемо, нужно, чтобы число предопределенных переменных, отсутствующих в данном уравнении, но присутствующих в системе, было равно числу эндогенных переменных в данном уравнении без одного. Если обозначить число эндогенных переменных в j-м уравнении системы через H, а число экзогенных (предопределенных) переменных, которые содержатся в системе, но не входят в данное уравнение, — через D, то условие идентифицируемости модели может быть записано в виде следующего счетного правила: D+1=H – уравнение идентифицируемо; D+1<H – уравнение неидентифицируемо; D+1>H- уравнение сверхидентифируемо. Для оценки параметров структурной модели система быть идентифицируема или сверхидентифицируема. Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации. Более точно условия идентификации определяются, если накладывать ограничения на коэффициенты матриц параметров структурной модели Уравнение идентифицируемо, если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного. Целесообразность проверки условия идентификации модели через определитель матрицы коэффициентов, отсутствующих в данном уравнении, но присутствующих в других уравнениях объясняется тем, что возможна ситуация, когда для каждого уравнения системы выполнено счетное правило, а определители матрицы названных коэффициентов равен нулю. В этом случае соблюдается лишь необходимое, но недостаточное условие идентификации. Для проверки на достаточное условие идентификации заполним таблицу коэффициентов при отсутствующих в первом уравнении переменных, в которой определитель матрицы (detA) коэффициентов равен нулю. Матрица коэффициентов (1) Урав Переменные нение х3 х4 2 а23 а24 3 0 0 Следовательно, достаточное условие идентификации не выполняется и первое уравнение нельзя считать идентифицируемым. Для второго уравнения Н = 2 (у1 и у2), D = 1 (отсутствует х1) счетное правило дает утвердительный ответ: уравнение идентифицируемо (D+ 1 = Н). Достаточное условие идентификации выполняется. Коэффициенты при отсутствующих во втором уравнении переменных составят: Матрица коэффициентов (2) Уравне Переменные ние y3 1 b13 3 -1 x1 a11 a31 Согласно таблице detA не равен 0, а ранг матрицы равен 2, что соответствует следующему критерию: ранг матрицы коэффициентов должен быть не меньше числа эндогенных переменных в системе без одной. Итак, второе уравнение точно идентифицируемо. Третье уравнение системы содержит H= 3 D = 2, т. е. по необходимому условию идентификации оно точно идентифицируемо (D + 1 = Н). Противоположный вывод имеем, проверив уравнение на достаточное условие идентификации. Составим таблицу коэффициентов при переменных, отсутствующих в третьем уравнении, в которой detA = 0. Матрица коэффициентов (3) Уравнен Переменные ие х3 x4 1 0 0 2 a23 a24 Из таблицы видно, что достаточное условие идентификации не выполняется. Уравнение неидентифицируемо. Следовательно, рассматриваемая в целом структурная модель, идентифицируема по счетному правилу, не может считаться идентифицируемой исходя из достаточного условия идентификации. В эконометрических моделях часто наряду с уравнениями, параметры которых должны быть статистически оценены, используются балансовые тождества переменных, коэффициенты при, которых равны  1. В этом случае, хотя само тождество и не требует проверки на идентификацию, ибо коэффициенты при переменных в тождестве известны, в проверке на идентификацию собственно структурных уравнений системы тождества участвуют. Идентификация уравнений достаточно сложна и не ограничивается только вышеизложенным. На структурные коэффициенты модели могут накладываться и другие ограничения, например, в производственной функции сумма эластичностей может быть равна по предположению 1. Могут накладываться ограничения на дисперсии и ковариации остаточных величин. 4. Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели: • косвенный метод наименьших квадратов (КМНК); • двухшаговый метод наименьших квадратов (ДМНК); • трехшаговьш метод наименьших квадратов (ТМНК); • метод максимального правдоподобия с полной информацией (ММПf); • метод максимального правдоподобия при ограниченной информации (MMПs). Косвенный метод наименьших квадратов применяется для идентифицируемой системы одновременных уравнений, а двухшаговый метод наименьших квадратов для оценки коэффициентов сверхидентифицируемой модели. Перечисленные методы оценивания также используются для сверхидентифицируемых систем уравнений. Основное условие применения косвенного метода наименьших квадратов заключается в том, что структурная форма системы одновременных уравнений должна быть точно идентифицированной. Алгоритм косвенного метода наименьших квадратов включает в себя следующие этапы. 1. На основе структурной формы системы одновременных уравнений составляется ее приведенная форма, в которой все приведенные коэффициенты выражены через структурные коэффициенты. 2. Неизвестные коэффициенты каждого уравнения приведенной формы системы одновременных уравнений оцениваются традиционным методом наименьших квадратов. 3. На основе полученных оценок приведенных коэффициентов рассчитываются оценки структурных коэффициентов через уравнения приведенной формы системы одновременных уравнений. Алгоритм двухшагового метода наименьших квадратов реализуется в четыре этапа. 1. На основе структурной формы системы одновременных уравнений составляется ее приведенная форма, в которой все приведенные коэффициенты выражены через структурные коэффициенты. 2. Неизвестные коэффициенты каждого уравнения приведенной формы системы одновременных уравнений оцениваются традиционным методом наименьших квадратов. 3. Рассчитываются значения тех эндогенных переменных, которые выступают в качестве факторных переменных в сверхидентифицированном уравнении. 4. С помощью традиционного МНК определяются все структурные коэффициенты уравнений системы через предопределенные переменные, входящие в это уравнение в качестве факторов, и значения эндогенных переменных, полученных на предыдущем шаге. Данный метод наименьших квадратов называется двухшаговым, потому что МНК используется дважды: первый раз для определения оценок эндогенных переменных приведенной формы системы одновременных уравнений и второй раз для определения оценок структурных коэффициентов уравнений системы. Сверхидентифицированная структурная форма системы одновременных уравнений может быть двух видов: 1) в систему, помимо сверхидентифицированного уравнения также входят точно идентифицированные уравнения. В этом случае оценки структурных коэффициентов точно идентифицированного уравнения определяются на основании приведенной формы системы одновременных уравнений; 2) все уравнения модели являются сверхидентифицированными. В этом случае оценки структурных коэффициентов системы определяются с помощью ДМНК. 5. Рассмотрим основные направления практического использования эконометрических систем уравнений. Наиболее широко системы одновременных уравнений применяются для построения макроэкономических моделей функционирования экономики той или иной страны. Большинство из них представляют собой мультипликаторные модели кейнсианского типа с той или иной степенью сложности. Статистическая модель Кейнса для описания народного хозяйства страны в наиболее простом варианте имеет следующий вид: С  a  by    y  C  I где С - личное потребление в постоянных ценах; у - национальный доход в постоянных ценах; в - случайная составляющая; I - инвестиции в постоянных ценах. В силу наличия тождества в модели (второе уравнение системы) структурный коэффициент b не может быть больше 1. Он характеризует предельную склонность к потреблению. Так, если b = 0,65, то из каждой дополнительной 1 тыс. руб. дохода на потребление расходуется в среднем 650 руб. и 350 руб. инвестируется, т.е. С и y выражены в тысячах рублей. Если b>1,то у<С+I т. е. на потребление расходуются не только доходы, но и сбережения. Параметр а Кейнс истолковывал как прирост потребления за счет других факторов. Поскольку прирост во времени может быть не только положительным, но и отрицательным (снижение), такой вывод возможен. Однако суждение о том, что параметр а характеризует конкретный уровень потребления, обусловленный влиянием других факторов, неправильно. Структурный коэффициент b используется для расчета мультипликаторов. По данной функции потребления можно определить два мультипликатора - инвестиционный мультипликатор потребления Мс и инвестиционный мультипликатор национального дохода Мy. Инвестиционный мультипликатор потребления рассчитывается по формуле: Mс. = b/(1-b). При b = 0,65, Мс = 0,65 / (1 - 0,65) = 1,857. Эта величина означает, что дополнительные вложения в размере 1 тыс. руб. приведут при прочих равных условиях к дополнительному увеличению потребления на 1,857 тыс. руб. Инвестиционный мультипликатор национального дохода можно определить как Му =1/(1-b). В нашем случае он составит: Му= 1/(1 -0,65) =2,857, |т. е. дополнительные инвестиции в размере 1 тыс. руб. на длительный срок приведут при прочих равных условиях к дополнительному доходу в 2,857 тыс. руб. Рассматриваемая модель Кейнса точно идентифицируема, и для получения величины структурного коэффициента b применяется КМНК, т.е. строится система приведенных уравнений: С=А+ВI+U1 у=А'+В'I+U2, в которой A=А', а параметры В и В' являются мультипликаторами, т. е. В=Мс и В'=Му. В этом можно убедиться, если выразить коэффициенты приведенной формы модели через структурные коэффициенты. Для этого в первое уравнение структурной модели подставим балансовое равенство: C  a  by    a  b(C  I )    a  bC  bI   ; C (1  b)  a  bI   ; a b 1 C  I  1 b 1 b 1  b - приведенное уравнение. Отсюда: A  a /(1  b); B  b(1  b)  M c ;U1  (1/(1  b)) Аналогично поступим и со вторым уравнением структурной модели: в тождество у=С+I вместо С подставим выражение первого структурного уравнения, т. е. у=а+bу+е+I. Далее, преобразовав, получим: y a b 1  I  1 b 1 b 1 b A  a /(1  b)  A; B  1 /(1  b)  M y ;U 2  (1 /(1  b)) т.е. Таким образом, приведенная форма модели содержит мультипликаторы, интерпретируемые как коэффициенты линейной регрессии, отвечающие на вопрос, на сколько единиц измениться значение эндогенной переменной, если экзогенная переменная изменится на одну единицу своего измерения? Этот смысл коэффициентов приведенной формы делает приведенную модель удобной для прогнозирования. В более поздних исследованиях статическая модель Кейнса включала уже не только функцию потребления, но и функцию сбережений: C  a  by   1  r  T  K (C  I )   2 y  C  I  r  где С, у и I - те же по смыслу переменные, что и в предыдущей модели; r-сбережения. Данная модель содержит три эндогенные переменные - С, r, у и одну экзогенную переменную I. Система идентифицируема: в первом уравнении H = 2 и D = 1, во втором H=1и D = 0;С +I рассматривается как предопределенная переменная. Наряду со статическими широкое, распространение получили динамические модели экономики. В отличие от статических они содержат в правой части лаговые переменные, а также учитывают тенденцию (фактор времени). Например, модели Клейна, разработанные им для экономики США в 1950-1960 гг. В упрощенном варианте модель Клейна рассматривается как конъюнктурная модель. Ct  b1 S t  b2 Pt  b3   1   I t  b4 Pt  b5 Pt 1  b6   2  S t  b7 Rt  b8 Rt 1  b9 t  b10   3 R  S  P  T t t t  t  Rt  Ct  I t  Gt где Сt - функция потребления в период t St - заработная плата в период t; Pt - прибыль в период t; Pt-1 - прибыль в период t - 1, т. е. в предыдущий год; Rt - общий доход в период t$ Rt-1 - общий доход в предыдущий период; t - время; Tt - чистые трансферты в пользу администрации в период t; It - капиталовложения в период t; Gt - спрос административного аппарата, правительственные расходы в период времени t. Модель содержит пять эндогенных переменных - Сt, It, St, Rt (расположенных в левой части системы) и Рt (последняя – зависимая переменная, определяемая по первому тождеству), три экзогенные переменные - Tt,Gt, и t и две предопределенных, лаговых переменных – Рt-1 и Rt-1. Как и большинство моделей такого типа, данная модель сверхидентифицируема и решаема ДМНК. Для прогнозных целей используется приведенная форма модели. Ct  d1T  d 2 G  d 3t  d 4 Pt 1  d 5 Rt 1  u1 , I  d T  d G  d t  d P  d R  u 6 7 8 9 t 1 10 t 1 2  t S t  d11T  d12G  d13t  d14 Pt 1  d15 Rt 1  u3 R  d T  d G  d t  d P  d R  u 16 17 18 19 t 1 20 t 1 4  t  Pt  d 21T  d 22G  d 23t  d 24 Pt 1  d 25 Rt 1  u5 В этой системе мультипликаторами являются коэффициенты при обычных экзогенных переменных. Они отражают влияние экзогенной переменной на эндогенную переменную. Мультипликаторами в нашей системе выступают коэффициенты при Т и G. Коэффициенты d1, d6, d11, d16, d21 - мультипликаторы чистых трансфертов в пользу администрации относительно личного потребления d1, инвестиций d6,заработной платы d11, дохода d16 и прибыли d21. Соответственно коэффициенты d2, d7, d12, d17, d22 являются мультипликаторами правительственных расходов относительно соответствующих эндогенных переменных. Динамическая модель может и не содержать учет тенденции, но лаговые переменные в ней обязательны. Динамическая модель Кейнса представлена следующими тремя уравнениями: Ct  a  b1Yt  b2Yt 1   1  Yt  Ct  Gt  I t  Lt P  Y  Z . t t  t В этой системе три эндогенные переменные: Yt - имеющийся в распоряжении доход в период времени t; Сt - частное потребление в период времени t; Рt, - валовой национальный продукт (ВНП) в период времени t. Кроме того, модель содержит пять предопределенных переменных: Yt-1 - доход предыдущего года; Gt - общественное потребление; It - валовые капиталовложения; Lt - изменение складских запасов; Zt - сальдо платежного баланса. Случайная переменная ε1 характеризует ошибки в первом уравнении ввиду его статистического характера. Параметр а отражает влияние других не учитываемых в данном уравнении факторов потребления (например, цен). Первое уравнение данной системы является сверхидентифицируемым, а второе и третье - определениями. Если в модели Кейнса доход рассматривается как лаговая переменная, то в других исследованиях функции потребления в виде лаговой переменной используется потребление предыдущего года, т. е. считается, что потребление текущего года зависит не только от дохода, но и от достигнутого в предыдущий период уровня потребления. Примером динамической модели экономики, учитывающей для каждой эндогенной переменной лаговые переменные соответствующего экономического содержания, может служить модель открытой экономики с экономической активностью со стороны государства. Ct  a0  a1Yt  a2 Ct 1   1 ,   I t  b0  b1 Yt  b2U t 1   2 ,  2   IM t  k 0  k1Yt  k IM t 1   3 , 2  Yt  Ct  I t  Gt  IM t . В этой модели четыре эндогенные переменные: Сt - личное потребление в период времени ;; It - частные чистые инвестиции в отрасли экономики в период времени t; IMt - импорт в период времени t; Yt, - национальный доход за период времени t. Все переменные приведены в постоянных ценах. Предопределенными переменными в модели являются следующие три переменные: Сt-1 - личное потребление за предыдущий период; Ut-1 - доход личных домохозяйств от предпринимательской деятельности за предыдущий период и доход от имущества плюс распределенная прибыль предприятий до налогообложении; IMt-1 - импорт за предыдущий период времени t - 1. В качестве экзогенной переменной в модели рассматривается переменная Gt - общественное потребление плюс государственные чистые капиталовложения в экономику страны плюс изменение запасов минус косвенные налоги плюс дотации плюс экспорт. Первые три уравнения системы являются сверхидентифицируемыми, а четвертое представляет собой балансовое тождество. Система одновременных уравнений нашла применение в исследованиях спроса и предложения. Линейная модель спроса и предложения имеет вид: Q d  a0  a1 P   1 ,  s Q  b0  b1 P   2 ,  d s Q  Q где Qd - спрашиваемое количество благ (объем спроса); Р - цена; Qs - предлагаемое количество благ (объем предложения). В этой системе три эндогенные переменные - Qd, Qs и Р. При этом если Qd и Qs представляют собой эндогенные переменные исходя из структуры самой системы (они расположены в левой части), то Р является эндогенной по экономическому содержанию (цена зависит от предлагаемого и испрашиваемого количества благ), а также в результате наличия тождества Qd = Qs. Приравняв первое и второе уравнения системы, можно показать, что Р - зависимая переменная: a0  a1 P   1  b0  b1 P   2 Отсюда: P b0  a0  2   1  a1  b1 a1 b1 Рассматриваемая модель спроса и предложения не содержит экзогенной переменной. Однако для того, чтобы модель имела статистическое решение и можно было убедиться в ее справедливости, в модель вводятся экзогенные переменные. Одним из вариантов модели спроса и предложения является модель вида Q d  a0  a1 P  a2 R   1 ,  s Q  b0  b1 P  b2W   2 ,  d s Q  Q где R - доход на душу населения; W - климатические условия (предположим, что речь идет о спросе и предложении зерна). Переменные R и W экзогенные. Введя их в модель, получим идентифицируемую структурную модель, оценки параметров которой могут быть даны с помощью КМНК. Широкий класс моделей в эконометрике представляют производственные функции: P  f ( x1 , x2 ,..., xn ) где Р - объем выпуска (уровень производства); х1х2 ...,хn - факторы производства (труд, капитал и др.). Однако реализация такого рода моделей, как правило, не связана с системой одновременных уравнений. Производственная функция в упрощенном виде может быть включена в систему одновременных уравнений. Так, в 1962 г. Б. Хохенбалкен и Г. Тинтнер предложили следующую модель экономики для каждой из одиннадцати стран - членов Организации экономического содружества: Y  C  NP  a1  b1 NP  log X  a2  b2 log D  dx / dD  W / p Y  C  K  X  Y / p  Здесь эндогенными переменными являются: С - величина личного потребления в текущих ценах; Y - ВНП в текущих ценах; X - ВНП в постоянных ценах; P - индекс цен; D - общая занятость. В качестве экзогенных переменных приняты: N - численность населения; W - средняя годовая заработная плата работника; К - государственное потребление плюс инвестиции и внешнеторговое сальдо. В системе имеются только два структурных уравнения - функция потребления (первое уравнение) и производственная функция (второе уравнение). Остальные составляющие модели представляют собой априорно разработанную функцию спроса на труд (третье уравнение) и два тождества, относящиеся к ВНП. Параметры функции потребления оцениваются с помощью КМНК. с учетом тождества Y = С + К, а параметры производственной функции - при комбинации ее с функцией спроса на труд. Как уже отмечалось, не все эконометрические модели имеют вид системы одновременных уравнений. Так, широкий класс функций спроса на ряд потребительских товаров часто представляет собой рекурсивную систему, в которой с уравнениями можно работать последовательно и проблемы одновременного оценивания не возникают. В этом плане система одновременных уравнений - лишь один из возможных вариантов построения экономических моделей. Вопросы для самоконтроля 1. Назовите возможные способы построения систем уравнений. Чем они отличаются друг от друга? 2. Как связаны между собой структурная и приведенная формы модели? 3. В чем состоят проблемы идентификации модели и какие условия идентификации (необходимое и достаточное) вы знаете? 4. В чем суть косвенного метода наименьших квадратов? 5. В каких случаях используется двухшаговый метод наименьших квадратов? Рекомендуемая литература 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.: ЮНИТИ, 1998. 2. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005.-576с. 3. Эконометрика: Учебник /Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2002.-480 с. Тема 5. Моделирование одномерных временных рядов 1. Основные элементы временного ряда. Специфика статистической оценки временных рядов. 2. Автокорреляция уровней временного ряда и выявление его структуры. 3. Моделирование сезонных и циклических колебаний. 4. Моделирование тенденции временного ряда при наличии структурных изменений. Тест Чоу. 1. Ряды динамики – статистические данные, отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами, временными рядами . В каждом ряду динамики имеется два основных элемента: 1) показатель времени t; 2) соответствующие им уровни развития изучаемого явления y; В качестве показаний времени в рядах динамики выступают либо определенные даты (моменты), либо отдельные периоды (годы, кварталы, месяцы, сутки). Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными или средними величинами. Ряды динамики различаются по следующим признакам: 1) По времени. В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определенным датам (моментам) времени, или к отдельным периодам. В соответствии с этим ряды динамики подразделяются на моментные и интервальные. Моментные ряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени. Особенностью моментного ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. Хотя и в моментном ряду есть интервалы – промежутки между соседними в ряду датами, величина того или иного конкретного уровня не зависит от продолжительности периода между двумя датами. Поэтому при суммировании уровней моментного ряда может возникнуть повторный счет. Интервальные ряды динамики отражают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени. Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы (субпериоды) времени. При прочих равных условиях уровень интервального ряда тем больше, чем больше длина интервала, к которому этот уровень относится . Свойство суммирования уровней за последовательные интервалы времени позволяет получить ряды динамики более укрупненных периодов. Статистическое отображение изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями отображения результатов развития изучаемых показателей не только за данный отчетный период, но и с учетом предшествующих периодов. При составлении таких рядов производится последовательное суммирование смежных уровней. Этим достигается суммарное обобщение результата развития изучаемого показателя с начала отчетного периода (года, месяца, квартала и т. д.) . 2) По форме представления уровней. Могут быть построены также ряды динамики, уровни которых представляют собой относительные и средние величины. Они также могут быть либо моментными либо интервальными. В интервальных рядах динамики относительных и средних величин непосредственное суммирование уровней само по себе лишено смысла, так как относительные и средние величины являются производными и исчисляются через деление других величин. 3) По расстоянию между датами или интервалам времени выделяют полные или неполные ряды динамики. Полные ряды динамики имеют место тогда, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равноотстоящие ряды динамики. Неполные – когда принцип равных интервалов не соблюдается. 4) По числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики. Если ведется анализ во времени одного показателя, имеем изолированный ряд динамики. Комплексный ряд динамики получается в том случае, когда в хронологической последовательности дается система показателей, связанных между собой единством процесса или явления Требования, предъявляемые к рядам динамики 1) Сопоставимость статистических данных Ряды динамики формируются в результате сводки и группировки материалов статистического наблюдения. Повторяющиеся во времени (по отчетным периодам) значения одноименных показателей в ходе статистической сводки систематизируются в хронологической последовательности. При этом каждый ряд динамики охватывает отдельные обособленные периоды, в которых могут происходить изменения, приводящие к несопоставимости отчетных данных с данными других периодов. Поэтому для анализа ряда динамики необходимо приведение всех составляющих его элементов к сопоставимому виду. Для этого в соответствии с задачами исследования устанавливаются причины, обусловившие несопоставимость анализируемой информации, и применяется соответствующая обработка, позволяющая производить сравнение уровней ряда динамики. 2)Величины временных интервалов должны соответствовать интенсивности изучаемых процессов. Чем больше вариация уровней во времени, тем чаще следует делать замеры. Соответственно для стабильных процессов интервалы можно увеличить. 3)Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями. При статистической оценке взаимосвязи двух временных рядов рекомендуется применять их разложение на несколько компонент, одна из которых является тредовой, а другая описывает регулярные (например, сезонные) колебания, иначе результаты исследования будет тяжело интерпретировать, либо они будут интерпретированы неверно. Эконометрическую модель можно построить, используя два типа исходных данных: • данные, характеризующие совокупность различных объектов в определенный момент (период) времени; • данные, характеризующие один объект за ряд последовательных моментов (периодов) времени. Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные по данным второго типа, называются моделями временных рядов. Временной ряд - это совокупность значений какого-либо показателя за несколько последовательных моментов (периодов) времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:  факторы, формирующие тенденцию ряда;  факторы, формирующие циклические колебания ряда;  случайные факторы. При различных сочетаниях этих факторов зависимость уровней ряда от времени может принимать разные формы. Во-первых, большинство временных рядов экономических показателей имеют тенденцию, характеризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. По всей видимости, эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей зависит от времени года (например, цены на сельскохозяйственную продукцию в летний период выше, чем в зимний; уровень безработицы в курортных городах в зимний период выше по сравнению с летним). При наличии больших массивов данных за длительные промежутки времени можно выявить циклические колебания, связанные с общей динамикой конъюнктуры рынка, а также с фазой бизнес-цикла, в которой находится экономика страны. Некоторые временные ряды не содержат тенденции и циклическую компоненту, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Чаще всего модели содержат все три компоненты. Каждый их уровень формируется под воздействием тенденции, сезонных колебаний и случайной компоненты. В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования отдельного временного ряда — выявление и придание количественного выражения каждой из перечисленных выше компонент, с тем чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов. 2. При наличии тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих значений. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Разумно предположить, что каждое значение временного ряда зависит от значений предыдущих лет. Определим коэффициент корреляции между рядами yt , yt 1 и измерим тесноту связи между предыдущим и последующим значениями. Для этого формируем ряд yt 1 путем сдвига исходного ряда на один момент времени. (Расчет начинается со второй пары значений, т.к. у первого значения пары нет). В качестве переменной х рассматривается ряд у2, у3,…у8; в качестве переменой у – ряд у1, у2,…,у7. Коэффициент корреляции имеет вид: n r1  (y t 2 n (y t 2 t  y1 )( yt 1  y 2 ) n t  y1 ) 2 *  ( yt 1  y 2 ) 2 t 2 n где y1  y t 2 n t n 1 ; y2  y t 2 t 1 n 1 Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда t и t-1, т. е. при лаге 1. Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями ряда уt, и y t-2 и определяется по формуле: n r2  (y t 3 n (y t 3 t  y3 )( yt 2  y 4 ) n t  y3 ) 2 *  ( yt 2  y 4 ) 2 t 3 Число периодов, по которым рассчитывается коэффициент автокорреляции, называется лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило «максимальный лаг должен быть не больше п/4». Отметим два важных свойства коэффициента автокорреляции Во-первых, он строится по аналогии с линейным коэффициентом корреляции и, таким образом, характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю. Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом они могут иметь убывающую тенденцию. Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется коррелограммой. Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, следовательно, лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда. Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка  , ряд содержит циклические колебания с периодичностью в  моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать предположение относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний и имеет структуру сходную со структурой ряда, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия отсутствия трендовой компоненты Т и циклической (сезонной) компоненты S. Аналогично, если, например, при анализе временного ряда наиболее высоким оказался коэффициент автокорреляции второго порядка, ряд содержит циклические колебания с циклом, равным двум периодам времени, т. е. имеет пилообразную структуру. 3. Известно несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Простейший подход расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий: Y=Т+ S + E. Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой Т, сезонной S и случайной Е компонент. Общий вид мультипликативной модели выглядит так: Y=T*S*E Данная модель предполагает, что каждый уровень временного может быть представлен как произведение трендовой Т, сезонной S и случайной Е компонент. Выбор одной из двух моделей проводится на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты. Построение аддитивной и мультипликативной моделей сводится к расчету значений Т, S и Е для каждого уровня ряда. Процесс построения моделей включает в себя следующие шаги: Шаг 1. Выравнивание исходного ряда методом скользящей средней. Шаг 2. Расчет значений сезонной компоненты S. Шаг 3. Устранение сезонной компоненты из исходных уровней ряда и получение выравненных данных (Т+Е) в аддитивной (Т*Е) в мультипликативной модели. Шаг 4. Аналитическое выравнивание уровней (Т+Е) или (Т*Е) и расчет значений Т с использованием полученного уравнения тренда. Шаг 5. Расчет полученных по модели значений (Т+S) или (T*S). Шаг 6. Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок Е для анализа взаимосвязи исходного ряда и других временных рядов. Выявление и устранение сезонного эффекта используются в двух направлениях. Во-первых, воздействие сезонных колебаний следует устранять на этапе предварительной обработки исходных данных при изучении взаимосвязи нескольких временных рядов. Поэтому в российских и международных статистических сборниках часто публикуются данные, в которых устранено влияние сезонной компоненты (если это помесячная или квартальная статистика). Во-вторых, выявление сезонного эффекта производится в анализе структуры одномерных временных рядов с целью прогнозирования уровней ряда в будущие моменты времени. 4. От сезонных и циклических колебаний следует отличать единовременные изменения характера тенденции временного ряда, вызванные структурными изменениями в экономике и иными факторами. В этом случае, начиная с некоторого момента времени t, происходит изменение характера динамики изучаемого показателя, что приводит к изменению параметров тренда, описывающего эту динамику. Момент (период) времени t* сопровождается значительными изменениями ряда факторов, оказывающих сильное воздействие на изучаемый показатель уt. Чаще всего эти изменения вызваны изменениями в общеэкономической ситуации или факторами (событиями) глобального характера, приведшими к изменению структуры экономики (например, начало крупных экономических реформ, изменение экономического курса, нефтяные кризисы и прочие факторы). Если исследуемый временной ряд включает в себя соответствующий момент (период) времени, то одной из задач его изучения становится выяснение вопроса о том, значимо ли повлияли общие структурные изменения на характер этой тенденции. Если это влияние значимо, то для моделирования тенденции данного временного ряда следует использовать кусочно-линейные модели регрессии, т. е. разделить исходную совокупность на две подсовокупности (до момента времени t* и после момента t*) и построить отдельно по каждой подсовокупности уравнения линейной регрессии. Если структурные изменения незначительно повлияли на характер тенденции ряда уt ,то ее можно описать с помощью единого для всей совокупности данных уравнения тренда. Каждый из описанных выше подходов имеет свои положительные и отрицательные стороны. При построении кусочно-линейной модели происходит снижение остаточной суммы квадратов, по сравнению с единым для всей совокупности уравнением тренда. Однако разделение исходной совокупности на две части ведет к потере числа наблюдений и, следовательно, к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Построение единого для всей совокупности уравнения тренда, напротив, позволяет сохранить число наблюдений п исходной совокупности, однако остаточная сумма квадратов по этомy уравнению будет выше по сравнению с кусочно-линейной моделью. Очевидно, что выбор одной из двух моделей (кусочно-линейной или единого уравнения тренда) будет зависеть от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели. Тест Чоу – это метод, который позволяет проверить предположение о необходимости разбиения основной выборочной совокупности на части, или подвыборки. Выдвинем гипотезу Но о структурной стабильности тенденции изучаемого временного ряда. Условные обозначения для алгоритма теста Чоу Номер уравнения Вид уравнения (1) y(1)=a1+b1t (2) y(2)=a2+b2t Число наблюдений в совокупности Остаточная сумма квадратов Число параметров в уравнении Число степеней свободы остаточной дисперсии k1 n1-k1 k2 n2-k2 Кусочно-линейная модель n1 C1ост C2ост n2 Уравнение тренда по всей совокупности (3) y(3)=a3+b3t C3ост n k3 n-k3 = (n1+n2)-k3 Остаточную сумму квадратов по кусочно-линейной модели (Склост) можно найти как сумму С'ост. и С2ост. Склост= С'ост. + С2ост. Соответствующее ей число степеней свободы составит: (n1-k1)+(n2+k2)=(n-k1-k2) Тогда сокращение остаточной дисперсии при переходе от единого уравнения тренда к кусочно-линейной модели можно определить следующим образом: 3 кл Сост  Сост  Сост Число степеней свободы, соотношения (6.19) будет равно: соответствующее Сост , с учетом п-к3–(n-k1-к2) = к1+к2—к3. Далее в соответствии с предложенной Г. Чоу методикой определяется фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации: Д Сост : (k1  k 2  k 3 ) Fфакт  С  кл Д кл Cост : (n  k1  k 2 ) Fфакт характеризует улучшение качества модели регрессии после разделения ее на подвыборки. Найденное значение Fфакт сравнивают с табличным, полученным по таблицам распределения Фишера для уровня значимости  и числа степеней свободы (k1 + k2 – k3) и (n – k1 - k2). Если Fфакт>Fтабл, то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику изучаемого показателя признают значимым. В этом случае моделирование тенденции временного ряда следует осуществлять с помощью кусочно-линейной модели (т.е. качество частных моделей регрессии превосходит качество основной модели регрессии без ограничений). Если Fфакт<Fтабл, то нет оснований отклонять нулевую гипотезу о структурной стабильности тенденции. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда (т.е. нет необходимости разбивать основную модель). Особенности теста Чоу: 1). Если число параметров во всех уравнениях (1), (2), (3) одинаково и равно к, то формула упрощается: Fфакт  Сост : k кл Cост : ( n  2k ) 2). Тест Чоу позволяет сделать вывод о наличии или отсутствии структурной стабильности в изучаемом временном ряде. Если Fфакт<Fтабл, то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их параметров а1 и а2, а также b1 и b2 соответственно статистически незначимы. Если же Fфакт>Fтабл,, то гипотеза о структурной стабильности отклоняется, что означает статистическую значимость различий в оценках параметров уравнений (1)и (2). 3). Применение теста Чоу предполагает соблюдение предпосылок о нормальном распределении остатков в уравнениях (1) и (2) и независимость их распределений. Ели гипотеза о структурной стабильности тенденции ряда уt отклоняется, дальнейший анализ может заключаться в исследовании вопроса о причинах этих структурных различий и более детальном изучении характера изменения тенденции. В принятых нами обозначениях эти причины обусловливают различия оценок параметров уравнений (1) и (2). Вопросы для самоконтроля 1. Дайте понятие временного ряда. Перечислите его основные характеристики. 2. Что такое автокорреляция уровней временного ряда и как ее можно оценить количественно? 3. Перечислите основные виды трендов. 4. Выпишите общий вид аддитивной и мультипликативной моделей временного ряда. 5. Перечислите этапы построения модели временного ряда. 6. С какими целями проводится выявление и устранение сезонного эффекта? 1. 2. 3. 4. Рекомендуемая литература Арженовский С.В., Федосова О.Н. Эконометрика: Учебное пособие / Рост. гос. экон. универ. Ростов н/Д., 2002. - 102 с. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. – М.: Финансы и статистика, 2001. Эконометрика: Учебник /Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2002.-480 с. Елисеева И.И., Юзбашев М.М. Общая теория статистики. – М.: Финансы и статистика, 2000. Тема 6. Изучение взаимосвязей по временным рядам 1.Включение в модель регрессии фактора времени. 2.Автокорреляция в остатках. Критерий Дарбина-Уотсона. 1. В корреляционно-регрессионном анализе можно устранить воздействие какого-либо фактора, если зафиксировать воздействие этого фактора на результат и другие включенные в модель факторы. Данный прием широко применяется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной. Модель вида yt  a  b1 xt  b2t   t относится к группе моделей, включающих фактор времени. Число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только текущие, но и лаговые значения независимой и результативной переменных. Преимущество данной модели состоит в том, что она позволяет учесть всю информацию, содержащуюся в исходных данных, поскольку значения уt и хt,- это уровни исходных временных рядов. Кроме того, модель строится по всей совокупности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к. потере числа наблюдений. Параметры а и b модели с включением фактора времени определяются обычным МНК. Система нормальных уравнений имеет вид: na  b1  xt  b2  t   yt  2 a  xt  b1  xt  b2  txt   xt yt  2 a  t  b1  txt  b2  xt   tyt Решив эту систему относительно a, b1, b2, найдем значения параметров. Интерпретация параметров уравнения следующая: Параметр b1 характеризует, как измениться результат при изменении фактора на единицу, в условиях существования неизменной тенденции. Воздействие всех факторов на результат, кроме фактора, включенного в модель, приведет к его среднегодовому абсолютному приросту на величину равную значению при параметре b2. 2. Автокорреляция - это корреляция, которая возникает между уровнями исследуемой переменной, т.е. корреляция во времени. Свойство автокорреляции чаще всего проявляется во временных рядах. Автокорреляция остатков модели регрессии (или случайных ошибок модели регрессии) - это корреляционная зависимость между настоящими и прошлыми значениями остатков. Временной лаг - это величина сдвига между рядами остатков модели регрессии. Величина временного лага определяет порядок коэффициента автокорреляции. Например, если существует корреляционная зависимость между остатками еn и en-2, то величина временного лага равняется двум. Следовательно, данную зависимость будет характеризовать коэффициент автокорреляции второго порядка между рядами остатков. Одно из условий нормальной линейной модели регрессии заключается в том, что случайный ошибки модели регрессии не коррелированы между собой, ковариация случайных ошибок любых двух разных наблюдений равна нулю. Нарушение этого условия приводит к автокорреляции остатков модели регрессии. Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, она связана с исходными данными и вызвана наличием измерения в значениях результативного признака. Во-вторых, в ряде случаев причину автокорреляции остатков следует искать в формулировке модели. Модель может не включать фактор, оказывающий существенное влияние на результат, влияние которого отражается в остатках, вследствие чего, последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени. Кроме того, в качестве таких существенных факторов могут выступать лаговые значения переменных, включенных в модель. Либо модель не учитывает несколько второстепенных факторов, совместное влияние которых на результат значительно, ввиду совпадения тенденций их изменении фаз циклических колебаний. Последствия автокорреляции остатков модели регрессии аналогичны последствиям гетероскедастичности. Для обнаружения автокорреляции первого порядка (между соседними рядами) остатков модели регрессии применяется критерий Дарбина-Уотсона. Критическое значение критерия d (n; h-1) определяется с помощью специальных таблиц, в которых указаны значения верхней d1 и нижней d2 границы критерия. Данные границы рассчитываются на основании объема выборки n и числа степеней свободы (h-1) , где h – количество оцениваемых по выборке параметров. Наблюдаемое значение критерия Дарбина-Уотсона: 2      t 2 t t 1 n d  2  t t 1 n Таким образом, d- это отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Соотношение между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка: d  2(1  r1 ) Если в остатках существует полная положительная автокорреляция и то d=0. Если в остатках есть полная отрицательная автокорреляция, то и d=4. Если автокорреляция остатков отсутствует, то re1=0 и d=2. Выдвигается гипотеза H0 об отсутствии автокорреляции остатков. Альтернативные гипотезы Н*1 и Н1 состоят соответственно в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам определяются критические значения критерия Дарбина - Уотсона dL и dU для заданного числа наблюдений п, числа независимых переменный модели к и уровня значимости . По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1 ) представлено на рисунке. Если фактическое значение критерия Дарбина - Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу Н0. re1=1, re1=-1   Есть Зона Нет оснований Зона положительная неопределенности отклонять H0 неопределенности автокорреляция (автокорреляция остатков. H0 остатков отклоняется. отсутствует) С вероятностью P=(1 -  ) Есть отрицательная автокорреляция остатков. H0 отклоняется. С вероятностью  P=(1 ) принимается H*1 принимается H1 0 dL dU 2 4-dU 4-dL Рис. Алгоритм проверки гипотезы о наличии автокорреляции остатков Есть несколько существенных ограничений на применение данного критерия: 1. он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака, т.е. к моделям авторегрессии; 2. методика расчета данного критерия направлена только на выявление автокорреляции остатков первого порядка; 3. критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок. Вопросы для самоконтроля 1. В чем преимущество моделей, включающих фактор времени? 2. Дайте понятие временного лага. 3. Что такое автокорреляция остатков модели регрессии? 4. Перечислите последствия автокорреляции остатков модели. 5. Алгоритм проверки гипотезы о наличии автокорреляции остатков. 4 1. 2. 3. 4. Рекомендуемая литература Арженовский С.В., Федосова О.Н. Эконометрика: Учебное пособие / Рост. гос. экон. универ. Ростов н/Д., 2002. - 102 с. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. – М.: Финансы и статистика, 2001. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005.-576с. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере/Под ред. В.Э.Фигурнова.-М.: ИНФРА-М, 1998.-528 с. Тема 7. Динамические эконометрические модели 1.Общая характеристика моделей с распределенным лагом и моделей авторегрессии. 2.Интерпретация параметров модели с распределенным лагом и моделей авторегрессии. 3.Изучение структуры лага и выбор вида модели с распределенным лагом (лаги Алмон, метод Койка). 1. Динамические эконометрические модели - это модели регрессии, которые в настоящий момент времени учитывают значения входящих в них переменных, относящимся не только к текущему, но и к предыдущему моментам времени. Например, динамическими эконометрическими моделями будут модели регрессии вида yt  f ( xt , xt 1 ).....или..... yt  ( xt , yt 1 ) . А модель регрессии вида yt  f ( x1 ...xn )  f ( xi ) не принадлежит к динамическим эконометрическим моделям. Выделяют два основных типа динамических эконометрических моделей: 1) модели, в которой значения переменным, относящихся к прошлым моментам времени (лаговые значения), включены в модель с текущими значениями этих переменных. К таким моделям относятся: а) модель авторегрессии. Это динамическая эконометрическая модель, в которую в качестве факторных переменных включены лаговые значения результативной переменной. yt   0  1 xt  1 yt 1   t б) модель с распределенным лагом. Это динамическая эконометрическая модель, в которую включены не только текущие, но и лаговые значения факторных переменных. Пример модели с распределенным лагом: yt   0  1 xt   2 xt 1  ...   L xt L   t где L. - это величина временного лага (запаздывания) между рядами наблюдений. 2) модели, включающие переменные, отражающие предполагаемый или желаемый уровень результативной переменной или одной из факторных переменных в определенный момент времени (t+1). Этот уровень заранее неизвестен и определяется на основании той информации, которая имеется в наличии на предшествующий момент времени (t). Предполагаемые значения переменных рассчитываются различными способами. Выделяют следующие виды моделей: а) модель адаптивных ожиданий (МАО). Это динамическая эконометрическая модель, которая учитывает предполагаемое (или желаемое) значение факторной переменной xt-1 Общий вид модели адаптивных ожиданий: yt   0  1 * xt 1   t Примером модели адаптивных ожиданий является модель зависимости предполагаемой в будущем периоде (t + 1) индексации заработных плат и пенсий на текущие цены, б) модель частичной (неполной) корректировки (МЧК). Это динамическая эконометрическая модель, которая учитывает предполагаемое (или желаемое) значение результативной переменной уt. Общий вид модель частичной корректировки: yt   0  1 * xt   t Примером модели частичной корректировки является зависимость желаемого объема дивидендов уt от фактического текущего объема прибыли хt. Данная модель более известна как модель Литнера. При исследовании экономических процессов нередко приходиться моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты времени t-1, t-2,…t-l. Например, на выручку от реализации и прибыль предприятия текущего периода могут оказывать влияние расходы на рекламу или проведение маркетинговых исследований, сделанные компанией в предшествующие моменты времени. Величину l, характеризующую запаздывание в воздействии фактора на результат, в эконометрике называют лагом, а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, лаговыми переменными. Разработка экономической политики как на макро-, так и на микроуровне, требует решения обратного типа задач, т.е., задач, определяющих какое воздействие окажут значения управляемых переменных текущего периода на будущие значения экономических показателей. Например, как повлияют инвестиции в промышленность на валовую добавленную стоимость этой отрасли экономики будущих периодов или как может измениться объем ВВП, произведенного в периоде t+1, под воздействием увеличения денежной массы в периоде t? Эконометрическое моделирование охарактеризованных выше процессов осуществляется с применением моделей, содержащих не только текущие, но и лаговые значения факторных переменных. Эти модели называются моделями с распределенным лагом. Модель вида: yt  a0  b0 xt  b1 xt 1  b2 xt 2   t Построение моделей с распределенным лагом и моделей авторегрессии имеет свою специфику. Во-первых, оценка параметров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть проведена с помощью обычного МНК ввиду нарушения его предпосылок и требует специальных статистических методов. Во-вторых, исследователям приходится решать проблемы выбора оптимальной величине лага и определения его структуры. Наконец, в-третьих, между моделями с распределенным лагом и моделями авторегрессии имеется определенная взаимосвязь, и в некоторых случаях необходимо осуществлять переход от одного типа моделей к другому. 2. Рассмотрим модель с распределенным лагом в ее общем виде в предположении, что максимальная величина лага конечна: yt  a  b0 xt  b1 xt 1  ...  b p xt  p   t Данная модель говорит о том, что если в некоторый момент времени t происходит изменение независимой переменной х, то это изменение будет влиять на значения переменной у в течение l следующих моментов времени. Коэффициент регрессии b() при переменной хt характеризует среднее абсолютное изменение у, при изменении х, на 1 единицу своего измерения в некоторый фиксированный момент времени t, без учета воздействия лаговых значений фактора х. Этот коэффициент называют краткосрочным мультипликатором. В момент t + 1 совокупное воздействие факторной переменной х, на результат yt составит (b0+b1) условных единиц, в момент t+2 это воздействие можно охарактеризовать суммой (b0+b1+b2) и т. д. Полученные таким образом суммы называют промежуточными мультипликаторами. С учетом конечной величины лага можно сказать, что изменение переменной х, в момент t на 1 у.е. приведет к общему изменению результата через l моментов времени на (b0+b1+…+bl) абсолютных единиц. Введем следующее обозначение: (b0+b1+…+bl)=b Величину b называют долгосрочным мультипликатором, который показывает абсолютное изменение в долгосрочном периоде t + l результата у под влиянием изменения на 1 ед. фактора x. Предположим,  j  b j / b, j  0 : 1 Назовем полученные величины относительными коэффициентами модели с распределенным лагом. Если все коэффициенты bj; имеют одинаковые знаки, то для любого j l 0<βj<1 и  j 0  j  1 В этом случае относительные коэффициенты βj являются весами для соответствующих коэффициентов bj. Каждый из них измеряет долю общего изменения результативного признака в момент времени t +j. Зная величины βj, с помощью стандартных формул можно определить еще две важные характеристики модели множественной регрессии: величину среднего и медианного лагов. Средний лаг рассчитывается по формуле средней арифметической взвешенной: l   j 0 jj l и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t. Небольшая величина среднего лага свидетельствует об относительно быстром реагировании результата на изменение фактора, тогда как высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени. lM Медианный лаг – это величина лага, для которого  j 0  j  0,5 . Это тот e период времени, в течение которого с момента времени t будет реализована половина общего воздействия фактора на результат. Изложенные выше приемы анализа параметров модели с распределенным лагом действительны только в предположении, что все коэффициенты при текущем и лаговых значениях исследуемого фактора имеют одинаковые знаки. Это предположение, вполне оправданно с экономической точки зрения: воздействие одного и того же фактора на результат должно быть однонаправленным независимо от того, с каким временным лагом измеряется сила или теснота связи между этими признаками. Однако на практике получить статистически значимую модель, параметры которой имели бы одинаковые знаки, особенно при большой величине лага l, чрезвычайно сложно. Применение обычного МНК к таким моделям в большинстве случаев затруднительно по следующим причинам. Во-первых, текущие и лаговые значения независимой переменной, как правило, тесно связаны друг с другом. Тем самым оценка параметров модели проводится в условиях высокой мультиколлинеарности факторов. Во-вторых, при большой величине лага снижается число наблюдений, по которому строится модель, и увеличивается число факторных признаков, что ведет к потере числа степеней свободы в модели. В-третьих, в моделях с распределенным лагом часто возникает проблема автокорреляции остатков. Вышеуказанные обстоятельства приводят к значительной неопределенности относительно оценок параметров модели, к снижению их точности и получению неэффективных оценок. Чистое влияние факторов на результат в таких условиях выявить невозможно. Поэтому на практике параметры моделей с распределенным лагом учитывают определенные ограничения на коэффициенты регрессии и условия выбранной структуры лага. На практике коэффициенты моделей с распределенным лагом оценивают с помощью специальных методов, к которым относятся метод Койка и метод Алмон. Обратимся теперь к модели авторегрессии. Пусть имеется следующая модель: yt  a  b0 xt  c1 yt 1   t Как и в модели с распределенным лагом, b0 в этой модели характеризует краткосрочное изменение у, под воздействием изменения х, на 1 ед. Однако промежуточные и долгосрочный мультипликаторы в моделях авторегрессии несколько иные. К моменту времени t+1 результат у изменился под воздействием изменения изучаемого фактора в момент времени t на bо единиц, a yt+1 – под воздействием своего изменения в непосредственно предшествующий момент времени на с1 единиц. Таким образом, общее абсолютное изменение результата в момент t+ 1 составит b0c1 единиц. Аналогично в момент времени t + 2 абсолютное изменение результата составит b0c12 единиц и т. д. Следовательно, долгосрочный мультипликатор в модели авторегрессии можно рассчитать как сумму краткосрочного и промежуточного мультипликаторов: b  b0  b0 c1  b0 c12  b0 c13 Учитывая, что практически во все модели авторегрессии вводится так называемое условие стабильности, состоящее в том, что коэффициент регрессии при переменной yt-1 по абсолютной величине меньше единицы |c1| < 1, соотношение можно преобразовать следующим образом: b  b0 (1  c1  c12  c13  ...)  b0 1  c1 где |с1| < 1. Такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на предпосылке о наличии бесконечного лага в воздействии текущего значения зависимой переменной на ее будущие значения. 3. Текущие и лаговые значения факторной переменной оказывают различное по силе воздействие на результативную переменную модели. Количественно сила связи между результатом и значениями факторной переменной, относящимися к различным моментам времени, измеряется с помощью коэффициентов регрессии при факторных переменных. Если построить график зависимости этих коэффициентов от величины лага, можно получить графическое изображение структуры лага, или распределения во времени воздействия факторной переменной на результат. Структура лага может быть различной. Если с ростом величины лага коэффициенты при лаговых значениях переменной убывают во времени, то имеет место линейная (се называют также треугольной) или геометрическая структура лага. Если лаговые воздействия фактора на результат не имеют тенденцию к убыванию во времени, то имеет место один из вариантов, то такую структуру лага называют «перевернутой» V-образной структурой. Основная ее особенность - симметричность лаговых воздействий относительно некоторого среднего лага, который характеризуется наиболее сильным воздействием фактора на результат. Графический анализ структуры лага аналогичным образом можно проводить и с помощью относительных коэффициентов регрессии βj. Основная трудность в выявлении структуры лага состоит в том, как получить значения параметров bj (или βj). Выше уже отмечалось, что обычный МНК. редко бывает полезным в этих целях. Поэтому в большинстве случаев предположения о структуре лага основаны на общих положениях экономической теории, на исследованиях взаимосвязи показателей либо на результатах проведенных ранее эмпирических исследований или иной априорной информации. Лаги Алмон Рассмотрим общую модель с распределенным лагом, имеющую конечную максимальную величину лага l, которая описывается yt  a  b0 xt  b1 xt 1  ...  b p xt  p   t . соотношением Предположим, было установлено, в исследуемой модели имеет место полиномиальная структура лага, т. е. зависимость коэффициентов регрессии bt от величины лага описывается полиномом k-й степени. Лаги, структуру которых можно описать с помощью полиномов, называют также лагами Алмон, по имени Ш. Алмон, впервые обратившей внимание на такое представление лагов. Формально модель зависимости коэффициентов bj от величины лага j в форме полинома можно записать так: • для полинома первой степени bj = с0 + c1j; • для полинома второй степени bj, = с0 + c1j + c2j2-, • для полинома третьей степени b} = с0 + c1j + с2j + c3j3 и т. д. В наиболее общем виде для полинома к-й степени имеем: bJ=c0 + c1j + c2j2+...+ ckjk. Тогда каждый из коэффициентов bj модели можно выразить следующим образом: b0  c0 ; b1  c0  c1  ...  ck ; b2  c0  2c1  4c2  ...  2 k ck ; b3  c0  3c1  9c2  ...  3k ck ; ........................................... bt  c0  lc1 l 2c2  ...  l k ck . Подставив в bJ=c0 + c1j + c2j2+...+ ckjk найденные соотношения для b**j -, получим: yt  a  c0 xt  (c0  c1  ...  ck ) xt 1  (c0  2c1  4c2  ...  2 k ck ) xt 2  (c0  3c1  9c2  ...  3k ck ) xt 3  ...  (c0  lc1  l 2 c2  ...  l k ck ) xt l   l Перегруппируем слагаемые: yt  a  c0 ( xt  xt 1  xt 2  ...  xt l )  c1 ( xt 1  2 xt 2  3xt 3  ...  lxt 1 )   c2 ( xt 1  4 xt 2  9 xt 3  ...  l 2 xt 1 )  ...  ck ( xt 1  2 k xt 2  3k x t 3 ...  l k xt l )   t Обозначим слагаемые в скобках при сi как новые переменные: z 0  xt  xt 1  x t 2 ...  xt l   j 0 xt  j l z1  xt 1  2 xt 2  3 x t 3 ...  lx t l   j 1 jxt  j l z 2  xt 1  4 xt 2  9 x t 3 ...  l 2 xt l   j 1 j 2 xt  j l .......................................................... z k  xt 1  2 k xt 2  3k x t 3 ...  l k xt l   j 1 j k xt  j l Перепишем модель с учетом соотношений: yt  a  c0 z0  c1 z1  c2 z 2  ...  ck z k   t Процедура применения метода Алмон для расчета метров модели с распределенным лагом выглядит следующим разом. 1. Определяется максимальная величина лага l. 2. Определяется степень полинома к, описывающего структуру лага. 3. По соотношениям рассчитываются значения переменных z0,….,zk 4. Определяются параметры уравнения линейной peгрессии. 5. С помощью соотношений рассчитываются параметры исходной модели с распределенным лагом. Применение метода Алмон сопряжено с рядом проблем. Во-первых, величина лага должна быть известна заранее. При ее определении лучше исходить из максимально возможного лага, чем ограничиваться лагами небольшой длины. Выбор меньшей величины лага по сравнению с его реальным значением приведет к тому, что в модели регрессии не будет учтен фактор, оказывающий значительное влияние на результат, т. е. к неверной спецификации модели. Влияние этого фактора в такой модели будет выражено в остатках. Тем самым в модели не будут соблюдаться предпосылки МНК о случайности остатков, а полученные оценки ее параметров окажутся неэффективными и смещенными. Выбор большей величины лага по сравнению с ее реальным значением будет означать включение в модель статистически незначимого фактора и снижение эффективности полученных оценок, однако эти оценки все же будут несмещенными. Известно несколько практических подходов к определению реальной величины лага, например построение нескольких уравнений регрессии и выбор наилучшего из этих уравнений или применение формальных критериев, например критерия Шварца. Однако наиболее простым способом является измерение тесноты связи между результатом и лаговыми значениями фактора. Кроме того, оптимальную величину лага можно приближенно определить на основе априорной информации экономической теории или проведенных ранее эмпирических исследований. Во-вторых, необходимо установить степень полинома к. Обычно на практике ограничиваются рассмотрением полиномов второй и третьей степени, применяя следующее простое правило: выбранная степень полинома к должна быть на единицу больше числа экстремумов в структуре лага. Если априорную информацию о структуре лага получить невозможно, величину к проще всего определить путем сравнения моделей, построенных для различных значении к, и выбора наилучшей модели. В-третьих, переменные z которые рассчитываются как линейные комбинации исходных переменных х, будут коррелировать между собой в случаях, когда наблюдается высокая связь между самими исходными переменными. Поэтому оценку параметров модели приходится проводить в условиях мультиколлинеарности факторов. Однако мультиколлинеарность факторов z0,…zk в модели сказывается на оценках параметров b0,…bl в несколько меньшей степени, чем если бы эти оценки были получены путем применения обычного МНК непосредственно к модели в условиях мультиколлинеарности факторов xt,…xt-l. Это связано с тем, что в модели мультиколлинеарность ведет к снижению эффективности оценок с0,..ск, поэтому каждый из параметров b0,…bl, которые определяются как линейные комбинации оценок с0,…ск, будет представлять собой более точную оценку, а стандартные ошибки этих параметров не будут превышать стандартные ошибки параметров, полученных по модели обычным МНК. Метод Алмон имеет два неоспоримых преимущества: - он достаточно универсален и может быть применен для моделирования процессов, которые характеризуются разнообразными структурами лагов; - при относительно небольшом количестве переменных (обычно выбираются k=2 или k=3), которое не приводит к потере значительного числа степеней свободы, с помощью метода Алмон можно построить модели с распределенным лагом любой длины. Метод Койка Рассмотренные выше модели были построены в предположении о том, что величина лага l конечна. Допустим теперь, что для описания некоторого процесса используется модель с бесконечным лагом вида: yt  a  b0 xt  b1 xt 1  b2 xt 2  ...   t Очевидно, что параметры такой модели обычным МНК или с помощью иных стандартных статистических методов определить нельзя, поскольку модель включает бесконечное число факторных переменных. Однако, приняв определенные допущения относительно структуры лага, оценки ее параметров все же можно получить. Эти допущения состоят в наличии геометрической структуры лага, т. е. такой структуры, когда воздействия лаговых значений фактора на результат уменьшаются с увеличением величины лага в геометрической прогрессии. Подход к оценке параметров моделей с распределеным лагом типа yt  a  b0 xt  b1 xt 1  b2 xt 2  ...   t впервые был предложен Л.М. Койком. Он предположил, что существует некоторый постоянный темп λ (0 < λ < 1) уменьшения во времени лаговых воздействий фактора на результат. Если, например, в период t результат изменялся под воздействием изменения фактора в этот же период времени на b0 ед., то под воздействием изменения фактора, имевшего место в период t - 1, результат изменится на b0 λ ед.; в период t-2 - на b0 λ λ = b0 λ 2ед. и т. д. Для некоторого периода t - l это изменение результата составит: b0λl. В более общем виде можно записать: b j  b0  j ; j  0,1,2...,0    1 Ограничение на значения λ > 0 обеспечивает одинаковые знаки для всех коэффициентов bj> 0, а ограничение λ < 1 означает, что с увеличением лага значения параметров модели убывают в геометрической прогрессии. Чем ближе λ к 0, тем выше, темп снижения воздействия фактора на результат во времени тем большая доля воздействия на результат приходится на текущие значения фактора хt. Выразим с помощью формулы все коэффициенты bj, в модели через b0 и λ; yt  a  b0 xt  b0 xt 1  b0 2 xt 2  ...   t Тогда для периода t - 1 модель можно записать следующим образом: yt 1  a  b0 xt 1  b0 xt 2  b0 2 xt 3  ...   t 1 Умножим обе части модели на λ, получим: yt 1  a  b0 xt 1  b0 2 xt 2  b0 3 xt 3  ...   t 1 Вычтем найденное соотношение из соотношения: yt  yt 1  a  a  b0 xt   t 1   t 1 В результате преобразований мы получаем модель Койка: yt  a(1   )  b0 xt  (1   ) yt 1  ut , гдеu t   t   *  t 1 Полученная модель - это модель двухфакторной линейной регрессии (точнее - авторегрессии). Определив ее параметры, мы найдем λ и оценки параметров а и bо исходной модели. Далее с помощью соотношений несложно определить параметры b1, b2,…модели. Применив обычный МНК к оценке параметров модели, получим смещенные оценки параметров ввиду наличия в этой модели в качестве фактора лаговой результативной переменной уt-1. Описанный выше алгоритм получил название «преобразования Койка». Это преобразование позволяет перейти от модели с бесконечными распределенными лагами к модели авторегрессии, содержащей две независимые переменные хt и уt-1. Несмотря на бесконечное число лаговых переменных в модели, геометрическая структура лага позволяет определить величины среднего и медианного лагов в модели Койка. Поскольку сумма коэффициентов регрессии в модели - это сумма геометрической прогрессии, т. е.   b  b0  b0   b0 2  b0 3  ...  b0 (1    2  3  ...)  b0 j 0 j 1 1  то средний лаг определяется как    l j 0  j 0 jb j bj  b0  (1  2  3  ...)  1 b0 1  2 3 1  (1   ) 2  1 1  b0 1  b0  Нетрудно заметить, что при λ = 0,5 средний лаг l = 1, а при l< 0,5 средний лаг l < 1, т. е. воздействие фактора на результат в среднем занимает менее одного периода времени. Величину (1- λ) интерпретируют обычно как скорость, с которой происходит адаптация результата во времени к изменению факторного признака. ln 0,5 l  Медианный лаг в модели Койка равен: Me ln  Вопросы для самоконтроля 1. Назовите и охарактеризуйте основные типы динамических эконометрических моделей. 2. Как рассчитываются краткосрочный, промежуточный и долгосрочный мультипликаторы? 3. Дайте определение среднего и медианного лага? Поясните их смысл. 4. Перечислите этапы метода Алмон. 5. В каких случаях используется метод Койка? Рекомендуемая литература 1. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. – М.: Финансы и статистика, 2001. 2. Эконометрика: Учебник / И.И. Елисеева, С.В.Курышева, Т.В. Костеева и др.; Под ред. И.И. Елисеевой.-2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005.-576с. 3. Эконометрика: Учебник /Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2002.-480 с.

Эконометрика - Институт управленческих технологий и

Похожие документы

Разделы

Поддержка

Эконометрика - Институт управленческих технологий и

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib