37. Эконометрика. Краткий конспект лекций.

Министерство образования и науки РФ ФГАОУ ВПО «Казанский (Приволжский) федеральный университет» Институт экономики и финансов Кафедра статистики, эконометрики и естествознания И. И. Исмагилов, А. В. Костромин, Е. И. Кадочникова Эконометрика Краткий конспект лекций Казань – 2014 1 Направление подготовки: 080100.62 «Экономика», бакалавриат, очное Учебный план: ИЭиФ (ОЭП) (Бухгалтерский учет, анализ и аудит) на базе СПО, 2013г.; ИЭиФ (ОЭП) (Экономика предприятий и организаций), очное, 2011г.; ИЭиФ (ОЭП) (Экономика труда), очное, 2011г.; ИЭиФ (ОЭП) (Бухгалтерский учет, анализ и аудит), очное, 2011г.; ИЭиФ (ФКО) (Финансы и кредит), на базе СПО, 2013 г.; ИЭиФ (ФКО) (Налоги и налогообложение), очное, 2011 г.; ИЭиФ (ФКО) (Финансы и кредит), очное, 2011г.. Дисциплина: Б. 3. «Эконометрика», 3 курс, форма контроля: экзамен Количество часов: 180 (в т.ч.: 44 – лекции, 36 – практические занятия,10 лабораторная работа, 90 – самостоятельная работа). Аннотация: Целью дисциплины «Эконометрика» является обучение студентов теоретическим основам эконометрической методологии и практическим навыкам применения эконометрических методов для исследования экономических закономерностей и взаимосвязей между экономическими переменными. Данный курс включен в раздел Б3.Б3. ОПД.Ф.З профессионального цикла дисциплин и относится к базовой части. Изучению дисциплины «Эконометрика» предшествует освоение следующих дисциплин: «Математический анализ», «Теория вероятностей и математическая статистика», «Линейная алгебра», «Микроэкономика», «Макроэкономика», «Статистика». В круг основных задач дисциплины «Эконометрика» входят: получение теоретических знаний об эконометрических методах эмпирического анализа экономических процессов с целью имитации альтернативных сценариев развития анализируемой системы; формирование умения выбирать необходимые инструменты эконометрического анализа для обоснования управленческих решений; обучение практическим навыкам использования эконометрических подходов к моделированию социально–экономических процессов и содержательного обоснования полученных результатов для принятия управленческих решений. Подготовленный материал можно изучать самостоятельно, выполняя предлагаемые задания и проводя самоконтроль усвоения материала с помощью вопросов для самоконтроля. 2 Темы: Тема 1. Эконометрика как научная дисциплина. Тема 2. Основные понятия теории вероятностей и статистики, применяемые в эконометрике. Тема 3. Линейная модель парной регрессии и метод наименьших квадратов. Тема 4. Экономическая и статистическая интерпретация линейной модели парной регрессии. Тема 5. Линейная модель множественной регрессии, оценка ее параметров. Тема 6. Оценка качества модели множественной регрессии. Тема 7. Мультиколлинеарность. Тема 8. Гетероскедастичность. Тема 9. Автокорреляция. Тема 10. Фиктивные переменные в регрессионных моделях. Тема 11. Нелинейные регрессии и их линеаризация. Тема 12. Модели с дискретной зависимой переменной. Тема 13. Модели панельных данных. Тема 14. Ошибки спецификации. Тема 15. Модели одномерных временных рядов. Тема 16. Адаптивные модели временных рядов. Тема 17. Модели стационарных и нестационарных временных рядов. переменными. Тема 18. Модели с лаговыми Тема 19. Понятие о системах эконометрических уравнений. Тема 20. Методы оценки систем одновременных уравнений. Ключевые слова: метод наименьших квадратов, линейная модель регрессии, гетероскедастичность, автокорреляция, динамические модели, система взаимозависимых уравнений, косвенный метод наименьших квадратов. Авторы: Исмагилов Ильяс Идрисович, зав. кафедрой статистики, эконометрики, естествознания, доктор технических наук, тел.: 291-13-92, email: [email protected]; Костромин Андрей Владиленович, доцент кафедры статистики, эконометрики и естествознания КФУ, кандидат физикоматематических наук, тел.: 291-13-72, e-mail: [email protected]; Кадочникова Екатерина Ивановна, кандидат экономических наук, доцент кафедры статистики, эконометрики и естествознания ЭиФ КФУ, e-mail: [email protected] URL электронного курса в MOODLE: http://tulpar.kpfu.ru/course/view.php?id=2213 3 Оглавление 1. Тема 1. Эконометрика как научная дисциплина…………………… 8 1.1. Цели, предмет, задачи эконометрики…………………………………. 9 1.2. Инструментарий эконометрики. Типы моделей и переменных……… 9 1.3. Этапы эконометрического моделирования……………………………. 10 2. Тема 2. Основные понятия теории вероятностей и статистики, применяемые в эконометрике …………………………………………… 11 2.1. Основные понятия теории вероятностей. Нормальное распределение и связанные с ним χ2 - распределение, распределение Стьюдента и Фишера……………………………………………………………………… 13 2.2. Генеральная совокупность и выборка. Свойства статистических оценок………………………………………………………………………. 15 2.3. Статистические выводы и проверка гипотез……………………….. 16 3. Тема 3. Линейная модель парной регрессии и метод наименьших квадратов (МНК)…………………………………………………………. 26 3.1. Спецификация линейной модели парной регрессии…………………. 28 3.2. Метод наименьших квадратов (МНК) – идентификация линейной модели парной регрессии………………………………………………….. 29 3.3. Предпосылки МНК и свойства МНК-оценок…………………………. 30 4. Тема 4. Экономическая и статистическая интерпретация линейной модели парной 32 регрессии…………………………………………… 4.1. Экономическая интерпретация параметров модели……………….. 34 4.2. Коэффициенты корреляции и детерминации в линейной модели парной регрессии………………………………………………………….. 4.3. Проверка качества модели линейной парной 34 регрессии (верификация модели)……………………………………………………… 36 4.4. Интервалы прогноза по линейному уравнению регрессии……….. 37 4 5. Тема 5. Линейная модель множественной регрессии, оценка ее параметров…………………………………………………………………… 39 5.1. Линейная модель множественной регрессии. Эмпирическая форма записи. ………………………………………………………………………. 41 5.2.Оценка параметров модели с помощью МНК……………………….. 41 6.Тема 6. Оценка качества модели множественной регрессии……… 44 6.1. Показатели множественной качества корреляции множественной и регрессии: коэффициент Скорректированный индекс детерминации. коэффициент 46 детерминации…………………………………………………… 6.2. Оценка значимости уравнения в целом и каждого параметра в отдельности…………………………………………………………………… 47 .. 6.3. Сравнение двух регрессий при включении и при исключении отдельных наборов переменных. Частные F-критерии…………………….. 48 7.Тема 7. Мультиколлинеарность………………………………………… 50 7.1. Понятие мультиколлинеарности, ее причины и последствия………. 51 7.2. Обнаружение мультиколлинеарности и способы ее устранения или снижения…………………………………………………………………….. 52 8. Тема 8. Гетероскедастичность. ………………………………………. 53 8.1. Понятие и последствия гетероскедастичности…………………. 55 8.2. Методы обнаружения гетероскедастичности………………………… 55 8.3. Коррекция на гетероскедастичность…………………………………. 56 9. Тема 9. Автокорреляция………………………………………………. 57 9.1. Понятие и последствия автокорреляции……………………………… 59 9.2. Обнаружение автокорреляции………………………………………… 59 9.3. Коррекция на автокорреляцию………………………………………. 60 10. Тема 10. Фиктивные переменные в регрессионных моделях…… 61 10.1.Регрессионные модели с переменной структурой (фиктивные 5 переменные)………………………………………………………………… 63 ……. 10.2. Правило использования фиктивных переменных………………….. 63 10.3. ANOVA–модели и ANCOVA–модели. Тест Чоу на наличие структурной 63 перестройки………………………………………………………… 11. Тема 11. Нелинейные регрессии и их линеаризация…………….. 66 11.1. Классы и виды нелинейных регрессий…………………………….. 68 11.2. Линеаризация нелинейных моделей. Выбор формы модели……. 68 11.3. Индекс корреляции. Подбор линеаризующего преобразования (подход Бокса-Кокса)………………………………………………………. 69 12. Тема 12. Модели с дискретной зависимой переменной………….. 72 12.1. Модели бинарного выбора………………………………………….. 74 12.2. Оценивание параметров моделей бинарного выбора……………. 74 12.3. Модели множественного выбора с упорядоченными альтернативами……………………………………………………………… 75 …………….. 12.4. Модели множественного выбора с неупорядоченными альтернативами……………………………………………………………… 75 …………. 13. Тема 13. Модели панельных данных……………………………… 76 13.1. Основные понятия и характеристики панельных данных………… 78 13.2. Модель сквозной регрессии и модель регрессии со случайным индивидуальным эффектом. Оценивание модели со случайным индивидуальным 78 эффектом……………………………………………………………. 14. Тема 14. Ошибки спецификации……………………………………. 80 14.1. Спецификация регрессионной модели……………………………… 81 14.2. Исключение существенных переменных 6 и включение несущественных 82 переменных…………………………………………………………….. 14.3. Замещающие переменные в регрессионных моделях……………….. 82 15. Тема 15. Модели одномерных временных рядов………………….. 84 15.1. Понятие временного ряда и его основные компоненты………….. 86 15.2. Построение аддитивной модели…………………………………….. 87 15.3. Построение мультипликативной модели…………………………… 88 16. Тема 16. Адаптивные модели временных рядов…………………. 90 16.1. Адаптация в моделях временных рядов. Построение адаптивных моделей линейного роста………………………………………………….. 92 16.2. Адаптивные модели с учетом аддитивных и мультипликативных сезонных составляющих……………………………………………………. 92 16.3. Процедуры подбора параметров адаптивных моделей временных рядов…………………………………………………………………………. 93 17. Тема 17. Модели стационарных и нестационарных временных рядов……………………………………………………………………….. 95 17.1. Модели стационарных и нестационарных временных рядов, их идентификация……………………………………………………………… 96 17.2. Модель авторегрессии–скользящего среднего (модель ARMA)… 98 17.3. Авторегрессионная модель проинтегрированного скользящего среднего (модель ARIMA)………………………………………………… 99 18. Тема 18. Модели с лаговыми переменными………………………… 100 18.1. Статические и динамические модели……………………………….. 102 18.2. Модели с распределенным лагом…………………………………… 103 18.3. Модель частичной корректировки и модель адаптивных ожиданий. 104 19. Тема 19. Понятие о системах эконометрических уравнений…… 106 19.1. Понятие о системах уравнений. Системы независимых уравнений и системы взаимозависимых уравнений……………………………………. 108 19.2. Структурная и приведенная формы модели………………………. 109 7 19.3. Идентификация модели…………………………………………....... 109 20. Тема 20. Методы оценки систем одновременных уравнений….. 111 20.1. Косвенный, двухшаговый и трехшаговый МНК…………………… 113 Применение 20.2. систем макроэкономических уравнений моделей и для моделей построения спроса – 115 предложения………………………….. Глоссарий…………………………………………………………………….. 116 Перечень информационных ресурсов…………………………………… 124 Вопросы и задания для экзамена………………………………………. 125 Лекция 1 Тема 1. Эконометрика как научная дисциплина Аннотация. Данная тема раскрывает основные понятия эконометрики. Ключевые слова. Модели, переменные, типы данных, этапы моделирования. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 8 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none)С. 4-7. 3. Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с. С. 6-11. Глоссарий Предопределенные переменные – это экзогенные переменные и лаговые эндогенные переменные. Цель эконометрики – эмпирический (практический) вывод экономических законов. Экзогенные переменные - это внешние для модели переменные, управляемые из вне, влияющие на эндогенные переменные, но не зависящие от них. Эконометрика – это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов, которые раскрыты и обоснованы экономической теорией. Эндогенные переменные - это внутренние, формируемые в модели переменные, зависимые от предопределенных переменных. Вопросы для изучения: 1. Цели, предмет, задачи эконометрики. 2. Инструментарий эконометрики. Типы моделей и переменных. 3. Этапы эконометрического моделирования Цели, предмет, задачи эконометрики. «Эконометрика – это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов, которые раскрыты и обоснованы экономической теорией» 9 Предметом эконометрики является определение наблюдаемых в экономике количественных закономерностей Цель эконометрики – эмпирический (практический) вывод экономических законов Прикладные цели – прогнозная оценка экономических показателей, априорная имитация альтернативных сценариев развития анализируемой системы Рис. 1.1. Предмет и цели эконометрики Основные задачи эконометрики:построение эконометрической модели;оценка параметров построенной модели, делающих выбранную модель наиболее адекватной реальным данным;проверка качества найденных параметров модели и самой модели в целом;использование построенных моделей для объяснения поведения исследуемых экономических показателей, прогнозирования, осмысленного проведения экономической политики. Инструментарий эконометрики. Типы моделей и переменных. Разделы: линейная модель регрессии и МНК; обобщенная линейная модель регрессии и ОМНК; статистический анализ временных рядов; анализ систем одновременных уравнений. Типы данных в эконометрике: Множество данных, состоящих из наблюдений за несколькими однотипными статистическими объектами в течение одного периода или за один момент времени, называется перекрестными данными. Множество данных, состоящих из наблюдений за одним статистическим объектом в течение нескольких периодов или за несколько моментов времени, называется временным рядом. Множество данных, состоящих из наблюдений за несколькими однотипными статистическими объектами в течение нескольких временных периодов, называется панельными, или пространственными, данными. 10 Этапы эконометрического моделирования. Выделяют следующие этапы: постановочный; априорный; спецификация модели; информационный; идентификация модели; верификация модели; интерпретация результатов. Экономическая теория Эконометри ческая модель Оценка параметров модели по статистическим данным Использование модели для прогноза и проведения экономической политики Модель адекватна? Проверка качества модели Рис. 2.1. Последовательность эконометрического моделирования Вопросы для самоконтроля 1. Что измеряет эконометрикa? 2. Каковы основные цели эконометрики? 3. В чем состоят предмет и задачи эконометрики? 4. Каковы типы моделей и переменных, применяемых в эконометрике? 5. В чем особенности перекрестных и панельных данных? 6. В чем особенности временных рядов? 7. Что понимается под спецификацией модели? 8. Что такое параметризация? 9. Что понимается под верификацией модели? 10. В чем основное отличие эконометрической модели от математической? Лекция 2 Тема 2. Основные понятия теории вероятностей и статистики, применяемые в эконометрике 11 Аннотация. Данная тема раскрывает основные понятия теории вероятностей и статистики, применяемые в эконометрике. Ключевые слова. Генеральная совокупность, выборка, статистическая оценка, гипотеза. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест и типовые задачи. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382 2. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 7-21. 3.Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С.11-226. 4. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.8-82. 12 Глоссарий Вероятность события А – это отношение числа m элементарных событий (исходов), благоприятствующих появлению события А, к числу n всех элементарных событий в условиях данного вероятностного эксперимента. Закон распределения случайной величины - это всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Плотность вероятности (плотность распределения вероятностей) непрерывной СВ Х - это производная ее функции распределения. Случайная величина - это такая величина, которая в результате наблюдения (испытания) принимает то или иное значение, заранее не известное и зависящее от случайных обстоятельств. Статистическая гипотеза - это любое предположение о виде закона распределения или о параметрах неизвестного закона распределения. Статистический вывод – это заключение о генеральной совокупности на основе выборки, случайно отобранной из генеральной совокупности. Функция распределения СВ Х - это функция F (x) , определяющая вероятность того, что СВ Х принимает значение меньшее, чем x, т.е. F ( x)  Р( Х < х ) . Вопросы для изучения 1. Основные понятия теории вероятностей. Нормальное распределение и связанные с ним χ2 - распределение, распределение Стьюдента и Фишера. 2. Генеральная совокупность и выборка. Свойства статистических оценок. 3. Статистические выводы и проверка гипотез. Основные понятия теории вероятностей. Нормальное распределение и связанные с ним χ2 - распределение, распределение Стьюдента и Фишера. Вероятностью события А – Р(А) – называется отношение числа m элементарных событий (исходов), благоприятствующих появлению события А, 13 к числу n всех элементарных событий в условиях данного вероятностного эксперимента. Случайной величиной (СВ) называют величину, которая в результате наблюдения (испытания) принимает то или иное значение, заранее не известное и зависящее от случайных обстоятельств. Дискретной называют такую СВ, которая принимает отдельные, изолированные (конечные или счетные) значения с определенными вероятностями. Непрерывной называют такую СВ, которая может принимать любое значение из некоторого конечного или бесконечного числового промежутка (т.е. количество возможных значений непрерывной СВ бесконечно и несчетно). Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Его можно задать таблично, аналитически (т.е. в виде формулы) и графически. n n i 1 i 1 Для  P( X  xi )   pi  1 любой дискретной случайной величины . Функцией распределения СВ Х называют функцию F (x) , определяющую вероятность того, что СВ Х принимает значение меньшее, чем x , т.е. F ( x)  Р( Х < х ) . Плотностью вероятности (плотностью распределения вероятностей) непрерывной СВ Х называются производная ее функции распределения: Р( х  Х  х  х) F ( x  x)  F ( x)  lim  F ' ( x) x 0  x  0 х x f ( x)  lim Плотность вероятности f(x), как и функция распределения F(x), является одной из форм закона распределения и существует только для непрерывных случайных величин. СВ Х имеет нормальное распределение, если ее плотность вероятности имеет вид: 14 f ( x)  ( x  m) 1  e 2 2 2 2 . Очень важным частным случаем нормального распределения является ситуация, когда m = 0 и σ = 1. В этом случае говорят о стандартизированном (стандартном) нормальном распределении. Для практических расчетов специально разработаны таблицы функций f (u), F (u) стандартизированного нормального распределения, но чаще используется так называемая таблица значений Лапласа Ф (u). Функция u 2 t 1    e 2 dt  F (u )  0,5 . Эту таблицу можно 2 0 Лапласа имеет вид: Ф(u )  использовать для любой нормальной СВ Х ( Х ~ N (m, σ)) при расчете соответствующих вероятностей: bm am bm am P ( a  x  b)  F    F   Ф   Ф              Заметим, что если Х ~ N (m, σ), то U  квадрат  2 распределение с n Х m степенями  ~ N(0,1). СВ χ2 имеет хи – свободы (χ2 ~ χn2), если n   U i2  U 12  U 22  ...  U 2n . Отметим, что число степеней свободы (это i 1 число обозначается v) исследуемой СВ определяется числом СВ, ее составляющих, уменьшенным на число линейных связей между ними. Пусть СВ U ~ N (0,1), СВ V – независимая от U величина, распределенная по закону χ2 с n степенями свободы. Тогда величина T  U V n имеет распределение Стьюдента (t – распределение) с n степенями свободы (T ~ Tn ). Пусть V и W – независимые СВ, распределенные по закону χ2 со степенями свободы v1 = m и v2 = n соответственно. Тогда величина F  V /m имеет распределение Фишера W /n со степенями свободы v1 = m и v2 = n (F ~ Fm,n). 15 Генеральная совокупность и выборка. Свойства статистических оценок. Статистические выводы – это заключения о генеральной совокупности (т.е. законе распределения исследуемой СВ и его параметрах либо о наличии и силе связи между исследуемыми переменными) на основе выборки, случайно отобранной из генеральной совокупности. Процесс нахождения оценок по определенному правилу (формуле) называется оцениванием. В качестве оценок параметров распределения генеральной совокупности берутся их выборочные оценки. При этом различают 2 вида оценок: точечные, интервальные. Доверительный интервал для математического ожидания нормальной известной ( x  u / 2 дисперсии: Ф(и / 2 )  1   . 2 2 ожидания Доверительный интервал нормальной ( x  t / 2 , n 1 S n СВ ; х  t / 2 , n 1 при S ) n . S 2 (n  1) дисперсии нормальной СВ:  а2 2 Оценка    n ; х  u / 2   при  ) n , для математического неизвестной Доверительный 2 CB дисперсии: интервал для S 2 (n  1) , n 1 1 a 1 , n 1 2 . называется несмещенной оценкой параметра  , если ее математическое ожидание равно оцениваемому параметру: M ( )   . В  противном случае – оценка называется смещенной. Оценка эффективной оценкой параметра дисперсии любой другой , называется если ее дисперсия D( ) меньше  альтернативной фиксированном объеме выборки  n, т.е. называется состоятельной оценкой параметра 16 несмещенной оценки при D(  )  Dmin . Оценка  n  , если  n сходится по вероятности к оцениваемому параметру  при n ∞. Другими словами, состоятельной называется такая оценка, которая дает истинное значение при достаточно большом объеме выборки вне зависимости от значений входящих в нее конкретных наблюдений. Статистические выводы и проверка гипотез. Статистической гипотезой называется любое предположение о виде закона распределения или о параметрах неизвестного закона распределения. I. Схема проверки гипотезы о математическом ожидании нормальной СВ при известной дисперсии H 0: m  m0 H1(1) : m  m0 ( H1( 2) : m  m0 ; H1(3) : m  m0 ) U x  m0 / n , где x 1 n 2  xi ,    . n i 1 1. Пусть в качестве альтернативной рассматривается гипотеза: H1(1) : m  m0 . Тогда критические точки u / 2 и u1 / 2  u / 2 будут определяться по таблице значений функции Лапласа из условия 1 2 x  m0 U набл.   u / 2 - нет оснований для отклонения H 0 . / n Фu / 2   Если Если U набл .  u / 2 альтернативной гипотезы 2. При - гипотеза критическую точку критической области находят из равенства   отклоняется в пользу H 1(1) . H1( 2) : m  m0 Ф И  H0 1  2 2 17 u правосторонней Если U набл. u - нет оснований для отклонения Если U набл. u 3. При H0. H 0 отклоняют в пользу H 1( 2) . H1(3) : m  m0 критическая точка u1  u . Если U набл. u1 - нет оснований для отклонения Если U набл. u1 - H0. H 0 отклоняют в пользу H1(3) . II. Схема проверки гипотезы о математическом ожидании нормальной СВ при неизвестной дисперсии H 0 : m  m0 H1(1) : m  m0 ( H1( 2) : m  m0 ; H1(3) : m  m0 ) . 1 n x   xi ; n i 1 исправленная выборочная дисперсия 2 1 n S   ( xi  x ) ; n  1 i 1 2 стандартное отклонение S  S2 . Далее строится t - статистика: T x  m0 , S/ n Стьюдента с имеющая v  n 1 при справедливости H0 распределение степенями свободы. Критическая область строится в зависимости от вида альтернативной гипотезы так же, как и в предыдущем разделе. 18 1. При значимости (1) H1 : m  m0  по таблице критических точек распределения и числу степеней свободы v  n 1 находятся критические точки: t / 2, n 1 Если t1 / 2, n 1  t / 2, n 1. и Tнабл.  x  m0  t / 2, n 1 S/ n - нет оснований для отклонения (1) H 0 . Если Tнабл.  t / 2, n 1- H 0 отклоняют в пользу H1 . ( 2) 2. При H 1 : m  m0 определяют критическую точку t , n 1 правосторонней критической области. Если Т набл .  t , n 1 - нет оснований для отклонения H 0 . Если Т набл . ( 2)  t , n 1 - H 0 отклоняется в пользу H1 . 3. При (3) H1 : m  m0 определяют критическую точку t1 , n 1  t , n 1 левосторонней критической области. Если Т набл .  t , n 1 - нет оснований для отклонения H 0 . Если Т набл . (3)  t , n 1 - H 0 отклоняется в пользу H1 . III. Схема проверки гипотезы о величине дисперсии нормальной СВ H 0 :  2   02  H1(1) :  2   02 H1( 2) :  2   02 ; H1(3) :  2   02 19 . Для проверки извлекается выборка объема H0 x вычисляются выборочное среднее 1 n  xi , n i 1 n : x1, x2 ...xn , исправленная выборочная 2 1 n 2 S    xi  x  . n  1 i 1 дисперсия Тогда критерий проверки При справедливости распределение с 1. При H 0 имеет вид:   H0 2  02 имеет  2- по таблице критических точек  2- построенная статистика 2 v  n  1 степенями свободы. (1) H1 :  2   02 распределения по заданному уровню значимости v  n 1 (n  1)  S 2 находят критические точки  и числу степеней свободы 12 / 2, n 1 и 2 / 2, n 1 двусторонней критической области. Если отклонения Если 2 2 12 / 2, n 1   набл .   / 2, n 1 нет оснований 2 2  набл .  1 / 2, n 1 При или  2 набл.   2 / 2, n 1 - H0 (1) H1 . (2) H1 :  2   02 определяют критическую точку правосторонней критической области. Если для H 0. отклоняется в пользу 2. - 2 2  набл .   , n 1- нет оснований для отклонения H 0 . 20 2 , n 1 ( 2) 2 2  набл .   , n 1- H 0 отклоняется в пользу H1 . (3) 2 2 находят критическую точку  2 При H :    1 , n 1 1 0 Если 3. левосторонней критической области. Если 2 2  набл .  1 , n 1- нет оснований для отклонения H 0 . Если (3) 2 2 H отклоняется в пользу  набл   H . 1 , n 1 0 1 . IV. Схема проверки гипотезы о равенстве M ( X ) двух нормальных СВ при известных дисперсиях H 0 : M  X   M Y  (2) (1) H1 : M  X   M Y   H1 : M  X   M Y     H (3) : M  X   M Y  .  1    В качестве критерия проверки U xy 2  x2  y  n k При справедливости 1. H 0 принимается СВ U: При H 0 СВ U ~ N (0, 1). (1) H1 : M  X   M Y  по таблице функции определяют 2 критические точки u1 и u / 2 из условий: 1 , u1 / 2  u / 2 . 2 U набл .  u / 2 - нет оснований для отклонения Н 0 . Фu / 2   Если 21 Лапласа Если U набл.  u / 2 - Н отклоняется в пользу H (1) . 0 1 2. При ( 2) H1 : M  X   M Y  критическую точку u критической области находят их равенства: Фu   правосторонней 1  2 . 2 Если U набл.  u - нет оснований для отклонения Н 0 . Если U на бл.  u - Н 3. При ( 2) 0 отклоняется в пользу H1 . (3) H1 : M  X   M Y  критическая точка u1 критической области определяется из соотношения u1 левосторонней  u . Если U набл.  u1 - нет оснований для отклонения Н 0 . Если U набл.  u1 - Н 0 отклоняется в пользу H (3) . 1 V. Схема проверки гипотезы о равенстве математических ожиданий двух нормальных СВ при неизвестных дисперсиях H 0 : M  X   M Y  H1 : M  X   M Y  H H ( 2) 1 (3) 1  : M ( Х )  M Y . : M ( Х )  M Y  ; При этих условиях в качестве критерия проверки Т xy (n  1) S x2  (k  1) S y2 H 0 принимают СВ Т : nk n  k  2 nk  22 где x n, k - объемы выборок x1, x2 ...xn и y1, y2 ... yk соответственно 1 1 2 2  xi ; S x    xi  x  , n n 1 1  yi ; k y 1. При S 2y  H1(1) : M  X   M Y  с помощью таблицы критических точек распределения Стьюдента степеней 1 2   yi  y  . k 1 свободы t1 / 2, n  k  2 и по заданному уровню значимости α и числу   n  k  2 определяются критические точки t / 2, n k  2 ( t1 / 2, n  k  2 =  t / 2, n  k  2 ) двусторонней критической области. Если Tнабл.  t / 2, n  k  2 Если Tнабл.  t / 2, n  k  2 - Н0 отклоняется в пользу Н1(1). 2. При H1( 2) : M  X   M Y  - нет оснований для отклонения Н0. находят критическую точку t , n  k  2 правосторонней критической области. Если Tнабл . Если 3.  t , n  k  2 - нет оснований для отклонения Н0. Tнабл .  t , n  k  2 - Н0 отклоняется в пользу Н1(2). При H1(3) : M  X   M Y  находят левосторонней критической области t1 , n  k  2 Если Tнабл . Если  t , n  k  2 критическую точку  t , n  k  2 . - нет оснований для отклонения Н0. Tнабл .  t , n  k  2 - Н0 отклоняется в пользу Н1(3). VI. Схема проверки гипотезы о равенстве дисперсий двух нормальных СВ При сравнении двух экономических показателей иногда, в первую очередь, проводят анализ разброса значений рассматриваемых СВ. Например, при решении инвестирования в одну из отраслей остро стоит проблема риска 23 вложений. При сравнивании уровня жизни двух стран среднедушевые доходы могут быть примерно одинаковы. Необходимо сопоставить разброс в доходах. Анализ проводится путем сравнения дисперсий исследуемых СВ.  X  N m x , x2 Пусть дисперсии  x2  y2 и 2 дисперсий  x и и  Y  N m y , y2 , причем их неизвестны. Выдвигается гипотеза о равенстве  y2 . H 0 :  x2   y2 H1(1) :  x2   y2 H1(2) :  x2   y2  . По независимым выборкам k  x1, x2 ...xn и y1, y2 ... yk объемов n и соответственно определяется: x , y , S x2 и S y2 (для определенности пусть S x2  S y2 , в противном случае эти величины можно переобозначить). В качестве критерия проверки H 0 принимают СВ F  S x2 , S y2 определяемую отношением большей исправленной выборочной дисперсии к меньшей. Если Фишера с v1 1. При H0 верна, то данная статистика F имеет F - распределение  n  1 и v2  k  1 степенями свободы. H1(1) :  x2   y2 по таблицам критических точек распределения Фишера по уровню значимости определяется критическая точка  и числам степеней свободы v1 F / 2, v1, v 2 . Если Fнабл.  F / 2, v1 , v2 - нет оснований для отклонения Если Fнабл.  F / 2, v1 , v2 - H0. H 0 отклоняется в пользу H 1(1) . 24 и v2 2. При H1(2) :  x2   y2 определяется критическая точка F , v1, v2 . Если Fнабл.  F , v1 , v2 - нет оснований для отклонения Если Fнабл.  F , v1 , v2 - H0. H 0 отклоняется в пользу H 1( 2) . В основном, при проверке гипотезы о равенстве дисперсий в качестве альтернативной гипотезы в большинстве случаев используется гипотеза H 1( 2) . VII. Схема проверки гипотезы о значимости коэффициента корреляции H 0 :  xy  0 H1(1) :  xy  0 . Для проверки H0 по выборке ( x1, y1 ), ( x1, y2 )...( xn , yn ) объема n строится статистика: T rxy  n  2 2 1  rxy где rxy - выборочный коэффициент корреляции. При справедливости с H0 статистика T имеет распределение Стьюдента v  n  2 степенями свободы. По таблице критических точек распределения Стьюдента по заданному уровню значимости  и числу степеней свободы n2 определяем критическую точку t / 2, n  2 . Если Tнабл.  t / 2,n2 - то нет оснований для отклонения H 0 . Если Tнабл.  t / 2, n  2 - то H 0 отклоняется в пользу альтернативной гипотезы H 1(1) . 25 Если отклоняется, то фактически это означает, что коэффициент H0 корреляции статистически Следовательно, и X Y- значим (существенно отличен от нуля). коррелированны, т.е. между ними существует линейная связь. Вопросы и задания для самоконтроля 1. Как связаны между собой случайные величины, имеющие стандартизованное нормальное распределение, распределение Стьюдента, 2 и Фишера? 2. В чем заключаются несмещенность, эффективность и состоятельность статистических оценок? 3. Что такое точечная и интервальная оценка? 4. Что такое нулевая и альтернативная гипотезы? 5. Что такое статистический критерий, уровень значимости? 6. Какая случайная величина применяется в качестве критерия проверки гипотезы о величине дисперсии нормальной случайной величины? 7. Какая случайная величина применяется в качестве критерия проверки гипотезы о равенстве дисперсий двух нормальных случайных величин? 8. К проверке каких гипотез сводятся исследования среднего дохода населения и анализ разброса в уровне дохода? Задача 1. В университете проведен анализ успеваемости среди студентов и студенток за последние 25 лет. Случайные величины X,Y , представляющие их суммарный балл за время учебы соответственно, имеют нормальный закон распределения. Получены следующие данные: x  400, y  420, Sx2=300, Sy2=150. Задание: проверить, можно ли на уровне значимости   0,05 утверждать, что девушки в среднем учатся лучше ребят. Задача 2. Точность работы станка-автомата, заполняющего пакеты со стиральным порошком, определяется совпадением веса пакетов. Дисперсия 26 веса не должна превышать 25. По выборке из 20 пакетов определена исправленная дисперсия S2=30. Задание: определить на уровне значимости   0,05 требуется ли переналадка станка. Задача 3. По двум независимым выборкам, объемы которых n1  9 и n2  6, найдены выборочные дисперсии Sx2=14,4 и Sy2=20,5 годовых дивидендов от вложений в отрасли А и В соответственно. Задание: проверить при уровне значимости   0,05 гипотезу о равенстве рисков при вложении денег в обе отрасли. Лекция 3 Тема 3. Линейная модель парной регрессии и метод наименьших квадратов Аннотация. Данная тема раскрывает суть регрессионного анализа в эконометрике. Ключевые слова. Модель регрессии, метод наименьших квадратов, остатки регрессии. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 27 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 28-46. 3.Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 323-338. 4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 38-99. 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 82-99. 6. Электронныйкурс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 Глоссарий Множественная регрессия представляет собой модель, где теоретическое (среднее) значение зависимой переменной Y рассматривается как функция нескольких независимых переменных X1, X2,...Xm. 28 Параметризация взаимосвязи между модели – переменными выражение модели, в математической формулирование форме исходных предпосылок и ограничений модели. Парная регрессия представляет собой модель, где теоретическое (среднее) значение зависимой переменной Y рассматривается как функция одной независимой переменной X. Спецификация модели - формулирование вида модели, исходя из соответствующей теории связи между переменными. Цель регрессионного анализа – оценка функциональной зависимости между независимыми переменными X и условным математическим ожиданием зависимой переменной Y. Вопросы для изучения: 1. Спецификация линейной модели парной регрессии. 2. Метод наименьших квадратов (МНК) – идентификация линейной модели парной регрессии. 3. Предпосылки МНК и свойства МНК-оценок. Спецификация линейной модели парной регрессии. Основная цель регрессионного анализа – оценка функциональной зависимости между независимыми переменными X и условным математическим ожиданием зависимой переменной Y.Простая (парная) регрессия представляет собой модель, где теоретическое (среднее) значение зависимой переменной Y рассматривается как функция одной независимой переменной X: Множественная регрессия представляет собой модель, где (среднее) значение Yx  f (x) теоретическое зависимой переменной Y рассматривается как функция нескольких независимых переменных X1, X2,...Xm: Yx  f ( x1 , x2 ,..., xm ) Спецификация модели - формулирование вида модели, исходя из соответствующей теории связи между переменными.Определяется состав переменных и математическая функция для отражения связи между ними. Спецификация линейной модели (уравнения) парной регрессии: Yi  Yx i   i 29 где Yi - фактическое значение зависимой переменной Y; Yxi - теоретическое (среднее) значение зависимой переменной Y; εi - случайная величина (остаток регрессии). Теоретическое уравнение регрессии (гипотетически для генеральной совокупности): Yi      xi   i где α – свободный коэффициент; β - коэффициент регрессии; εi – случайное отклонение (возмущение). Случайное отклонение включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Источники его присутствия в модели: спецификация модели, выборочный характер исходных данных, особенности измерения переменных. Эмпирическое уравнение регрессии (для выборки наблюдений): Yi  a  b  xi  ei где а – эмпирическая (выборочная) оценка свободного коэффициента; b - эмпирическая (выборочная) оценка коэффициента регрессии; ei – эмпирическая (выборочная) оценка теоретического случайного отклонения ε (остаток регрессии). Метод наименьших квадратов (МНК). Суть метода наименьших квадратов (МНК) - оценки параметров таковы, что сумма квадратов отклонений фактических значений зависимой переменной Yiот расчетных (теоретических) Yx минимальна: n (y i 1 i  y xi ) 2  min Оценкапараметров регрессии: S   ( y i  y x i ) 2   ( y  a  b  x) 2 ; dS  2 y  2  n  a  2  b x  0; da dS  2 y  x  2  a  x  2  b x 2  0. db 30 n  a  b x   y,  2 a  x  b x   y  x a  y  b  x, b yx yx  2 , 2 x  x 2  ( x )2 x Предпосылки МНК и свойства МНК-оценок. Предпосылки МНК: 1. Математическое ожидание случайного отклонения εi равно нулю для всех наблюдений: M ( i )  0 2. Дисперсия случайных отклонений εi постоянна. Выполнение предпосылки называется гомоскедатичностью, нарушение – гетероскедастичностью: D( i )  D( j )   2 3.Случайные отклонения εi и εj являются независимыми друг от друга для i ≠ j. Выполнение данной предпосылки говорит об отсутствии автокорреляции, нарушение – о присутствии автокорреляции:     cov( i ,  j )  0, i  j i j     cov( i ,  j )   2 , i  j i j 4.Случайное отклонение должно быть независимо от объясняющих переменных:   x  cov( i , xi )  0 i i 5.Модель линейна относительно параметров. Если предпосылки МНК выполнены, то МНК-оценки регрессии обладают следующими свойствами: 1.Оценки являются несмещенными: M (a)   , M (b)   2. Оценки состоятельны, так как их дисперсия при увеличении выборки стремится к нулю: D(a)  0, D(b)  0, n   3.Оценки эффективны, имеют наименьшую дисперсию по сравнению с другими оценками, линейными относительно зависимой переменной: D(a)  Dmin , D(b)  Dmin Вопросы и задания для самоконтроля 1. Что такое функция регрессии? 2. Чем регрессионная модель отличается от функции регрессии? 3. Каковы основные причины наличия в регрессионной модели 31 случайного отклонения? 4. Как осуществляется спецификация модели? 5. В чем состоит различие между теоретическим и эмпирическим уравнениями регрессии? 6. В чем суть метода наименьших квадратов? 7. Каковы формулы расчета коэффициентов эмпирического парного линейного уравнения регрессии по МНК? Каковы предпосылки МНК? Каковы последствия их выполнимости 8. или невыполнимости? Действительно ли оценки коэффициентов регрессии будут иметь 9. нормальное распределение, если случайные отклонения распределены нормально? 10. Действительно ли в любой линейной регрессионной модели, построенной по МНК, сумма случайных отклонений равна нулю? Задача 1. При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные: x  16,2; y  4000;  x2  4; cov( x, y )  40. Задание: построить линейное уравнение регрессии Y на X. Задача 2. По выборке объема n  10 получены следующие данные: x i  100; y i  200; x y i i  21000; x 2 i  12000; y 2 i  45000. Задание: оценить с помощью МНК параметры линейного уравнения регрессии, найти выборочный коэффициент корреляции rxy . Лекция 4,5 Тема 4. Экономическая и статистическая интерпретация линейной модели парной регрессии 32 Аннотация. Данная тема раскрывает прикладное содержание регрессионного анализа. Ключевые слова. Коэффициент регрессии, статистическая значимость, метод наименьших квадратов, коэффициент детерминации. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест и типовые задачи. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 46-56. 3. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 338-365. 4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 67-99. 33 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 99-133. Глоссарий Верификация модели – проверка истинности модели, определение соответствия построенной модели реальному экономическому явлению. Идентификация модели – проведение статистического анализа модели и оценивания качества ее параметров. Ковариация характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных. Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. Коэффициент детерминации – это показатель, который определяет долю разброса зависимой переменной Y, объясняемую регрессией Y на X. Линейный коэффициент парной корреляции – это показатель тесноты статистической взаимосвязи между переменными Y и X. Парный коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак Y, если переменную X увеличить на единицу измерения. Прямолинейная зависимость – это статистическая взаимосвязь, при которой с возрастанием (убыванием) величины факторного признака происходит равномерное возрастание (убывание) величин результативного признака. Вопросы для изучения: 1. Экономическая интерпретация параметров модели. 34 2. Коэффициенты корреляции и детерминации в линейной модели парной регрессии. 3. Проверка качества модели линейной парной регрессии (верификация модели). 4. Интервалы прогноза по линейному уравнению регрессии. Экономическая интерпретация параметров модели Коэффициент регрессии b • показывает среднее изменение результата с изменением фактора на одну единицу • b>0- связь прямая • b<0- связь обратная Свободный коэффициент a • показывает значение Y при х=0 • если a>0, то Vx>Vy • если признак-фактор х не может иметь нулевого значения, то трактовка а не имеет смысла Рис. 4.1. Интерпретация параметров модели Коэффициенты корреляции и детерминации в линейной модели парной регрессии. Если все точки лежат на построенной прямой, то регрессия Y на Х «идеально» объясняет поведение зависимой переменной. Обычно поведение Y лишь частично объясняется влиянием переменной Х. Рис. 4.2. Диаграмма Венна Линейный коэффициент парной корреляции: 35 ryx  b  x cov( x, y ) yx  y  x   y  x y  x  y  1  ryx  1 Если b>0, то ryx>0; если b<0, то ryx<0. По абсолютной величине, чем ближе значение rxy к единице, тем теснее связь, чем ближе значение rxy к нулю, тем слабее связь между y и x. ryx  0,3  слабая 0,3  ryx  0,7  средняя ryx  0,7  сильная , тесная Суммы квадратов отклонений: - общая (TSS): (y i  y)2 - регрессионная (ESS): - остаточная (RSS): ( y i (y ( y i x  y) 2  yx )2  y) 2   ( y x  y) 2   ( yi  y x ) 2 Рис. 4.3. Геометрическая интерпретация Выборочные оценки дисперсий: - общая дисперсия: S 2  ( y  y)  2 i TSS - регрессионная дисперсия: S n 1 2 ESS ( y  x  y) 2 m 36 - остаточная дисперсия: S 2 RSS   ( yi  y x ) 2 n  m 1 Коэффициент детерминации: R2  (y (y x  y) 2 i  y) 2  1 (y  y )  ( y  y) i 2 x 2 i R 2  r 2 yx ;0  R 2  1 Коэффициент детерминации определяет долю разброса зависимой переменной Y, объясняемую регрессией Y на X. Проверка качества модели линейной парной регрессии (верификация Проверка значимости коэффициен -тов регрессии 3 этап Проверка общего качества уравнения регрессии 2 этап 1 этап модели) Проверка соблюдения предпосылок МНК Рис. 4.4. Этапы проверки качества модели 1 этап:F-тест состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. H 0 : D 2 ESS  D 2 RSS H 1 : D 2 ESS  D 2 RSS F (y (y i x  y) 2 / m  y x ) 2 /( n  m  1)  r 2 xy  (n  2) 1  r 2 xy F  F ,v1  m ,v2  n  m 1  H 1 F  F ,v1  m ,v2  n  m 1  H 0 2 этап: T-тест состоит в проверке гипотезы Н0 о статистической незначимости коэффициентов регрессии и корреляции. H0 :   0 H1 :   0 tb  t / 2,n  2  H1 tb  t / 2,n  2  H 0 37 b  b a r r ;ta  ;tr    n2 mb ma mr 1 r2  ( y  y ) /( n  2)  S  ( x  x)  ( x  x) 2 mb  ma  mr  2 x RSS 2 (y  y x )2 (n  2) x  n ( x  x) 2  S RSS x n 2 2 1 r2 2 ;t r  t 2b  F n2 3 этап: проведение тестов на гетероскедастичность и автокорреляцию остатков. Доверительные интервалы для коэффициентов теоретического уравнения регрессии: t b mb b  t / 2,n  2  mb ; b  b    b  b a  t / 2,n  2  ma ; a  a    a  a Интервалы прогноза по линейному уравнению регрессии. Предсказание среднего и индивидуального значения зависимой переменной: Y xp  mYxp  Y *  Y xp  mYxp ; ( x  x ïð ) 2 1 a  b  x ïð  t / 2,n  2  S   n  ( xi  x) 2 a  b  xïð  t / 2,n2  S  1  2 1 ( x  xïð )  n  ( xi  x ) 2 где mYxp – стандартная ошибка точечного прогноза; S2 – остаточная дисперсия на одну степень свободы; t – случайная величина, имеющая распределение Стьюдента с заданной вероятностью. 38 Вопросы и задания для самоконтроля 1. Каков экономический смысл коэффициента регрессии? 2. Какой смысл может иметь свободный коэффициент уравнения регрессии? Какова связь между линейным коэффициентом корреляции и 3. коэффициентом регрессии в линейной модели парной регрессии? 4. Каков статистический смысл коэффициента детерминации? 5. Как записывается баланс для сумм квадратов отклонений результативного признака? Что происходит, когда общая СКО равна остаточной? В каком 6. случае общая СКО равна факторной? Что такое число степеней свободы? Чему равны числа степеней 7. свободы для различных СКО в парной регрессии? 8. Как используется F-статистика в регрессионном анализе? 9. Как F-статистика связана с коэффициентом детерминации в парной регрессии? Как рассчитать критерий Стьюдента для коэффициента регрессии в 10. линейной модели парной регрессии? В чем суть предсказания индивидуальных значений зависимой 11. переменной? Задача 1. Пусть имеется следующая модель парной регрессии, построенная по 20 наблюдениям: ~y  8  7 x . При этом rxy  - 0,5. Задание: построить доверительный интервал для коэффициента регрессии в этой модели с вероятностями 0,9 и 0,95. Задача 2. Анализируется зависимость между доходами горожан (X), имеющими индивидуальные домовладения, и рыночной стоимостью их домов (Y). По случайной выборке из 120 горожан данной категории получены результаты: x i  27343; y i  115870; (x i  x ) 2  75200; 39 ( y i  y ) 2  1620340; (x i  x )( yi  y )  250431. Задание: найти оценку коэффициента регрессии b1 и построить 95% доверительный интервал для коэффициента регрессии. Лекция 6 Тема 5. Линейная модель множественной регрессии и оценка ее параметров Аннотация. Данная тема раскрывает особенности линейной модели множественной регрессии. Ключевые слова. Стандартизованный коэффициент регрессии, метод наименьших квадратов, коэффициент эластичности. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С.50-58. 3. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. 40 (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 323-369. 4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 142-181. 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 133-140. 6. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 Глоссарий Частное уравнение регрессии характеризует изолированное влияние фактора Xj на результат. Частный коэффициент эластичности показывает, на сколько % изменяется в среднем результативный признак Y при изменении фактора Xj на 1%. Индекс множественной корреляции оценивает тесноту совместного влияния факторов на результативный признак Y. Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного среднеквадратического отклонения. 41 признака на величину своего Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак Y при изменении факторного признака X на один процент. Множественная корреляция – это зависимость между результативным признаком и двумя и более факторными признаками. Множественная регрессия характеризует связь между результативным признаком и двумя и более факторными признаками. Вопросы для изучения: Линейная модель множественной регрессии. Эмпирическая форма 1. записи. Оценка параметров модели с помощью МНК. 2. Линейная модель множественной регрессии. Эмпирическая форма записи. Множественная регрессия представляет собой модель, где среднее значение зависимой переменной Y рассматривается как функция нескольких независимых переменных Xj: Y  f ( x1 , x2 , x3 ,...xm )   Линейная модель множественной регрессии: Y  a0  b1 x1  b2 x2  ...  bm xm   Оценка параметров модели с множественной регрессии: ei  yi  a0  b1 x1  ...  bm xm n n m i 1 j 1 Q   ei   ( yi  (a0   b j xij )) 2  min i 1 2 n m  Q   2 ( y  ( a  b j xij )),   i 0  a i  1 j  1 0   n m  Q  2 ( y  (a  b x ))  x   i 0 j ij ij  b j i 1 j 1 m n ( y  ( a  b j xij ))  0,  0  i j 1  i 1 n m  ( y  (a  b x ))  x  0  i 0 j ij ij  i 1 j 1 42 помощью МНК. МНК-оценки  y  n  a0  b1   x1  b2   x2  ...  bm   xm ,  2  y  x1  a0   x1  b1  x1  b2  x1  x2  ...  bm  xm x1 ,  ...... 2  yx  a m 0  xm  b1  x1  xm  b2  x2  xm  ...  bm  xm  Стандартизованные коэффициенты регрессии: t y  1  t x 1   2  t x 2  ...   m  t xm   ty  y y y ; t xj  xj  xj x ; j t y  t x j  0;  ty   tx  1 Благодаря тому, что в стандартизованном уравнении все переменные заданы как центрированные и нормированные, β-коэффициенты сравнимы между собой. Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор xj изменится на одну сигму при неизменном среднем уровне других факторов.В парной зависимости стандартизованный коэффициент регрессии есть линейный коэффициент корреляции:   rxy Во множественной регрессии зависимость следующая: b j   j y Частное уравнение регрессии связывает результативный x j признак Y с соответствующим фактором Xj при закреплении других факторов на среднем уровне и характеризует изолированное влияние фактора Xj на результат. y x1  x2 ,... xm  a0  b1 x1  b2 x2  ...  bm xm   ; y x2  x1 , x3 ... xm  a0  b1 x1  b2 x2  ...  bm xm   ; ................................................................; y xm  x1 ,... xm 1  a0  b1 x1  b2 x2  ...  bm xm   .  y x1  x2 ,... xm  A1  b1 x1 ,   y x2  x1 , x3 ... xm  A2  b2 x2 ,  ........................................,  y x  x ,... x  Am  bm xm  m 1 m 1 43 Частный коэффициент эластичности показывает, на сколько % изменяется в среднем результативный признак Y при изменении фактора Xj на 1% и при неизменных других факторах, включенных в модель. Эy x  b j  j xj y x j  x1x2 ... x j1x j1 ... xm Вопросы и задания для самоконтроля 1. Как записывается эмпирическое уравнение линейной модели множественной регрессии? 2. Что измеряют коэффициенты регрессии линейной модели множественной регрессии? 3. Какие этапы включает алгоритм определения коэффициентов множественной линейной регрессии по МНК в матричной форме? 4. Какие требования предъявляются к факторам для их включения их в модель множественной регрессии? 5. Как интерпретируются коэффициенты регрессии линейной модели потребления? 6. Какой смысл приобретает сумма коэффициентов регрессии в производственных функциях? 7. Как в линейной модели множественной регрессии, записанной в стандартизованном виде, сравнить факторы по силе их воздействия на результат? 8. Как связаны стандартизованные коэффициенты регрессии с натуральными? Задача 1. Получены следующие величины: y  15,0; x1  6,5; x2  12,0;  y  4,0;  x1  2,5;  x  3,5; ryx1 2 0,78;  0,63; ryx2  rx1 x2  0,52. Задание: записать регрессию y на x1 и x2 в стандартизованной и естественной формах. 44 Задача 2. Уравнение регрессии, построенное по 15 наблюдениям, имеет вид: ~ y  12,4  9,6 x1  ? x2  6,3x3 mb (?) t b (1,55) (3,2) (0,12) (?) (?) (4,0) (3,15). Задание: определить пропущенные значения и построить доверительный интервал для  3 с вероятностью 0,99. Задача 3. Уравнение регрессии в стандартизованной форме имеет вид t y  0,37t x1  0,52t x2  0,43t x3 . При этом коэффициенты вариации равны: V y  18%, Vx  25%, Vx  38%, Vx  30%. 1 2 3 Задание: определить частные коэффициенты эластичности. Лекция 7 Тема 6. Оценка качества модели множественной регрессии Аннотация. Данная тема раскрывает особенности оценки качества линейной модели множественной регрессии. Ключевые слова. Индекс множественной корреляции, коэффициент детерминации, частные F-критерии. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест и типовые задачи. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 45 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. М.: - ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 3. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) 4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 142-181. 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 133-140. 6. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 Глоссарий Частное уравнение регрессии характеризует фактора Xj на результат. 46 изолированное влияние Индекс множественной корреляции оценивает тесноту совместного влияния факторов на результативный признак Y. Множественная корреляция – это зависимость между результативным признаком и двумя и более факторными признаками. Скорректированный коэффициент детерминации содержит поправку на число степеней свободы, что не допускает возможного преувеличения тесноты связи. Вопросы для изучения: 1. Показатели качества множественной регрессии: индекс множественной корреляции и коэффициент детерминации. Скорректированный коэффициент детерминации. 2. Оценка значимости уравнения в целом и каждого параметра в отдельности. 3. Сравнение двух регрессий при включении и при исключении отдельных наборов переменных. Частные F-критерии. Показатели множественной качества множественной корреляции и регрессии: коэффициент индекс детерминации. Скорректированный коэффициент детерминации. Индекс множественной корреляции независимо от формы связи оценивает тесноту совместного влияния факторов на результативный признак Y: R yx1x2 ... xm  (y  y 1  ( y  y) x1 x2 ... xm )2 2 0  R yx1x2 ... xm  1 При линейной регрессии: Ryx x ... x  1 2 m  Коэффициент детерминации: R 2 yx1 x2 ... xm (y  y  1  ( y  y) x1 x2 ... xm )2 2 47 xj  ryx j Скорректированный коэффициент детерминации: ) /( n  m  1) (y  y  ( y  y ) /( n  1) 2 R 2 yx1 x2 ... xm  1  x1 x2 ... xm 2 Скорректированный R2 содержит поправку на число степеней свободы, что не допускает возможного преувеличения тесноты связи. Частные коэффициенты корреляции: ryx j  x1x2 ... x j1x j1 ... xm  1  1  R 2 yx1x2 ... x j ... xm 1  R 2 yx1x2 ... x j1x j1 ... xm где, R2yx1x2…xj…xm – множественный коэффициент детерминации всего комплекса факторов с результатом; R2yx1x2…xj-1,хj+1…xm – тот же показатель детерминации, но без введения в модель фактора xj. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты частной корреляции первого порядка: ryx1x2 1  r 2 x1x2 1  r 2 x1x2   x1  ; ryx2 x1   x 2  1  r 2 yx2 1  r 2 yx1 Оценка значимости уравнения в целом и каждого параметра в отдельности. Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера: S 2 ESS R2 n  m 1 F 2   S RSS 1  R 2 m Оценка значимости коэффициентов регрессии выполняется с помощью tстатистики Стьюдента: H 0 : i  0 H1 :  i  0 tb i  bi , mb i tb i  t / 2,n  m 1  H1 48 Сравнение двух регрессий при включении и при исключении отдельных наборов переменных. Частные F-критерии. Мерой для оценки включения дополнительного фактора в модель служит частный F-критерий: R 2 y x1 ... x j ... xm  R 2 y x1 ... x j1x j1 ... xm n  m  1 Fx j   1  R 2 y x ... x ... x 1 1 j m Если наблюдаемое значение частного F-критерия больше критического, то дополнительное включение фактора xj в модель статистически оправданно и коэффициент bj статистически значим в предположении, что соответствующий фактор xj был введен в уравнение множественной регрессии последним. Вопросы и задания для самоконтроля 1. Как определяется статистическая значимость коэффициентов регрессии в линейной модели множественной регрессии? 2. В чем недостаток использования коэффициента детерминации при оценке общего качества линейной модели множественной регрессии? 3. Как корректируется коэффициент детерминации? 4. Как проверяется адекватность линейной модели множественной регрессии в целом? 5. Как определяется индекс множественной корреляции и какой он имеет смысл? 6. Как проверить обоснованность исключения части переменных из уравнения регрессии? 7. Как проверить обоснованность включения группы новых переменных в уравнение регрессии? 8. Что такое частный F-критерий и чем он отличается от последовательного F-критерия? Задача 1. На основе статистических данных за 10 лет оценены параметры и их стандартные ошибки для линейной модели, описывающей зависимость объемов производства y от количества работающих мощности оборудования x2 : 49 x1 и установочной ~ y  54  23,41x1  6,44x2 (6,5) (5,1) (0,83) Задание: установить для уровня значимости   0,05, оказывают ли объясняющие переменные переменную x1 , x2 существенное влияние на объясняемую y. Задача 2. Имеются данные регрессионного анализа чистого дохода в зависимости от стоимости капитала и численности служащих по 20 фирмам: Множественный R ? R-квадрат Нормированный Rквадрат ? ? Стандартная ошибка 1,249 Наблюдения 20 df Регрессия Остаток Итого Y-пересечение X1 X2 SS ? ? ? Коэффициент ы 1,706 0,072 -0,002 MS F 30,821 ? 26,537 ? 57,358 Стандартная tошибка статистика 0,463 ? 0,016 ? 0,002 ? ? PЗначение 0,002 0,0003 0,202 Задание: 1) записать линейное уравнение множественной регрессии и пояснить экономический смысл его параметров; 2) оценить качество уравнения и проверить значимость коэффициентов регрессии и R2 при α=0,05. Лекция 8 Тема 7. Мультиколлинеарность Аннотация. Данная тема раскрывает понятие мультиколлинеарности, ее причины и последствия, способы обнаружения и устранения. 50 Ключевые слова. Мультиколлинеарность, совершенная мультиколлинеарность. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 2e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 69-70. 4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 142-181. 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 244-253. 6. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps 51 /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 Глоссарий Мультиколлинеарность - это линейная взаимосвязь двух или нескольких объясняющих переменных (х1, х2, … хm). Совершенная мультиколлинеарность - это линейная взаимосвязь двух или нескольких объясняющих переменных (х1, х2, … хm), в которой объясняющие переменные связаны строгой функциональной зависимостью. Анализ корреляционной матрицы – способ обнаружения мультиколлинеарности. Расчет множественных коэффициентов корреляции (коэффициентов детерминации) для объясняющих переменных - способ обнаружения мультиколлинеарности. Вопросы для изучения 1. Понятие мультиколлинеарности, ее причины и последствия. 2. Обнаружение мультиколлинеарности и способы ее устранения или снижения. Понятие мультиколлинеарности, ее причины и последствия. Мультиколлинеарность - это линейная взаимосвязь двух или нескольких объясняющих переменных (х1, х2, … хm). Если объясняющие переменные связаны строгой функциональной зависимостью, то говорят о совершенной мультиколлинеарности. Последствия мультиколлинеарности: увеличиваются стандартные ошибки оценок; уменьшаются t-статистики МНК-оценок регрессии; МНК-оценки чувствительны к изменениям данных;возможность неверного знака МНК-оценок; трудность в определении вклада независимых переменных в дисперсию зависимой переменной. Обнаружение мультиколлинеарности и способы ее устранения или снижения. Признаки мультиколлинеарности: высокий R2; близкая к 1 парная корреляция между малозначимыми независимыми переменными; высокие 52 частные коэффициенты корреляции; сильная дополнительная регрессия между независимыми переменными. Методы устранения мультиколлинеарности: исключение из модели коррелированных переменных (при отборе факторов); сбор дополнительных данных или новая выборка; изменение спецификации модели; использование предварительной информации о параметрах; преобразование переменных. Вопросы и задания для самоконтроля 1. В чем различие терминов "коллинеарность" и "мультиколлинеарность"? 2. Каковы причины и последствия мультиколлинеарности? 3. Как можно обнаружить мультиколлинеарность? 4. Каковы основные методы устранения мультиколлинеарности? 5. Каковы основные типы процедур пошагового отбора переменных в регрессионную модель? 6. Действительно мультиколлинеарности ли, невозможно что при оценить наличии высокой статистическую значимость коэффициентов регрессии при коррелированных переменных? Задача 1. По выборке n=50 для X1, X2, X3 построена следующая корреляционная матрица 0,45  0,35  1,0  R   0,45 1,0 0,52   0,35 0,52 1,0  Задание: 1) оценить статистическую значимость следующих частных коэффициентов корреляции r12*3, r23*1, r13*2. 2) ответить на вопрос: при рассмотрении какой регрессии будет иметь место мультиколлинеарность? Задача 2. Имеется выборка из10 наблюдений за переменными Х1,Х2,Y: X1 1 2 3 4 5 6 7 8 9 10 X2 1 1,6 2,2 2,8 3,4 4 4,6 5,2 5,6 6,2 53 Y 0 3 6 9 12 15 18 21 24 27 Задание: 1) ответить на вопрос: можно ли по этим данным по МНК оценить коэффициенты регрессии с двумя объясняющими переменными? 2) предложить преобразования, которые позволят оценить коэффициенты регрессии в случае отрицательного ответа на вопрос. Лекция 9 Тема 8. Гетероскедастичность. Аннотация. Данная тема раскрывает способы проверки соблюдения второй предпосылки МНК в остатках регрессии. Ключевые слова. Гетероскедастичность, гомоскедастичность, остатки регрессии, метод взвешенных наименьших квадратов. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 92-106. 3. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. 54 (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 202-229. 4. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 369-383. 5. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 197-244. Глоссарий Голдфелда Квандта тест – один из наиболее распространенных способов тестирования остатков регрессии на гетероскедастичность. Гомоскедастичность остатков регрессии – постоянство дисперсии случайных отклонений εi. Дарбина-Уотсона тест – один из наиболее распространенных способов тестирования остатков регрессии на автокорреляцию Метод наименьших квадратов – один из распространенных способов оценивания параметров регрессии. Метод взвешенных наименьших квадратов – один из распространенных способов устранения гетероскедастичности остатков регрессии. Вопросы для изучения: 1. Понятие и последствия гетероскедастичности. 2. Методы обнаружения гетероскедастичности. 3. Коррекция на гетероскедастичность. 55 Понятие и последствия гетероскедастичности. Гетероскедастичностью остатков называется нарушение 2 предпосылки МНК о постоянстве дисперсий случайных отклонений. Если предпосылка МНК о том, что D(i)=D(j)=2 соблюдена, то имеет место гомоскедастичность случайных отклонений. Последствия гетероскедастичности: МНК-оценки сохраняют свойства несмещенности и линейности, но теряют свойство эффективности; дисперсии МНК-оценок смещены; t-статистика и F-статистика завышены. Методы обнаружения гетероскедастичности. Методы обнаружения: графический анализ остатков; тест Голдфелда-Квандта; тест Спирмена и др. 1. Ранжирование n наблюдений по переменной х 3. Оценка регрессий для первых и последних k наблюдений 2. Выделение трех подвыборок размерностью k, n-2k, k. 4. Сравнение остаточных дисперсий по регрессиям для первых и последних k наблюдений Рис. 8.1. Тест Голдфелда-Квандта F-статистика для сравнения дисперсий: k S 21   ei ; S 2 3  i 1 2 n e i i  n  k 1 2 , H 0 : S 2 3  S 21 ( гомоскедас тичность) H1 : S 2 3  S 21 ( гетероскедастичность) S 2 3 /( k  m  1) , S 21 /( k  m  1) F  F ,m ,k  m 1  H1 F t- статистика для проверки значимости rx,e: 56 rx ,e  1  6  ( d i / n(n 2  1)) 2 H 0 : rx ,e  0( гомоскедас тичность) H1 : rx ,e  0( гетероскедастичность) rx ,e  n  2 t 1  r 2 x ,e t  t ,n  2  H1 , Коррекция на гетероскедастичность. Устранение гетероскедастичности метом взвешенных наименьших квадратов: 1). σ2eизвестны: y    x y    1   x     y*    z    x * v 2). σ2e неизвестны: Дисперсии σ2e пропорциональны xi  2 i   2 xi yi x  1    i  i xi xi xi xi yi 1      xi  vi xi xi y*    z    x *  vi Дисперсии σ2e пропорциональны x2i  2i   2  x 2i yi x  1     i  i xi xi xi xi yi 1       vi xi xi y*    z    vi Вопросы и задания для самоконтроля 1. Действительно ли, вследствие гетероскедастичности оценки перестают быть эффективными и состоятельными? 2. Какие критерии могут быть использованы для проверки гипотезы о гомоскедастичности регрессионных остатков? 3. В чем заключается тест Спирмена? 57 4. Какова схема теста Голдфелда-Квандта? 5. В чем суть метода взвешенных наименьших квадратов? 6. Какие типы преобразований применяются для устранения гетероскедастичности? Задача 1. Заданы следующие значения остатков линейной модели: Ранг xi ei 1 2 3 4 5 6 7 8 9 10 11 -1 2 -3 2 0 -3 3 1 -2 -4 5 12 13 14 15 16 17 18 -11 8 -20 12 -21 18 14 Задание: установить, имеется ли гетероскедастичность по тесту ранговой корреляции Спирмена на уровне значимости   0,05. Задача 2. Для линейной модели переменной y относительно переменной x получены следующие остатки, соотнесенные последовательным наблюдениям переменной xi . xi 1,3 0,9 0,8 0,7 1,1 1,0 1,5 1,0 0,8 1,4 1,2 1,1 ei -5 xi 1,5 1,8 1,2 0,8 1,3 1,1 1,2 1,0 0,9 1,3 1,2 1,0 ei -4 1 9 2 -5 -6 -2 4 8 -4 -5 1 6 4 -4 5 5 -6 7 -1 -8 6 5 Задание: на уровне значимости   0,05 с помощью F  теста проверить гипотезу о равенстве дисперсий случайных ошибок. Лекция 10 Тема 9. Автокорреляция Аннотация. Данная тема раскрывает способы проверки соблюдения третьей предпосылки МНК в остатках регрессии. Ключевые слова. Автокорреляция, остатки регрессии, авторегрессионное преобразование. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. 58  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 92-106. 3. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 202-229. 5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 197-244. Глоссарий Автокорреляция остатков - это нарушение третьей предпосылки МНК о независимости случайного отклонения  i от отклонений во всех других наблюдениях. Дарбина-Уотсона критерий – один из самых распространенных критериев для обнаружения автокорреляции в остатках. Метод рядов – способ обнаружения автокорреляции в остатках. 59 Авторегрессионное преобразование – способ коррекции остатков регрессии на автокорреляцию. Вопросы для изучения 1. Понятие и последствия автокорреляции. 2. Обнаружение автокорреляции. 3. Коррекция на автокорреляцию. Понятие и последствия автокорреляции. Автокорреляцией остатков называется нарушение третьей предпосылки МНК о независимости случайного отклонения  i от отклонений во всех других наблюдениях. Если предпосылка МНК о том, что cov(i,j)=0, соблюдена, то автокорреляция случайных отклонений отсутствует. Автокорреляция остатков обычно встречается при использовании данных временных рядов. В перекрестных данных наличие автокорреляции бывает редко. Положительная автокорреляция имеет место, когда ri,j>0. Отрицательная автокорреляция имеет место, когда ri,j<0. Последствия автокорреляции: МНК-оценки сохраняют свойства несмещенности и линейности, но теряют свойство эффективности; дисперсии МНК-оценок смещены в сторону занижения; t-статистика и F-статистика завышены. Обнаружение автокорреляции. Методы обнаружения автокорреляции: графический анализ остатков; критерий Дарбина-Уотсона; метод рядов. Критерий Дарбина-Уотсона: N DW   (e  e n2 i 1 i N e n 1 )2 2 i DW  2  (1  rei ,ei1 );0  DW  4 rei ,ei1  0  DW  2 rei ,ei1  1  DW  0("" автокорреляция ) rei ,ei1  1  DW  4("" автокорреляция ) 60 Рис. 9.1 Проверка гипотезы об автокорреляции остатков по DW-критерию Коррекция на автокорреляцию. Применяется авторегрессионное преобразование. Линейная модель парной регрессии yi=α+βxi+εi (1) yi-1=α+βxi-1+εi-1(2) Из (1) вычтем (2), умноженное на ρ yi-ρyi-1=α(1-ρ)+β(xi-ρxi-1)+(εi-ρεi-1) получим ρ≈1-DW/2 Yi*=α*+βx*+vi Рис.9.2. Авторегрессионное преобразование Вопросы и задания для самоконтроля 1. Каковы основные причины и последствия автокорреляции? 2. Что такое автокорреляционная функция? 3. Какова основная идея метода рядов при обнаружении автокорреляции? 4. Как проводится тест Дарбина-Уотсона? 5. В чем состоит авторегрессионная схема 1-го порядка? Задача 1. По статистическим данным за 20 лет построено уравнение регрессии между ценой бензина и объемом продаж бензина, d  DW  0,71. 61 Задание: ответить на вопросы: будет ли иметь место автокорреляция остатков? Что могло послужить причиной автокорреляции? ~ Задача 2. Для модели y  32  0,35x1  0,46 x2 , параметры которой оценены по МНК, получена следующая последовательность остатков: Номер i ei 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -2 3 -1 2 -4 2 0 1 -1 0 -4 3 -2 3 0 Задание: рассчитать коэффициент автокорреляции первого порядка. При уровне значимости   0,05 исследовать с помощью теста Дарбина-Уотсона наличие автокорреляции между ошибками  i и  i 1 . Лекция 11 Тема 10. Фиктивные переменные Аннотация. Данная тема раскрывает особенности построения регрессионных моделей с переменной структурой. Ключевые слова. Фиктивные переменные, Anova – модели, Ancova – модели, тест Чоу. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 3-e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 62 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 63-65. 3. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 229-242. 4. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 253-273. Глоссарий ANCOVA-модель (модель ковариационного анализа) – это регрессионная модель, в которой объясняющие переменные носят как количественный, так и качественный характер. ANOVA-модель (модель дисперсионного анализа) - это регрессионная модель, содержащая лишь качественные объясняющие переменные. Фиктивные переменные - переменные, которые отражают в модели влияние качественного фактора, содержащего атрибутивные признаки двух и более уровней. Чоу тест – метод определения целесообразности применения фиктивных переменных в регрессионной модели. Вопросы для изучения 1. Регрессионные модели с переменной структурой (фиктивные переменные). 2. Правило использования фиктивных переменных. 3. ANOVA–модели и ANCOVA–модели. 63 Тест Чоу на наличие структурной перестройки. Регрессионные модели с переменной структурой (фиктивные переменные). Исходные статистические данные называют однородными, если все они зарегистрированы при одних и тех же условиях (время года, регион, образование, пол человека). Если же данные объединяют в себе наблюдения, зарегистрированные при различных условиях, то они могут быть неоднородными. В этом случае в модель включается фактор, имеющий два или более качественных уровней. Фиктивные (dummy variables, искусственные, двоичные, структурные) переменные отражают в модели влияние качественного фактора, содержащего атрибутивные признаки двух и более уровней. Для того, чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, то есть качественные переменные необходимо преобразовать в количественные. Правило использования фиктивных переменных. В случае, когда качественная переменная принимает не два, а большее число значений, может возникнуть ситуация, которая называется ловушкой фиктивной переменной. Она возникает, когда для моделирования k значений качественного признака используется ровно k бинарных (фиктивных) переменных. В этом случае одна из таких переменных линейно выражается через все остальные, и матрица X ' X  становится вырожденной. Тогда исследователь попадает в ситуацию совершенной мультиколлинеарности. Избежать подобной ловушки позволяет правило: если качественная переменная имеет k альтернативных значений, то при моделировании используется только (k-1) фиктивных переменных. ANOVA–модели и ANCOVA–модели. Тест Чоу на наличие структурной перестройки. Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями 64 (моделями дисперсионного анализа). Например, зависимость начальной заработной платы от образования может быть записана так: y  a  gD  e , где D=0, если претендент на рабочее место не имеет высшего образования, D=1, если имеет. Тогда при отсутствии высшего образования начальная заработная плата равна: yˆ  a  g  0  a, а при его наличии: yˆ  a  g 1  a  g. Регрессионные модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVAмоделями (моделями ковариационного анализа). Ancovaмодель Ancova-модель при наличии у фиктивной переменной двух альтернатив Ancova-модель при наличии у фиктивных переменных более двух альтернатив Ancova-модель с одной количественной и двумя качественными переменными Рис.10.1. Виды Ancova-моделей Например, Ancova-модель при наличии у фиктивной переменной двух альтернатив: y=a+b*x+γ*D+ε, D=1- лица мужского пола, D=0 – лица женского пола. Ожидаемое потребление кофе при цене x будет: y=a+b*x+ε для женщины; y=a+b*x+γ*D+ε=(a+ γ)+b*x +ε – для мужчины. Если γ будет статистически значим по t-статистике, то пол влияет на потребление кофе. При γ>0 - в пользу мужчин, при γ<0 – в пользу женщин. Тест Чоу: Вся выборка объёма n разбивается на две подвыборки объёмами n1 и n2 (n1+n2=n), и для каждой строится уравнение регрессии. Обозначим через s1 и s2 остаточные СКО для каждой из регрессий. Кроме того, строится общая регрессия для всех наблюдений (линия 3), и для неё определяется остаточная СКО, которую обозначим s3. Равенство s3=s1+s2 возможно лишь при совпадении коэффициентов регрессии для всех трёх 65 уравнений. Если сумма s1+s2 будет значительно меньше, чем s3, то можно считать разбиение общей выборки на две подвыборки обоснованным. В этом смысле разность (s3-(s1+s2)) можно считать мерой улучшения качества модели при разбиении выборки на две части. Однако при разбиении уменьшается число степеней свободы каждой из подвыборок. Эта альтернатива между числом степеней свободы и уменьшением остаточной СКО выражается через статистику F s3  s1  s2  n  2 p  2 ,  s1  s2 p 1 где p – число факторов. Данное выражение равно отношению уменьшения необъясненной дисперсии к необъясненной дисперсии кусочно – линейной модели. Если уменьшение дисперсии статистически незначимо, то F-статистика имеет распределение Фишера с (p+1, n-2p-2) степенями свободы. Если на заданном уровне значимости α Fнабл  F  ; p  1; n  2 p  2  , то нет смысла разбивать уравнение регрессии на части. В противном случае разбиение на подвыборки целесообразно с точки зрения улучшения качества модели. Вопросы и задания для самоконтроля 1. В чем преимущества фиктивных переменных? 2. Как фиктивные переменные включаются в модель регрессии? 3. В чем суть ANOVA-моделей? 4. В чем суть ANCOVA-моделей? 5. В чем состоит правило применения фиктивных переменных? 6. Какой смысл имеет дифференциальный свободный член? 7. Какой смысл имеет дифференциальный угловой коэффициент? 8. Какова идея теста Чоу? Задача 1. Исследуется зависимость заработной платы рабочего x y от возраста для мужчин и женщин. Оценивание объединенной регрессии 66 ( n  20) и отдельных регрессий для рабочих-мужчин ( n1  13) и рабочихженщин ( n2  7) дали следующие результаты: Выборка Оцененное уравнение ~ y  62,27  7,23 x Объединенная ~ y  55  7,39 x Мужчины ~ y  59,43  7,3x Женщины R2 0,728 0,735 0,712 Сумма квадратов остатков 24888 18619 5658 Задание: проверить на уровне значимости   0,05 с использованием критерия Чоу, улучшилось ли качество регрессии после разделения выборки на части. Лекция 12 Тема 11. Нелинейные регрессии и их линеаризация Аннотация. Данная тема раскрывает особенности построения нелинейных моделей регрессии. Ключевые слова. Нелинейная регрессия, индекс корреляции, коэффициент эластичности, подход Бокса-Кокса. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 67 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 41-45. 3.Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 383-399. 4. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.172-174. Глоссарий Бокса-Кокса подход – способ подбора линеаризующего преобразования. Индекс корреляции - показатель корреляции, который определяется для нелинейных регрессий. Коэффициент эластичности показывает, на сколько процентов изменится результативный признак Y, если факторный признак изменится на 1 процент. Линеаризация нелинейных моделей – процедура, которая заключается в преобразовании или переменных, или параметров модели, или в комбинации этих преобразований. Нелинейная модель, внутренне линейная, с помощью преобразований может быть приведена к линейному виду. Нелинейная модель, внутренне нелинейная, не может быть сведена к линейной функции. Вопросы для изучения 1. Классы и виды нелинейных регрессий. 2. Линеаризация нелинейных моделей. Выбор формы модели. 68 3. Индекс корреляции. Подбор линеаризующего преобразования (подход Бокса-Кокса). Классы и виды нелинейных регрессий. Различают два класса нелинейных регрессий: регрессии, нелинейные относительно включенных в анализ объясняющих переменных; регрессии, нелинейные по оцениваемым параметрам. Нелинейная модель, внутренне линейная, с помощью преобразований может быть приведена к линейному виду. Нелинейная модель, внутренне нелинейная, не может быть сведена к линейной функции. При анализе нелинейных регрессионных зависимостей наиболее важным вопросом применения классического МНК является способ их линеаризации. Линеаризация нелинейных моделей. Выбор формы модели. В нелинейных зависимостях, не являющихся классическими полиномами, обязательно проводится предварительная линеаризация, которая заключается в преобразовании или переменных, или параметров модели, или в комбинации этих преобразований. Рассмотрим некоторые классы таких зависимостей. Способы линеаризации Логарифмир ование Замена Комбиниро обеих переменных ванный частей уравнения Рис. 11.1. Способы линеаризации Замена переменных заключается в замене нелинейных объясняющих переменных новыми линейными переменными и сведении нелинейной регрессии к линейной. Логарифмирование обеих частей уравнения применяется обычно, когда мультипликативную модель необходимо привести к линейному виду. К классу степенных функций относятся: кривые спроса и предложения, производственная функция Кобба-Дугласа, кривые освоения для характеристики связи между трудоемкостью продукции и масштабами 69 производства в период освоения и выпуска нового вида изделий, зависимость валового национального дохода от уровня занятости. Индекс корреляции. Подбор линеаризующего преобразования (подход Бокса-Кокса). Любое уравнение нелинейной регрессии, как и линейной зависимости, дополняется показателем корреляции, который в данном случае называется индексом корреляции: 2  ост R  1 2 y Здесь  y2 - общая дисперсия результативного признака y, 2  ост - остаточная дисперсия, определяемая по уравнению нелинейной регрессии yˆ x  f  x  . Подругому можно записать так:  y  yˆ x  1  2  y  y 2 R Следует обратить внимание на то, что разности в соответствующих суммах y  y 2   y  yˆ x  2 и берутся не в преобразованных, а в исходных значениях результативного признака. Иначе говоря, при вычислении этих сумм следует использовать не преобразованные (линеаризованные) зависимости, а именно исходные нелинейные уравнения регрессии. Величина R находится в границах 0  R  1, и чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии. Если разные модели используют разные функциональные формы для зависимой переменной, то проблема выбора модели становится более сложной, так как нельзя непосредственно сравнивать коэффициенты R2 или суммы квадратов отклонений. Например, нельзя сравнивать эти статистики для линейного и логарифмического вариантов. Пусть в линейной модели в качестве зависимой переменной используется заработок, а в нелинейной – логарифм заработка. Тогда R2 в одном уравнении измеряет объясненную регрессией долю 70 дисперсии заработка, а в другом - объясненную регрессией долю дисперсии логарифма заработка. В случае, если значения R2 для двух моделей близки друг к другу, проблема выбора усложняется. Здесь следует использовать тест Бокса – Кокса. При сравнении моделей с использованием в качестве зависимой переменной y и lny проводится такое преобразование масштаба наблюдений y, при котором можно непосредственно сравнивать суммы квадратов отклонений в линейной и логарифмической моделях. Здесь выполняются следующие шаги. Вычисляется среднее геометрическое значений y в выборке. Оно совпадает с экспонентой среднего арифметического логарифмов y. Все значения y пересчитываются делением на среднее геометрическое, получаем значения y*. Оцениваются две регрессии: для линейной модели с использованием качестве зависимой переменной и для логарифмической y* в модели с использованием ln y* вместо ln y. Во всех других отношениях модели должны оставаться неизменными. Теперь значения СКО для двух регрессий сравнимы, и модель с меньшей остаточной СКО обеспечивает лучшее соответствие исходным данным. Для проверки, обеспечивает ли одна из моделей значимо лучшее соответствие, можно вычислить величину (n/2)lnz, где z – отношение значений остаточной СКО в перечисленных регрессиях. Эта статистика имеет распределение хи – квадрат с одной степенью свободы. Если она превышает критическое значение при выбранном уровне значимости α, то делается вывод о наличии значимой разницы в качестве оценивания. Величина коэффициента эластичности показывает, на сколько процентов изменится результативный признак Y, если факторный признак изменится на 1 %: Ý  f ( x) x y В заключение приведем формулы расчета коэффициентов эластичности для наиболее распространенных уравнений регрессии: Вид уравнения регрессии Коэффициент эластичности y  а b х  bх а  bх 71 b  2cx   x y  a  bx  cx 2   a  bx  cx 2 b y  а   х b ах  b y  a  bx  x ln b y  a  xb b y  a  b ln x   b a  b ln x y y  bx a  bx 1 a  bx   cx a 1  b  e cx  1 cx  e 1 b Вопросы и задания для самоконтроля 1. Какие модели являются нелинейными относительно: а) включаемых переменных; б) оцениваемых параметров? 2. Какие преобразования используются для линеаризации нелинейных моделей? 3. Чем отличается применение МНК к моделям, нелинейным относительно включаемых переменных, от применения к моделям, нелинейным по оцениваемым параметрам? 4. Как определяются коэффициенты эластичности по разным видам регрессионных моделей? 5. Какие показатели корреляции используются при нелинейных соотношениях рассматриваемых признаков? 6. В каких случаях используют обратные и степенные модели? Задача 1. По группе предприятий, производящих однородную продукцию известно, как зависит себестоимость единицы продукции (Y) от факторов, приведенных в таблице: 72 Признак-фактор Уравнение парной регрессии Среднее значение фактора Объем производства, x1 , млн. руб. 58,74 ~ y x1  0,62  x1 x1  2,64 Трудоемкость единицы продукции, x2 , чел/час Оптовая цена за 1т энергоносителя, x3 , млн. руб. Доля прибыли, изымаемая государством, x 4 ,% ~ y x2  9,30  9,83x 2 x2  1,38 ~ y x3  11,45  x31,6281 x3  1,503 ~ y x4  14,87  1,016 x4 x4  26,3 Задание: 1) определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат; 2) ранжировать факторы по силе влияния на результат. Задача 2. По группе из 10 заводов, производящих однородную продукцию, получено уравнение регрессии себестоимости единицы продукции y (тыс. руб) от уровня технической оснащенности x (тыс. руб.) 700 ~ y  20  . x Доля остаточной дисперсии в общей составила 0,19. Задание: 1) определить коэффициент эластичности, предполагая, что стоимость активных производственных фондов составляет 200 тыс. руб.; 2) вычислить индекс корреляции; 3) оценить значимость уравнения регрессии с помощью F  критерия. Лекция 13,14 Тема 12. Модели с дискретной зависимой переменной Аннотация. Данная тема раскрывает особенности построения моделей регрессии с дискретной зависимой переменной. Ключевые слова. Логит-модель, пробит-модель, метод максимального правдоподобия, тест Вальда. 73 Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. В качестве самостоятельной работы предлагается выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: учеб. / под ред. В. С. Мхитаряна.- М.: Проспект, 2008. – 384 с. С. 216-256. 4. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.257-273. Глоссарий Бинарная переменная - переменная, которая принимает лишь два значения: 0 и 1. Вальда тест – тест для проверки гипотезы о значимости коэффициентов моделей бинарного выбора. Дискретная зависимая переменная - зависимую переменная, которая принимает несколько альтернативных значений. Логит-модель – модель с дискретной зависимой переменной, в основу которой положена функция стандартного нормального распределения. Пробит-модель – модель с дискретной зависимой переменной, в основу которой положена функция логистического распределения. Вопросы для изучения 1. Модели бинарного выбора. 2. Оценивание параметров моделей бинарного выбора. 74 3. Модели множественного выбора с упорядоченными альтернативами. 4. Модели множественного выбора с неупорядоченными альтернативами. Модели бинарного выбора. Зависимую переменную, которая принимает несколько альтернативных значений, называют дискретной. В зависимости от числа альтернатив выделяют модели бинарного и множественного выбора. Чаще применяются модели бинарного выбора. Бинарная переменная принимает лишь два значения: 0 и 1. Выбор функции F () определяет тип бинарной u z2  модели. Если используют функцию стандартного нормального распределения 1 2 F (u )  Ô (u )  2 e dz , то модель бинарного выбора называют пробит-моделью  (probit model). Если используют функцию логистического распределения, F (u )  (u )  model). eu , то модель бинарного выбора называют логит-моделью (logit 1  eu P ( yi  1)  pi  1 1 e  (  0  1 xi )  1 1  ez 1 1  e zi P ( yi  0)  1  pi  pi 1  e zi   e zi z 1  pi 1  e ln pi  zi   0  1 xi 1  pi Оценивание параметров моделей бинарного выбора. Для оценивания параметров  в моделях бинарного выбора обычно используют метод максимального правдоподобия. Общее уравнение правдоподобия: P( yi  1 xi ;  )  F ( xi ) Подставив N N i L(  )   p ( yi  1 xi ;  ) yi P( yi  0 xi ;  )1 yполучим: i 1 N log L(  )   yi log F ( xi )   (1  yi ) log( 1  F ( xi )). Уравнение i 1 правдоподобия i 1 является системой нелинейных (относительно ) уравнений и решается обычно итерационными методами. Для пробит- и логит-моделей данная функция является вогнутой по , следовательно, решение уравнения правдоподобия дает оценку максимального правдоподобия параметров i. Унифицированного, как в линейной регрессии R2, показателя 75 качества «подгонки» модели не существует. Пусть, log Lf - значение функции правдоподобия исходной модели, log Lc -значение функции правдоподобия той же модели с нулевыми параметрами, но с константой. Чем больше их разность, тем лучше должна быть модель. На этой идее основаны нижеследующие показатели качества модели: EpseudoR 2  1  1 1  2(log L f  log Lc ) / n McFaddenR 2  1  log L f log Lc Чем больше значение этих показателей, тем лучше модель. Данные показатели редко достигают значений, превышающих 0,5. Для проверки гипотезы о значимости коэффициентов моделей бинарного выбора применяют: - тест Вальда (Wald test); - тест множителей Лагранжа (Lagrange multiplier (LM) test); - отношения правдоподобия (Likelihood ratio (LR) test). Модели множественного выбора с упорядоченными альтернативами. Модели множественного выбора (multinomial, multi-response models) используются в тех случаях, когда имеется более чем две альтернативы. Различают: модели с упорядоченными альтернативами (ordered response y *i  xi   i models); модели с неупорядоченными альтернативами (unordered response models). Если существует логическое упорядочивание М альтернатив, то может использоваться дискретная модель с упорядоченными альтернативами. Эта модель основывается на предположении о существовании одной    i y i  xiпеременной ненаблюдаемой латентной Yi* : * Стандартное нормальное распределение остатков дает упорядоченную probit-модель (ordered probit model). Логистическое распределение остатков дает упорядоченную logit-модель (ordered logit model). Модели множественного выбора с неупорядоченными альтернативами. В некоторых случаях не существует естественного упорядочивания между альтернативами. Например, при моделировании способа передвижения (автобус, поезд, 76 машина, велосипед, пешком). Предполагается существование случайной полезности, которая влияет на выбор альтернатив. Случайные полезности являются линейными функциями от наблюдаемых характеристик и имеют аддитивно-разделяемую структуру. Полезность: U ij  ij   ij ij - неслучайная функция наблюдаемых неизвестных параметров; ij – ненаблюдаемый остаточный член. P( y i  j )  P(U ij  max( U i1 ,...U iM ))  Вопросы P(  i j   i j для  max (  i k   i k ). самоконтроля k 1,..., J , k  j Вопросы для самоконтроля 1. В каких ситуациях фиктивная переменная используется в качестве зависимой переменной? 2. Какие законы распределения чаще всего используются в моделях бинарного выбора? 2. В чем суть логит-модели? 3. В чем суть пробит –модели? 4. Какова интерпретация коэффициентов моделей бинарного выбора? 5. Как осуществляется проверка значимости коэффициентов в модели бинарного выбора? 6. Как получить прогноз вероятности по логит-модели? 7. Как получить прогноз вероятности по пробит-модели? 8. Можно ли рассчитать по логит-модели коэффициент детерминации? 9. В чем отличие моделей упорядоченного и неупорядоченного выбора? Лекция 15 Тема 13. Модели панельных данных Аннотация. Данная тема раскрывает особенности построения моделей регрессии по панельным данным. 77 Ключевые слова. Панельные данные, сбалансированная панель, фиксированные эффекты, случайные эффекты. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. В качестве самостоятельной работы предлагается выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: учебник / Под ред. И. И. Елисеевой. 2-е изд. -М.: Финансы и статистика, 2008. – 576 с. С.495-556. 3. Эконометрика: учеб. / под ред. В. С. Мхитаряна.- М.: Проспект, 2008. – 384 с. С. 133-178. Глоссарий Панельные данные - множество данных, состоящих из наблюдений за однотипными статистическими объектами, в течение нескольких временных периодов. Сбалансированная панель - панельные данные, в которых нет пропущенных наблюдений. Панельное истощение - сокращение объектов в выборке. Ротационная панель - панельные данные, в которых в обследуемую выборку периодически добавляется новый объект. Модель с фиксированными эффектами – модель панельных данных, в которой моделируется эффект гетерогенности между объектами наблюдения с инвариантным по отношению ко времени, но специфическим для каждого объекта наблюдения параметром местоположения i. 78 Модель со случайными эффектами - модель панельных данных, в которой моделируется эффект гетерогенности объектов наблюдения путем введения неизменного во времени, но специфического для каждого объекта наблюдения слагаемого ошибки mi, которое предполагается независимым от оставшейся части ошибки it. Вопросы для изучения 1. Основные понятия и характеристики панельных данных. 2. Модель сквозной регрессии и модель регрессии со случайным индивидуальным эффектом. Оценивание модели со случайным индивидуальным эффектом. Основные понятия и характеристики панельных данных. Множество данных, состоящих из наблюдений за однотипными статистическими объектами, панельными, в течение или нескольких временных пространственными, данными. периодов, называется Панельные данные позволяют учитывать ненаблюдаемую гетерогенность. Чтобы смоделировать разницу между измерениями в два разных периода времени вводят фиктивную переменную (d2=0 при t=1, d2=1 при t=2) Для d2=0 при t=1: yit  d 2t   0 i  1 xit  uit ( y2t  y1t )    1 ( x2t  x1t )  (u2t  u1t ) учесть в . модели . Свойства панельных данных: позволяют ненаблюдаемую гетерогенность; позволяют идентифицировать потоки или перемещения между различными состояниями наблюдаемых объектов. Сбалансированной панелью называют панельные данные, в которых нет пропущенных наблюдений. Сокращение объектов в выборке называют панельным истощением. Ротационной панелью называют панельные данные, в которых в обследуемую выборку периодически добавляется новый объект. В микроэконометрических панелях объекты наблюдения – индивиды, домохозяйства, предприятия. В макроэконометрических панелях объектами наблюдения служат страны, регионы, города. В модели с фиксированными эффектами моделируется эффект гетерогенности между объектами наблюдения с инвариантным по 79 yit  i  xit   uit отношению ко времени, но специфическим для каждого объекта наблюдения параметром местоположения i:  y.it Это  i вxточности модель с it   uit фиктивными переменными. Модель с фиксированными эффектами - это простая регрессионная модель, оценки параметров тестируют с помощью обычных t- и F – тестов. Модель сквозной регрессии и модель регрессии со случайным индивидуальным эффектом. В модели со случайными эффектами моделируется эффект гетерогенности объектов наблюдения путем введения неизменного во времени, но специфического для каждого объекта наблюдения слагаемого ошибки mi, которое предполагается независимым от оставшейся части ошибки it. yit  i  xit   uit uit  mi  it Эффекты mi, описывающие гетерогенность, являются случайными переменными в смысле случайности выборки из генеральной совокупности, поскольку каждый объект наблюдения имеет специфический, не зависящий от времени, эффект. МНК – оценки в модели со случайными эффектами неэффективны из-за присутствия автокорреляции в слагаемом ошибки mi. Применяется двухшаговая процедура обобщенного метода наименьших квадратов – ВОМНК – выполнимый обобщенный метод наименьших квадратов. Фиксированные и случайные эффекты – это случайные переменные. Оба эффекта моделируют ненаблюдаемые различия в объектах наблюдения. Фиксированные эффекты – параметры. Случайные эффекты – слагаемые ошибок. Фиксированные эффекты могут коррелировать с регрессорами. Случайные эффекты предполагаются некоррелированными с регрессорами. Чтобы проверить гипотезу о том, какие эффекты моделировать, используют тест Хаусмана: H  ( ˆFE  ˆRE )Ôˆ 1 ( ˆFE  ˆRE )   P  22  H  H 0 Вопросы для самоконтроля 80 1. Какие данные называют панельными? 2. Назовите преимущества использования панельных данных. 3. В чем отличия моделей с фиксированными и случайными эффектами для панельных данных? 4. Можно ли модель с фиксированными эффектами для панельных данных рассматривать как частный случай использования фиктивных переменных? 5. Охарактеризуйте роль инструментальных переменных в оценивании моделей по панельным данным. 6. Для проверки какой гипотезы применяется тест Хаусмана? 7. Как проверить значимость фиксированных эффектов и случайных эффектов? 8. Каковы достоинства и недостатки моделей фиксированных и случайных эффектов? Лекция 16 Тема 14. Ошибки спецификации Аннотация. Данная тема раскрывает типы ошибок спецификации, последствия исключения существенных переменных и включения несущественных переменных, использования замещающих переменных. Ключевые слова. Спецификация модели, ошибки спецификации, замещающие переменные. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. В качестве самостоятельной работы предлагается практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 81 выполнить 2. Эконометрика: учебник / Под ред. И. И. Елисеевой. 2-е изд. -М.: Финансы и статистика, 2008.- 576 с. С. 109-125. 3. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.174-197. 4. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3e изд., испр. и доп. М.: - ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 62-63. Глоссарий Замещающая (proxy) переменная – переменная, которая применяется вместо отсутствующей переменной, имеющая с ней зависимость, близкую к линейной. Ошибка спецификации – это неправильно выбранная форма модели, исключение существенного фактора, включение несущественного фактора. Спецификация модели - формулировка вида модели исходя из соответствующей теории связи между переменными. Вопросы для изучения 1. Спецификация регрессионной модели. 2. Исключение существенных переменных и включение несущественных переменных. 3. Замещающие переменные в регрессионных моделях. Спецификация регрессионной модели. Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными. Чтобы 82 выбрать качественную модель, необходимо ответить на ряд вопросов, возникающих при ее анализе: 1. Каковы признаки «хорошей» модели? 2. Какие ошибки спецификации встречаются, и каковы последствия данных ошибок? 3. Как обнаружить ошибку спецификации? 4. Каким образом можно исправить ошибку спецификации и перейти к лучшей (качественной) модели? Для построения «хорошей» модели и сравнения ее с другими возможными моделями необходимо учитывать следующие свойства (критерии): скупость (простота), единственность, максимальное соответствие, согласованность с теорией, прогнозные качества. Основные типы ошибок спецификации: неправильно выбранная форма модели; недоучет в уравнении регрессии какоголибо существенного фактора, т.е. использование парной регрессии вместо множественной. Исключение существенных переменных и включение несущественных переменных. Последствия исключения значимой переменной достаточно серьезны. МНК-оценки несостоятельными даже являются при смещенными бесконечно (M(g0)≠  0,M(g1)≠  1 ) и большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными. При положительном 2 и положительной коррелированности между X 1 и Х2 оценка g1 будет завышать истинное значение 1. Коэффициенты b1 и b2 отражают степень индивидуального воздействия на Y каждой из объясняющих переменных X1 и Х2. Ошибка данного рода существенно отражается и на коэффициенте детерминации. Его значение будет завышать роль переменной X 1 в объяснении дисперсии переменной Y. Это связано с косвенным присутствием в уравнении через коэффициент g 1 переменной Х2, что повышает объясняющую способность уравнения в целом. 83 Последствия ошибки добавления незначимой переменной будут не столь серьезными, как в предыдущем случае. Оценки коэффициентов остаются, как правило, несмещенными и состоятельными. Однако их точность уменьшится, увеличивая при этом стандартные ошибки, т. е. оценки становятся неэффективными, что отразится на их устойчивости. Увеличение дисперсии оценок может привести к ошибочным результатам проверки гипотез относительно значений коэффициентов регрессии, расширению интервальных оценок. Замещающие переменные в регрессионных моделях. Замещающие (proxy) переменные применяются вместо отсутствующих переменных. Причины их использования: отсутствие данных, трудность измерения, неточные данные. Отбрасывание существенной переменной приведет к смещенным и несостоятельным МНК-оценкам. Замещающая переменная может дать косвенную информацию о той самой существенной переменной. На практике обычно невозможно найти замещающую переменную, имеющую строгую линейную зависимость с недостающей переменной. Но если зависимость близка к линейной, то результаты приблизительно сохраняются. Основной проблемой является то, что не существует средств для проверки выполнения указанного условия. Вопросы и задания для самоконтроля 1. Что понимается под спецификацией модели? 2. Каковы основные виды ошибок спецификации? 3. Каковы признаки «хорошей» модели? 4. Во сколько раз число наблюдений должно превышать число рассчитываемых параметров при переменной x? 5. Как можно обнаружить ошибки спецификации? 6. Каковы последствия исключения существенных переменных? 7. Каковы последствия включения несущественных переменных? 8. В чем состоит смысл замещающих переменных? 9. В чем суть теста Рамсея? 84 10. Как можно исправить ошибку спецификации? Задача 1. При построении регрессионной зависимости некоторого результативного признака на 8 факторов по 25 измерениям коэффициент множественной детерминации составил 0,736. После исключения 3 факторов коэффициент детерминации уменьшился до 0,584. Задание: проверить, обосновано ли было принятое решение на уровнях значимости 0,1; 0,05; 0,01? Задача 2. При построении регрессионной зависимости некоторого результативного признака на 10 факторов по 45 наблюдениям коэффициент множественной детерминации составил 0,347. После добавления 3 факторов коэффициент детерминации увеличился до 0,536. Задание: проверить, обосновано ли было принятое решение на уровнях значимости 0,1; 0,05; 0,01? Лекция 17 Тема 15. Модели одномерных временных рядов Аннотация. Данная тема раскрывает порядок построения аддитивных и мультипликативных моделей одномерных временных рядов. Ключевые слова. Тренд, сезонные и случайные колебания, аддитивная модель, мультипликативная модель. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест и типовые задачи. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 85 2. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 242-261. 3.Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с. С.128-183. 4.Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3-e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 68-121. 5. Электронный курс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1. Глоссарий Автокорреляция уровней ряда – корреляционная зависимость между уровнями временного ряда. Аддитивная модель временного ряда – временной ряд представлен как сумма циклической, трендовой и случайной компонент. Аналитическое выравнивание временного ряда – способ моделирования тенденции временного ряда посредством построения аналитической функции, характеризующей зависимость уровней ряда от времени. Временной ряд – совокупность значений какого-либо показателя за несколько последовательных моментов времени. Коррелограмма – график зависимости значений автокорреляционной функции временного ряда от величины лага. 86 Лаг – число периодов, по которым рассчитывается коэффициент корреляции временного ряда. Мультипликативная модель временного ряда – временной ряд представлен как произведение циклической, трендовой и случайной компонент. Модель временного ряда – разновидность эконометрической модели, в которой результативный признак является функцией переменной времени или переменных, относящихся к другим моментам времени. Сезонная компонента – компонента временного ряда, которая характеризует внутригодичные колебания показателя. В общем виде является циклической составляющей. Тренд – это основная достаточно устойчивая тенденция во временном ряду, более или менее свободная от случайных колебаний. Вопросы для изучения: 1. Понятие временного ряда и его основные компоненты. 2. Построение аддитивной модели. 3. Построение мультипликативной модели. Понятие временного ряда и его основные компоненты. Временной ряд - это совокупность значений какого-либо показателя за несколько последовательных моментов (периодов) времени (yt).Модели, построенные по временным рядам, называются моделями временных рядов. Модель, в которой временной ряд представлен как сумма его компонент, называется аддитивной моделью временного ряда: yt  Tt  St  et .Модель, в которой временной ряд представлен как произведение его компонент, называется мультипликативной моделью временного ряда: yt  Tt  St  et . Основная задача эконометрического исследования временного ряда – выявление и количественное измерение тенденции, циклической и случайной компонент, с тем, чтобы использовать информацию для получения прогнозных 87 оценок или при построении моделей взаимосвязи двух или более временных рядов. Коэффициент автокорреляции уровней ряда первого порядка: n r1  (y t 2 t  y1 )  ( yt 1  y2 ) n n  ( yt  y1 ) 2   ( yt 1  y2 ) 2 t 2 t 2 n y1  y t 2 n t ; y2  n 1 y t 2 t 1 n 1 Коэффициент автокорреляции уровней ряда второго порядка: n r2  (y t 3 n (y t 3 t  y3 )  ( yt  2  y 4 ) n t  y 3 ) 2   ( yt  2  y 4 ) 2 n y3  y t 3 t 3 n t n2 ; y4  y t 3 t 2 n2 Самый высокий r1 Самый высокий rƬ Ни один r не значим • Ряд содержит только тенденцию • Ряд содержит циклические колебания с периодичностью в Ƭмоментов времени • Ряд не содержит тенденцию и циклические колебания, либо имеет сильную нелинейную тенденцию Рис. 15.1. Выводы о структуре временного ряда Приемы выявления типа тенденции: графически; по абсолютным приростам и темпам роста сглаженных уровней; метод последовательных разностей; сравнительная оценка остаточной суммы квадратов и характеристик качества регрессии. 88 Построение аддитивной модели. 1 шаг. Выравнивание уровней ряда. Просуммируем уровни ряда за каждые четыре квартала со сдвигом на один момент времени. Разделив полученные суммы на 4, найдем скользящие средние. Найдем центрированные скользящие средние как средние значения из двух последовательных скользящих средних. 2 шаг. Расчет сезонной компоненты S. Найдем разность между уровнями и центрированными скользящими средними. Расчет средней оценки сезонной компоненты для каждого квартала за все годы. Расчет скорректированной сезонной компоненты.Моделирование сезонных колебаний:Аддитивная модель: Yt  Tt  St  et . Оценка сезонной компоненты за каждый квартал: st  yt  yt . Средняя оценка сезонной компоненты для квартала за все годы: St   t . Скорректированная s n 4 сезонная компонента: S t  S t  k ; k  S t 1 t 4 3 шаг. Устранение сезонной компоненты S.Вычтем скорректированное значение сезонной компоненты из каждого уровня исходного временного ряда. Получим: T+E=Y-S. 4 шаг. Расчет значений тренда. Проведем аналитическое выравнивание ряда (T+E) с помощью линейного тренда. Рассчитаем значения T для каждого момента времени по уравнению тренда. 5 шаг. Расчет значений T+S. Прибавим к уровням T значения сезонной компоненты (S) для соответствующих кварталов. 6 шаг. Расчет абсолютной ошибки. Выполним расчет ошибки для каждого уровня ряда по формуле: E=Y-(T+S). Расчет суммы квадратов абсолютных ошибок и ее сравнение с общей суммой квадратов отклонений уровней ряда. Построение мультипликативной модели. 1 шаг. Выравнивание уровней ряда. Просуммируем уровни ряда за каждые четыре квартала со сдвигом на один момент времени. Разделив полученные 89 суммы на 4, найдем скользящие средние. Найдем центрированные скользящие средние как средние значения из двух последовательных скользящих средних. 2 шаг. Расчет сезонной компоненты S. Найдем оценки сезонной компоненты как частное от деления уровней на центрированные скользящие средние. Расчет средней оценки сезонной компоненты для каждого квартала за все годы. Расчет скорректированной сезонной компоненты. Моделирование сезонных колебаний:Мультипликативная модель: Yt  Tt  St  et . Оценка сезонной компоненты за каждый квартал: st  yt . Средняя оценка yt сезонной компоненты для квартала за все годы: St   t . Скорректированная s n сезонная компонента: St  St  k ; k  4 . 4 S t 1 t 3 шаг. Устранение сезонной компоненты S. Разделим каждый уровень исходного временного ряда на скорректированное значение сезонной компоненты. Получим: T*E=Y/S. 4 шаг. Расчет значений тренда. Проведем аналитическое выравнивание ряда (T*E) с помощью линейного тренда. Рассчитаем значения T для каждого момента времени по уравнению тренда. 5 шаг. Расчет значений T+S. Умножим уровни T на значения сезонной компоненты (S) для соответствующих кварталов. 6 шаг. Расчет абсолютной ошибки. Выполним расчет ошибки для каждого уровня ряда по формуле: E=Y/(T*S). Расчет суммы квадратов абсолютных ошибок и ее сравнение с общей суммой квадратов отклонений уровней ряда. Вопросы и задания для самоконтроля 1. В чем особенность временного ряда? 2. Каковы основные компоненты уровней временного ряда? 3. В чем состоит основная задача эконометрического исследования временного ряда? 90 4. Как определяется автокорреляция остатков во временных рядах? 5. Какие свойства имеет коэффициент автокорреляции? 6. Как определяется автокорреляционная функция? 7. Что такое коррелограмма? Что выявляют при помощи анализа коррелограммы? 8. Как сформулировать вывод о структуре временного ряда? 9. Какие методы применяются для выявления основной тенденции ряда? 10. В чем суть сглаживания временных рядов? Задача 1. Имеются следующие данные об урожайности пшеницы y за 12 лет: yt t 16,3 20,2 17,1 9,7 1 2 3 4 Задание: 1) 15,3 16,3 19,9 14,4 18,7 20,7 19,5 21,1 5 6 7 8 9 10 11 12 определить среднее значение, среднее квадратическое отклонение и коэффициенты автокорреляции (для лагов   1,2) временного ряда; 2) провести сглаживание исходного временного ряда методом скользящих средних, используя среднюю арифметическую с интервалом сглаживания: а) m  3; б) m  4; 3) записать уравнение тренда ряда, полагая, что он линейный, и проверить его значимость на уровне   0,05. Задача 2. Данные, отражающие динамику роста доходов yt на душу населения за восемь лет, приведены в таблице: Год, t yt 1 2 3 4 5 6 7 8 1130 1220 1350 1390 1340 1380 1490 1680 Задание: определить точечный прогноз дохода населения по линейному тренду на 9 год. Лекция 18 91 Тема 16. Адаптивные модели временных рядов Аннотация. Данная тема раскрывает особенности адаптивных моделей временных рядов. Ключевые слова. Адаптивная модель, экспоненциальное сглаживание, параметр адаптации. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. В качестве самостоятельной работы предлагается выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с. С.200-205. 3.Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3-e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 96-113. 4. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.276-278. 5. Эконометрика: учебник / под ред. В. С. Мхитаряна. - М.: Проспект, 2008. -384 с. С.297-325. 6. Электронный курс “Time Series Econometrics”, Princeton University, URL: 92 http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1. Глоссарий Коэффициент сезонности – коэффициент, учитывающий в адаптивной модели сезонную составляющую; используется в адаптивных моделях в аддитивной и мультипликативной формах. Параметр адаптации - параметр сглаживания , который минимизировал бы ошибку предсказания. Экспоненциальное сглаживание – процедура, которая приводит к адаптивному механизму, построенному на принципе регулятора с обратной связью. Вопросы для изучения 1. Адаптация в моделях временных рядов. Построение адаптивных моделей линейного роста. 2. Адаптивные модели с учетом аддитивных и мультипликативных сезонных составляющих. 3. Процедуры подбора параметров адаптивных моделей временных рядов. Адаптация в моделях временных рядов. Построение адаптивных моделей линейного роста. Примером модели, для которой можно построить различные варианты адаптивных механизмов, как раз и является адаптивный полином первой степени xt+=a1t+ a2t + t+ . Ее адаптивный механизм предусматривает расчет оценок текущих (т. е. на данный момент времени) коэффициентов модели по двум рекуррентным соотношениям: aˆ1t  1 xt  (1  1 )( aˆ1t 1  aˆ2t 1 ), aˆ2t   2 (aˆ1t  aˆ1t 1 )  (1   2 )aˆ2t 1 , где 1,2 – параметры экспоненциального сглаживания (0<1, 2<1). Используемая в рекуррентных соотношениях процедура экспоненциального 93 сглаживания приводит, как и в случае полинома нулевой степени, к адаптивному механизму, построенному на принципе регулятора с обратной связью. Адаптивные модели с учетом аддитивных и мультипликативных сезонных составляющих. Модели с мультипликативным коэффициентом сезонности: xt  a1t f t   t , где a1t – изменяющийся во времени коэффициент, динамика которого характеризует тенденцию развития процесса;ft, ft-1, …, ft-l+1 – коэффициенты сезонности;l – количество фаз в полном сезонном цикле (при месячных наблюдениях l=12, при квартальных – l=4). Модели с аддитивным коэффициентом сезонности: xt  a1t  g t   t , где gt, gt-1, …, gt-l+1 – адаптивные коэффициенты сезонности. Если моделируемый процесс имеет тенденцию линейного роста, то в указанных моделях член, соответствующий полиному нулевого порядка, заменяется полиномом первого порядка, и тогда модели записываются в следующем виде: Расчет текущих оценок xt  (a1t  a 2t ) f t   t , xt  a1t  a 2t  g t   t . коэффициентов всех этих моделей осуществляется с использованием принципа экспоненциального сглаживания. Процедуры подбора параметров адаптивных моделей временных рядов. Основное внимание уделяется выбору такой величины параметра сглаживания , которая минимизировала бы ошибку предсказания. Выбор величины этого параметра в зависимости от количества наблюдений m, входящих в интервал сглаживания, по формуле: =2/(m+1) малопригоден для практического использования. Наиболее величины  часто является используемой метод проб. процедурой Общая подбора схема этой оптимальной процедуры предусматривает деление временного ряда на две части: обучающую и контрольную. Затем по обучающей части при различных  строятся прогнозные модели и делаются расчеты на период, отведенный под 94 контрольную часть. Для каждого  расчетные значения сравниваются с фактическими значениями контрольной части, и определяется среднеквадратическая ошибка прогноза. Оптимальным считается то *, для которого эта ошибка оказалась минимальной. Все прогнозные расчеты осуществляются с использованием оптимального значения сглаживающего параметра. В тех случаях, когда оптимальный уровень параметра  с течением времени подтвержден изменениями, эффективность этого подхода снижается, так как оптимум по обучающейся части может не совпадать с оптимумом по всему временному ряду. Еще одной интересной процедурой оптимальной настройки изменяющегося во времени параметра сглаживания является метод адаптивного градиентного экспоненциального сглаживания, так как в его основе лежит применение градиентной оптимизации для поиска оптимальных значений параметра t в адаптивных моделях, использующих принцип экспоненциального сглаживания. Вопросы и задания для самоконтроля 1. В чем заключаются сущность, механизмы и формы адаптации в социально-экономических системах? 2. В чем заключается специфика экспоненциального сглаживания? 3. В чем состоит особенность модели с мультипликативным коэффициентом сезонности? 4. Какова особенность модели с аддитивным коэффициентом сезонности? 5. Как оценивается коэффициент сезонности для модели, учитывающей тенденцию линейного роста? 6. Какие модели включает группа адаптивных моделей с сезонными составляющими? 7. Какие особенности включает процедура подбора сглаживающего параметра методом проб? 8. В чем заключаются особенности процедуры подбора сглаживающего параметра методом градиентной оптимизации? 95 Задача 1. Имеются данные о потреблении мороженого, тыс. руб.: Сезон Год 2008 253,1 331,2 364,3 292,4 Зима Весна Лето Осень 2009 265,5 343,6 376,7 304,8 2010 277,9 356,0 389,1 317,2 2011 290,3 368,4 401,5 343,2 2012 301,3 375,4 412,4 337,5 Задание: постройте адаптивную модель с линейным трендом и аддитивной сезонной компонентой для прогнозирования потребления мороженого. Лекция 19 Тема 17. Модели стационарных и нестационарных временных рядов Аннотация. Данная тема раскрывает особенности моделей стационарных и нестационарных временных рядов и методы их оценивания. Ключевые слова. Стационарный процесс, модель авторегрессии, модель Бокса-Дженкинса. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 328-338. 96 3.Тихомиров Н. П. Эконометрика: учебник. - М.: Экзамен, серия «Учебник Плехановской академии», 2007, -512 с. С.211-222. 4. Эконометрика: учебник / под ред. В. С. Мхитаряна. - М.: Проспект, 2008. -384 с. С. 325-336. 5. Электронный курс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1. Глоссарий Авторегрессионая эконометрической модель модели, – которая разновидность содержит в динамической качестве факторных переменных лаговые значения эндогенных переменных. Авторегрессия – регрессия, учитывающая влияние предыдущих уровней на последующие. Бокса Дженкинса модель – это модель авторегрессии (левая часть) – проинтегрированного скользящего среднего (правая часть), описывающая нестационарный однородный временной ряд. Бокса-Пирса статистика – статистический критерий для обнаружения «белого шума» в остатках регрессии. Коинтеграция– причинно-следственная связь в уровнях двух или более временных рядов, которая выражается в совпадении или противоположной направленности их тенденций и случайной колеблемости. Модель авторегрессии – скользящего среднего – это линейная модель множественной регрессии, в которой в качестве объясняющих переменных выступают прошлые значения самой зависимой переменной, а в качестве регрессионного остатка – скользящие средние из элементов «белого шума». 97 Ряд Фурье – в гармониках Фурье исходным рядом является не первичный ряд за несколько лет, а усредненные значения месячных уровней, в которых исключены тренд и случайная компонента. Вопросы для изучения: 1. Модели стационарных и нестационарных временных рядов, их идентификация. 2.Модель авторегрессии–скользящего среднего (модель ARMA). 3. Авторегрессионная модель проинтегрированного скользящего среднего (модель ARIMA). Модели стационарных и нестационарных временных рядов, их идентификация. Для стационарного процесса в слабом смыслесреднее и дисперсия периода независимо от рассматриваемого времени имеют постоянное значение, а автоковариация зависит только от длины лага между рассматриваемыми переменными. Модели стационарных временных рядов: - модели авторегрессии порядка p (АР(p) – модели); - модели скользящего среднего порядка q(СС(q)-модели); - авторегрессионные модели со скользящими средними в остатках; - (APCC(p,q)-модели); - простая и обобщенная модели авторегрессионных условно гетероскедастичных остатков. Параметрические тесты на стационарность: 1) Тестирование математического ожидания по статистике Стьюдента требует разбить временной ряд (1,T) на две части, не обязательно одинаковые, H0 – гипотеза о постоянстве математического ожидания:  y1  y2 s12 s2  2 T1 T2  y1  y2 s 2  ,  12   22 T1  T2 ,  12   22   T1  T2    ( p, v  T1  T  2)  H 0 98 2) Тестирование математического ожидания по статистике Фишера (если количество наблюдений достаточно велико), Н0 – гипотеза о постоянстве математического ожидания временного ряда. Интервал наблюдений делится на несколько частей. n 1  Tj ( y j  y)2 n  1 j 1 F s 2 ( n) s 2 ( n)  n 1   (T j  1)  s j2 T  n j 1 F  F ( p, v1  n  1, v2  T1  T2  ...  Tn  n  H 0 где, n – число частей разбиения интервала (1,Т); Tj- число измерений переменной yt на j-ой части; j=1,2,…,n; s 2 (n) - среднее значение временного ряда; y - средняя дисперсия. Модель авторегрессии–скользящего среднего (модель ARMA).Построение модели АР(k) сводится к решению двух задач:определение рационального порядка модели (величины k);оценивание параметров модели на основе уравнений Юла-Уокера. yt  1 yt 1   2 yt 2  ...   k yt k   t Система уравнений Юла-Уокера: r1  a1  a2 r1  ...  ak rk 1 ; r2  a1r1  a2  ...  ak rk  2 ;  rk  a1rk 1  a2 rk  2  ...  ak ; r1,r2,…rk – известные оценки коэффициентов автокорреляции; a1,a2,…ak - неизвестные оценки коэффициентов модели. Модель авторегрессии первого порядка АР(1): yt  1 yt 1   t , a1  r1 Модель авторегрессии второго порядка АР(2): 99 yt  1 yt 1   2 yt  2   t , r1  a1  a2 r1 ; r2  a1r1  a2 . a1  r1 (1  r2 ) ; 1  r12 a2  r2  r12 1  r12 Модель скользящего среднего первого порядка СС(1): yt   t  1 t 1 ,  y2  (1  12 ) 2 , 1   1 1  12 Модель скользящего среднего второго порядка СС(2): yt   t  1 t 1   2 t  2 ,  y2  (1  12   22 ) 2 , 1   1 (1  1 )  2 ; 2  ;  i  0, i  3. 2 2 1  1   2 1  12   22 Простейшая модель авторегрессии - скользящего среднего АРСС(k,m) (AutoRegressive-MovingAverage (ARMA (k,m)) : yt  yt 1   t  t 1 yt  yt 1   t  t 1 ,   1,   1 Значения автокорреляционной функции для ARMA (1,1) будут иметь вид:  (1)  (1   )(   ) ,  1 1   2  2  ( )   (  1)    1  (1),  1 Авторегрессионная модель проинтегрированного скользящего среднего (модель ARIMA).Для описания нестационарных однородных временных рядов применяется модель Бокса-Дженкинса (ARIMA –модель). Наиболее распространены ARIMA (k,m,q) – модели, со значениями параметров, не превышающими 2, q – порядок разности (дискретной производной). Этапы методологии Бокса-Дженкинса: 100 1. Тестирование исходного ряда на стационарность. Анализ автокорреляционной функции. Переход к стационарному ряду путем взятия последовательных разностей (дискретные производные). Определение параметра q. 2. Исследование характера автокорреляционной функции и предположение о значениях параметров k (порядок авторегрессии) и m (порядок скользящего среднего). 3. Оценивание параметров ARIMA (k,m,q) – модели. 4. Проверка пробной модели на адекватность путем анализа ряда остатков. Для обнаружения «белого шума» в остатках применяют Q-статистику Бокса-Пирса, H0 об отсутствии автокорреляции в остатках:  Q  n rp2 , p 1 Q   2 ( , v    k  m)  H 0 :   0 Критерии качества подгонки модели Бокса-Дженкинса: КритерийАкайка (Akaike information criterion, AIC):  n 2   et  k m AIC   ln  t 1   n  n     Выбор следует сделать в пользу модели с меньшим значением AIC. Критерий Шварца (Swarzcriterion):  n 2   et  ( p  q) ln n SIK   ln  t 1   n  n     Вопросы для самоконтроля 1. Какая модель временного ряда называется статической? 101 2. Когда модель временного ряда называется динамической? 3. Как определяются авторегрессионные модели? 4. Как определяется модель ARMA? 5. Как интерпретируют параметры моделей авторегрессии? 6. Что означает стационарность временного ряда? 7. Какой стационарный процесс называется «белым шумом»? 8. Какие типы включают модели стационарных временных рядов? 9. Какие типы включают модели нестационарных временных рядов? 10. Как определяется ARIMA-модель? Лекция 20 Тема 18. Модели с лаговыми переменными Аннотация. Данная тема раскрывает особенности моделей с лаговыми переменными и методы их оценивания. Ключевые слова. Модель с распределенным лагом, метод Алмон, метод Койка, модель частичной корректировки, модель адаптивных ожиданий. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. В качестве самостоятельной работы предлагается выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб. пособие / А.И. Новиков. - 3e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 102 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 138-146. 3. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С.273-276. 4. Электронный курс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1. Глоссарий Статическая эконометрическая модель – это модель, построенная по данным временного ряда, которая не содержит лаговые значения экзогенных и (или) эндогенных переменных. Динамическая эконометрическая модель – это модель, которая в данный момент времени t учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к предыдущим моментам времени. Лаговые переменные - это переменные, влияние которых характеризуется определенным запаздыванием во времени. Модель с распределенным лагом - это эконометрическая модель, которая содержит в качестве лаговых переменных лишь независимые (объясняющие) переменные. Модель адаптивных ожиданий - это эконометрическая модель, в которой применяется процедура корректировки ожиданий, когда в каждый момент времени реальное значение переменной х сравнивается с её ожидаемым значением. 103 Модель частичной корректировки – это эконометрическая модель, в которой поведенческое уравнение определяет не фактическое значение yt, а её * y t желаемый (целевой) уровень . Вопросы для изучения 1. Статические и динамические модели. 2. Модели с распределенным лагом. 3. Модель частичной корректировки и модель адаптивных ожиданий. Статические и динамические модели. Эконометрическая модель, построенная по данным временного ряда, является статической, если она не содержит лаговые значения экзогенных и (или) эндогенных переменных. Эконометрическая модель является динамической, если в данный момент времени t она учитывает значения входящих в нее переменных, относящиеся как к текущему, так и к предыдущим моментам времени, то есть отражает динамику переменных в каждый момент времени. Различают два типа динамических моделей. Динамические модели 1 тип Модель авторегрессии 2 тип Модель с распределенным лагом Модель адаптивных ожиданий Модель частичной корректировки Рис. 18.1. Типы динамических моделей. Модели с распределенным лагом. Переменные, влияние которых характеризуется определенным запаздыванием, 104 называются лаговыми переменными. Модели с распределенным лагом содержат в качестве лаговых переменных лишь независимые y  a  b0 xt  b1xt 1  ...  b p xt  p   t (объясняющие) переменные: . Модель говорит о том, что, если в некоторый момент времени t происходит изменение х, это изменение будет влиять на значение Y в течение р последующих моментов времени. Коэффициент b0 называется краткосрочным мультипликатором, т.к. он характеризует изменение среднего значения Y при единичном изменении х в p тот же самый момент времени. Сумма мультипликатором; он характеризует bj j 0 называется долгосрочным изменение Y под воздействием единичного изменения х в каждом из моментов времени. Любая сумма k  b j k  p  j 0 называется промежуточным мультипликатором. Достоинства метода Алмон: универсальность, применимость для моделирования процессов с разнообразными структурами лагов. При малых k (2 или 3) можно построить модели с распределенным лагом любой длины. Ограничения метода Алмон: величина р должна быть известна заранее. При этом приходится задавать максимально возможную величину лага. Выбор меньшего лага, чем его реальное значение, приведет к неверной спецификации модели, невозможности обеспечить случайность остатков, поскольку влияние значимых факторов будет выражено в остатках. Оценки параметров при этом окажутся неэффективными и смещенными. Включение в модель большей величины лага, чем его реальное значение, снижает эффективность оценок изза наличия статистически незначимых факторов. Метод Койка применяется в модели с бесконечным лагом, yt  a1     b0 xt  yt 1  ut , 105 по модели авторегрессии определив её параметры, находим λ, а, b0 исходной модели, а затем и параметры b j   j b0 , j  1,2,3,... . Модель частичной корректировки и модель адаптивных ожиданий. Модель адаптивных ожиданий заключается в простой процедуре корректировки ожиданий, когда в каждый момент времени реальное значение переменной х сравнивается с её ожидаемым значением. Если реальное значение оказывается больше, то ожидаемое в следующий момент значение корректируется в сторону его увеличения, если меньше – то в сторону уменьшения. Предполагается, что размер корректировки пропорционален разности между реальным и ожидаемым значениями переменной. Таким образом, основную  xte1  xte   xt  xte  идею можно записать формулой: 0    1 . В модели частичной корректировки поведенческое уравнение определяет не фактическое значение yt, а её желаемый (целевой) уровень yt* : yt*  a  bxt  ut . В модели предполагается, что фактическое приращение зависимой переменной пропорционально разнице между её желаемым уровнем и значением в предыдущий период. Модель частичной корректировки: yt  a  bxt  1    yt 1   t  ut также является моделью авторегрессии. Вопросы и задания для самоконтроля 1. Какая модель временного ряда называется динамической? 2. Какие типы включают динамические модели? 3. Как определяются модели с распределенными лагами? 4. Как интерпретируют параметры модели с распределенным лагом? 5. Как определяются авторегрессионные модели? 6. Как интерпретируют параметры моделей авторегрессии? 7. В чем основная идея метода Алмон и к каким моделям он применяется? 106 8. Когда применяется преобразование Койка? 9. Как оценить параметры моделей авторегрессии? 10. В чем суть метода инструментальных переменных? 11. Для чего применяется модель адаптивных ожиданий? 12. Для чего применяется модель частичной корректировки? Задача 1. Модель зависимости объемов продаж компании в среднем за месяц от расходов на рекламу была следующая (млн. руб): ~ yt  0,73  4,3xt  3,5xt 1  1,2 xt 2  0,8 xt 3 . Задание: найти краткосрочный, долгосрочный мультипликатор и средний лаг. Задача 2. Дана таблица следующих данных: Момент времени t 3 x 80 90 x  Здесь x , x t 2 t 1 95 110 t 1 t 120 - - ожидаемый и действительный спрос на некоторый товар соответственно. Задание: в соответствии с моделью адаптивных ожиданий xt  xt 1  (1   ) xt1 , где  =0,40 найти остальные значения x  . Лекция 21 Тема 19. Понятие о системах эконометрических уравнений Аннотация. Данная тема излагает типы систем эконометрических уравнений. Ключевые слова. Система взаимозависимых уравнений, идентификация системы взаимозависимых уравнений, структурная и приведенная формы модели. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме. 107  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеются контрольный тест и типовые задачи. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none)С. 117-136. 3. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 338-356. 4.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 286-313. Глоссарий Достаточное составленный из условие идентификации коэффициентов при – определитель переменных, матрицы, отсутствующих в исследуемых уравнениях, не равен нулю, и ранг этой матрицы не менее числа эндогенных переменных системы без единицы. Для решения идентифицируемого уравнения применяется косвенный МНК, для решения сверхидентифицируемого – двухшаговый МНК. 108 Необходимое правила:D+1=H условие – идентификации- уравнение выполнение счетного – уравнение идентифицируемо, D+1<H неидентифицируемо, D+1>H – уравнение сверхидентифицируемо (Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе). Приведенная форма модели - система линейных функций эндогенных переменных от всех предопределенных переменных системы. Система взаимосвязных (совместных) уравнений – одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую. Система независимых уравнений – каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х. Система рекурсивных уравнений – зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении. Экзогенные переменные – независимые переменные, которые взамосвязанныепеременные которые определяются вне системы. Эндогенные переменные – определяются внутри модели. Вопросы для изучения: 1. Понятие о системах уравнений. Системы независимых уравнений и системы взаимозависимых уравнений. 2. Структурная и приведенная формы модели. 3. Идентификация модели. Понятие о системах уравнений. Системы независимых уравнений и системы взаимозависимых уравнений. Эндогенные переменные обычно обозначаются как определяются внутри y. Это зависимые модели. Их переменные, число равно значения числу которых уравнений в системе.Экзогенные переменные обычно обозначаются как x. Это внешние по отношению к модели переменные. Они влияют на эндогенные переменные, но не зависят от них.Лаговые переменные – это значения эндогенных переменных 109 за предшествующий период времени (yt-1). В модели участвуют в качестве экзогенных переменных. В поведенческих уравнениях описываются взаимодействия между переменными.В уравнениях-тождествах описываются соотношения, которые должны выполняться во всех случаях. Тождества не содержат подлежащие оценке параметры a и b, а также случайное отклонение ε. В системе независимых уравнений каждая зависимая переменная y рассматривается как функция одного и того же набора факторов x:  y1  a11x1  a12 x2  ...  a1m xm   1 ,  y  a x  a x  ...  a x   ,  2 21 1 22 2 2m m 2  ....................................................  yn  an1 x1  an 2 x2  ...  anm xm   n . Система независимых уравнений с различным набором факторов:  y1  y   2   y3   y4  f ( x1 , x2 , x3 , x4 , x5 ), f ( x1 , x3 , x4 , x5 ), f ( x2 , x3 , x5 ), f ( x3 , x4 , x5 ). В системе рекурсивных уравнений каждое последующее уравнение включает в качестве факторов все зависимые переменные y предшествующих уравнений наряду с набором собственно факторов х:  y1  a11x1  a12 x2  ...  a1m xm   1 ,  y  b y  a x  a x  ...  a x   , 21 1 21 1 22 2 2m m 2  2  y3  b31 y1  b32 y2  a31x1  a32 x2  ...  a3m xm   3 ,  .................................................................  yn  bn1 y1  bn 2 y2  bn 3 y3  ...  bnn1 yn 1    an1 x1  an 2 x2  ...  anm xm   n . В системе взаимозависимых уравнений одни и те же зависимые переменные y в одних уравнениях входят в левую часть, а в других уравнениях – в правую часть системы:  y1  b12 y2  b13 y3  ...  b1n yn  a11 x1  a12 x2  ...  a1m xm   1 ,   y2  b21 y1  b23 y3  ...  b2 n yn  a21x1  a22 x2  ...  a2 m xm   2 ,  ....................................  y  b y  b y  ...  b y  a x  a x  ...  a x   . n1 1 n2 2 nn1 n 1 n1 1 n2 2 nm m n  n 110 Структурная и приведенная формы модели. Система взаимозависимых (одновременных) уравнений, описывающая структуру связей между переменными, называется структурной формой модели.Коэффициенты biи ajназываются структурными коэффициентами модели.Приведенная форма модели представляет собой систему линейных функций эндогенных переменных от экзогенных.В каждое приведенное уравнение включаются все экзогенные переменные структурной модели. Идентификация модели. Необходимое условие идентификации: D+1=H уравнение идентифицируемо; D+1<H - уравнение неидентифицируемо; D+1>H - уравнение сверхидентифицируемо. D - число экзогенных переменных, которые содержатся в системе, но не входят в данное уравнение; H - число эндогенных переменных в уравнении. Достаточное условие идентификации: определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении, не равен нулю, и ранг этой матрицы не менее числа эндогенных переменных системы без единицы. Модель идентифицируема Модель неидентифицируема (недоопределена) Модель сверхидентифицируема (переопределена) •Число параметров структурной модели равно числу параметров приведенной модели •Применяется косвенный МНК •Число параметров структурной модели больше числа параметров приведенной модели •Нельзя оценить структурные коэффициенты •Число параметров структурной модели меньше числа параметров приведенной модели •Применяется двухшаговый МНК Рис. 19.1. Признаки идентификации Следует помнить, что на идентификацию проверяется каждое уравнение модели. Вопросы и задания для самоконтроля 111 1. В чем преимущество систем эконометрических уравнений? 2. Какие переменные называют предопределенными? 3. Что такое структурная форма модели? 4. Что такое приведенная форма модели? 5. Почему нужна приведенная форма модели? 6. Когда структурная модель является идентифицируемой? 7. Когда структурная модель является неидентифицируемой? 8. В каком случае модель является сверхидентифицируемой? 9. Как идентифицируется отдельное уравнение в системе по счетному правилу? 10. В чем состоит достаточное условие идентификации отдельного уравнения? Задача 1. Дана модель Менгеса: Yt  1  b11Yt 1  b12 I t  1 , I t   2  b21Yt  b22Qt   2 , Ct   3  b13Yt  b32Ct 1  b33 Pt   3 , Qt   4  b41Qt 1  b42 Rt   4 . где Y - национальный доход; C - расходы на личное потребление; I чистые инвестиции; Q - валовая прибыль экономики; P - индекс стоимости жизни; R - объем продукции промышленности; t - текущий период; ( t  1) предыдущий период. Задание: проверить идентифицируемость каждого уравнения использованием необходимого и достаточного условий идентификации. Задача 2. Имеется модель денежного и товарного рынков: Rt  1  b12Yt  b14 M t  1 , Yt   2  b21Rt  b23 I t  b25Gt   2 , I t   3  b31Rt   3 , 112 с где R - процентные ставки; Y - реальный ВВП; M - денежная масса; I внутренние инвестиции; G - реальные государственные расходы; t - текущий период. Задание: проверить идентифицируемость каждого уравнения с использованием необходимого и достаточного условий идентифицируемости и записать приведенную форму модели. Лекция 22 Тема 20. Методы оценки систем одновременных уравнений Аннотация. Данная тема раскрывает методы оценки систем эконометрических уравнений. Ключевые слова. Косвенный метод наименьших квадратов, двухшаговый метод наименьших квадратов, модели спроса-предложения. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, выполнить практические задания и ответить на вопросы для самоконтроля.  Для проверки усвоения темы имеется тест для самоконтроля.  Для подготовки к экзамену имеется контрольный тест. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 2-e изд., испр. и доп. - М.: ИНФРА-М, 2011. - 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 117-136. 3. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. 113 (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 338-356. 4.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 286-313. Глоссарий Двухшаговый метод наименьших квадратов - метод оценивания точно идентифицируемых и сверхидентифицируемых систем уравнений, который основан на конструировании новых значений эндогенных переменных по приведенной форме модели и замене эндогенных переменных в правой части каждого уравнения их прогнозными значениями. Косвенный метод наименьших квадратов – метод оценивания точно идентифицируемых систем уравнений, который основан на вычислении оценок структурных параметров через решение системы нелинейных уравнений, связывающих приведенные и структурные коэффициенты. Метод максимального правдоподобия – один из способов оценивания параметров регрессии, в частности, в моделях с дискретной зависимой переменной. Метод наименьших квадратов – один из распространенных способов оценивания параметров регрессии. Система взаимосвязных (совместных) уравнений – одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую. Система независимых уравнений – каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х. Система рекурсивных уравнений – зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении. 114 Экзогенные переменные – независимые переменные, которые взамосвязанныепеременные которые определяются вне системы. Эндогенные переменные – определяются внутри модели. Вопросы для изучения: 1. Косвенный, двухшаговый и трехшаговый МНК. 2. Применение систем уравнений для построения макроэкономических моделей и моделей спроса – предложения. Косвенный, двухшаговый и трехшаговый МНК. Косвенный МНК применяется для оценивания идентифицируемых систем одновременных уравнений. Исходя из структурных уравнений, строятся приведенные уравнения Определяются МНК-оценки приведенных коэффициентов Оцениваются структурные коэффициенты Рис. 20.1. Этапы косвенного МНК Основная идея ДМНК На основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения Подставить их вместо фактических значений и применить обычный МНК к структурной форме сверхидентифицируемого уравнения Рис. 20.2. Основная идея двухшагового метода наименьших квадратов 115 Таким образом, метод наименьших квадратов используется дважды: 1) При определении приведенной формы модели и нахождении на ее основе yˆ i   i1 x1   i 2 x2  ...   ij x j оценок эндогенной переменной 2) При определении сверхидентифицируемого структурных уравнения коэффициентов на основе оценок структурного эндогенных переменных. Двухшаговый метод наименьших квадратов является наиболее общими широко распространенным методом решения системы одновременныхуравнений. Для точно идентифицируемых уравнений ДМНК дает тот же результат, что и КМНК. Применение систем уравнений для построения макроэкономических моделей и моделей спроса – предложения Основные направления использования систем эконометрических уравнений Построение Построение статических динамических Построение моделей моделей производственных функционирования функционирования функций экономики страны экономики страны Рис. 20. 3. Основные направления эконометрических уравнений Статическая модель Кейнса: C  a  b  y   ,   y  C  I. 116 использования систем С – личное потребление в постоянных ценах; y – национальный доход в постоянных ценах;  - случайная составляющая; I– инвестиции в постоянных ценах. В силу наличия тождества в модели структурный коэффициент b не может быть больше 1. Он характеризует предельную склонность к потреблению. Если b>1, то y< С+I, то есть на потребление расходуются не только доходы, но и сбережения.Структурный коэффициент b используется для расчета мультипликаторов. Динамическая модель Клейна: Ct  b1  St  b2  Pt  b3   1 , I  b  P  b  P  b   , 4 t 5 t 1 6 2  t St  b7  Rt  b8  Rt 1  b9  t  b10   3 , R  S  P  T , t t t  t СRt t – Cфункция потребления в период t;St – заработная плата в период t;Pt – t  I t  Gt . прибыль в период t;Pt-1 – прибыль в период t-1;Rt – общий доход в период t; Rt-1 – общий доход в предыдущий период;t – время;Tt – чистые трансферты в пользу администрации в период t;It – капиталовложения в период t;Gt – спрос административного аппарата, правительственные расходы в период t. Динамическая модель Кейнса: Ct  a  b1Yt  b2Yt 1  1 ,  Yt  Ct  Gt  I t  Lt , P  Y  Z . t t  t Yt – имеющийся в распоряжении доход в период времени t;Сt – частное потребление в период времени t;Pt – валовой национальный продукт в период времени t;Yt-1 – доход предыдущего года;Gt - общественное потребление;It – валовые капиталовложения;Lt – изменение складских запасов;Zt – сальдо платежного баланса. Глоссарий 117 ANCOVA-модель – это регрессионная модель, в которой объясняющие переменные носят как количественный, так и качественный характер. Автокорреляция остатков регрессии – зависимость случайных отклоненийεi и εj друг от друга для i ≠ j. Автокорреляция уровней ряда – корреляционная зависимость между уровнями временного ряда. Авторегрессионная эконометрической модель модели, – которая разновидность содержит в динамической качестве факторных переменных лаговые значения эндогенных переменных. Аддитивная модель временного ряда – временной ряд представлен как сумма циклической, трендовой и случайной компонент. Аналитическое выравнивание временного ряда – способ моделирования тенденции временного ряда посредством построения аналитической функции, характеризующей зависимость уровней ряда от времени. Базовое значение качественной переменной имеет цифровую метку ноль: D=0. Бета-коэффициент показывает, на какую часть своего среднего квадратического отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину своего среднеквадратического отклонения. Бокса Дженкинса модель – это модель авторегрессии (левая часть) – проинтегрированного скользящего среднего (правая часть), описывающая нестационарный однородный временной ряд. Бокса-Кокса подход - формализованная процедура подбора линеаризующего преобразования. Верификация модели – проверка истинности модели, определение соответствия построенной модели реальному экономическому явлению. Внутренне линейная нелинейная модель с помощью преобразований может быть приведена к линейному виду. Внутренне нелинейная модель не может быть сведена к линейной функции. 118 Временной ряд – совокупность значений какого-либо показателя за несколько последовательных моментов времени. Выборочная совокупность – часть генеральной совокупности. Генеральная совокупность - вся совокупность объектов исследования, объем выборки которой должен быть равен бесконечности. Гетероскедастичность – неоднородность относительно дисперсии. Голдфелда Квандта тест – один из наиболее распространенных способов тестирования остатков регрессии на гетероскедастичность. Гомоскедастичность остатков регрессии – постоянство дисперсии случайных отклонений εi. Дарбина-Уотсона тест – один из наиболее распространенных способов тестирования остатков регрессии на автокорреляцию Двухшаговый метод наименьших квадратов - метод оценивания точно идентифицируемых и сверхидентифицируемых систем уравнений, который основан на конструировании новых значений эндогенных переменных по приведенной форме модели и замене эндогенных переменных в правой части каждого уравнения их прогнозными значениями. Дискретная зависимая переменная – это переменная, которая принимает несколько альтернативных значений. Дифференциальный коэффициент свободного члена – это коэффициент перед фиктивной переменной в регрессионной модели. Он показывает, на какую величину отличается свободный коэффициент а при значении D=1, от свободного коэффициента а при D=0. Дифференциальный угловой коэффициент – это коэффициент перед произведением фиктивной переменной и независимой переменной в регрессионной модели. Он показывает, на какую величину отличается коэффициент регрессии b при значении D=1, от коэффициента регрессии b при D=0. Достаточное условие идентификации – определитель матрицы, составленный из коэффициентов при переменных, отсутствующих в иссле119 дуемых уравнениях, не равен нулю, и ранг этой матрицы не менее числа эндогенных переменных системы без единицы. Для решения идентифицируемого уравнения применяется косвенный МНК, для решения сверхидентифицируемого – двухшаговый МНК. Идентификация модели – проведение статистического анализа моде-ли и оценивания качества ее параметров. Индекс корреляции – показатель тесноты статистической взаимосвязи, выраженной в нелинейной форме. Индекс множественной корреляции оценивает тесноту совместного влияния факторов на результативный признак Y. Интервальный прогноз - интервал, в котором с определенной вероятностью находится фактическое значение прогнозной переменной экономического объекта. Коллинеарными называются две переменные, которые находятся между собой в линейной зависимости Коррелограмма – график зависимости значений автокорреляционной функции временного ряда от величины лага. Корреляция – это статистическая зависимость между случайнымивеличинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. Косвенный метод наименьших квадратов – метод оценивания точно идентифицируемых систем уравнений, который основан на вычислении оценок структурных параметров через решение системы нелинейных уравнений, связывающих приведенные и структурные коэффициенты. Коэффициент детерминации – это показатель, который определяет долю разброса зависимой переменной Y, объясняемую регрессией Y на X. Коэффициент корреляции - числовая характеристика совместного распределения двух случайных величин, выражающая их взаимосвязь. Коэффициент эластичности – показатель, который измеряет, на сколько процентов изменится результативный признак Y, если факторный признак 120 изменится на 1 %. Лаг – число периодов, по которым рассчитывается коэффициент корреляции временного ряда. Линеаризация – приведение нелинейных моделей регрессии к линейному виду путем замены, логарифмирования переменных или комбинированным способом с целью применения МНК. Линейный коэффициент парной корреляции – это показатель тесноты статистической взаимосвязи между переменными Y и X. Ловушка фиктивной мультиколлинеарности в переменной силу строгой – это состояние линейной совершенной зависимости между переменными D1 и D2, при котором коэффициенты уравнения регрессии однозначно определены быть не могут. Логит-модель основана на использовании функции логистического распределения. Метод максимального правдоподобия – один из способов оценивания параметров регрессии, в частности, в моделях с дискретной зависимой переменной. Метод наименьших квадратов – один из распространенных способов оценивания параметров регрессии. Множественная корреляция – это зависимость между результативным признаком и двумя и более факторными признаками. Множественная регрессия представляет собой модель, где теорети-ческое (среднее) значение зависимой переменной Y рассматривается как функция нескольких независимых переменных X1, X2,...Xm. Модели бинарного выбора содержат зависимую переменную, которая принимает лишь два альтернативных значения, обозначаемых цифровыми метками: 0 и 1. Модель авторегрессии – скользящего среднего – это линейная модель множественной регрессии, в которой в качестве объясняющих переменных выступают прошлые значения самой зависимой переменной, а в качестве 121 регрессионного остатка – скользящие средние из элементов «белого шума». Модель временного ряда – разновидность эконометрической модели, в которой результативный признак является функцией переменной времени или переменных, относящихся к другим моментам времени. Мультиколлинеарность - это линейная взаимосвязь двух или не-скольких объясняющих переменных (х1, х2, … хm). Мультипликативная модель временного ряда – временной ряд представлен как произведение циклической, трендовой, случайной компонент. Неидентифицирyемая модель - разновидность структурной модели системы одновременных уравнений, в которой структурные коэффициенты невозможно найти по приведенным коэффициентам. 105 Нелинейная регрессия внутренне линейная, т.е. она с помощью соответствующих преобразований может быть приведена к линейному виду Нелинейная регрессия внутренне нелинейная, т.е. она не может быть сведена к линейной функции. Необходимое условие идентификации - выполнение счетного правила:D+1=H – уравнение идентифицируемо, D+1<H – уравнение неидентифицируемо, D+1>H – уравнение сверхидентифицируемо (Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе). Объект эконометрики - экономические процессы, происходящие в экономической системе общества. Объясняющая объясняющий переменная фактор)-это (причина, характеристика независимая объекта, переменная, которая вызывает следствие у зависимой переменной . Параметризация взаимосвязи между модели – переменными выражение модели, в математической формулирование форме исходных предпосылок и ограничений модели. Парная регрессия представляет собой модель, где теоретическое (среднее) значение зависимой переменной Y рассматривается как функция одной 122 независимой переменной X. Парный коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак Y, если переменную X увели-чить на единицу измерения. Предмет эконометрики - количественная оценка взаимосвязи между случайными событиями, признаками, показателями, факторами переменных экономических объектов. Предопределенные переменные – это экзогенные переменные и лаго-вые эндогенные переменные. Приведенная система одновременных уравнений – система уравнений, которая отражает зависимость эндогенных переменных только от экзогенных переменных. Приведенная форма модели - система линейных функций эндогенных переменных от всех предопределенных переменных системы. Пробит-модельоснована на использовании функции стандартного нормального распределения. Прогноз - предвидение, предсказание. Различают два вида: точечный и интервальный прогноз. Регрессионный анализ - раздел аналитической статистики, изучающий форму зависимости характеристик стохастического процесса от одного или нескольких факторов. Сверхидентифицируемая модель - разновидность структурной модели системы одновременных уравнений, в которой структурные коэффициен-ты, выраженные через приведенные коэффициенты, имеют два и более числовых значений. Сезонная компонента – компонента временного ряда, которая характеризуетвнутригодичные колебания показателя. В общем виде является циклической составляющей. Сезонные колебания – это колебания, периодически повторяющиеся в некоторое определенное время каждого года, месяца, дня или его часа. 123 Система взаимосвязaнных уравнений – одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую. Система независимых уравнений – каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х. Система рекурсивных уравнений – зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении. Спецификация модели - формулирование вида модели, исходя из соответствующей теории связи между переменными. Стохастический - случайный, вероятностный. Структурная форма модели – система взаимосвязных (совместных) уравнений, в которой одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую. Тенденция - направление, в котором совершается развитие какого-либо явления. Тобит-модель – модель для описания зависимости цензурированной зависимой переменной от влияющих на нее факторов. Точечный прогноз - среднее прогнозное значение изучаемой переменной экономического объекта. Тренд – это основная достаточно устойчивая тенденция во временном ряду, более или менее свободная от случайных колебаний. Трехшаговый метод наименьших квадратов - метод оценивания точно идентифицируемых и сверхидентифицируемых систем, который основан на анализе ковариационной матрицы ошибок с использованием оценок, полученных в результате применения двухшагового метода наименьших квадратов. Фиктивные переменные - качественные переменные, преобразован-ныев количественные с помощью цифровых меток. Цель регрессионного анализа – оценка функциональной зависимости между независимыми переменными X и условным математическим ожиданием зависимой переменной Y. 124 Цель эконометрики – эмпирический (практический) вывод экономических законов. Циклические (или периодические ) колебания состоят в том, что значение изучаемого признака в течение какого-то времени возрастает, достигая определенного максимума, затем понижается, достигая определенного минимума, вновь возрастает до прежнего значения и т.д. Частное уравнение регрессии характеризует изолированное влияние фактора Xj на результат. Частные уравнения регрессии - уравнения регрессии, которые связывают результативный признак с соответствующими факторами при закреплении других учитываемых во множественной регрессии факторов на среднем уровне Частный коэффициент эластичности показывает, на сколько % изменяется в среднем результативный признак Y при изменении фактора Xj на 1%. Чоу тест – это статистический тест, определяющий целесообразность использования фиктивной переменной. Экзогенные переменные – независимые переменные, которые определяются вне системы. Эконометрика – это наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов, которые раскрыты и обоснованы экономической теорией. Экстраполяция - прогноз, получение расчетных значений при условии.что значения аргумента выходят за пределы области определения функции. Эндогенные переменные - это переменные, определяются внутри модели и обозначаются обычно как у. Перечень информационных ресурсов 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382 125 значение которых 2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. - 3-e изд., испр. и доп. - М.: ИНФРА-М, 2014. - 272 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) 3. Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с. 4. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°», 2012. - 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) 5. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. - 3-е изд. - М.: Дашков и К, 2010. - 436 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) 6. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. - 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) 7.Тихомиров Н. П. Эконометрика: учебник. - М.: Экзамен, серия «Учебник Плехановской академии», 2007, -512 с. 8. Эконометрика: учебник / под ред. В. С. Мхитаряна. - М.: Проспект, 2008. -384 с. 9. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps 126 /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 10. Электронный курс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1. Вопросы и задания для экзамена 1. Каковы типы моделей и переменных, применяемых в эконометрике? 2. Что понимается под спецификацией модели? 3. Что понимается под верификацией модели? 4. Чем регрессионная модель отличается от функции регрессии? 5. Каковы основные причины наличия в регрессионной модели случайного отклонения? 6. В чем суть метода наименьших квадратов? 7. Каковы предпосылки МНК? Каковы последствия их выполнимости или невыполнимости? 8. нормальное Действительно ли оценки коэффициентов регрессии будут иметь распределение, если случайные отклонения распределены нормально? 9. Какой смысл может иметь свободный коэффициент уравнения регрессии? 10. Какова связь между линейным коэффициентом корреляции и коэффициентом регрессии в линейной модели парной регрессии? 11. Каков статистический смысл коэффициента детерминации? 12. Как записывается баланс для сумм квадратов отклонений результативного признака? 13. Что происходит, когда общая СКО равна остаточной? В каком случае общая СКО равна факторной? 127 14. Что такое число степеней свободы? Чему равны числа степеней свободы для различных СКО в парной регрессии? 15. Как используется F-статистика в регрессионном анализе? 16. Как рассчитать критерий Стьюдента для коэффициента регрессии в линейной модели парной регрессии? 17. В чем состоит "грубое" правило анализа статистической значимости коэффициентов регрессии? 18. Какая связь между tb- и F- статистиками в парной линейной регрессии? 19. Какие этапы включает схема определения интервальных оценок коэффициентов регрессии? 20. В чем суть предсказания индивидуальных значений зависимой переменной? 21. В каком месте доверительный интервал прогноза по парной модели является наименьшим?Как записывается эмпирическое уравнение линейной модели множественной регрессии? 22. Что измеряют коэффициенты регрессии линейной модели множественной регрессии? 23. Какие требования предъявляются к факторам длявключения их в модель множественной регрессии? 24. Какой смысл приобретает сумма коэффициентов регрессии в производственных функциях? 25. Как в линейной модели множественной регрессии, записанной в стандартизованном виде, сравнить факторы по силе их воздействия на результат? 26. Как связаны стандартизованные коэффициенты регрессии с натуральными? 27. Как определяется статистическая значимость коэффициентов регрессии в линейной модели множественной регрессии? 128 28. Как строятся доверительные интервалы для параметров линейной модели множественной регрессии? 29. В чем недостаток использования коэффициента детерминации при оценке общего качества линейной модели множественной регрессии? 30. Как корректируется коэффициент детерминации? 31. Каково назначение частной корреляции при построении модели множественной регрессии? 32. Как определяется индекс множественной корреляции и какой он имеет смысл? 33. Каковы способы отбора факторов для включения в линейную модель множественной регрессии? 34. Как проверить обоснованность исключения части переменных из уравнения регрессии? 35. Как проверить обоснованность включения группы новых переменных в уравнение регрессии? 36. Что такое частный F-критерий и чем он отличается от последовательногоF-критерия? 37. Как связаны между собой t-критерий Стьюдента для оценки значимости biи частные F-критерии? 38. В чем суть гомоскедастичности и гетероскедастичности? Каковы последствия гетероскедастичности? 39. Действительно ли, вследствие гетероскедастичности оценки перестают быть эффективными и состоятельными? 40. Какие критерии могут быть использованы для проверки гипотезы о гомоскедастичности регрессионных остатков? 41. Что такое автокорреляция случайных отклонений? 42. Каковы основные причины и последствия автокорреляции? 43. Каковы основные методы обнаружения автокорреляции? 44. В чем суть ANOVA-моделей? 45. В чем суть ANCOVA-моделей? 129 46. В чем состоит правило применения фиктивных переменных? 47. Какой смысл имеет дифференциальный свободный член? 48. Какой смысл имеет дифференциальный угловой коэффициент? 49. В чем особенность моделей с переменной структурой? 50. Какова идея теста Чоу? 51. Как определяются коэффициенты эластичности по разным видам регрессионных моделей? 52. Какие показатели корреляции используются при нелинейных соотношениях рассматриваемых признаков? 53. В чем смысл средней ошибки аппроксимации и как она определяется? В чем суть логит-модели? 54. В чем суть пробит–модели? 55. Какова интерпретация коэффициентов моделей бинарного выбора? 56. Как осуществляется проверка значимости коэффициентов в модели бинарного выбора? 57. Как получить прогноз вероятности по логит-модели? 58. Как получить прогноз вероятности по пробит-модели? 59. Каков смысл коэффициентов регрессии в логарифмических регрессионных моделях? 60. Какие этапы содержит процедура построения тренд-сезонных моделей временных рядов? 61. В чем отличие аддитивной и мультипликативной моделей временных рядов? 62. Чему равна сумма сезонных компонент в аддитивной модели временного ряда? 63. Как осуществляется прогнозирование на основе трендовой и тренд- сезонной моделей временных рядов? 64. Как определяется модель ARMA? 65. Как интерпретируют параметры моделей авторегрессии? 66. Что означает стационарность временного ряда? 130 67. Какой стационарный процесс называется «белым шумом»? 68. Какие типы включают модели стационарных временных рядов? 69. Какие типы включают модели нестационарных временных рядов? 70. Как определяется ARIMA-модель? 71. Какие переменные называют предопределенными? 72. В чем отличие системы взаимозависимых уравнений от системы независимых уравнений? 73. В чем особенность системы рекурсивных уравнений? 74. Что такое структурная форма модели? 75. Что такое приведенная форма модели? 76. Почему нужна приведенная форма модели? 77. Что называют идентификацией модели? 78. В чем суть косвенного МНК? 79. Всегда ли можно применить косвенный МНК? 80. В чем суть двухшагового МНК и когда он применяется? Задача 1. Пусть X,Y – годовые дивиденды от вложений денежных средств в акции компаний А и В соответственно. Риск от вложений характеризуется дисперсиями D(X)=25, D(Y)=16. Коэффициент корреляции σ =+0,8. Куда менее рискованно вкладывать денежные средства: в отрасль В, в отрасль А, в обе отрасли в соотношении 30% на 70%? Задача 2. Доход Х населения имеет нормальный закон распределения со средним значением 5000 руб. и средним квадратическим отклонением 1000 руб. Обследуется 1000 человек. Каково наиболее вероятное количество человек, имеющих доход более 6000 руб.? Задача 3. Статистика по годовым темпам инфляции в стране за последние 10 лет составила (%) : 2,6; 3,0; 5,2; 1,7; -0,5; 0,6; 2,2; 2,9; 4,2; 3,8. Определите ресмещенные оценки среднего темпа инфляции, дисперсии и среднего квадратического отклонения. Задача 4. Предполагается, что месячный доход граждан страны имеет нормальное распределение с математическим ожиданием m=500 $ и 131 дисперсией σ2=22500. По выборке из 500 человек определен выборочный средний доход х =450 Определите $. доверительный интервал для среднедушевого дохода в стране при уровне значимости 0,05. Задача 5. При анализе зависимости между двумя показателями Х и Y по 30 30 наблюдениям получены следующие данные: х = 105; у =80; 30 (y 30 =900; x y i 1 i i =252600; i 1 i  (х ш 1 i  x) 2  y)2 =635. Оцените наличие линейной зависимости между Х и Y и статистическую значимость коэффициента корреляции ρхy. Задача 6. Предполагается, что месячная зарплата сотрудников фирмы составляет 500 $ при стандартном отклонении σ = 50 $. Выборка из 49 человек дала следующие результаты : х =450$ и S = 60$. На основании результатов проведенных наблюдений можно утверждать, что средняя зарплата сотрудников меньше рекламируемой на всех уровнях значимости, а разброс в зарплатах больше на уровне значимости α=0,05 и α=0,1. Задача 6. Имеется три вида акций A, B и C каждая стоимостью 20 у.е., дивиденды по которым являются независимыми СВ со средним значением 8 % и дисперсией 25. Формируются два портфеля инвестиций. Портфель z1 состоит из 60 акций A. Портфель z2 включает в себя по 20 акций A, B и C. Коэффициент корреляции между дивидендами по акциям A и C равен -0,5, но обе величины не коррелируют с дивидендами по акциям B. Рассчитать риски от вложений средств в данные портфели инвестиций. Задача 7. Зависимость спроса на кухонные комбайны y от цены x по 20 торговым точкам компании имеет вид: ln y  6,8  0,6 ln x   , ( 2,7) (2,8) В скобках – фактическое значение t – критерия. Ранее предполагалось, что увеличение цены на 1 % приводит к уменьшению спроса на 1,2 %. Можно ли утверждать, что приведенное уравнение предположение? 132 регрессии подтверждает это Задача 8. Для двух видов продукции А, Б зависимость удельных постоянных расходов от объема выпускаемой продукции выглядят следующим образом y A  15  8 ln x, у Б  25 х 0,3 Сравнить эластичности затрат по каждому виду продукции при x=50 и определить объем выпускаемой продукции обоих видов, при котором их эластичность будут одинаковы. Задача 9. Пусть имеется уравнение парной регрессии: y  5  6x   , построенное по 15 наблюдениям. При этом r=-0.7. Определите доверительный интервал с вероятностью 0,99 для коэффициента регрессии в этой модели. Задача 10. Уравнение регрессии потребления материалов производства y от объема x , построенное по 15 наблюдениям, имеет вид: у  5  5 х   , (4,0) . В скобках – фактическое значение t – критерия. Определите коэффициент детерминации для этого уравнения. Задача 11. Уравнение регрессии имеет вид : ln y = 4,5 + 0,003x + ln e. При значении фактора, равном 85, определите коэффициент эластичности Y по X. Задача 12. По совокупности 15 предприятий торговли изучается зависимость между ценой x на товар А и прибылью y торгового предприятия. При оценке линейной регрессионной модели были получены следующие результаты  ( y  yˆ ) 2  32000  ( y  y ) 2  40000 Определите индекс корреляции, фактическое значение F- критерия, значимость уравнения регрессии. Задача 13. Изучалась зависимость вида y=a*xb. Для преобразованных в логарифмах переменных (X, Y) получены следующие данные 133  XY  4,2087  X  8,2370  X 2  9,2334  Y  3,9310 , n  10 Определите значение параметра b. Задача 14. Изучалась зависимость вида y=a+b*x+e. Получены следующие данные  xy  42,087  x  82,370  x 2  92,334  y  39,310, n  100 Определите значение параметра b. Задача 15. Зависимость объема продаж Y от расходов на рекламу X характеризуется по 12 предприятиям концерна следующим образом y  10,6  0,6  x  x  4,7  y  3,4 Определите t-статистику коэффициента регрессии. Задача 16. По совокупности 15 предприятий торговли изучается зависимость между ценой x на товар А и прибылью y торгового предприятия. При оценке квадратической регрессионной модели были ( y  yˆ ) получены следующие результаты:  2  32000  ( y  y ) 2  40000 , . Определите фактическое значение F- критерия, значимость уравнения регрессии. Задача 17. Уравнение регрессии в стандартизированном виде имеет вид: tˆy  0,37t x1  0,52t x 2  0,43t x3 , V y  18%; Vx1  25%; Vx 2  38%; Vx3  30%. Определите частные коэффициенты эластичности. 134 Задача 18. По 18 наблюдениям получены yˆ  a  0,36 x1  0,255x2  2,86 x3, R 2  0,65 ; x1  110 ; x2  150 ; x3  85 . следующие данные: y  70 ; Определите значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра a. Задача 19. Уравнение регрессии в стандартизованном виде имеет вид: tˆy  0,82t x1  0,65t x2  0,43t x3, V y  32%;Vx1  38%;Vx 2  43%;Vx3  35% Как влияют факторы на результат и каковы значения частных коэффициентов эластичности?   4,0; Задача 20. По следующим данным: у  15,0; х1  6,5; х2  12,0; y  x1  2,5; регрессии  х  3,5; 2 у ryx1  0,63; на х1 и х2 rух 2  0,78; rx1x 2  0,52 , запишите уравнения в стандартизованном и натуральном масштабе. Задача 21. При построении регрессионной зависимости некоторого результативного признака на 8 факторов по 25 измерениям коэффициент детерминации составил 0,736. После исключения 3 факторов коэффициент детерминации уменьшился до 0,584. Обоснованно ли было принятое решение на уровнях значимости 0,1, 0,05 и 0,01? Задача 22. По данным 150 наблюдений о доходе индивидуума Y, уровне его образования X1, и возрасте X2 определите, можно ли считать на уровне значимости 5 % линейную регрессионную модель Y на X1 и X2 гетероскедастичной, если суммы квадратов остатков после упорядочения данных по уровню образования следующие RSS1 (для 50 значений с наименьшим уровнем образования) = 894,1; RSS2 (для 50 значений с наибольшим уровнем образования) = 3918,2. 135 Задача 23. При построении регрессионной зависимости y  f  x1 х2 ,...х9  по 40 измерениям коэффициент детерминации составил x4 0,618. После исключения факторов и x5 коэффициент детерминации уменьшился до 0,547. Обоснованно ли было принятое решение на уровнях значимости 0,1; 0,05 и 0,01? Задача 24. При анализе данных на гетероскедастичность вся выборка была после упорядочения разбита на три подвыборки. Затем по результатам парных регрессий остаточная СКО в первой подвыборке составила 6450, в третьей – 3480. Подтверждается ли наличие гетероскедастичности на уровнях 0,1; 0,05 и 0,01, если объем данных в каждой подвыборке равен 25? Задача 25. Уравнение регрессии, построенное по 12 наблюдениям, имеет вид: y  12  0,24 x1  6,4 x2   3,2 mb 8    2,4  tb ? x3 4,0  3,1 Определите пропущенные значения и доверительный интервал для b 3 с вероятностью 0,99. Задача 26. На основе помесячных данных за последние 4 года была построена аддитивная модель временного потребления тепла. Скорректированные значения сезонной компоненты приведены в таблице: Январь + 30 май - 20 сентябрь - 10 февраль + 25 июнь - 34 октябрь ? март + 15 июль - 42 ноябрь +22 апрель -2 август - 18 декабрь +27 Уравнение тренда выглядит так Т  350  1,3t . Определите значение сезонной компоненты за октябрь, а также точечный прогноз потребления тепла на 1 квартал следующего года. 136 Задача 27. На основе поквартальных данных построена мультипликативная модель некоторого временного ряда. Уравнение тренда ____ имеет вид: T  11,6  0,1 t (t  1,48). Скорректированные значения сезонной компоненты равны: ―I квартал – 1,6 ―II квартал – 0,8 ―III квартал – 0,7 ―IV квартал - ? Определите значение сезонной компоненты за IV квартал и прогноз на II и III кварталы следующего года . Задача 28. На основе квартальных данных объемов продаж 2008 – 2013гг. была построена аддитивная модель временного ряда. Трендовая компонента имеет вид T  260  3  t (t  1,2,...).Показатели за 2014 г. приведены в таблице: Квартал 1 Фактический объем продаж 270 2 y2 3 310 4 y4 Компонента аддитивной модели трендовая сезонная случайная -9 T1 S1 10 +4 T 2 40 T3 T4 S4 E3 E4 ИТОГО 2000 Определите отдельные недостающие данные в таблице. Задача 29. На основе квартальных данных с 2000 г. по 2004 г. получено уравнение y = - 0,67 + 0,0098 x t1 – 5,62 x t2 + 0,044 x t3. ESS =110,3, RSS = 21,4 (ESS – объясненная сумма квадратов, RSS – остаточная сумма квадратов). В уравнение были добавлены три фиктивные переменные, соответствующие трем первым кварталам года, величина ESS увеличилась до 120,2. Проверьте гипотезу о сезонности (α =0,05) 137 Задача 30. Модель зависимости объемов продаж компании от расходов на рекламу имеет вид y = - 0,67 + 4,5 x t + 3 x t-1 + 1,5 x t-2 + 0,5 x t-3. Определите краткосрочный, долгосрочный мультипликатор и средний лаг. Задача 31. На основе квартальных данных получено уравнение множественной регрессии и ESS = 120,32, RSS = 41,4. (ESS – объясненная сумма квадратов, RSS – остаточная сумма квадратов). Для этой же модели были раздельно проведены регрессии на основе данных: 1-й квартал 1991 г. - 1-й квартал 1995 г. и 2-й квартал 1995 г. – 4 квартал 1996 г., соответственно получены следующие значения сумм квадратов остатков RSS1 = 22,25, RSS2=12,32. Проверьте гипотезу о том, что произошли структурные изменения на уровне α =0,05. Задача 32. На основе квартальных данных с 1991 года по 1996 год с помощью МНК получено следующее уравнение Y t = 1,12 – 0, 0098 x t1 – 5, 62 x t2 + 0, 044 x t3 (2,14) (0,0034) (3,42) (0,009) В скобках указаны стандартные ошибки, ESS (объясненная сумма квадратов) = 116, 32; RSS (остаточная сумма квадратов) = 31, 43 Проверьте значимости коэффициентов и модели в целом при уровне значимости α = 0,05. Задача 33.Дана таблица Момент времени t  3 70 * S S 85 где t 2 t 1 t t 1 100 120 135 ___ S * , S  ожидаемый и действительный объемы предложения. В соответствии с моделью адаптивных ожиданий, где   0,45 , определите значение S * t 1 138 Задача 34. Модель зависимости объемов продаж компании от расходов на рекламу имеет вид y  0,67  4,5xt  3xt -1  1,5xt  2  0,5xt 3 . Определите средний лаг Задача 35. Имеется следующая структурная модель:  y1  b12 y 2  a11 x1  a12 x2 ,   у 2  b21 y1  b23 y3  a22 x2 ,   у3  b32 y 2  a31 x1  a33 x3. Соответствующая ей приведенная форма модели имеет вид  y1  3x1  4 x 2  2 x3 ,   у 2  2 x1  4 x 2  5 x3 ,   у3  5 x1  6 x 2  5 x3. Определите параметры первого уравнения структурной формы. Задача 36. Имеется следующая структурная модель  y1  b12 y 2  a11 x1  a12 x2 ,   у 2  b21 y1  b23 y3  a22 x2 ,   у3  b32 y 2  a31 x1  a33 x3. Ей соответствует приведенная форма:  y1  3x1  4 x 2  2 x3 ,   у 2  2 x1  4 x 2  5 x3 ,   у3  5 x1  6 x 2  5 x3. Определите параметры третьего уравнения структурной формы. Задача 37. Имеется следующая модель  Rt  a1  b11 Mt  b12Yt   1 ,  Yt  a 2  b21 Rt  b22 I t   2 ,  I  a  b Rt   .  t 3 33 3 Проверьте модель на идентификацию. 139 Задача 38. Имеется следующая модель Ct I  t   Yt  Dt  a1  b11 Dt   1t ,  a 2  b22Yt  b23Yt 1   2t ,  Dt  Tt ,  Ct  I t  Gt . Проверьте модель на идентификацию. 140

37. Эконометрика. Краткий конспект лекций.

Похожие документы

Разделы

Поддержка

37. Эконометрика. Краткий конспект лекций.

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib