Западно-Казахстанский государственный университет им. М. Утемисова Факультет истории, экономики и права Кафедра экономики и менеджмента УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ДИСЦИПЛИНЫ «Анализ данных и прогнозирование экономики» по кредитной технологии обучения для студентов специальности 5В050600 - экономика Курс – 3 Семестр – 6 Количество кредитов - 2 Лекции – 15 часов Практические занятия – 15 часов СРСП – 30 часов СРС – 30 часов Экзамен – в 6-м семестре Всего – 90 часов Уральск 2014г. Учебно-методический комплекс дисциплины (УМКД) составлен: на основании рабочей учебной программы «Анализ данных и прогнозирование экономики», разработанной преподавателем кафедры «Экономики и менеджмента» ЗКГУ им.М.Утемисова Черемухиной О.В. Расмотрен на заседании кафедры экономики и менеджмента Протокол №1 от « 15 » 09 2014 г. Рассмотрен на заседании учебно-методического совета факультета истории, экономики и права Протокол №1 от « 19 » 09 2014 г. 1. Учебно-методический комплекс дисциплины (УМКД) составлен: на основании рабочей учебной программы «Анализ данных и прогнозирование экономики» 2. Программа обучения по дисциплине – SYLLABUS Данные о преподавателе Черемухина Оксана Валериевна – преподаватель Офис: кафедра экономики и менеджмента Данные о дисциплине Анализ данных и прогнозирование экономики Семестр состоит из 15 учебных недель и 2 недель сессии. В неделю проводится 2 кредит-часа. Каждый кредит-час состоит из одного контактного часа (лекция, практика) и двух часов самостоятельной работы обучаемых (СРО) под руководством преподавателя (СРСП) и без него (СРС). Распределение кредитов на неделю: Время Занятия Время Занятия проведения СРО Проведения Контактный час 1 (лекция 1) 50 мин. СРСП, СРС 50 + 50 мин. Контактный час 2 50 мин. СРСП, СРС 50 + 50 мин. (практическое занятие) Количество кредитов – 2 Место проведения: корпус № 2 по расписанию Выписка из учебного плана: Курс Семестр Кредиты Лекции Практическое СРСП СРС Всего Форма занятие контроля 3 6 2 15 15 30 30 90 экзамен Введение Математическое моделирование экономических процессов в сочетании с методами обработки статистической информации является одним из важнейших направлений развития экономической теории. Цель преподавания дисциплины. В данном курсе ставится цель дать студентам-экономистам представление о современных направлениях экономико-математического моделирования, как на уровне микроэкономики, так и на уровне макроэкономики, представить основные методы анализа экономических данных для принятия решений и прогнозирования социально-экономического развития. Задачи изучения дисциплины. В процессе изучения дисциплины студенты должны понять принципы математического моделирования в экономике, изучить основные модели микроэкономики и макроэкономики, в частности, модели поведения потребителей и производителей, их взаимодействия, модели равновесия и экономического роста, понять следствия, вытекающие из анализа этих моделей. Студенты также должны освоить основные методы количественного анализа числовой и нечисловой экономической информации, такие, как методы описательной статистики, корреляционного, дисперсионного, факторного, кластерного, дискриминантного анализа, знать основные подходы к прогнозированию экономических показателей, уметь применять методы, используя пакеты прикладных программ. Пререквизиты. Для изучения курса необходимо знание следующих дисциплин: экономическая теория, математика для экономистов, информатика, статистика, микроэкономика, макроэкономика, экономикоматематические методы, эконометрика. Постреквизиты. Знания, полученные при изучении данного курса могут использоваться в анализе экономической деятельности предприятия и при выполнении дипломной работы. При изучении предмета студент должен знать: - принципы математического моделирования в экономике; - основные модели микроэкономики и макроэкономики; - основные методы количественного анализа экономической информации. должен уметь: - строить экономико-математические модели; - применять методы корреляционного, дисперсионного, факторного, кластерного, дискриминантного анализа Методология обучения: Обучение проводится в основном в виде лекций и практических занятий, на которых отражается содержание основного учебного материала, и закрепляются практические навыки и полученные представления. Контроль знаний студентов будет осуществляться в виде проверки выполнения домашних заданий посредством решения задач, тестов предложенных в электронном учебнике, устного опроса, индивидуальных семестровых заданий и их защиты. Неделя 1 Кредит час 1 Лекция №1 Тема: Анализ данных и прогнозирование экономики как наука Содержание лекции. 1. Математическое моделирование как метод научного познания в экономике. 2. Понятия моделирования и модели. Классификация моделей 3. Понятие прогноза. Типы прогнозирования. Виды прогнозов, их классификация. Литература: [5] стр5-17, [6] стр4-19 Содержание СРСП: 1. Объективная необходимость моделирования и прогнозирования экономических процессов. 2. История развития экономико-математического моделирования. Литература: [5] стр18-25, [6] стр3-5 Кредит час 2 Практическое занятие №1 Тема: Анализ данных и прогнозирование экономики как наука Содержание занятия. 1. Особенности экономики как объекта математического моделирования и прогнозирования. 2. Понятия моделирования и модели 3. Этапы экономико-математического моделирования Литература: [1]стр5-13, [6] стр6-26 Содержание СРСП: 1. Методологические принципы прогнозирования и моделирования. 2. Особенности измерения и анализа статистических данных в экономике. Литература: [5]стр43-50, [6]стр8-19 Содержание СРС: 1. Объекты макроэкономического прогнозирования и моделирования 2. Прогнозирование и планирование на микроуровне Литература: [5]стр50-71 Неделя 2 Кредит час 1 Лекция №2 Тема: Информационное обеспечение прогнозирования в экономике. Содержание лекции. 1. Представление данных 2. Типы данных 3. Методы представления данных Литература: [1]стр165-168, [2]стр31-44 Содержание СРСП: 1. Роль информации и данных в процессе принятия решений 2.Методы и формы представления данных Литература: [1]стр168-174, [2] стр18-27 Содержание СРС: 1. Генеральная совокупность и выборка 2. Решение задач Литература: [2] стр23-24 Кредит час 2 Практическое занятие №2 Тема: Информационное обеспечение прогнозирования в экономике. Содержание занятия. 1. Предварительный анализ данных 2. Графические формы описания данных 3. Решение задач Содержание СРСП: 1.Методы группирования (представления) данных 2. Решение задания №4 [2] стр40 Содержание СРС: Решение задач Литература: [2] стр23-24 Неделя 3 Кредит час 1 Лекция №3 Тема: Статистический и регрессионный анализ Содержание лекции. 1. Проверка гипотез о законе распределения случайной величины. 2. Статистические оценки параметров. 3. Доверительные области. Доверительные интервалы для зависимой переменной. Литература: [1]стр14-26, [2]стр31-44 Содержание СРСП: 1. Параметры распределения 2. Решение заданий №1-3 [2] стр40 Содержание СРС: Решение задания №4 [2] стр40 Кредит час 2 Практическое занятие №3 Тема: Статистический и регрессионный анализ Содержание занятия. 1. Проверка гипотезы о законе распределения. Теория моментов. 2. Статистические оценки. Доверительные области. 3. Решение задач №1-3 [1] стр193 Содержание СРСП: Решение задач №4-5 [1] стр193 Содержание СРС: Решение задач №6-7 [1] стр193 Неделя 4 Кредит час 1 Лекция №4 Тема: Статистический и регрессионный анализ Содержание лекции. 1. Содержание задачи корреляционного анализа. Этапы построения регрессионной модели. 2. Оценка адекватности регрессионной модели Литература: [1]стр176-192, [2] стр44-52 Содержание СРСП: Решение заданий №6.14-6.15 [1] стр121, №5-7 [2] стр53 Содержание СРС: Решение задач №6.16 [1] стр121-122, №8 [2] стр52 Кредит час 2 Практическое занятие №4 Тема: Статистический и регрессионный анализ Содержание занятия. 1. Корреляционный анализ. 2. Методы оценки адекватности регрессионной модели 3. Решение задач Решение задач №8-9 [1] стр194 Содержание СРСП: Выполнение индивидуального задания по теме «Статистический и регрессионный анализ» Содержание СРС: Решение задач Неделя 5 Кредит час 1 Лекция №5 Тема: Статистический и регрессионный анализ Содержание лекции: 1. Использование модели множественной линейной регрессии для прогнозирования экономических показателей. 2. Оценка надежности результатов множественной регрессии и прогнозирование зависимой переменной Литература: [1] стр195-202, [2] стр53-61 Содержание СРСП: 1. Модель множественной линейной регрессии для прогнозирования экономических показателей. 2. Решение задач №1-3 [1] стр203 Содержание СРС: Решение задач №1-3 [2] стр61 Кредит час 2 Практическое занятие №5 Тема: Статистический и регрессионный анализ Содержание занятия. 1. Отбор факторов при построении множественной регрессии 2. Использование модели множественной линейной регрессии для прогнозирования экономических показателей 3. Решение задач №127 [7] стр192, №8-12 [1] стр35 Содержание СРСП: Решение задач №9-14 [1] стр35 Литература: [1] стр26-33, [2] стр95-100 Содержание СРС: Написание глоссария. Литература: [1]- [20] Неделя 6 Кредит час 1 Лекция №6 Тема: Анализ временных рядов Содержание лекции. 1. Компоненты временного ряда. 2. Выделение тренда. Литература: [1] стр26-52, [2] стр61-72 Содержание СРСП: Решение задач №5-6 [13] стр215 Содержание СРС: Решение задач №4-5 [1] стр53 Кредит час 2 Практическое занятие №6 Тема: Анализ временных рядов Содержание занятия. 1. Основные элементы временного ряда. 2. Автокорреляция уровней временного ряда и её оценка. Основные виды трендов. 3. Решение задач №6-7 [1] стр53 Литература: [1] стр26-33 Содержание СРСП: Выполнение индивидуального задания по теме «Анализ временных рядов» Содержание СРС: Написание реферата на выбранную тему Литература: [1]- [20] Неделя 7 Кредит час 1 Лекция №7 Тема: Анализ временных рядов Содержание лекции. 1. Сезонные и циклические колебания. 2. Сглаживание временных рядов. Литература: [1] стр204-208, [2]стр73-100 Содержание СРСП: Решение задач №1-2 № [2] стр82 Содержание СРС: Решение задач №5-6 [2] стр82 Кредит час 2 Практическое занятие №7 Тема: Анализ временных рядов Содержание занятия. 1. Сглаживание временных рядов. 2. Решение задач №7-8 [2] стр100 Содержание СРСП: Написание глоссария терминов Содержание СРС: Решение задач №9-10 [2] стр82 Неделя 8 Кредит час 1 Лекция №8 Тема: Анализ временных рядов Содержание лекции. 1. Динамические модели с распределенными лагами 2. Стационарные временные ряды. Литература: [1] стр204-208, [2]стр73-100 Содержание СРСП: 1. Тестирование стационарности. 2. Коинтеграция. Решение задач №4-3 № [2] стр82 Содержание СРС: Решение задач №5-6 [2] стр82 Кредит час 2 Практическое занятие №8 Тема: Анализ временных рядов Содержание занятия. 1. Виды динамических эконометрических моделей. 2. Интерпретация параметров модели авторегрессии 3. Сущность модели адаптивных ожиданий и модели неполной корректировки. Оценка её параметров. 3. Решение задач №7-8 [2] стр100, Содержание СРСП: Решение задач №7-8 [2] стр82 Содержание СРС: Решение задач №9-10 [2] стр82 Неделя 9 Кредит час 1 Лекция №9 Тема: Прогнозирование временных рядов Содержание лекции: 1. Аддитивные методы прогнозирования 2. Мультипликативные методы прогнозирования. Литература: [2] стр101-118, [22] стр168-178 Содержание СРСП: Решение задач №1-5 [2] стр106 Содержание СРС: Решение задач №5-8 [2] стр106 Кредит час 2 Практическое занятие №9 Тема: Прогнозирование временных рядов Содержание занятия. 1. Аддитивные и мультипликативные методы прогнозирования. 2. Решение задач по анализу аддитивной и мультипликативной моделей временного ряда. Содержание СРСП: Решение задач №3.7-3.9 [14] стр80-81 Содержание СРС: Решение задач №83-84 [7] стр97-98 Неделя 10 Кредит час 1 Лекция №10 Тема: Прогнозирование временных рядов Содержание лекции. 1.Экспоненциальное сглаживание. 2. Экспоненциальное сглаживание с поправкой на тренд Литература: [14] стр78-80, [22] стр178-180 Содержание СРСП: 1. Дисперсионный анализ влияния качественных факторов 2. Решение задач №3.10-3.11[14] стр81 Содержание СРС: Решение задач №81-82 [7] стр94-96 Кредит час 2 Практическое занятие №10 Тема: Прогнозирование временных рядов Содержание занятия. 1. Экспоненциальное сглаживание. 2.Решение задач №69-70 [7] стр72,74 Содержание СРСП: 1.Решение задач №67-68 [7] стр66,68 2.Выполнение индивидуального задания по теме «Прогнозирование временных рядов» Содержание СРС: Выполнение индивидуального задания по теме «Прогнозирование временных рядов» Неделя 11 Кредит час 1 Лекция № 11 Тема: Прогнозирование временных рядов Содержание лекции. 1.Авторегрессионные модели 2. Прогнозирование социально-экономических процессов. Литература: [2]стр179-182, [22]стр180185 Содержание СРСП: Решение задач № 5-6 [2] стр192 Литература: [2] стр182-192 Содержание СРС: Решение задач №65-66 [7] стр64 Кредит час 2 Практическое занятие №11 Тема: Прогнозирование временных рядов Содержание занятия: 1. Методы прогонозирования социально-экономических процессов. 2. Оценка параметров авторегрессионной модели Литература: [2]стр179-182, [22]стр180-185 Содержание СРСП: Решение задач № 5-6 [2] стр192 Литература: [2] стр182-192 Содержание СРС: Решение задач №65-66 [7] стр64 Неделя 12 Кредит час 1 Лекция №12 Тема: Многомерный статистический анализ Содержание лекции. 1. Представление информации в многомерном пространстве. 2. Факторный анализ. 3. Метод главных факторов Литература: [2]стр173-178 Содержание СРСП: Решение задач №1-3 [2] стр192 Содержание СРС: Решение задач Кредит час 2 Практическое занятие №13 Тема: Многомерный статистический анализ Содержание занятия. 1.Факторный анализ. 2. Решение задач Содержание СРСП: Решение задач № 6.9 [14] стр149 Содержание СРС: Решение задач Неделя 13 Кредит час 1 Лекция №13 Тема: Многомерный статистический анализ Содержание лекции. 1. Дисперсионный анализ влияния качественных факторов. 2.Многомерное шкалирование. Классическая модель многомерного шкалирования. Литература: [8] cтр139-146, [10] стр64, [16] стр45 Содержание СРСП: 1. Понятие многомерного шкалирования. 2. Исходные данные для многомерного шкалирования: мера сходства и мера различия. Содержание СРС: Основные задачи многомерного шкалирования. Кредит час 2 Практическое занятие №13 Тема: Многомерный статистический анализ Содержание занятия. 1. Классификация моделей многомерного шкалирования. 2. Метрические модели многомерного шкалирования, модель Торгерсона. 3. Не метрические модели многомерного шкалирования. Литература: [8] cтр139-146, [10] стр64, [16] стр45 Содержание СРСП: 1.Не метрические модели МШ: меры соответствия; общая схема алгоритма не метрического многомерного шкалирования. 2. Сущность этапов неметрического многомерного шкалирования. Содержание СРС: Алгоритмы реализации неметрического и метрического этапов многомерного шкалирования. Неделя 14 Кредит час 1 Лекция №14 Тема: Многомерный статистический анализ Содержание лекции. 1.Ранговая корреляция. 2.Таблица сопряженности. 3.Ранговые методы Литература: [21] стр225-260 Содержание СРСП: Решение задачи №87 [7] стр107 Содержание СРС: Решение задач Кредит час 2 Практическое занятие №14 Тема: Многомерный статистический анализ Содержание занятия. 1. Ранговая корреляция. Таблица сопряженности 2. Коэффициенты Спирмена, Кендалла. 3. Решение задач Содержание СРСП: 1.Решение задачи 2.Выполнение индивидуального задания по теме «Многомерный анализ данных» Содержание СРС: Выполнение индивидуального задания по теме «Многомерный анализ данных» Неделя 15 Кредит час 1 Лекция №15 Тема: Многомерный статистический анализ Содержание лекции. 1.Неметрические методы. 2.Кластерный анализ. 3.Дискриминантный анализ. Литература: [14]стр146-149, стр206-207 [20]стр160-168, [19]стр290-329 Содержание СРСП: Решение задач №8.3-8.5 [14] стр223 Содержание СРС: Решение задач Кредит час 2 Практическое занятие №15 Тема: Многомерный статистический анализ Содержание занятия. 1. Кластерный анализ. 2. Решение задач по кластерному анализу Решение задач №8.4-8.5 [14] стр222-223 Содержание СРСП: Решение задач №8.1-8.2 [14] стр222 Содержание СРС: Написание глоссария терминов Литература: [1]- [22] 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. Список литературы Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г Прогнозирование и планирование в условиях рынка. Под редакцией Морозовой Т.Г., Пикулькина В.Н., М.-Финансы и статистика, 2003г Парсаданов Г.А., Егоров В.В. Прогнозирование национальной экономики - М.- Финансы и статистика, 2002г Прогнозирование и планирование экономики. Под редакцией Кандауровой Г.А., Борисевича В.И.М.: Финансы и статистика, 2005г Найденков В.И. Прогнозирование и моделирование национальной экономики. -М.: Приор-издат, 2004г Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г. Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г Лугачев М.И., Ляпунцов Ю.П. «Методы социально-экономического прогнозирования.- М.:ТЕИС, 1999г Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г Экономико-статистический анализ. Под редакцией Ильенковой С.Д. – М.:ЮНИТИ, 2002г Замков О.О., Черемных Ю.А., Толстопятенко А.В. «Математические методы в экономике», М.: Дело и сервис, 1999г Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Кундышева Е.С. Математическое моделирование в экономике. Учебное пособие – М.: Издательскоторговая корпорация «Дашков и К», 2007г Афанасьев В.Н., Юзбашев М.М., Гуляева Т.И. Эконометрика М.: Финансы и статистика, 2005г. Многомерный статистический анализ в экономике. Под редакцией Тамашевича В.Н.- М.:ЮНИТИ, 1999г Смирнов А.Д. Лекции по макроэкономическому моделированию. – М.: Высшая школа, 2000г Малыхин В.И. Математическое моделирование экономики. – М.: УРАО, 1998г Балдин К.В., Быстров О.Ф., Соколов М.М. Эконометрика.- М.: ЮНИТИ, 2004г Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 3. График выполнения и сдачи заданий по дисциплине Анализ данных и прогнозирование экономики № п/п Вид работ Цель и содержание задания Рекомендуемая литература 1 Выполнение заданий практических занятий Развитие аналитических и познавательных способностей 1-10 Продолжительность выполнения и дата (неделя) представления работы 1 -15недели Баллы Форма контроля по 100% Проверка выполнения задания, способность ответа на вопросы Устный ответ 2 Глоссарий 1-22 7,15 недели по 100% 3 Реферат Активизация самостоятельности у студентов, а также усвоение терминологии Развитие аналитических и 1-22 14 неделя по 100% Защита реферата 3 Задания СРС и СРСП 4 Экзамен познавательных способностей Развитие аналитических и познавательных способностей Комплексная проверка знаний 1-22 1-15 недели по100% Проверка выполнения задания 100% Тест 4.Карта учебно-методической обеспеченности дисциплины «Анализ данных и прогнозирование экономики» № п/п Наименование литературы 1 1 2 Прогнозирование и планирование в условиях рынка. Под редакцией Морозовой Т.Г., Пикулькина В.Н., М.-Финансы и статистика, 2003г Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Найденков В.И. Прогнозирование и моделирование национальной экономики. -М.:Приориздат, 2004г Прогнозирование и планирование экономики. Под редакцией Кандауровой Г.А., Борисевича В.И.М.:Финансы и статистика, 2005г Парсаданов Г.А., Егоров В.В. Прогнозирование национальной экономики - М.Финансы и статистика, 2002г Шелобаев С.И. «Математические методы и модели в экономике», М:ЮНИТИ, 2000г Афанасьев В.Н., Юзбашев М.М., Гуляева Т.И. Эконометрика М.: Финансы и статистика, 2005г. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Эконометрика. Под редакцией Елисеевой 2 3 4 5 6 7 8 9 В библиотеке 3 3 на кафедре 4 - Наличие обеспеченности студентов (%) 5 25% Электронная версия 6 - 5 - 41,7% - 5 - 41,7% - 5 - 41,7% - 3 - 25% - 6 - 50% - 3 25% - 4 33,3% - 8 66,7% - Примечания 7 И.И.. -М.: Финансы и статистика, 2005г 5. Лекционный комплекс Лекция №1 Тема: Математическое моделирование и развитие экономической теории Содержание лекции. 1. Математическое моделирование как метод научного познания в экономике. 2. Особенности измерения и анализа статистических данных в экономике. 3. Понятия моделирования и модели. Классификация моделей Цель: Дать общую характеристику предмету математического моделирования, понятия моделирования и модели и показать классификацию моделей. 1. Математическое моделирование как метод научного познания в экономике. Моделирование в научных исследованиях стало применяться еще в глубокой древности и постепенно захватывало все новые области научных знаний: техническое конструирование, строительство и архитектуру, физику, химию, и наконец, общественные науки. Термин «модель» широко используется в различных сферах человеческой деятельности и имеет множество смысловых значений. Модель – такой материальный или мысленно представляемый объект, который в процессе исследования замещает объекторигинал так, что его непосредственное изучение дает новые знания об объекте оригинале. Под моделированием понимается процесс построения, изучения, применения моделей. Оно тесно связано с такими категориями, как абстракция, аналогия, гипотеза и др. Процесс моделирования обязательно включает и построение абстракций, и умозаключения по аналогии, и конструирование научных гипотез. Необходимость использования метода моделирования определяется тем, что многие объекты (или процессы) непосредственно исследовать или вовсе невозможно, или же это исследование требует много времени и средств. Проникновение математики в экономическую науку связано с преодолением значительных трудностей. В этом отчасти была «повинна» математика, развивающаяся на протяжении нескольких веков в основном в связи с потребностями физики и техники. Но главные причины лежат все же в природе экономических процессов, в специфике экономической науки. Большинство объектов, изучаемых экономической наукой, может быть охарактеризовано понятием сложной системы. Наиболее распространено понимание системы как совокупности элементов, находящихся во взаимодействии и образующих некоторую целостность, единство. Одна из трудностей экономических исследований – в том, что почти не существует экономических объектов, которые можно было бы рассматривать как отдельные (внесистемные) элементы. Сложность системы определяется количеством входящих в нее элементов, связями между этими элементами, а также взаимоотношениями между системой и средой. Экономика страны обладает всеми признаками этой сложной системы. Она объединяет огромное число элементов, отличается многообразием внутренних связей и связей с другими системами (природная среда, экономика других стран и т.д.). В народном хозяйстве взаимодействуют природные, технологические, социальные процессы, объективные и субъективные факторы. Сложность экономики иногда рассматривалась как обоснование невозможности ее моделирования, изучения средствами математики. Но такая точка зрения в принципе неверна. Моделировать можно объект любой природы и любой сложности. И как раз сложные объекты представляют наибольший интерес для моделирования; именно здесь моделирование может дать результаты, которые нельзя получить другими способами исследования. 2. Особенности измерения и анализа статистических данных в экономике. Уже длительное время главным тормозом практического применения математического моделирования в экономике является наполнение разработанных моделей конкретной и качественной информацией. Точность и полнота первичной информации, реальные возможности её сбора и обработки во многом определяют выбор типов прикладных моделей. С другой стороны, исследования по моделированию экономики выдвигают новые требования к системе информации. В зависимости от моделируемых объектов и назначения моделей используемая в них исходная информация имеет существенно различный характер и происхождение. Она может быть разделена на две категории: о прошлом развитии и современном состоянии объектов (экономические наблюдения и их обработка) и о будущем развитии объектов, включающую данные об ожидаемых изменениях их внутренних параметров и внешних условий (прогнозы). Вторая категория информации является результатом самостоятельных исследований, которые также могут выполняться посредством моделирования. Методы экономических наблюдений и использования результатов этих наблюдений разрабатываются экономической статистикой. Поэтому стоит отметить только специфические проблемы экономических наблюдений, связанные с моделированием экономических процессов. В экономике многие процессы являются массовыми, они характеризуются закономерностями, которые не обнаруживаются на основании лишь одного или нескольких наблюдений. Поэтому моделирование в экономике должно опираться на массовые наблюдения. Другая проблема порождается динамичностью экономических процессов, изменчивостью их параметров и структурных отношений. Вследствие этого экономические процессы приходится постоянно держать под наблюдением, необходимо иметь устойчивый поток новых данных. Поскольку наблюдения за экономическими процессами и обработка эмпирических данных обычно занимают довольно много времени, то при построении математических моделей экономики требуется корректировать исходную информацию с учетом её запаздывания. Познание количественных отношений экономических процессов и явлений опирается на экономические измерения. Точность измерений в значительной степени предопределяет и точность конечных результатов количественного анализа посредством моделирования. 3. Понятия моделирования и модели. Классификация моделей Моделирование представляет собой метод опосредованного познания с помощью использования объектов-заменителей. Моделирование опирается на философскую теорию отражения и общенаучный метод абстракции. Оно включает в себя построение, изучение и применение моделей, опосредующих отношения между познаваемым объектом и познающим субъектом. Модель (лат. modulus) – мера, мерило, образец, норма. Моделью называется материальный или мысленно представляемый объект, который замещает объект-оригинал с определенной степенью приближения, отражает его важнейшие характеристики и поведение. Все экономические модели в общем смысле можно разбить на два класса: 1) модели позитивного анализа – для познания свойств реальных или гипотетических экономических систем. Значения их параметров невозможно оценить по эмпирическим данным; 2) модели нормативного анализа – для прогнозирования или принятия управленческих решений. Их параметры можно оценить по опытным данным. Все модели, применяемые в настоящее время в прогнозировании и планировании, можно подразделить на два класса – предметные и мысленные модели. Используемые в прогнозировании логико-математические модели можно классифицировать по нескольким признакам: - по объекту исследования выделяются макроэкономические и локальные (отраслевые и региональные) модели; - по направлениям познания и отражения сущности объекта: структурные, описывающие внутреннюю организацию оригинала, его составные части, параметры, внутренние взаимосвязи и т. д.; и функциональные, характеризующие деятельность, функционирование, поведение оригинала; - по целевому назначению модели могут быть: теоретико-аналитическими, используемыми в научнопознавательных целях и прикладными, применяемыми в целях решения конкретных задач управления и планирования; - по характеру отражения причинно-следственных связей различают жестко детерминированные (функциональные) и вероятностные модели; - по типу содержащейся в моделях информации выделяют: модели дескриптивные, объясняющие наблюдаемые факты или дающие пассивный прогноз; и модели нормативные, отражающие желаемое состояние и необходимые для его достижения действия; - по способу отражения фактора времени, модели делятся на статические, состоящие из зависимостей, относящихся к одному моменту или периоду времени и динамические, описывающие протекание каких-либо процессов во времени; - по отношению, входящих в модель переменных различаются открытые и закрытые модели. Вопросы для самоконтроля: 1. Сформулируйте понятия «модель» и «метод моделирования». 2. Охарактеризуйте структурные элементы экономико-математической модели. 3. Назовите основные классификационные признаки экономико-математических моделей. 4. Приведите примеры моделей, входящих в ту или иную классификационную группу. Рекомендуемая литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2.Прогнозирование и планирование в условиях рынка. Под редакцией Морозовой Т.Г., Пикулькина В.Н., М.Финансы и статистика, 2003г 3. Парсаданов Г.А., Егоров В.В. Прогнозирование национальной экономики - М.- Финансы и статистика, 2002г 4.Прогнозирование и планирование экономики. Под редакцией Кандауровой Г.А., Борисевича В.И.- М.: Финансы и статистика, 2005г 5.Найденков В.И. Прогнозирование и моделирование национальной экономики. -М.: Приор-издат, 2004г Лекция № 2 Тема: Информационное обеспечение прогнозирования в экономике. Содержание лекции. 1. Представление данных 2. Типы данных 3. Методы представления данных Цель: Раскрыть понятие данных в прогнозировании, дать характеристику типам данных и методам представления данных. 1.Информация является основой планирования и прогнозирования, а также принятия решений. Различают понятия «данные» и «информация». Данные – подробные исходные сведения о конкретных производственных операциях или процессах. Достаточно обширны, используются для контроля над основными операциями. Информация – сообщение, содержащие новое, дополнительное знание и уменьшающее неопределенности у получателя в той области, к которой оно относится. Информация может быть: качественная (жесткие данные) и количественная (гибкие данные). Основные типы информации и источники ее получения. Прогнозирование и планирование явно или неявно основывается на информации, которая может быть получена с использованием первичных и вторичных данных, или первичной и вторичной информации. Первичные данные получают в результате исследований, специально проведенных для решения конкретной проблемы. Их сбор осуществляется путем наблюдений, измерений, опросов, экспериментальных исследований. Их обычно выполняют только для части генеральной, то есть общей, совокупности исследуемых объектов. Эта часть, как известно, называется выборкой. Вторичные данные, применяемые при проведении так называемых кабинетных исследований, — это данные, собранные ранее из внутренних и внешних источников для целей, отличных от целей данного исследования. Кабинетные исследования являются наиболее доступным и дешевым методом получения информации, необходимой для прогнозирования и планирования. Для небольших организаций — это основной метод получения информации. Внутренними источниками информации служат бухгалтерские, финансовые, статистические и иные отчеты организации, беседы с сотрудниками и руководителями, информационные системы в электронных офисах, вычислительных центрах. Внутренними источниками могут быть отчеты руководителей на заседаниях и собраниях коллегиальных органов управления, сообщения персонала, обзоры жалоб, протоколы различных заседаний, деловая переписка. Вторичная информация из внешней среды обширна и, как правило, рассеяна во множестве источников, которые полностью невозможно перечислить. Многие международные и российские организации регулярно публикуют экономические данные, полезные при анализе и прогнозировании. Внешними источниками являются данные международных организаций, таких, как Международный валютный фонд, Европейская организация по сотрудничеству и развитию, ООН. Это, кроме того, законы, указы, постановления государственных органов; выступления государственных, политических и общественных деятелей; данные официальной статистики, периодической печати; результаты научных исследований и другие источники. Следует использовать следующие источники: статистические ежегодники; данные переписи населения; каталоги, проспекты и годовые финансовые отчеты фирм; результаты конкурсов; информация отраслей, бирж, банков; таблицы курсов акций; судебные решения. Вторичные данные можно получить из многочисленных изданий экономического и специального характера, таких, как газеты, журналы, информационно-аналитические бюллетени. К источникам внешней вторичной информации также относятся выставки, ярмарки, совещания, конференции, презентации, дни открытых дверей, базы и банки данных. Основная тематика электронных баз данных — это финансово-экономическая статистика, информация о государственных бюджетах, фирмах, отраслях, странах, регионах, коммерческих предложениях, ценных бумагах. Главные достоинства использования вторичных данных — это быстрота получения, дешевизна, легкость использования, а также повышение эффективности сбора первичных данных. Поэтому сбор вторичной информации обычно предшествует сбору первичной информации. Недостатки вторичных данных — это возможная несогласованность единиц измерения, использование различных определений и систем классификаций, разная степень новизны, трудность оценки достоверности. Для определения источников вторичной информации необходимо выполнить следующие процедуры. Установить, какая информация уже имеется и какая необходима. Составить список ключевых терминов и названий, определяющих содержание источников вторичной информации. Осуществить поиск вторичных источников информации, начиная с каталогов печатных изданий и серверов компьютерных сетей. Оценить найденную информацию. Если информация не соответствует требованиям, то. необходимо уточнить список ключевых терминов и названий, требования к содержанию и качеству информации и продолжить поиск. Оценить найденную информацию. На этом этапе уже необходимо ясное представление о характере требуемой информации и необходимости использования дополнительных источников. Синдикативная информация. Внешнюю информацию можно подразделить на официально опубликованную, доступную для всех, и на так называемую синдикативную информацию. Это первичная информация, которую специальные информационно-консультационные организации собирают, обрабатывают, а затем продают своим подписчикам. Важным достоинством синдикативных данных является их невысокая стоимость, так как она разделяется между подписчиками. Синдикативные данные основаны на отработанной системе сбора информации, поэтому им присуще высокое качество. Недостатки синдикативных данных: во-первых, подписчики не могут влиять на сбор информации. Поэтому, перед тем как стать подписчиком, необходимо оценить пригодность информации; во-вторых, поставщики синдикативных данных обычно стараются заключать контракты на длительный период; в-третьих, стандартизированные синдикативные данные доступны многим пользователям, в том числе конкурентам. Синдикативные данные собирают обычно в нескольких направлениях, это прежде всего: 1) оценки отношений потребителей и общественного мнения. Например, как изменяется система общественных ценностей и как это влияет на выбор потребителей; 2) определение рыночных сегментов. Получают информацию о потребителях, определяющих структуру рынков потребительских товаров, рынков продукции производственно-технического назначения; 3) отслеживание рыночных тенденций. Ведется отслеживание динамики показателей объема продаж и рыночной доли как для розничной торговли, так и для отдельных домашних хозяйств. Методы сбора первичных данных можно классифицировать как количественные и качественные. Количественные исследования обычно отождествляют с проведением измерений и различных опросов. Опросы основаны на использовании структурированных вопросов закрытого типа, на которые отвечает большое число респондентов. Структурированные вопросы закрытого типа — это вопросы, на которые можно дать только определенный ответ, например «да» или «нет». Характерными особенностями таких исследований являются: четко определенные формы данных и источники их получения, обработка собранных данных с помощью упорядоченных количественных процедур. Качественные исследования включают сбор, анализ и интерпретацию данных путем наблюдения за тем, что люди делают и говорят. Наблюдения и выводы носят качественный характер и осуществляются в нестандартной форме. Качественные данные могут быть переведены в количественную форму, но этому предшествуют специальные процедуры. К качественным методам относят наблюдение, глубинные интервью, анализ протоколов бесед, некоторые разновидности экспертных методов. Если наблюдения сопровождаются измерениями, то это способ количественного исследования. Основу качественных исследований составляют методы наблюдений, предполагающие скорее наблюдение, чем коммуникации с респондентами. Большинство этих методов основано на подходах, разработанных психологами. Наблюдение представляет собой метод сбора первичной информации об изучаемом объекте путем наблюдения за выбранными группами людей, действиями и ситуациями. При этом исследователь непосредственно воспринимает и регистрирует все факторы, касающиеся изучаемого объекта и значимые с точки зрения целей исследования. Наблюдение может быть направлено на достижение различных целей. Оно может быть использовано как источник информации для построения гипотез, служить для проверки данных, полученных другими методами, с его помощью можно извлечь дополнительные сведения об изучаемом объекте. Разнообразие способов проведения наблюдений определяется четырьмя подходами к их осуществлению: прямое или непрямое наблюдение, открытое или скрытое, структурализованное или неструктурализованное, осуществляемое с помощью человека или механических средств. Прямое наблюдение предполагает непосредственное наблюдение за поведением, скажем, покупателей в магазине, например, в какой последовательности они изучают товары, выставленные на прилавке. При применении непрямого наблюдения изучаются результаты определенного поведения, а не само поведение. Здесь часто используются архивные данные, например, данные о динамике запасов определенных товаров, которые могут быть полезными при изучении сдвигов в рыночной ситуации. Открытое наблюдение предполагает, что люди знают о том, что за ними наблюдают, например, при проведении специальных экспериментов. Однако присутствие наблюдателей влияет на поведение наблюдаемых, поэтому надо стремиться свести его к минимуму. Этим требованиям удовлетворяет скрытое наблюдение, когда обследуемый не предполагает, что за ним наблюдают. Например, в магазинах могут скрыто наблюдать за тем, насколько продавец вежливо обходится с покупателями и помогает им совершить покупку. При проведении структурализованного наблюдения наблюдатель заранее определяет, что он будет наблюдать и регистрировать. Все другие виды поведения игнорируются. Часто используется стандартный лист наблюдений, сокращающий до минимума затраты времени наблюдателя. Этот метод дает возможность осуществлять наблюдения по заранее намеченной схеме, фиксировать результат наблюдений для каждой выделенной категории. Это наблюдения не носят случайного или произвольного характера, а осуществляются в соответствии с определенным планом, обладают высокой степенью законченности. Исследователю легче обобщить результаты, полученные от разных наблюдателей. Когда осуществляется неструктурализованное наблюдение, наблюдатель фиксирует в изучаемом эпизоде все виды поведения. Такой тип поведения часто используется при проведении разведочных исследований. Обычно метод наблюдений используется совместно с другими методами. Полученные в этом случае результаты дополняют и контролируют друг друга. Так, если наблюдение используется для контроля данных, полученных другими методами, оно должно быть максимально строго структурализовано, проводиться в тех условиях, в которых собиралась контролируемая информация. Недостатки метода наблюдений присущи всем качественным исследованиям. При прямом наблюдении обычно изучается поведение в определенных условиях малой группы людей, следовательно, возникает вопрос о достоверности полученных данных. При этом имеет место субъективное истолкование последних. Человеческое восприятие ограниченно, поэтому исследователь может пропустить, не заметить какие-то важные проявления изучаемой ситуации. Обычно исследователь не в состоянии на основе метода наблюдений углубить полученные результаты и вскрыть интересы, мотивы, отношения, лежащие в основе определенного поведения. В ряде случаев это ограничение удается преодолеть, например изучая реакцию детей на новую игрушку. Кроме того, надо иметь в виду, что присутствие наблюдателя может оказывать влияние на наблюдаемую ситуацию. Уровень этого влияния определить чрезвычайно сложно. Наблюдение является весьма трудоемким методом. Оформление итогов наблюдений занимает порой в два раза больше времени, чем само наблюдение. Оно должно дополнять другие методы сбора первичных данных, и применяется тогда, когда информация, необходимая исследователю не может быть получена никакими иными способами. Глубинное интервью заключается в последовательном задании квалифицированным интервьюером респонденту группы зондирующих вопросов, в целях понимания, почему члены группы ведут себя определенным образом или что они думают об определенной проблеме. Респонденту задаются вопросы по исследуемой теме, на которые он отвечает в произвольной форме. При этом интервьюер задает вопросы типа: «Почему вы ответили подобным образом?», «Можете ли вы обосновать вашу точку зрения?», «Можете ли вы привести какие-то специальные аргументы?». Ответы на подобные вопросы помогают интервьюеру лучше разобраться в процессах, происходящих в голове респондента. Данный метод применяется для сбора информации о новых концепциях, дизайне, рекламе и других методах продвижения продукта; он помогает лучше разобраться в поведении потребителей, в эмоциональных и личностных аспектах жизни потребителей, в принятии решений на индивидуальном уровне, получить данные об использовании определенных продуктов. Здесь прежде всего необходимо добиться благожелательной атмосферы при общении с опрашиваемым. Интервьюеру желательно быть внимательным как к словесному оформлению, так и к чувствам, заключенным в словах. Самым сложным является суммирование данных индивидуальных опросов в итоговый отчет. Анализ протокола заключается в помещении респондента в определенную ситуацию по принятию решения, при этом он должен словесно описать все факторы и аргументы, которыми он руководствовался при принятии решения. Метод анализа протокола используется при анализе решений, принятие которых распределено во времени, например решения о покупке дома. В этом случае исследователь собирает в единое целое отдельные решения, принимаемые на его отдельных этапах. Кроме того, данный метод используется при анализе решений, процесс принятия которых очень короток. В этом случае метод анализа протокола как бы замедляет скорость принятия решения. Например, покупая жевательную резинку, обычно люди не задумываются относительно этой покупки. Анализ протокола дает возможность разобраться в некоторых внутренних аспектах подобных покупок. При использовании проекционных методов респонденты помещаются в определенные имитируемые ситуации в надежде на то, что респонденты выскажут такую информацию о себе, которую невозможно получить при проведении прямого опроса, например, относительно потребления наркотиков, алкоголя, получения чаевых и т.п. Можно выделить следующие конкретные методы, входящие в состав проекционных методов: ассоциативные методы, испытание при помощи завершения предложений, тестирование иллюстраций, тестирование рисунков, разыгрывание ролей, ретроспективные беседы и беседы с опорой на творческое воображение. Почему часто используются качественные методы? Качественные методы нередко являются источниками идей. Опыт показывает, что крупномасштабные дорогостоящие количественные исследования далеко не всегда, особенно если в их основе нет перспективных идей, дают необходимые результаты. Методы опроса. Опрос — это сбор первичной информации в форме ответов на прямые вопросы. Опрос может носить структурированный и неструктурированный характер; в первом случае все опрашиваемые отвечают на одни и те же вопросы, во втором — интервьюер задает вопросы в зависимости от полученных ответов. При проведении опроса группа опрашиваемых людей может подвергаться однократному или многократному обследованиям. В первом случае получается срез данной группы по многим параметрам для фиксированного момента. Например, редакции журналов и газет проводят разовые выборочные исследования своих читателей по таким параметрам, как возраст, пол, уровень образования, род занятий. Во втором случае одна и та же группа опрашиваемых людей, называемая панелью, неоднократно изучается в течение определенного периода. В этом случае часто говорят, что используется панельный метод опроса. Достоинства методов опроса: 1) стандартизация, обусловленная тем, что всем респондентам задаются одни и те же вопросы с одинаковыми вариантами ответов на них; 2) простота, так как респондентов посещать не обязательно, можно передавать им вопросники по почте или опрашивать их по телефону, не нужно использовать технические средства и привлекать высококвалифицированных профессионалов; 3) возможность глубокого анализа, обусловленная применением последовательных уточняющих вопросов; 4) возможность табулирования и проведения статистического анализа с использованием методов математической статистики и соответствующих статистических пакетов для персональных компьютеров. Информация от респондентов при проведении опросов собирается тремя способами: 1) интервьюеры задают вопросы респондентам, ответы на которые интервьюер фиксирует; 2) вопросы задаются с помощью компьютера; 3) путем самостоятельного заполнения анкет респондентами. Панельный метод обследования. Панель — выборочная совокупность опрашиваемых единиц, подвергаемых повторяющимся исследованиям, причем предмет исследования остается постоянным. Членами панели могут быть семьи, организации, эксперты, которые с определенными оговорками остаются постоянными. Панельный метод опроса имеет преимущества по сравнению с обычными одноразовыми опросами, так как он дает возможность сравнивать результаты последующих опросов с итогами предыдущих и устанавливать тенденции и закономерности развития изучаемых явлений. Все виды панелей подразделяются по: времени существования; характеру изучаемых единиц, характеру изучаемых проблем; методам получения информации. По времени существования панели делятся на краткосрочные — существующие до года, и долгосрочные — обычно не более пяти лет. Долгосрочные панели могут давать непрерывную либо периодическую информацию. Непрерывная информация фиксируется в Дневниках ежедневно, а сами дневники высылаются организаторам исследования через определенные промежутки времени. Периодическая информация поступает по мере проведения опросов в виде заполненных анкет. По характеру изучаемых проблем панели могут быть специализированными. Специализированные панели создаются для изучения узких проблем. Например, с их помощью осуществляются: тестирование товаров и концепций новых товаров; отслеживание рыночных тенденций (изучается динамика показателя рыночной доли); определение источников, из которых потребители получают информацию о новых товарах. По методу получения информации возможны четыре вида панелей, когда члены панели: 1) высылают требуемую информацию (заполненные дневники, опросные листы) почтой; 2) интервьюируются; 3) заполняют дневники или опросные листы, но собирают информацию специальные работники; 4) дают интервью через определенный промежуток времени, а внутри временного интервала высылают информацию по почте. Целесообразность использования тех или иных панелей определяется характером решаемых задач и выделяемым объемом средств. Поэтому перед проведением опросов, исходя из целей исследования, нужно выбрать вид панели. Типичным примером использования панельного метода опроса может служить изучение медицинского обслуживания и рынка лекарств во Франции. В панель входило 1600 врачей — каждый двадцатый врач, работающий с частной клиентурой. Члены панели выписывали в течение одной недели раз в три месяца рецепты в специальной отрывной книжке с корешками. Это позволяло одновременно получать дубликат рецепта и определенную информацию, записанную на корешке: особенности больного, диагноз, терапевтическое воздействие, ожидаемое от выписанного лекарства. Процесс формирования панели в данном примере включал: 1) разделение территории на регионы и категории городов; 2) разделение медицинского персонала на категории по специальности и возрасту; 3) жеребьевку в каждой категории для отбора нужного числа врачей; 4) проверку выборки по многим параметрам. 3.Методы анализа данных. Для получения нужной информации необходимо использование методов анализа изучаемых данных. Вею совокупность носителей таких данных называют документами. Выделяют два основных типа анализа: традиционный, классический, и формализованный, количественный — контент-анализ. Существенно различаясь между собой, они не исключают, а взаимно дополняют друг друга, позволяя компенсировать имеющиеся недостатки. Анализ документов используется главным образом при работе с вторичными данными. Традиционный анализ — это цепь логических построений, направленных на выявление сути анализируемого материала. Интересующая информация, заложенная в документе, часто присутствует в неявном виде, в форме, отвечающей целям созданного документа, но не всегда отвечающей целям конкретного исследования. Традиционный анализ позволяет улавливать основные мысли и идеи, оценить скрытые стороны содержания документа, проникнуть вглубь документа, исчерпать его содержание. Основным его недостатком является субъективность. При проведении традиционного анализа необходимо ответить на следующие вопросы. Что представляет собой документ? Каков его контекст? Кто его автор? Каковы цели создания документа? Какова надежность самого документа? Какова достоверность зафиксированных в нем данных? Каково фактическое содержание документа? Каково оценочное содержание документа? Какие выводы можно сделать о фактах, содержащихся в документе? Какие выводы можно сделать об оценках, содержащихся в документе? В традиционном анализе различают внешний и внутренний анализ. Внешний анализ — это анализ контекста документа в собственном смысле этого слова и всех тех обстоятельств, которые сопутствовали его появлению. Цель внешнего анализа — установить вид документа, его форму, время и место появления. Определяются автор и инициатор создания документа, цели его создания, достоверность и суть его контекста. Пренебрежение таким анализом во многих случаях грозит неверным истолкованием содержания документа. Например, сиюминутная политическая ситуация может диктовать тенденциозную оценку событий. Внутренний анализ — это исследование содержания документа. По существу, вся работа направлена на проведение внутреннего анализа документа, включающего выявление уровня достоверности приводимых фактов и цифр, установление уровня компетенции автора документа, выяснение его личного отношения к описываемым в документе фактам. Искажения могут возникать не только в результате личной симпатии или антипатии автора; источником искажения выступает и методологическая позиция автора. Авторы, придерживающиеся разных теоретических позиций, могут признать существенными в объяснении конкретного явления разные факты. Некоторые документы требуют специальных методов анализа. Психологический анализ применяется, как правило, при оценке отношения автора к какому-либо политическому, экономическому или социальному явлению. На основе таких исследований может быть получено представление о формировании общественного мнения, общественных установок. Юридический анализ — применяется для всех видов юридических документов. В юриспруденции используется специфический словарь терминов, замена которых недопустима. Незнание юридического словаря при анализе юридических документов может привести к грубым ошибкам. Формализованный анализ документов позволяет избавиться от субъективности за счет применения количественных методов. Суть этих методов сводится к тому, чтобы найти такие подсчитываемые признаки, черты, свойства документа, например, такой признак, как частота употребления определенных терминов, которые отражают существенные стороны содержания. Качественное содержание делается измеримым, становится доступным точным вычислительным операциям. Ограниченность формализованного анализа заключается в том, что далеко не все содержание документа может быть измерено с помощью формальных показателей. Контент-анализ — это техника выведения заключения, производимого благодаря объективному и систематическому выявлению соответствующих задачам исследования характеристик текста. Подразумевается, что применение такой техники включает в себя некоторые стандартизованные процедуры, часто предполагающие измерение. На практике определились некоторые общие принципы целесообразности и полезности применения методов количественного анализа: 1) когда требуется высокая степень точности или объективности анализа; 2) при наличии обширного по объему и несистематизированного материала; 3) когда важные категории характеризуются определенной частотой появления в изучаемых документах. Требование объективности анализа делает необходимым перевод исследуемого материала на язык гипотез в единицах, которые позволяют точно описать характеристики текста. В связи с этим исследователю приходится решать ряд проблем, связанных с выработкой категорий анализа, с выделением единиц анализа и единиц счета. Категории анализа — это понятия, в соответствии с которыми будут сортироваться единицы анализа — единицы содержания. При разработке категорий важно учитывать, что от их выбора будет в значительной степени зависеть характер полученных результатов. Как правило, необходимо несколько раз переходить от теоретической схемы к документальным данным, а от них — снова к схеме, чтобы исходя из выбранной гипотезы выработать категории, соответствующие задачам исследования. Категории должны быть исчерпывающими, охватывать все части содержания, определяемые задачами данного исследования. Категории должны отвечать требованию надёжности, их следует сформулировать так, чтобы у различных исследователей была достаточно высокая степень согласия по поводу того, какие части содержания следует отнести к той или иной категории. Эффективным способом повышения надежности категории является ее исчерпывающее определение и перечисление всех входящих в нее элементов. Тогда обработка документа сводится к чисто техническим процедурам, для выполнения которых могут использоваться средства электронных офисов. Например, можно использовать текстовые редакторы офиса Microsoft Office 2007. При проведении формализованного анализа содержания нужно четко указать признаки, по которым определенные единицы относятся к определенным категориям. Единицей анализа — смысловой или качественной — является та часть содержания, которая выделяется как элемент, подводимый под ту или иную категорию. В тексте она может быть выражена по-разному: одним словом, некоторым устойчивым сочетанием слов или может вообще не иметь явного терминологического выражения, а преподноситься описательно или скрываться в заголовке абзаца, раздела. Поэтому возникает задача выделения признаков — индикаторов, по которым определяется наличие в тексте интересующей темы. Индикаторы могут быть неоднородны: относящиеся к теме слова и словосочетания, термины, имена людей, названия организаций, географические названия, пути решения экономических проблем. При изучении экономических проблем смысловые единицы могут включать внутренние и международные события; лиц и авторов, описывающих эти события или являющихся их инициаторами и пропагандистами; отношение к событиям в терминах: «за — против», «выгодно — невыгодно», «хорошо — плохо», в чьих это интересах. Определены некоторые «стандартные» смысловые единицы, приведенные ниже. Понятие, выраженное отдельным словом, термином или сочетанием слов. Применение такой единицы целесообразно при изучении способов, с помощью которых источник информации организует сообщение, передает свои намерения тем, кому оно направлено. Тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах. Тема является важной смысловой единицей при анализе направленности интересов, ценностных ориентаций, установок тех, кто передает сообщение. Однако определение темы часто затруднено в связи с неясностью текста. Тому, кто проводит анализ, приходится определять тему и ее границы внутри текста. Выбор темы в качестве единицы анализа подразумевает также внутреннее разделение текста на определенные части, внутри которых тема может быть определена. Имена людей, географические названия, марки продуктов, названия организаций, упоминание какого-либо события. Частота и длительность промежутка времени, с которыми они присутствуют в сообщении, могут послужить показателями их важности, значимости для исследуемого объекта. Выбрав смысловую единицу и ее индикаторы, необходимо определить также единицу счета, которая станет основанием для количественного анализа материала. Единица счета «время — пространство». Подсчет в этой системе пригоден в основном при исследовании сообщений, передаваемых средствами массовой информации. За единицы счета здесь принимаются числа строк, абзацев, квадратных сантиметров площади, знаков, колонок в печатных текстах, посвященных тому или иному вопросу, мнению, оценке. Для кино, радио и телевидения единицей счета будет время, отведенное освещению определенного события. Единица счета «появление признака». Такая система счета подразумевает необходимость отмечать наличие определенной характеристики в любом ее проявлении; например, упоминание определенной марки товара в каждой из единиц контекстов. Иногда отмечается лишь появление признака, а повторение данной характеристики внутри единицы контекстов не учитывается. Единица счета «частота появления». Самым распространенным способом измерения характеристик содержания является подсчет частот их употребления, когда фиксируется каждое появление любого признака данной характеристики. В зависимости от того, какие единицы счета выбираются, частота может использоваться для решения различных задач. Частота появления темы в том или ином документе может служить показателем ее значимости с точки зрения автора документа. Подсчет оценочных характеристик текста позволяет подойти к исследованию установок автора сообщения и к выявлению намерений, которыми было продиктовано сообщение. Формирование выборки основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которых выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автозаправочные станции города, то надо иметь список этих станций. Он и будет рассматриваться как контур, в пределах которого формируется выборка. Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что может не быть полного официального списка всех автозаправочных станций большого города, включая и нелегальный бизнес в данной области. Существуют три главные проблемы формирования выборки. Исходя из сути рассматриваемой задачи необходимо определить, кто или что является единицей выборки. Например, производитель автомобилей решил изучить потенциальный рынок для своей продукции. Было принято решение изучить мнение по данному вопросу лиц, принимающих решения по выбору автомобилей в различных организациях, и глав семейств, определяющих данную политику в семье. В указанном примере единицы выборки — это руководители соответствующих служб организаций и главы семейств. Важно определить контур выборки. Например, список всех предприятий определенного региона. В целях выполнения правила репрезентативности, то есть представительности проводимого исследования, необходимо тщательно подобрать метод, с помощью которого выбираются единицы выборки из контура выборки, и. спланировать структуру выборки. Кроме того, необходимо определить объем выборки, то есть число изучаемых единиц. Обоснованный объем выборки не зависит от размера совокупности. Например, для отдельного региона он может быть не больше, чем для государства в целом, хотя сами единицы выборки должны отбираться по разным планам. При формировании выборки предпочтительно использовать вероятностные, то есть случайные методы. Если все единицы выборки имеют определенную вероятность быть включенными в выборку, то выборка называется случайной. Нередко из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому применение термина «известная вероятность» далеко не всегда обосновано. Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор. Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и одинакова для всех единиц совокупности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности. Простой случайный отбор может осуществляться с помощью таблиц или генераторов случайных чисел. Могут использоваться генераторы случайных чисел, имеющиеся в средствах электронных офисов. Единицам совокупности присваивают порядковые номера, после чего генерируются случайные числа в диапазоне всей генеральной совокупности. Количество чисел должно быть равно объему выборки. Особенно широко метод систематического отбора используется, когда для различных видов совокупностей имеются различные справочники, списки, спецификации, например справочники телефонных номеров. Кластерный отбор основан на делении совокупности на подгруппы. К сожалению, методологические ошибки в применении кластерного отбора чрезвычайно широко распространены, они проникли даже в популярные учебники. При кластерном отборе необходимо основываться на большой совокупности статистических данных и методах прикладной статистики — кластерном и дискриминантном анализе. Предположим, что исследуется мнение населения страны относительно какой-либо проблемы. Страна разбивается на четко определяемые части — 89 регионов. По каждому региону подбираются данные статистики о показателях, которые могут влиять на мнение населения по проблеме. С помощью кластерного и дискриминантного анализа регионы группируются в группы — кластеры по близости характеристик. Далее в простейшем случае можно ограничиться выбором в каждом кластере одного из регионов случайным образом. Затем необходимо определить совокупность для отобранных регионов и проводить в них соответствующее исследование, а выводы обобщить для всей страны. Формирование выборки можно осуществить на основе двухступенчатого подхода, использующего двухступенчатую кластеризацию. При этом, например, каждый кластер может быть разбит на более мелкие и более однородные кластеры. В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, то есть каждая выборка достаточно полно характеризует всю совокупность, различные крайности в выборке уравновешивают друг друга. Такая ситуация встречается не часто. Например, рыночный потенциал определенного региона для какого-то товара неоднороден. Население больших, средних и малых городов, сельской местности региона может отличаться по уровню образования, дохода, образу жизни. В случае несимметричного распределения совокупности последняя разделяется на различные подгруппы — страты, например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Для него следует выбрать признаки, характеризующие каждую единицу совокупности, например уровень дохода. Далее для каждой страты с помощью случайного отбора формируется выборка. Если размер выборки для определенной страты пропорционален размеру страты по отношению ко всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимо использовать весовые коэффициенты, уравновешивающие размеры страт. Вероятностно обоснованная стратификация строится на основе кластерного и дискриминантного анализа. Систематический отбор имеет место при последовательном формировании нескольких выборок с целью постепенного уточнения получаемых данных. Формирование выборки может осуществляться следующими этапами: 1) определение соответствующей совокупности; 2) получение «списка» совокупности; 3) определение структуры выборки; 4) определение методов доступа к совокупности; 5) определение и подготовка организационного обеспечения нужной численности выборки; 6) проверка выборки на соответствие требованиям проводимого исследования. Определение объема выборки. На практике используется множество методов определения объема выборки. Обоснованными являются только вероятностный метод и метод экспертной оценки. С помощью методов математической статистики может быть определен вероятностно обоснованный объем выборки, позволяющий получить данные с определенной точностью и достоверностью. В статистике изменчивость признака, как известно, характеризуется его вариацией. Вариация — это степень несхожести измерений признака, например ответов респондентов на определенный вопрос. В качестве меры вариации обычно принимается среднеквадратичное отклонение, которое характеризует отличие отдельных величин признака от средней величины. Эту меру вариации называют в разных случаях также стандартной ошибкой, стандартным отклонением. Напомним, кроме того, необходимое в оценках понятие «доверительный интервал», который представляет собой диапазон величин признака, куда попадает определенный процент измерений или ответов на вопрос. Доверительный интервал прямо пропорционален стандартному отклонению и тем шире, чем выше доверительная вероятность, к которой по мере роста объема выборки приближается доля попадающих в интервал ответов, величин измерений. Лекция №3 Тема: Статистический и регрессионный анализ Содержание лекции. 1. Проверка гипотез о законе распределения случайной величины. 2.Статистические оценки параметров. 3.Доверительные области. Доверительные интервалы для зависимой переменной. Цель: Ознакомить с основными принципами прверки гипотез о законе распределения случайной величины, охарактеризовать виды статистических оценок и доверительных интервалов. 1. Проверка гипотезы о законе распределения.. Большинство случайных величин подчиняется определенному закону распределения, зная который можно предвидеть вероятности попадания случайной величины в определенные интервалы. Законов распределения много. Рассмотрим лишь некоторые из них. 1)Биномиальное распределение – это распределение числа Х появления события А. Вероятность наступления события А в каждом испытании равна p, а вероятность его отсутствия q=1-p. В каждом испытании возможны два исхода: наступление или ненаступление события А. Ряд распределения числа n−m появления события А определяется формулой Бернулли: P ( X = m ) = C n p q , где m - число появления события А. Характер биномиального распределения определяется двумя параметрами: р и п. Числовые характеристики биномиального распределения случайной величины Х: 1) математическое ожидание: М ( Х ) = п ⋅ р m m 2) дисперсия: D ( Х ) = п ⋅ р ⋅ q Мастер функций fx пакета Excel среди статистических функций содержит функции f(x) и F(x) случайной величины Х, имеющей биномиальное распределение с параметрами т, п и р. f(x)=БИНОМРАСП ( т; п; р; 0) и F(x)=БИНОМРАСП ( т; п; р; 1). 2)Распределение Пуассона является предельным случаем биномиального распределения. Предположим, что в биномиальном распределении p → 0 и n → ∞ так, что n ⋅ p → M ( X ) = a > 0 . Тогда плотность вероятности биномиального распределения принимает вид: P ( X = m) = a m −a e , m = 0, 1, 2, ... , что и является распределением Пуассона. Это распределение зависит m! от одного параметра – математического ожидания. Примеры случайных величин, имеющих распределение Пуассона: число автомашин, которые будут обслужены автозаправочной станцией; число бракованных изделий в готовой продукции. Числовые характеристики распределения случайной величины Пуассона 1) математическое ожидание: М ( Х ) = а ; 2) дисперсия: D ( Х ) = а . Мастер функций fx пакета Excel среди статистических функций содержит функцию ПУАССОН (х; а; 0), которая позволяет вычислить вероятность заданного числа появления события х при заданном значении среднего. 3) В экономике особое место занимает нормальный закон распределения случайной величины (закон распределения Гаусса). Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения близкие к средней величине – достаточно часто. Плотность нормального распределения определяется по формуле: f ( x) = 1 σ x 2π − ( x −mx )2 e 2σ x2 . Параметр mx определяет положение центра рассеивания случайной величины, распределенной по нормальному закону, а параметр σ x характеризует меру ее рассеяния относительно центра. Числовые характеристики нормального распределения случайной величины Х: 1) математическое ожидание: М ( Х ) = а 2) дисперсия: D ( Х ) = σ . 2.Статистические оценки и доверительные интервалы. 2 Оценкой θ n* параметра θ называют всякую функцию результатов наблюдений над случайной величиной Х, с помощью которой судят о значениях параметра θ . Процесс нахождения оценок по определенному правилу (формуле) называется оцениванием. Цель любого оценивания – получение наиболее точного значения оцениваемой характеристики. Различают два вида оценок – точечные и интервальные. Точечной оценкой объема п. Пусть θ* параметра θ называется числовое значение этого параметра, полученное по выборке θ - оцениваемый параметр, а θ * - его статистическая оценка. Величина θ * − θ называется точностью оценки. Чем меньше эта величина, тем лучше, тем точнее определен неизвестный параметр. Свойства точечной оценки: 1) Оценка θ* называется несмещенной оценкой параметра равно оцениваемому параметру: 2) Несмещенная оценка 3) Оценка если ее математическое ожидание М (θ * ) = θ . В противном случае оценка называется смещенной. θ * параметра θ называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра того же объема п, т.е θ, θ , вычисленных по выборкам одного и D(θ ) = Dmin . * θ * параметра θ оцениваемому параметру при называется состоятельной, если она сходится по вероятности к п → ∞ , т.е. для любого δ > 0 при п → ∞ P ( θ * − θ < δ ) → 1 . При проведении оценивания на начальном этапе в качестве оценки той или иной числовой характеристики (М(х), D(х)) берется выборочная числовая характеристика. Затем, исследуя эту оценку, её уточнят таким образом, чтобы она удовлетворяла описанным выше свойствам. Доказано, что выборочное среднее является несмещенной и состоятельной оценкой математического ожидания (М(х)). Выборочная дисперсия является смещенной оценкой дисперсии (D(х)) и в качестве оценки дисперсии (D(х)) следует n брать исправленную дисперсию: s 2 = n Dв = 1 ∑ пi ( xi − xв ) 2 n −1 п − 1 i =1 2 Исправленная дисперсия s является несмещенной и состоятельной оценкой дисперсии (D(х)). При n>30 различия между выборочной и исправленной дисперсиями практически незначимо. Поэтому при большом объеме выборки ту и другую оценки можно считать несмещенными. Точечная оценка может быть дополнена интервальной оценкой – интервалом (θ 1 ;θ 2 ) , внутри которого с наперед заданной вероятностью γ находится точное значение оцениваемого параметра θ . Задачу определения такого интервала называют интервальным оцениванием, сам интервал – доверительным интервалом, а γ - доверительной вероятностью или надежностью. Для определения доверительного α = 1 − γ , и находят два числа θ1 и θ 2 таких, что P(θ1 < θ < θ 2 ) = 1 − α = γ . Полученный интервал (θ − δ ;θ + δ ) , накрывающий неизвестный параметр θ с вероятностью 1 − α и является интервальной оценкой θ . интервала выбирают число * Вопросы для самоконтроля: 1. Какие законы распределения случайных величин вы знаете? 2. Запишите нормальный закон распределения случайной величины. 3. Статистические оценки параметров распределения. 4. Свойства точечной оценки 5. Понятие доверительного интервала и доверительной вероятности Рекомендуемая литература: 1."Эконометрика" под редакцией И.И. Елисеевой, М: Финансы и статистика", 2002 2."Практикум по эконометрике" под редакцией И.И. Елисеевой, М: Финансы и статистика, 2002 3.Кристофер Доугерти "Введение в эконометрику" М: Ифра-М, 1999 4.Мардас А.Н. "Эконометрика" Учебное пособие, С-Пб "Питер", 2001 5. Ежеманская С.Н. «Эконометрика», Ростов-на-Дону «Феникс», 2003г 6. Кремер Н.Ш., Бутко Б.А. «Эконометрика» М.: ЮНИТИ-ДАНА, 2002г. Лекция №4 Тема: Статистический и регрессионный анализ Содержание лекции. 1. Содержание задачи корреляционного анализа. Этапы построения регрессионной модели. 2. Оценка адекватности регрессионной модели Цель: Дать постановку задачи корреляционного анализа, охарактеризовать этапы построения регрессионной модели, порядок оценки адекватности регрессионной модели 1. Экономико-статистические методы анализа и прогнозирования представляют математический аппарат построения моделей позитивного (познавательного) анализа на основе изучения зафиксированных ранее (ретроспективных) данных о состоянии экономического объекта или процесса. Экономикостатистические методы изучаются в разделе экономической теории, называемом эконометрикой. В эконометрике выделяют три основных направления: 1) разработка и исследование методов прикладной статистики; 2) разработка и исследование экономико-статистических моделей в соответствии с конкретными потребностями экономической науки и практики; 3) применение эконометрических методов и моделей для статистического анализа и прогнозирования состояния конкретных экономических объектов. Эти направления предполагают использование экономико-статистических методов: 1)статистика случайных величин (выборочные методы, оценка законов распределения случайных величин); 2) многомерный статистический анализ (корреляционно-регрессионный анализ); 3) анализ и прогнозирование временных рядов; 4) статистика объектов нечисловой природы. В эконометрике решаются следующие задачи: 1)описание данных; 2) оценивание и проверка гипотез; 3) восстановление зависимостей; 4) классификация объектов и признаков; 5) прогнозирование статистических решений и др. Исходные данные представляют собой эмпирические ряды числовых значений показателей, характеризующих состояния объекта в разные моменты времени. Они оформляются в таблицах или изображаются графически посредством геометрических образов – точек, линий, фигур в различных сочетаниях. Итак, исследование связей в условиях массового наблюдения и действия случайных факторов осуществляется с помощью экономико-статистических моделей. Статистическая модель – логическое или математическое описание компонентов и функций, отображающих существенные свойства моделируемого объекта или процесса, которое дает возможность установить основные закономерности изменения оригинала. Выражение модели в виде функциональных уравнений используют для расчета средних значений моделируемого показателя по набору заданных величин и для выявления степени влияния на него отдельных факторов. Таким образом, статистическое моделирование – способ исследования процессов поведения вероятностных систем, когда неизвестны внутренние взаимодействия в этих системах. Основными задачами любого статистического исследования является установление и анализ качественных либо количественных взаимосвязей между теми или иными экономическими показателями. Такие взаимосвязи являются стохастическими по своей природе, т.е. позволяют устанавливать лишь вероятностные, логические соотношения между изучаемыми явлениями. Сам процесс выявления взаимосвязей осуществляется на основе статистического наблюдения за анализируемыми переменными. В зависимости от познавательной цели модели подразделяются на структурные, динамические и модели связи. В основе структурной модели лежит описание структуры связей между изучаемыми переменными в форме системы одновременных уравнений. Структурные модели формализуют гипотезы о причинных отношениях. Модель является динамической, если в данный момент времени она учитывает значения входящих в нее переменных, относящихся как к текущему, так и к предыдущим моментам времени, т.е. если эта модель отражает динамику исследуемых переменных в каждый момент времени. Модели связи представляет собой математические уравнения, связывающие эндогенные и экзогенные переменные и отражающие статистически значимые взаимосвязи. Рассмотрим основные проблемы статистического моделирования связи методами корреляционного и регрессионного анализа. Корреляционная связь между различными явлениями и их признаками существует там, где среднее значение (математическое ожидание) случайной величины результативного признака у закономерно изменяется в зависимости от изменения другой случайной величины х или других случайных величин х1, х2,…хп. Односторонняя вероятностная зависимость между случайными величинами есть регрессия. Она устанавливает соответствие между этими величинами. Существует различные виды регрессий: 1)Регрессия относительно числа переменных: - простая регрессия – регрессия между двумя переменными; - множественная регрессия – регрессия между зависимой переменной у и несколькими объясняющими переменными х1, х2,…хп. 2) Регрессия относительно форм зависимости: - линейная регрессия, выражаемая линейной функцией; - нелинейная регрессия, выражаемая нелинейной функцией. 3) Регрессия относительно её характера: - положительная регрессия – с увеличением (уменьшением) объясняющей переменной значения зависимой переменной также увеличивается (уменьшается); - отрицательная регрессия - с увеличением или уменьшением объясняющей переменной зависимая переменная также уменьшается или увеличивается; 4) Регрессия относительно типа соединения явлений: - непосредственная – зависимая и объясняющие переменные связаны непосредственно друг с другом; - косвенная - объясняющая переменная действует на зависимую через ряд других переменных; - ложная – возникает при формальном подходе к исследуемым явлениям без уяснения того, какие причины обусловливает данную связь. Регрессия тесно связана с корреляцией. Корреляция в широком смысле означает связь, соотношение между объективно существующими явлениями. Связи между явлениями могут быть различны по силе. При измерении тесноты связи говорят о корреляции в узком смысле слова. Если случайные переменные причинно обусловлены и можно в вероятностном смысле высказываться об их связи, то имеется корреляция. Корреляция также имеет различные виды: 1)относительно характера корреляции: положительная и отрицательная; 2) относительно числа переменных: простая, множественная и частная; 3) относительно формы связи: линейная и нелинейная; 4) относительно типа соединения: непосредственная, косвенная и ложная Решение задачи построения регрессионной модели можно разбить на три этапа: 1.Спецификация: выбор независимых переменных, существенно влияющих на зависимую величину, а также выбор формы уравнения регрессии. 2. Параметризация: определение параметров выбранной модели. 3. Верификация: анализ качества модели и проверка ее адекватности эмпирическим данным, совершенствование модели. Вопросы для самоконтроля: 1. Сущность статистического моделирования и понятие статистической модели. 2. Понятие и задачи корреляционно-регрессионного анализа. 3. Этапы построения регрессионной модели и их сущность. Рекомендуемая литература: 1. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 2. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г Лекция №5 Тема: Статистический и регрессионный анализ Содержание лекции: 1. Использование модели множественной линейной регрессии для прогнозирования экономических показателей. 2. Оценка надежности результатов множественной регрессии и прогнозирование зависимой переменной Цель: Раскрыть прниципы построения модели множественной линейной регрессии для прогнозирования экономических показателей и порядок оценки надежности результатов множественной регрессии 1.Множественная регрессия – уравнение связи с несколькими независимыми переменными: у = f ( x1 , х 2 ,...х р ) , где у - зависимая переменная (результативный признак), x1 , х 2 ,...х р независимые переменные (факторы). Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию должны отвечать следующим требованиям: 1)Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, то ему нужно придать количественную определенность. 2) Каждый фактор должен быть достаточно тесно связан с результатом, т.е. коэффициент парной линейной корреляции между фактором и результатом должен существенно отличаться от нуля. 3) Факторы не должны сильно коррелировать друг с другом, тем более находиться в строгой функциональной связи (т.е. они не должны быть интеркоррелированы). Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные коллинеарны, т.е. находятся между собой в линейной зависимости, если rx x ≥ 0,7 . Если факторы коллинеарны, то они дублируют друг i j друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Методы построения уравнения множественной регрессии: 1) метод исключения (отсев факторов из полного его набора); 2) метод включения (дополнительное введение фактора); 3) шаговый регрессионный анализ (исключение ранее введенного фактора). При отборе факторов большую роль играют показатели частной корреляции, оценивающие в чистом виде тесноту связи с результатом. При отборе факторов рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6-7 раз меньше объема совокупности, по которой строится регрессия. Как и в парной зависимости, возможны различные виды уравнений множественной регрессии: линейные и нелинейные. Наиболее широко используются линейная и степенная функции. В линейной множественной регрессии y€x = a + b1 x1 + b2 x 2 + ... + b p x p параметры при переменных х называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне. Например, зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением: у€х = 0,5 + 0,35 х1 + 0,73 х 2 , где у – расходы семьи за месяц на продукты питания, тыс. д.ед.; х1 – месячный доход на одного члена семьи, тыс. д.ед.; х2- размер семьи, человек. Анализ уравнения: с ростом дохода на одного члена семьи на 1 тыс. д.ед. расходы на питание в среднем возрастут на 350 д.ед., при том же среднем размере семьи. Увеличение размера семьи предполагает дополнительный рост расходов на питание на 730 д.ед. Параметр а экономической интерпретации не подлежит. Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов. Строится следующая система нормальных уравнений: ∑ у = па + b1 ∑ x1 + b2 ∑ x 2 + ... + b p ∑ x p 2 ∑ yx1 = a ∑ x1 + b1 ∑ x1 + b2 ∑ x1 x 2 + ... + b p ∑ x p x1 ......................................................................................... yx = a x + b ∑ p 1 ∑ x1 x p + b2 ∑ x 2 x p + ... + b p ∑ x 2p ∑ p Ее решение может быть осуществлено методом определителей. В линейной множественной регрессии y€x = a + b1 x1 + b2 x 2 + ... + b p x p параметры при переменных х называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне. Возможен и другой подход к определению параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе: t y = β 1t x1 + β 2 t x 2 + ... + β p t x p + ε , где t y = y−y σy , t xi = x i − xi σx - стандартизованные переменные; i β i - стандартизованные коэффициенты регрессии. на сколько β -коэффициенты показывают, сигм изменится в среднем результат, если соответствующий фактор хi изменится на одну сигму при неизменном среднем уровне других факторов. Стандартизованные коэффициенты регрессии сравнимы между собой. Сравнивая, их друг с другом, можно ранжировать факторы по силе их воздействия на результат (коэффициенты «чистой регрессии» несравнимы между собой). 2. Оценка практической значимости уравнения регрессии Практическая значимость множественной регрессии оценивается с помощью индекса множественной корреляции. Индекса множественной корреляции оценивает тесноту совместного влияния факторов на результат и определяется следующим образом: R yx1x2 ... x p 2 σ ост = 1− 2 σу . Границы его изменения от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Для расчета индекса множественной корреляции можно воспользоваться и другой формулой: R yx1x2 ... x p = где ∑ (у − у€ 1− ∑ (у − у) ) 2 х1 х2 ... х р 2 у - фактические значения результативного показателя; - значения результативного показателя, рассчитанные по уравнению регрессии; - среднее значение результативного показателя. Индекс множественной корреляции для уравнения в стандартизованном масштабе можно определить следующим образом: R yx1 x2 ... x p = ∑ β i ryxi где β i - стандартизованные коэффициенты регрессии; ryxi - парные коэффициенты корреляции между результативным признаком и соответствующим фактором х. Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле: R€2 = 1 − (1 − R 2 ) (n − 1) ( n − m − 1) Оценка значимости уравнения множественной регрессии по F-критерию Фишера. Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера: R2 n − m −1 . F= ⋅ 1− R2 m Если Fтабл < Fфакт, то Н0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 принимается и признается статистическая незначимость и ненадежность уравнения регрессии. Во множественной регрессии оценивается значимость не только уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Мерой для оценки включения фактора в модель служит частный F– F– критерий определяется как: критерий, т. е. Fxi . В общем виде для фактора xi частный Fxi = R yx2 1 ...xi ...x p − R yx2 1 ... xi −1 xi +1 ...x p n − m − 1 ⋅ 1 1 − R yx2 1 ...xi ... x p Фактическое значение частного F– критерия сравнивается с табличным при 5% или 1% уровне значимости и числе степеней свободы 1 и n-m-1. Если фактическое значение Fxi превышает табличное, то дополнительное включение фактора в модель статистически оправдано и коэффициент чистой регрессии bi при факторе xi статистически значим. Если же фактическое значение Fxi меньше табличного, то дополнительное включение в модель фактора xi не увеличивает существенно долю объясненной вариации признака y, следовательно, нецелесообразно его включение в модель, коэффициент регрессии при данном факторе в этом случае статистически незначим. Оценка значимости коэффициентов регрессии. Оценка значимости коэффициентов чистой регрессии с помощью t– критерия Стьюдента сводится к вычислению значения: t = bi = F bi xi mbi Сравнивая фактическое и критическое (табличное) значения t – статистики, принимаем и отвергаем гипотезу Н0. Если tтабл < tфакт то Н0 отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт, то гипотеза Н0 принимается и признается случайная природа формирования a, b, r. Вопросы для самоконтроля: 1.В чем заключается спецификация модели множественной регрессии? 2. Как проводится отбор факторов при построении множественной регрессии? 3. Какие основные формы уравнений множественной регрессии можно построить? 4. Что характеризуют коэффициенты «чистой» регрессии? 5. Что характеризуют коэффициенты эластичности во множественной регрессии? 6.Способы построения уравнения множественной линейной регрессии? 7. Что показывают стандартизованные коэффициенты регрессии? 8. Как рассчитывается индекс множественной корреляции? 9. С какой целью и каким образом рассчитывается скорректированный индекс множественной корреляции? 10. Как определяется индекс множественной корреляции для уравнения в стандартизованном масштабе? 11.Как рассчитывается F-критерий Фишера для уравнения множественной регрессии? 12.С какой целью рассчитывается частный F-критерий Фишера? 13. Как проводится оценка значимости параметров уравнения множественной регрессии? Рекомендуемая литература: 1."Эконометрика" под редакцией И.И. Елисеевой, М: Финансы и статистика", 2002 2."Практикум по эконометрике" под редакцией И.И. Елисеевой, М: Финансы и статистика, 2002 3.Кристофер Доугерти "Введение в эконометрику" М: Ифра-М, 1999 4.Мардас А.Н. "Эконометрика" Учебное пособие, С-Пб "Питер", 2001 5.Бережная Е.В., Бережной В.И. "Математические методы моделирования экономических систем" М: Финансы и статистика, 2003 6.Магнус Я.Р., Катышев П.К., Пересецкий А.А. "Эконометрика. Начальный курс" М: Дело, 1998 Лекция №6 Тема: Анализ временных рядов Содержание лекции. 1. Компоненты временного ряда. 2. Выделение тренда. Цель: дать понятие временного ряда, охарактеризовать его компоненты, этапы построения временного ряда и принципы пострения трендовых моделей временного ряда 1. Основные элементы временных рядов. Виды моделей временного ряда. Эконометрическую модель можно построить, используя два типа исходных данных: 1 данные, характеризующие совокупность различных объектов в определенный момент (период) времени; 2 данные, характеризующие один объект за ряд последовательных моментов (периодов) времени. Модели, построенные по данным первого типа, называются пространственными моделями. Модели, построенные на основе второго типа данных, называются моделями временных рядов. Временный ряд - это совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы: факторы, формирующую тенденцию ряда; 1 факторы, формирующие циклические колебания ряда 2 случайные факторы При различных сочетаниях в изучаемом процессе этих факторов зависимость уровней ряда от времени может принимать различные формы. Во-первых, большинство временных рядов экономических показателей имеют, тенденцию характеризующую совокупное, долговременное воздействие множества факторов на динамику изучаемого показателя. Эти факторы, взятые в отдельности, могут оказывать разнонаправленное воздействие на исследуемый показатель. Однако в совокупности они формируют его возрастающую или убывающую тенденцию. Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезонный характер, поскольку экономическая деятельность ряда отраслей экономики зависит от времени года. Некоторые временные ряды не содержат тенденции и циклической компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда. Основная задача эконометрического исследования отдельного временного ряда - выявление и придание количественного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов. 2. Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда. Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функции. Для построения трендов чаще всего применяются следующие функции: 1 линейный тренд: yˆ t = a + b ∗ t ; 2.гипербола: yˆ t = a + b / t ; 3.экспоненциальный тренд: 1 yˆ t = e a +b∗t ; 4.тренд в форме степенной функции yˆ t = a ∗ t b ; 5.парабола второго и более высоких yˆ t = a + b1 ∗ t ;+b2 ∗ t 2 + bk ∗ t k Существуют несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях же можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровнем ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни yt и yt-1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов. Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм трендов, расчета по каждому уравнению скорректированного порядков 2 коэффициента детерминации R и выбора уравнения тренда с максимальным значением коэффициента детерминации. Вопросы для самоконтроля: 1.Какие типы данных используются при построении эконометрических моделей? 2. Структура временного ряда. 3. Дайте определение автокорреляции уровней временного ряда. 4. Как рассчитывается коэффициент автокорреляции уровней временного ряда. 5. С какой целью строится коррелограмма? 6.Что называется аналитическим выравниванием временного ряда? 7. Какие виды трендов существуют? 8. Как определить параметры трендов с помощью анализа данных Excel? Рекомендуемая литература: 1."Эконометрика" под редакцией И.И. Елисеевой, М: Финансы и статистика", 2002 2."Практикум по эконометрике" под редакцией И.И. Елисеевой, М: Финансы и статистика, 2002 3.Кристофер Доугерти "Введение в эконометрику" М: Ифра-М, 1999 4.Мардас А.Н. "Эконометрика" Учебное пособие, С-Пб "Питер", 2001 5. Ежеманская С.Н. «Эконометрика», Ростов-на-Дону «Феникс», 2003г 6. Кремер Н.Ш., Бутко Б.А. «Эконометрика» М.: ЮНИТИ-ДАНА, 2002г. Лекция №7 Тема: Анализ временных рядов Содержание лекции. 1. Сезонные и циклические колебания. 2. Сглаживание временных рядов. Цель: Дать основные понятия и этапы построения моделей временных рядов., охарактеризовать метод скользящей средней. 1.При экстраполяционном прогнозировании экономической динамики на основе временных рядов с использованием трендовых моделей выполняется ряд этапов: 1)Установление цели и задачи исследования, анализ объекта прогнозирования. Необходимо провести детальное логическое изучение системы: зависимость рассматриваемого объекта (параметра, показателя) от других систем одного уровня и субсистемы (системы более высокого уровня); взаимосвязь между данным объектом и др. объектами системы; характер представления статистических данных об объекте. 2) Подготовка исходных данных. Работы начинаются с проверки временного ряда, в результате которой устанавливаются полнота ряда (наличие данных за каждый год (месяц, квартал) ретроспективного периода), сопоставимость данных и в случае необходимости проверка методики проведения данных к сопоставимому виду. Также осуществляется формирование массива функций, который в последующем будет использован для выбора вида математической модели. 3) Фильтрация исходного временного ряда. Устраняются возмущения, возникающие под воздействием неучтенных факторов или ошибок измерения относительно наиболее вероятного протекания процесса, и тем самым исключается искажающее влияние случайных колебаний на выбор вида регрессии. Фильтрация исходного динамического ряда включает его сглаживание и выравнивание. Сглаживание применяется для устранения случайных отклонений из экспериментальных значений исходного ряда. Сглаживание проводится с помощью многочленов, приближающих (обычно по МНК) группы опытных точек. Чаще всего для сглаживания применяют линейную зависимость. Выравнивание применяется для более удобного представления исходного ряда без изменения его числовых значений. Выравниванием называется приведение исходной эмпирической формулы y=f(t,a,b), где t- время, a,b –параметры к виду y=a1T+b0. 4) Логический отбор видов аппроксимирующей функции. На основании изучения статистических данных и логического анализа протекания изучаемого процесса из заданного массива функций отбираются наиболее приемлемые виды уравнений связи. 5) Оценка математической модели прогнозирования. Определяются параметры различных видов аппроксимирующих функций. Наиболее распространенными методами оценки параметров аппроксимирующих зависимостей является метод наименьших квадратов. И его модификации, метод экспоненциального сглаживания, метод вероятностного моделирования, метод адаптивного сглаживания. 6) Выбор математической модели прогнозирования. Он базируется на оценке качества моделей. Независимо от метода оценки параметров моделей экстраполяции их качество определяется на основе исследования свойств остаточной компоненты: (yi-yТi) i=1,…,n , т.е. величины расхождений на участке аппроксимации (построения модели) между фактическими уровнями yi и их расчетными трендовыми значениями yТi. Качество модели определяется её адекватностью исследуемому процессу и точностью. Адекватность характеризуется наличием и учетом определенных статистических свойств, а точность – степенью близости к фактическим данным. Модель прогнозирования будет считаться лучшей со статистической точки зрения, если она является адекватной и более точно описывает динамический ряд. 2.Среднее скользящее значение относится к категории аналитических инструментов, которые, как принято говорить, "следуют за тенденцией". Его назначение состоит в том, чтобы позволить определить время начала новой тенденции, а также предупредить о ее завершении или повороте. Методы скользящего среднего предназначены для отслеживания тенденций непосредственно в процессе их развития, их можно рассматривать как искривленные линии тренда. Однако методы скользящего среднего не предназначены для прогнозирования движений на рынке в том смысле, в котором это позволяет делать графический анализ, поскольку они всегда следуют за динамикой рынка, а не опережают ее. Иначе говоря, эти показатели, например, не прогнозируют динамику цен, а только реагируют на нее. Они всегда следуют за движениями цен на рынке и сигнализируют о начале новой тенденции, но только после того, как она появилась. Построение скользящего среднего представляет собой специальный метод сглаживания показателей. Действительно, при усреднении ценовых показателей их кривая заметно сглаживается и наблюдать тенденцию развития рынка становится намного проще. Однако уже по самой своей природе скользящее среднее как бы отстает от динамики рынка. Краткосрочное скользящее среднее точнее передает движение цен, чем более продолжительное, т.е. вычисленное для более длинного интервала. Применение краткосрочного скользящего среднего позволяет сократить отставание во времени, однако полностью устранить его при использовании любого метода скользящих средних невозможно. Простое скользящее среднее, определяемое как среднее арифметическое значение, вычисляется по следующей формуле, при условии что m — нечетное число: (11.3) где у, — фактическое значение /-го уровня; m — число уровней, входящих в интервал сглаживания - текущий уровень ряда динамики; i — порядковый номер уровня в интервале сглаживания; р — при нечетном m имеет значение р = (m - 1)/2. Интервал сглаживания, т.е. число входящих в него уровней m, определяют по следующим правилам. Когда необходимо сгладить незначительные, беспорядочные колебания, интервал сглаживания берут большим, если же требуется сохранить более незначительные колебания и освободиться лишь от периодически повторяющихся выбросов — интервал сглаживания обычно уменьшают. Метод простого скользящего среднего используется обычно в тех случаях, когда график временного ряда представляет собой прямую линию, поскольку при этом динамика исследуемого явления не искажается. В том случае, когда тренд ряда имеет явно нелинейный характер и желательно сохранить незначительные колебания в динамике значений, этот метод не используется, так как его применение может привести к значительным искажениям исследуемого процесса. В таких случаях используется взвешенное скользящее среднее или методы экспоненциального сглаживания. Практика показывает, что метод простого скользящего среднего позволяет выработать объективную стратегию и четко определенные правила, например, в сфере торговли. Именно поэтому данный метод положен в основу многих компьютерных систем для торговых организаций. Как же можно использовать метод скользящего среднего? Наиболее распространенные способы применения скользящего среднего таковы. 1. Сопоставление значения текущей цены со скользящим средним, используемым в этом случае как индикатор тенденции. Так, если цены находятся выше 65-дневного скользящего среднего, то на рынке имеется промежуточная (краткосрочная) восходящая тенденция. В случае более долгосрочной тенденции цены должны быть выше 40-недельного скользящего среднего. 2. Использование скользящего среднего как уровня поддержки или сопротивления. Закрытие цен выше данного скользящего среднего служит "бычьим" сигналом, закрытие ниже его — "медвежьим". 3. Отслеживание полосы скользящего среднего (другое часто используемое название — конверт). Эта полоса ограничивается двумя параллельными линиями, которые располагаются на определенную процентную величину выше и ниже кривой скользящего среднего. Эти границы могут служить индикаторами уровня поддержки или сопротивления соответственно. 4. Наблюдение за направлением наклона кривой скользящего среднего. Так, если после длительного подъема она выравнивается или поворачивает вниз, это может быть "медвежьим" сигналом. 5. Еще один простой метод наблюдения заключается в построении линий тренда по кривой скользящего среднего. Также иногда может быть целесообразно использование комбинации из двух скользящих средних. Microsoft Excel располагает функцией Скользящее среднее (Moving Average), которая обычно используется для сглаживания уровней эмпирического временного ряда на основе метода простого скользящего среднего. Для вызова этой функции необходимо выбрать команду меню Tools^Data Analysis (Сервис1*Анализ данных). На экране раскроется окно Data Analysis, в котором следует выбрать значение Moving Average. В результате на экран будет выведено диалоговое окно Moving Average, представленное на рис. 11.1. В диалоговом окне Скользящее среднее задаются следующие параметры. 1. Input Range (Входные данные) — в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра. 2. Labels in First Row (Метки в первой строке) — данный флажок опции устанавливается в том случае, если первая строка/столбец входного диапазона содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия. 3.Interval (Интервал) — в это поле вводится число уровней m, входящих в интервал сглаживания. По умолчанию v = 3. 4. Output options (Параметры вывода) — в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего нужно установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего необходимо установить флажок опции Standart Errors (Стандартные погрешности). Рассмотрим конкретный пример. Допустим, за указанный период (1999-2002 гг.) необходимо выявить основную тенденцию изменения фактического объема выпуска продукции и характер сезонных колебаний этого показателя. Данные для примера представлены на рис. 11.2. На рис. 11.3 отображены вычисленные с помощью функции Moving Average (Скользящее среднее) значения сглаженных уровней и значения m=3. Ha puc. 11.4 rpaфически представлены фактические и прогнозируемые значения анализируемого ряда. Рассчитанные сглаженные уровни не только дают представление об общей тенденции поведения изучаемого ряда, но и может быть также использованы для вычисления индексов сезонности IS , совокупность которых характеризует сезонную кривую исследуемого процесса. Средние индексы сезонности определяются по формуле где - исходные уровни ряда, - сглаженные уровни ряда, u — число одноименных периодов. На рис. 11.3 представлены вычисленные значения yt . Для получения средних индексов сезонности ) yt IX выполняется усреднение вычисленных значений yt , по одноименным кварталам. ) yt Вычисленные показатели являются средними индексами сезонных колебаний объема выпуска продукции по кварталам. Вопросы для самоконтроля: 1. Дайте определение временного ряда. 2. Типы исходных данных для построения эконометрических моделей. 3. С помощью, каких факторов формируется уровень временного ряда? 4. Этапы экстраполяционного прогнозирования экономической динамики на основе временных рядов 5. Какая модель временного ряда называется аддитивной? 6. Какая модель временного ряда называется мультипликативной? 7. Этапы построения аддитивной и мультипликативной моделей временного ряда. Рекомендуемая литература: 1.Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 2. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Лекция №8 Тема: Анализ временных рядов Содержание лекции. 1. Динамические модели с распределенными лагами 2. Стационарные временные ряды. Цель: дать понятиединамических эконометрических моделей, их типы; охарактеризовать стационарные временные ряды. 1. К динамическим эконометрическим моделям относят модели, которые в данный момент времени учитывают значения входящих в неё переменных, относящихся к текущему и предыдущему моментам времени, например, yt=f(xt;xt-1). Выделяют два типа динамических эконометрических моделей: 1) Модели, в которых лаговые значения переменных (переменных, относящихся к предыдущим моментам времени) непосредственно включены в модель. Это модели авторегрессии и модели с распределенным лагом. Модели авторегрессии – это динамические эконометрические модели, в которых в качестве факторных переменных содержатся лаговые значения результативной переменной. Например, yt=a+b0xt+c1yt1+et.Модели с распределенным лагом - динамические эконометрические модели, в которых содержатся не только текущие, но и лаговые значения факторных переменных. Например, yt=a+b0xt+b1xt-1+…+bLxt-L+et. 2) Модели, в которых включены переменные, характеризующие ожидаемый или желаемый уровень признака – результата или одного из факторов в момент времени t. Этот уровень считается неизвестным и определяется с учетом информации, которой располагают в предыдущий момент времени t-1. В модели авторегрессии yt=a+b0xt+c1yt-1+et коэффициент b0 – характеризует краткосрочное изменение у под влиянием изменения х на единицу своего измерения. Коэффициент c1 характеризует изменение у в момент t под воздействием своего изменения в предшествующий момент времени (t-1). Произведение коэффициентов (b0 c1) называют промежуточным мультипликатором. Данный показатель характеризует общее абсолютное изменение результата у в момент (t+1). Показатель b=b0+b0c1+b0c21+b0c31+…- называют долгосрочным мультипликатором. Он характеризует общее абсолютное изменение у в долгосрочном периоде. При построении моделей авторегресссии возникает проблема: нарушается первая предпосылка нормальной линейной модели регрессии об отсутствии связи между факторными признаками и случайной составляющей. В модели авторегрессиии факторный признак yt-1 связан со случайной составляющей et-1. Поэтому применение обычного МНК для оценки параметров уравнения регрессии приводит к получению смещенной оценки параметра при переменной yt-1. Для оценивания параметров уравнения регрессии может быть использован метод инструментальных переменных. Суть этого метода состоит в следующем. Переменную yt-1 из правой части уравнения, для которой нарушается предпосылка МНК, заменяют на новую переменную, удовлетворяющую следующим требованиям: 1) она должна тесно коррелировать с yt-1; 2) она не должна коррелировать со случайной составляющей et. Затем оценивают регрессию с новой инструментальной переменной с помощью обычного МНК. Если в моделях учитывают не фактическое значение переменной, а её желаемое (ожидаемое) значение, то такие модели относят ко второму типу динамических эконометрических моделей – моделям адаптивных ожиданий либо к моделям частичной (неполной) корректировки. Модель адаптивных ожиданий (МАО) учитывает желаемое (ожидаемое) значение факторного * * признака хt +1 . Пример МАО: ожидаемое в будущем (в период (t+1)) значение курса доллара хt +1 влияет на yt . Или другой пример: ожидаемое значение заработной платы хt*+1 влияет на уровень безработицы в текущем периоде y t . инвестиции в текущем периоде В общем виде модель адаптивных ожиданий можно записать так: y t = a + b0 ⋅ xt +1 + u t . * Желаемое (ожидаемое) значение переменных определяется по значению реальных (фактических) переменных в предыдущий период времени (t). Механизм формирования ожиданий в модели адаптивных ожиданий следующий: хt*+1 − х t* = λ ⋅ ( x t − xt* ) (0 ≤ λ ≤ 1) или хt*+1 = λ ⋅ x t + (1 − λ ) ⋅ x t* . * То есть значение переменной, ожидаемое в следующий период хt +1 , формирующееся как среднее арифметическое взвешенное её реального и ожидаемого значений в текущем периоде. Чем больше величина λ , тем быстрее ожидаемое значение адаптируется предыдущим реальным значениям. Чем меньше λ , тем * * ожидаемое значение в будущем хt +1 ближе к ожидаемому значению предыдущего периода х t (т.е. тенденции в ожиданиях сохраняются). Модель частичной корректировки * (МЧК) учитывает желаемое (ожидаемое) значение результативного признака у t . Примером МЧК может служить модель Литнера: фактический объем прибыли х t оказывает влияние на величину желаемого объема дивидендов у t* . В общем виде модель частичной корректировки можно записать так: y t = a + b0 ⋅ xt + u t . Желаемое (ожидаемое) значение переменных определяется по значению реальных (фактических) переменных в предыдущий период времени (t-1). В таких моделях предполагается, что фактическое приращение зависимой переменной y t − y t −1 * пропорционально разнице между её желаемым уровнем и фактическим значением в предыдущий период y t* − y t −1 : y t* − y t −1 = λ ( y t* − y t −1 ) + υ t (0 ≤ λ ≤ 1) или y t = λ ⋅ y + (1 − λ ) ⋅ y t + υ t * t Из этого следует, что yt получается как среднее арифметическое взвешенное желаемого уровня у t* и фактического значения этой переменной в предыдущем периоде быстрее происходит процесс корректировки. Если значение происходит за 1 период. Если λ = 0 , то корректировка yt y t −1 . Чем больше величина λ , тем λ = 1 , то у t = у t* и полная корректировка не происходит совсем. Вопросы для самоконтроля: 1. Какие виды моделей относятся к динамическим эконометрическим моделям? 2. Общий вид записи модели авторегрессии. 3. Как записывается в общем виде модель адаптивных ожиданий? 4. Как записывается в общем виде модель частичной корректировки? Рекомендуемая литература: 1. Басовский А.Е. «Прогнозирование и планирование в условиях рынка», М:Инфра-М, 2006г 2. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г Лекция №9 Тема: Прогнозирование временных рядов Содержание лекции: 1. Аддитивные методы прогнозирования 2. Мультипликативные методы прогнозирования. 1. Существуют несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания. Простейший подход - расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда. Общий вид аддитивной модели следующий:Y= T+S+E Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (Т), сезонной (S) и случайной (Е) компонент. Общий вид мультипликативной модели следующий:Y= T*S*E Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (Т), сезонной (S) и случайной (Е) компонент. Построение аддитивной и мультипликативной моделей сводится к расчету значений T,S и E для каждого уровня ряда. Процесс построения модели включает в себя следующие шаги. 1. Выравнивание исходного ряда методом скользящей средней. 2. Расчет значений сезонной компоненты S. 3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (T+E) в аддитивной или (T*E) в мультипликативной модели. 4. Аналитическое выравнивание уровней (Т+Е) или (Т*Е) и расчет значений Т с использованием полученного уравнения тренда. 5. Расчет, полученных по модели значений (T+S) или (T * S). 6. Расчет абсолютных и /или относительных ошибок. 2.Пример. Пусть имеются поквартальные данные о прибыли компании за 3 года. Квартал I II III IV 1 72 100 90 64 2 70 92 80 58 3 62 80 68 48 Построить мультипликативную модель временного ряда. Для построения мультипликативной модели временного ряда необходимо: 1) Провести выравнивание временного ряда методом скользящей средней. 2) Найти оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (графа 6). Расчет оценок сезонной компоненты в мультипликативной модели Год № Прибыль, Скользящая Центрированная Оценка сезонной квартала, Yt средняя за 4 скользящая компоненты t квартала средняя 1 72 2 100 81,5 3 90 81,0 81,25 1,108 64 79,0 80,00 0,800 4 76,5 77,75 0,900 5 70 75,75 1,215 6 92 75,0 1,081 7 80 73,0 74,00 8 58 70,0 71,50 0,811 9 62 67,0 68,50 0,905 10 80 64,5 65,75 1,217 68 11 12 48 Найденные оценки используются для расчета сезонной компоненты S. Для этого находятся средние за каждый квартал оценки сезонной компоненты Si. Взаимопогашаемость сезонных воздействий в мультипликативной модели выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле (в примере равно 4). Расчет сезонной компоненты Показатели Год № квартала I II III IV 1 1,108 0,800 2 0,900 1,215 1,081 0,811 3 0,905 1,217 Итого за квартал 1,805 2,432 2,189 1,611 Средняя оценка сезонной 0,9025 1,216 1,0945 0,8055 компоненты Скорректированная сезонная 0,8983 1,2104 1,0895 0,8018 компонента, Si Имеем: 0,9025+1,216+1,0945+0,8055=4,0185. Определим корректирующий коэффициент: k=4:4,0185=0,9954. Определим скорректированные значения сезонной компоненты, умножив её средние оценки на корректирующий коэффициент S i = S i ⋅ k 3) Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. Получим величины T*E=Yt/Si, которые содержат только тенденцию и случайную компоненту. Расчет выравненных значений Т и ошибок в мультипликативной модели t Yt Si T*E=Yt/Si T T*S E=Yt-(T*S) E2 18,545 -4,306 80,15 94,94 0,943 0,8983 1 72 -0,304 0,092 82,87 0,996 1,2104 82,62 2 100 3,908 1,022 1,977 82,61 80,79 90 1,0895 3 1,014 0,886 0,784 78,71 64 0,8018 79,92 4 0,8983 77,92 76,64 1,016 1,155 1,334 5 70 1,749 3,062 92 1,2104 76,01 74,56 1,019 6 1,054 1,013 1,026 7 80 1,0895 73,43 72,48 70,41 1,027 1,546 2,390 0,8018 72,34 8 58 0,381 9 62 0,8983 69,02 68,33 1,010 0,617 0,038 0,997 -0,195 10 80 0,2104 66,09 66,25 0,972 -1,923 3,698 1,0895 62,41 64,17 11 68 62,10 0,964 -1,793 3,217 12 48 0,8018 59,86 4) Определить компоненту Т. Для этого рассчитываются параметры линейного тренда, используя уровни (Т*Е). Уравнение тренда имеет следующий вид: Т=87,022-2,076t. Подставляя в это уравнение значения t=1,2,…12 найти уровни Т для каждого момента времени. 5) Найти уровни временного ряда, умножив уровни Т на значения сезонной компоненты для соответствующих кварталов. 6) Расчет ошибки в мультипликативной модели производится по формуле E=Yt-(T*S) (графа 7). Пусть необходимо дать прогноз прибыли в течение первого полугодия следующего года. Прогнозное значение Ft уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компоненты. Для определения трендовой компоненты следует воспользоваться уравнением тренда Т=87,022-2,076t. Т13=87,022-2,076*13=60,034. Т14=87,022-2,076*14=57,958. Значения сезонной компоненты S1=0,8983; S2=1,2104. F13= Т13* S1=60,034*0,8983=53,928 F14= Т14* S2=57,958*1,2104=70,152 Прогноз ожидаемой прибыли компании на первое полугодие составит: 53,928+70,152=124,080 тыс. у.ед. Вопросы для самоконтроля: 1. Какая модель временного ряда называется аддитивной? 2. Какая модель временного ряда называется мультипликативной? 3. Перечислить этапы построения аддитивной и мультипликативной моделей временного ряда? 4.Как рассчитывается скорректированная сезонная компонента в мультипликативной модели временного ряда? 5. Как рассчитывается прогнозное значение по мультипликативной модели временного ряда? Рекомендуемая литература: 1."Эконометрика" под редакцией И.И. Елисеевой, М: Финансы и статистика", 2002 2."Практикум по эконометрике" под редакцией И.И. Елисеевой, М: Финансы и статистика, 2002 3.Кристофер Доугерти "Введение в эконометрику" М: Ифра-М, 1999 4.Мардас А.Н. "Эконометрика" Учебное пособие, С-Пб "Питер", 2001 5.Бережная Е.В., Бережной В.И. "Математические методы моделирования экономических систем" М: Финансы и статистика, 2003 6.Магнус Я.Р., Катышев П.К., Пересецкий А.А. "Эконометрика. Начальный курс" М: Дело, 1998 Лекция №10 Тема: Прогнозирование временных рядов Содержание лекции. 1.Экспоненциальное сглаживание. 2. Экспоненциальное сглаживание с поправкой на тренд Цель: Раскрыть сущность и порядок экспоненциального сглаживания временного ряда 1. Простая и логически ясная модель временного ряда имеет следующий вид: где b — константа, а ε — случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание именно так и построено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определенное окно. Точная формула простого экспоненциального сглаживания имеет вид: Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра α. Если α равен 1, то предыдущие наблюдения полностью игнорируются. Если а равен 0, то игнорируются текущие наблюдения. Значения α между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз. На практике обычно рекомендуется брать α меньше 0,30. Однако выбор а больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение α по реальным данным, чем использовать общие рекомендации. На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от α =0,1 до α = 0,9 с шагом 0,1. Затем выбирается такое значение α, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной. Microsoft Excel располагает функцией Экспоненциальное сглаживание (Exponential Smoothing), которая обычно используется для сглаживания уровней эмпирического временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools - Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Экспоненциальное сглаживание. В результате появится диалоговое окно Экспоненциальное сглаживание, представленное на рис. В диалоговом окне Exponential Smoothing задаются практически те же параметры, го и в рассмотренном выше диалоговом окне Moving Average. 1. Input Range (Входные данные) — в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра. 2. Labels (Метки) — данный флажок опции устанавливается в том случае, если первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия. 3. Damping factor (Фактор затухания) — в это поле вводится значение выбранного коэффициента экспоненциального сглаживания α. По умолчанию принимается значение α = 0,3. 4. Output options (Параметры вывода) — в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Errors (Стандартные погрешности). Воспользуемся функцией Экспоненциальное сглаживание для повторного решения рассмотренной выше задачи, но уже с помощью метода простого экспоненциального сглаживания. На рис. показаны рассчитанные показатели и построенные графики Вопросы для самоконтроля: 1. Как называется метод прогнозирования, при котором более поздним данным приписываются большие веса, чем более ранним? 2.Формула записи определения прогнозного значения показателя по методу экспоненциального сглаживания. 3. Порядок определения прогнозного значения показателя по методу экспоненциального сглаживания с помощью функций Microsoft Excel. Рекомендуемая литература: 1. Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 3. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Лекция № 11 Тема: Прогнозирование временных рядов Содержание лекции. 1.Авторегрессионные модели 2. Прогонозирование социально-экономических процессов. Цель: Охарактеризовать авторегрессионные модели и методы прогонозирования социально-экономических процессов: методы экспертных оценок, методы теории катастроф и сценарное прогнозирование. 1.К динамическим эконометрическим моделям относят модели, которые в данный момент времени учитывают значения входящих в неё переменных, относящихся к текущему и предыдущему моментам времени, например, yt=f(xt;xt-1). Выделяют два типа динамических эконометрических моделей: 1) Модели, в которых лаговые значения переменных (переменных, относящихся к предыдущим моментам времени) непосредственно включены в модель. Это модели авторегрессии и модели с распределенным лагом. Модели авторегрессии – это динамические эконометрические модели, в которых в качестве факторных переменных содержатся лаговые значения результативной переменной. Например, yt=a+b0xt+c1yt1+et.Модели с распределенным лагом - динамические эконометрические модели, в которых содержатся не только текущие, но и лаговые значения факторных переменных. Например, yt=a+b0xt+b1xt-1+…+bLxt-L+et. 2) Модели, в которых включены переменные, характеризующие ожидаемый или желаемый уровень признака – результата или одного из факторов в момент времени t. Этот уровень считается неизвестным и определяется с учетом информации, которой располагают в предыдущий момент времени t-1. В модели авторегрессии yt=a+b0xt+c1yt-1+et коэффициент b0 – характеризует краткосрочное изменение у под влиянием изменения х на единицу своего измерения. Коэффициент c1 характеризует изменение у в момент t под воздействием своего изменения в предшествующий момент времени (t-1). Произведение коэффициентов (b0 c1) называют промежуточным мультипликатором. Данный показатель характеризует общее абсолютное изменение результата у в момент (t+1). Показатель b=b0+b0c1+b0c21+b0c31+…- называют долгосрочным мультипликатором. Он характеризует общее абсолютное изменение у в долгосрочном периоде. При построении моделей авторегресссии возникает проблема: нарушается первая предпосылка нормальной линейной модели регрессии об отсутствии связи между факторными признаками и случайной составляющей. В модели авторегрессиии факторный признак yt-1 связан со случайной составляющей et-1. Поэтому применение обычного МНК для оценки параметров уравнения регрессии приводит к получению смещенной оценки параметра при переменной yt-1. Модель адаптивных ожиданий (МАО) учитывает желаемое (ожидаемое) значение факторного * * признака хt +1 . Пример МАО: ожидаемое в будущем (в период (t+1)) значение курса доллара хt +1 влияет на yt . Или другой пример: ожидаемое значение заработной платы хt*+1 влияет на уровень безработицы в текущем периоде y t . В общем виде модель адаптивных ожиданий можно инвестиции в текущем периоде записать так: y t = a + b0 ⋅ xt +1 + u t . Желаемое (ожидаемое) значение переменных определяется по значению реальных (фактических) переменных в предыдущий период времени (t). Модель частичной корректировки (МЧК) учитывает желаемое (ожидаемое) значение * * результативного признака у t . Примером МЧК может служить модель Литнера: фактический объем прибыли х t оказывает влияние на величину желаемого объема дивидендов у t* . В общем виде модель частичной корректировки можно записать так: y t = a + b0 ⋅ xt + u t . * 2. Экспертные оценки Сущность методов экспертных оценок заключается в том, что в основу прогноза закладывается мнение специалиста или коллектива специалистов, основанное на профессиональном, научном и практическом опыте. Различают индивидуальные и коллективные экспертные оценки. Индивидуальные экспертные оценки основаны на использовании мнений экспертов-специалистов соответствующего профиля. К этим методам относятся: методы «интервью», аналитический, написания сценария. Метод «интервью» предполагает беседу прогнозиста с экспертом по схеме «вопрос-ответ», в процессе которой прогнозист в соответствии с разработанной программой ставит перед экспертом вопросы относительно перспектив развития прогнозируемого объекта. Аналитический метод предусматривает тщательную самостоятельную работу эксперта над анализом тенденций, оценкой состояния и путей развития прогнозируемого объекта. Свои выводы он оформляет в виде докладной записки. Методы коллективных экспертных оценок предполагают определение степени согласованности мнений экспертов по перспективным направлениям развития объекта прогнозирования, сформулированными отдельными специалистами. К методам коллективных экспертных оценок относятся: метод коллективной генерации идей, метод «635», метод «Дельфи», метод «комиссий», метод написания сценария. Суть метода коллективной генерации идей («мозговой атаки») состоит в использовании творческого потенциала специалистов при «мозговой атаке» проблемной ситуации, реализующей вначале генерацию идей, а затем их деструктурирование (разрушение, критику) с выдвижением контридей и выработкой согласованной точки зрения. Метод «635» - одна из разновидностей «мозговой атаки». Цифры обозначают шесть участников, каждый из которых должен записать три идеи в течение 5 минут. Лист ходит по кругу. За полчаса каждый запишет по 18 идей, а все вместе – 108. Это метод широко используется для отбора из множества идей наиболее оригинальных и прогрессивных по решению определенных проблем. Метод «Дельфи» используется при прогнозировании развития науки и техники, инвестиций и др. аспектов. Цель метода – разработка программы последовательных многотуровых индивидуальных опросов. Опрос экспертов проводится в форме анкет-вопросников. Затем осуществляется их статистическая обработка на компьютере и формируется коллективное мнение группы, выявляются и обобщаются аргументы в пользу различных суждений. Метод «комиссий» основан на работе специальных комиссий. Группы экспертов за «круглым столом» обсуждают ту или иную проблему с целью согласования точек зрения и выработке единого мнения. Метод написания сценария основан на определении логики процесса или явления во времени при различных условиях. Он предполагает установление последовательности событий, развивающихся при переходе от существующей ситуации к будущему состоянию объекта. Прогнозирование неустойчивости методами теории катастроф Теория катастроф представляет собой исследовательскую программу изучения и прогнозирования неустойчивости различных систем. Такое название она получила потому, что потеря устойчивости по своим проявлениям может быть катастрофична, даже если не приводит к гибели или разрушению системы, а лишь обуславливает переход к иной траектории развития. Простейшая программа прогнозирования элементарной катастрофы в экономической или производственной системе может быть построена на основе данных о связи переменных, характеризующих её поведение. Функции, описывающие эти связи, могут быть получены эконометрическими методами. Например, связь двух переменных величин можно представить уравнением у = х / 3 + а ⋅ х , (1) где у и х – переменные, а – параметр, множитель 1/3 в первое слагаемое введен для упрощения преобразований. 3 Уравнение (1) представляет собой функцию, характер которой определяется величиной параметра а. Если этот параметр положителен, то функция носит монотонный характер, её график – плавно монотонно возрастающая кривая. Но если параметр а уменьшается, то при нулевом его значении тип функции меняется. При нулевом значении параметра изменяются характер связи в системе и поведении системы, это изменение называется бифуркацией. При отрицательной величине параметра а функция, описываемая уравнением (1), представляет собой уже немонотонную функции. Она имеет максимум и минимум при значениях х = ± а . Связь между переменными в определенной окрестности начала координат будет не однозначной. Одному значению переменной у будут соответствовать теперь три разных по величине значения переменной х. Таким образом, при монотонном плавном изменении переменной у переменная х будет изменяться скачкообразно. Это и будет катастрофа. Если установлено, что между переменными, характеризующими поведение системы, связь описывается уравнением вида (1), то можно утверждать, что в системе возможно проявление неустойчивости. Если параметр а положителен, но выявлена тенденция его уменьшения, то можно считать, что система приближается к катастрофе. В обоих случаях необходимо продолжить изучение системы и выявить условия или возможные сроки наступления катастрофы, оценить её вероятные последствия. Тип элементарной катастрофы, определяемой связью, которая описывается уравнением (1), носит название катастрофы складки, поскольку в пространстве трех координат – двух переменных и параметра а – поверхность, описываемая уравнением, имеет вид складки, начинающейся при а=0 и углубляющейся по мере дальнейшего уменьшения параметра. Элементарная теория катастроф основывается на теореме Тома и классификации Арнольда. Они определили простейшие формы устойчивых и неустойчивых связей в системах – формы катастроф. Сценарное прогнозирование. Метод сценариев – эффективное средство для организации и прогнозирования, объединяющего качественный и количественный подходы. Сценарий – это модель будущего, в которой описывается возможный ход событий с указанием вероятностей их реализации. В сценарии определяются основные факторы, которые должны быть приняты во внимание, и указывается, каким образом эти факторы могут повлиять на предполагаемые события. Как правило, составляется несколько альтернативных вариантов сценариев. Сценарий, таким образом, - это характеристика будущего в изыскательском прогнозе, а не определение одного возможного или желательного состояния будущего. Обычно наиболее вероятный вариант сценария рассматривается в качестве базового, на основе которого принимаются решения. Другие варианты сценария, рассматриваемые в качестве альтернативных, планируются в том случае, если реальность в большей мере начинает приближаться к их содержанию, а не к базовому варианту сценария. Сценарии обычно представляют собой описание событий и оценки показателей и характеристик во времени. Метод подготовки сценариев вначале использовался для выявления возможных результатов военных действий. Позже сценарное прогнозирование стали применять в экономической политике, а затем и в стратегическом корпоративном планировании. Теперь это наиболее известный интеграционный механизм прогнозирования экономических процессов в условиях рынка. Сценарии являются эффективным средством преодоления традиционного мышления. Сценарий – это анализ быстро меняющегося настоящего и будущего, его подготовка заставляет заниматься деталями и процессами, которые могут быть упрощены при изолированном использовании частных методов прогнозирования. Поэтому сценарий отличается от простого прогноза. Он является инструментом, который используется для определения видов прогнозов, которые должны быть разработаны, чтобы описать будущее с достаточной полнотой, с учетом всех главных факторов. Использование сценарного прогнозирования в условиях рынка обеспечивает: -лучшее понимание ситуации, её эволюции; -оценку потенциальных угроз; -выявление благоприятных возможностей; -выявление возможных и целесообразных направлений деятельности; -повышение уровня адаптации к изменениям внешней среды. Сценарное прогнозирование является эффективным средством подготовки плановых решений как на предприятии, так и в государстве. Вопросы для самоконтроля: 1. Как называется метод прогнозирования, при котором более поздним данным приписываются большие веса, чем более ранним? 2. Какие виды моделей относятся к динамическим эконометрическим моделям? 3. Общий вид записи модели авторегрессии. 4. Как записывается в общем виде модель адаптивных ожиданий? 5. Как записывается в общем виде модель частичной корректировки? 6. В чем заключается сущность методов экспертных оценок? 7. Какие методы экспертных оценок вы знаете? 8. В чем заключается сущность программы прогнозирования катастрофы в экономической системе? 9.Перечислите формы катастроф. Рекомендуемая литература: 1. Басовский А.Е. «Прогнозирование и планирование в условиях рынка», М:Инфра-М, 2006г 2. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 1/ 2 Лекция №12 Тема: Многомерный статистический анализ Содержание лекции. 1. Представление информации в многомерном пространстве. 2. Факторный анализ. 3 Метод главных факторов Цель: Дать характеристику метода факторного анализа и метода главных компонент. 1. Сценарное моделирование экономических процессов (явлений, ситуаций), т.е. воспроизведение в модели реальной действительности, характеризующейся множеством взаимосвязей многочисленных показателей, каждый из которых подвержен случайным колебаниям значений (как в количественном, так и в качественном выражении), предполагает прежде всего установление границ упорядоченности наблюдаемых объектов изучения, их классификации по тем или иным признакам (критериям). И уже затем можно ставить задачу диагностирования экономического состояния рассматриваемого объекта, прогнозирования его поведения в будущем, снижения риска развития неблагоприятных тенденций. Решение задач диагностирования состояний наблюдаемой совокупности экономических объектов предполагает предварительную их классификацию – определение правил отнесения исследуемых объектов к тому или иному классу. Под классом в теории распознавания образов понимается совокупность объектов, обладающих определенным свойством. В другой интерпретации классы – множества состояний объекта, обладающие свойством либо нормальности, либо предкризисности относительно угроз финансовой несостоятельности или банкротства. Наиболее теоретически обоснованным подходом к решению задачи классификации наблюдений является классификация на основе математической статистики, из которой к настоящему времени выделились самостоятельные разделы: кластерный анализ, дискриминантный анализ и индикативный анализ. Решение задачи классификации подразумевает: - получение описаний классов в виде функций от включаемых в расчет переменных, что необходимо для определения границ классов; - идентификацию объектов с неизвестной классовой принадлежностью. Количественной характеристикой класса является мера сходства (подобия) между объектами, составляющими данный класс. Формализация понятия меры сходства основана на гипотезе «компактности», т.е. нахождении среди всего множества объектов групп «похожих» объектов. Наибольшее распространение на практике получили три меры сходства: коэффициенты подобия, коэффициенты связи (корреляции), показатели расстояния в метрическом пространстве. Коэффициенты подобия удобно определять для величин, представленных в двоичном коде. Для перевода в двоичный код количественных десятичных признаков необходимо их значащие разряды разложить по степеням числа 2. Качественные признаки класса кодируются проще: есть –«1», нет - «0». Обозначим: b – общее число единичных признаков; т (jm1,1) - число совпадающих единичных признаков у обоих изучаемых объектов; т (jm0,0) - число совпадающих нулевых признаков у обоих изучаемых объектов; т (jm1, 0) - число совпадающих единичных признаков у j-объекта и нулевых у т-объекта; т (jm0,1) - число совпадающих нулевых признаков у j-объекта и единичных у т-объекта; Р jm = т (jm1,1) + m (jm0, 0) - общее число совпадающих признаков; q jm = т (jm1, 0) + m (jm0,1) - общее число несовпадающих признаков. Существует много различных измерителей подобия. Наиболее распространенные из них: 1)общепринятого названия нет: 2) коэффициент Рао: S jm = S jm = Р jm b (0 ≤ S jm ≤ 1) m (jm1,1) 3) коэффициент Хаммана: S jm b = Pjm − q jm b 4) коэффициент Роджерса-Танимото: S jm = m (jm1,1) m (j1) + m m(1) − m (jm1) 5) коэффициент Дейка: S jm = 2m (jm1,1) 2m (jm1,1) + q jm Чем ближе значение коэффициента S jm к единице, тем больше объекты «похожи» друг на друга. Коэффициент корреляции, как мера сходства случайных величин, вычисляется по формуле: n ∑x ij xim i =1 r jm = n , где xij и xim – отклонения соответствующих компонент вектора наблюдения от своих n ∑x ∑x 2 ij i =1 2 im i =1 средних значений. Коэффициент корреляции чаще всего используется для группирования не объектов, а составляющих (переменных) векторов. Расстояние между объектами как мера сходства выражается через функцию расстояния. Наиболее распространенные из них: 1)Функция Хемминга: d ( x j , x m ) = n ∑x ij − xim i =1 2) евклидово расстояние: d ( x j , x m ) ∑ (x n = − xim ) 2 ij i =1 3) взвешенное евклидово расстояние отличается дополнительным подбором весов wj: d w ( x j , xm ) = n ∑ w (x j ij − xim ) 2 i =1 Под решением задачи классификации понимается установление правил отнесения нового объекта к одной (или нескольким) группе на основе измерения некоторого числа его характеристик и описание классов. Эффективность и целесообразность применения различных методов классификации обусловлена исходной математической моделью и постановкой задачи, а также качеством исходной информации. 2.Факторный анализ. Компонентный анализ является методом определения структурной зависимости между случайными величинами, в результате использования которого получается сжатое описание малого объема, несущее почти всю информацию, содержащуюся в исходных данных. Главные компоненты Y1, Y2,…Ym получатся из исходных переменных X1,X2,…,Xm путем целенаправленного вращения, т.е. как линейные комбинации исходных переменных. Вращение производится таким образом, чтобы главные компоненты были ортогональны и имели максимальную дисперсию среди возможных линейных комбинаций исходных переменных Х. При этом переменные Y1, Y2,…Ym некоррелированы между собой и упорядочены по убыванию дисперсии. Кроме того, общая дисперсия после преобразования остается без изменений. Итак, i-я m компонента Yi: Yi = ∑ α ij x j ; j =1 m ∑α 2 ij = 1, i = 1,..., m j =1 Пусть R-корреляционная матрица переменных Х. Тогда α ij - первый собственный вектор матрицы R и т.д. Кроме того, дисперсия первой главной компоненты равна первому собственному числу матрицы R, дисперсия второй главной компоненты равна второму собственному числу матрицы R и т.д. Факторный анализ – более общий метод преобразования исходных переменных по сравнению с компонентным анализом. Структура отчета может включать 5 таблиц (собственные значения, прямая и повернутая матрицы факторов, оценки общности, значения главных факторов). Модель факторного анализа имеет вид: p Х i = ∑ λij F j + ei j =1 где λij - постоянные величины, называемые факторными нагрузками; F j - общие факторы, используемые для представления всех р исходных переменных; ei - специфические факторы, уникальные для каждой переменной, p ≤ m . Задачами факторного анализа являются определение числа общих факторов, определение оценок λ , определение общих и специфических факторов. 3. Метод главных факторов Как правило, основной задачей факторного анализа является нахождение сокращенной системы существенных факторов в пространстве регистрируемых переменных, что включает следующие этапы: -выделение первоначальных факторов; этот этап включает вычисление главных компонент т выбор в качестве факторов тех компонент, которые отвечают за большую часть дисперсии, рассеяния данных наблюдения; -вращение выделенных факторов с целью облегчения их интерпретации в терминах исходных переменных; содержательная интерпретация новых факторов является творческой задачей исследователя, выходящей за рамки формального метода, однако она может нести много полезного для дальнейшего понимания объекта исследования. Исходные данные представляются в виде матрицы размером тхп, содержащей данные одного из следующего типов: значения т переменных для п объектов; квадратная матрица корреляции между т переменными. Анализ выполняется следующим образом. Если исходные данные представляют собой значения т переменных для п объектов, то можно использовать один из двух методов анализа: по корреляционной матрице и по ковариационной матрице. Использование ковариационной матрицы сравнительно менее употребительно и позволяет в вычислениях учитывать не только степень взаимосвязанности, коррелированности переменных, но и абсолютную величину ковариаций. Производится выделение главных компонент, для каждого компонента находят: -собственное значение, пропорциональное части общей дисперсии экспериментальных данных, приходящейся на данный фактор, то есть объясняемой им; -процент полной дисперсии, приходящейся на каждый фактор; процент накопленной дисперсии. Малозначительные компоненты, собственные значения которых составляют менее 1-2% накопленной дисперсии, обычно опускаются. В процессе анализа могут быть получены следующие результаты: -матрица собственных векторов аij , в которой соответствуют исходным переменным Х, столбцы – факторам Z , её элементы представляют собой коэффициенты перехода от системы исходных координат Х к координатной системе факторов Z: z i = ∑ аij ⋅ x j ; - таблица координат объектов в новой системе факторов (только для исходных данных типа переменныеобъекты); - рисунки проекций объектов в новой системе координат на плоскость двух факторов, номера которых указываются в следующем бланке; -график собственных значений факторов в порядке их убывания, который облегчает выбор числа значимых факторов; -значения нагрузок каждой исходной переменной. Показывающие относительные величины проекции переменной на факторную координатную ось; чем больше нагрузка, тем больше близость фактора к исходной переменной, меньше угол девиации между ними в многомерном пространстве; -графики факторных нагрузок в проекции на плоскости каждой из двух выбранных переменных. Вопросы для самоконтроля: 1.Охарактеризуйте метод факторного анализа. 2. Охарактеризуйте метод компонентного анализа. 3. Перечислить этапы метода главных компонет. Рекомендуемая литература: 1. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 2. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 3. Басовский Л.Е. «Прогнозирование и планирование в условиях рынка», М:ИНФРА-М, 2006 Лекция №13 Тема: Многомерный статистический анализ Содержание лекции. 1. Дисперсионный анализ влияния качественных факторов. 2. Многомерное шкалирование. Классическая модель многомерного шкалирования. 1.Дисперсионный анализ (от латинского Dispersio - рассеивание) - статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации. Основные понятия дисперсионного анализа В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия σ2. Она является мерой вариации частных средних по группам определяется по формуле: вокруг общей средней и , где k - число групп; nj - число единиц в j-ой группе; - частная средняя по j-ой группе; - общая средняя по совокупности единиц. Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия σj2. . Между общей дисперсией σ02, внутригрупповой дисперсией σ2 и межгрупповой дисперсией существует соотношение: σ02 = + σ2. Внутригрупповая дисперсия объясняет влияние неучтенных при группировке факторов, а межгрупповая дисперсия объясняет влияние факторов группировки на среднее значение по группе. Однофакторный комплекс Изучается влияние на нормально распределенный результативный признак одного контролируемого фактора , имеющего уровней . Под уровнем фактора подразумевается его мера или состояние, т.е. некоторое количественное или качественное значение. Двухфакторный комплекс Изучается влияние на нормально распределенный результативный признак фактора , имеющего уровней и фактора с уровнями . Определение оценок параметров классической линейной модели множественной регрессии с помощью метода наименьших квадратов Регрессионный анализ - это статистический метод исследования зависимости случайной величины Y от переменных Xj (j = 1, 2, ., k), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения Xj. Наиболее часто используемая множественная линейная модель регрессионного анализа имеет вид: y = β0 +β1хi1 + .+βjxij+ .+βkxik+εi (2.1) где εi - случайные ошибки наблюдения, независимые между собой, имеют нулевую среднюю и дисперсию σ2 В матричной форме регрессионная модель имеет вид: Y = Xβ + ε (2.2) где Y - случайный вектор - столбец размерности (n x 1) наблюдаемых значений результативного признака (y1, y2, ., yn); X - матрица размерности [n x (k+1)] наблюдаемых значений аргументов. Элемент матрицы xij рассматривается как неслучайная величина (i =1,2, .,n; j=0,1,2, .k; x=1); β-вектор - столбец размерности [(k+1) x 1] неизвестных, подлежащих оценке параметров (коэффициентов регрессии) модели; ε-случайный вектор столбец размерности (n x 1) ошибок наблюдений (остатков). Компоненты вектора ε независимы между собой, имеют нормальный закон распределения с нулевым математическим ожиданием (Mε=0) и неизвестной дисперсией σ2 (D εi = σ2). 2.Задача многомерного шкалирования состоит в построении переменных на основе имеющихся расстояний между объектами. В частности, если нам даны расстояния между городами, программа многомерного шкалирования должна восстановить систему координат (с точностью до поворота и единицы длины) и приписать координаты каждому городу, так чтобы зрительно карта и изображение городов в этой системе координат совпали. Близость может определяться не только расстоянием в километрах, но и другими показателями, такими как размеры миграционных потоков между городами, интенсивность телефонных звонков, а также расстояниями в многомерном признаковом пространстве. В последнем случае задача построения такой системы координат близка к задаче, решаемой факторным анализом - сжатию данных, описанию их небольшим числом переменных. Нередко требуется также наглядное представление свойств объектов. В этом случае полезно придать координаты переменным, расположить переменные в геометрическом пространстве. С технической точки зрения это всего лишь транспонирование матрицы данных. Для определенности мы будем говорить о создании геометрического пространства для объектов, специально оговаривая случаи анализа множества свойств. В социальных исследованиях методом многомерного шкалирования создают зрительный образ «социального пространства» объектов наблюдения или свойств. Для такого образа наиболее приемлемо создание двумерного пространства. Основная идея метода состоит в приписывании каждому объекту значений координат, так, чтобы матрица евклидовых расстояний между объектами в этих координатах, умноженная на константу, оказалась близка к матрице расстояний между объектами, определенной из каких-либо соображений ранее. Метод весьма трудоемкий и рассчитан на анализ данных, имеющих небольшое число объектов. Многомерное шкалирование - это не просто определенная процедура, а скорее способ наиболее эффективного размещения объектов, приближенно сохраняющий наблюдаемые между ними расстояния. Другими словами, МНШ размещает объекты в пространстве заданной размерности и проверяет, насколько точно полученная конфигурация сохраняет расстояния между объектами. МНШ использует алгоритм минимизации некоторой функции, оценивающей качество получаемых вариантов отображения. Меры качества отображения: стресс. Мерой, наиболее часто используемой для оценки качества подгонки модели (отображения), измеряемого по степени воспроизведения исходной матрицы сходств, является так называемый стресс. Величина стресса Phi в для текущей конфигурации определяется так: Phi = [dij - f ( ij)]2 Здесь dij - воспроизведенные расстояния в пространстве заданной размерности, а ij (дельтаij) - исходное расстояние. Функция f ( ij)обозначает неметрическое монотонное преобразование исходных данных (расстояний). Таким образом, МНШ воспроизводит не количественные меры сходств объектов, а лишь их относительный порядок. Обычно используется одна из несколько похожих мер сходства. Тем не менее, большинство из них сводится к вычислению суммы квадратов отклонений наблюдаемых расстояний (либо их некоторого монотонного преобразования) от воспроизведенных расстояний. Таким образом, чем меньше значение стресса, тем лучше матрица исходных расстояний согласуется с матрицей результирующих расстояний. Диаграмма Шепарда. Можно построить для текущей конфигурации точек график зависимости воспроизведенных расстояния от исходных расстояний. Такая диаграмма рассеяния называется диаграммой Шепарда. По оси ординат OY показываются воспроизведенные расстояния (сходства), а по оси OX откладываются истинные сходства (расстояния) между объектами (отсюда обычно получается отрицательный наклон). На этом график также строится график ступенчатой функции. Ее линия представляет так называемые величины D-с крышечкой, то есть, результат монотонного преобразования f( ) исходных данных. Если бы все воспроизведенные результирующие расстояния легли на эту ступенчатую линию, то ранги наблюдаемых расстояний (сходств) был бы в точности воспроизведен полученным решением (пространственной моделью). Отклонения от этой линии показывают на ухудшение качества согласия (т.е. качества подгонки модели). Чем больше размерность пространства, используемого для воспроизведения расстояний, тем лучше согласие воспроизведенной матрицы с исходной (меньше значение стресса). Если взять размерность пространства равной числу переменных, то возможно абсолютно точное воспроизведение исходной матрицы расстояний. Однако нашей целью является упрощение решаемой задачи, с тем, чтобы объяснить матрицу сходства (расстояний) в терминах лишь нескольких важнейших факторов (латентных переменных или вспомогательных шкал). Возвращаясь к нашему примеру с расстояниями между городами, если получена двумерная карта, намного проще представить себе расположение городов и планировать передвижение между ними, чем если бы имелась только матрица попарных расстояний. Причины плохого качества отображения. Обсудим, почему уменьшение числа факторов (или вспомогательных шкал) может приводить к ухудшению представления исходной матрицы. Обозначим буквами A, B, C и D, E, F две тройки городов. Соответствующие им точки и попарные расстояния между ними показаны в двух табличках (матрицах). A B C D E F A 0 D0 B 90 0 E 90 0 C 90 90 0 F 180 90 0 Первой матрице соответствует случай когда города удалены друг от друга в точности на 90 километров, а второй - когда города D и F удаляются на 180 километров. Можно ли три точки, соответствующие городам (объектам) расположить в одномерном пространстве (на прямой)? Действительно, три точки, соответствующие городам D, E и F могут быть расположены на прямой линии:D---90 км---E---90 км---F D удален на 90 км от города E, и E - на 90 км от F, а город D удален на 90+90=180 км от F. Если попытаться проделать тоже самое с городами A,B и C, то видно, что соответствующие им точки уже нельзя разместить на прямой с сохранением исходной структуры расстояний. Однако эти точки можно расположить на плоскости, например, в виде треугольника: A 90 км 90 км 90 км C B Располагая эти три точки так, можно в точности воспроизвести все расстояния между ними. Без лишних деталей, этот пример показывает, как конкретная матрица расстояний (сходств) связана с числом искомых латентных переменных (размерностью результирующего пространства). Конечно, "реальные" данные никогда не являются такими "точными", и содержат случайный шум, т.е. случайную изменчивость, влияющую на различие между воспроизведенной и исходной матрицей. Лекция №14 Тема: Многомерный статистический анализ Содержание лекции. 1.Ранговая корреляция. 2.Таблица сопряженности. 3.Ранговые методы Цель: Раскрыть сущность ранговой корреляции., охарактеризовать методы ранговой корреляции Спирмена и Кендалла. 1. Ранговая корреляция. Таблица сопряженности Наряду с линейным коэффициентом корреляции r для измерения тесноты связи между двумя коррелируемыми признаками часто используются менее точные, но более простые по расчету непараметрические показатели, к которым относятся коэффициенты корреляции рангов Спирмена ρ и Кендалла τ . Ранг – это порядковый номер, присваемый каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать в одном и том же порядке: от меньших значений к большим, и наоборот. Если встречается несколько одинаковых значений х (или у), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений. 2. Ранговые методы Коэффициенты Спирмена, Кендалла. Для расчета коэффициента Спирмена значения признаков х и у нумеруют в порядке возрастания от 1 до п, т.е. им присваивают определенный ранг (Nx, Ny). Затем для каждой пары находят их разность (d=Nx Ny) и квадраты этой разности суммируют. Коэффициент корреляции рангов Спирмена: ρ = 1− 6∑ d 2 ( ) n n2 −1 где d – разность рангов х и у; п – число наблюдаемых пар значений х и у. Коэффициент Спирмена может принимать значения 0 до ± 1 Коэффициент корреляции рангов Кедалла строится несколько по-другому. Ранги х (Nx) располагаются строго в порядке возрастания и параллельно записывают соответствующее каждому значению Nx значение Ny . Поскольку Nx записаны строго по возрастанию, то ставится задача определить меру соответствия последовательности Ny «правильному» следованию Nx. При этом каждого Ny последовательно определяют число следующих за ним рангов, превышающих его значение, и число рангов, меньших по значению. Первые («правильное» следование) учитываются как баллы со знаком «+», а их сумма обозначается через Р. Вторые («неправильное» следование) учитываются как баллы со знаком «-», и их сумма обозначается буквой Q. Затем суммируются все положительные и отрицательные баллы (S=P+Q). Отношение данной суммы S к максимальному значению одного из слагаемых и представляет собой коэффициент корреляции рангов Кендалла, τ= τ= 2S . n(n − 1) Если же встречается несколько одинаковых значений х (или у), т.е. ранги повторяются, становятся связанными, коэффициент корреляции рангов Кендалла определяется по S формуле: n (n − 1) n (n − 1) − U x −U y 2 2 где S - фактическая общая сумма баллов при оценке +1 каждой пары рангов с одинаковым порядком изменения и -1 каждой пары рангов с обратным порядком изменения; U x = U y = ∑ t (t − 1) 2 - число баллов, корректирующих (уменьшающих) максимальную сумму баллов за счет повторений (объединений) t рангов в каждом ряду. Вопросы для самоконтроля: 1. В чем заключается сущность ранговой корреляции? 2. Как рассчитываются коэффициенты Спирмена и Кендалла? Рекомендуемая литература: 1. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 2. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г Лекция № 15 Тема: Многомерный анализ данных Содержание лекции. 1. Неметрические методы. 2. Кластерный анализ. 3. Иерархические методы (параллельные и последовательные) Цель: Дать характеристику методам многомерного анализа данных и методы расчета коэффициентов подобия, охарактеризовать сущность и методы кластерного анализа. 1. Неметрические методы. Сценарное моделирование экономических процессов (явлений, ситуаций), т.е. воспроизведение в модели реальной действительности, характеризующейся множеством взаимосвязей многочисленных показателей, каждый из которых подвержен случайным колебаниям значений (как в количественном, так и в качественном выражении), предполагает прежде всего установление границ упорядоченности наблюдаемых объектов изучения, их классификации по тем или иным признакам (критериям). И уже затем можно ставить задачу диагностирования экономического состояния рассматриваемого объекта, прогнозирования его поведения в будущем, снижения риска развития неблагоприятных тенденций. Решение задач диагностирования состояний наблюдаемой совокупности экономических объектов предполагает предварительную их классификацию – определение правил отнесения исследуемых объектов к тому или иному классу. Под классом в теории распознавания образов понимается совокупность объектов, обладающих определенным свойством. В другой интерпретации классы – множества состояний объекта, обладающие свойством либо нормальности, либо предкризисности относительно угроз финансовой несостоятельности или банкротства. Наиболее теоретически обоснованным подходом к решению задачи классификации наблюдений является классификация на основе математической статистики, из которой к настоящему времени выделились самостоятельные разделы: кластерный анализ, дискриминантный анализ и индикативный анализ. Количественной характеристикой класса является мера сходства (подобия) между объектами, составляющими данный класс. Формализация понятия меры сходства основана на гипотезе «компактности», т.е. нахождении среди всего множества объектов групп «похожих» объектов. Наибольшее распространение на практике получили три меры сходства: коэффициенты подобия, коэффициенты связи (корреляции), показатели расстояния в метрическом пространстве. Коэффициенты подобия удобно определять для величин, представленных в двоичном коде. Для перевода в двоичный код количественных десятичных признаков необходимо их значащие разряды разложить по степеням числа 2. Качественные признаки класса кодируются проще: есть –«1», нет - «0». Существует много различных измерителей подобия. Наиболее распространенные из них: 1)общепринятого названия нет: S jm = 3) коэффициент Хаммана: S jm = коэффициент Дейка: S jm = Р jm b Pjm − q jm b m (jm1,1) (0 ≤ S jm ≤ 1) 2) коэффициент Рао: S jm = 4) коэффициент Роджерса-Танимото: S jm b = m (jm1,1) 5) m (j1) + m m(1) − m (jm1) 2m (jm1,1) 2m (jm1,1) + q jm Коэффициент корреляции, как мера сходства случайных величин, вычисляется по формуле: n r jm = ∑x ij xim , где xij и xim – отклонения соответствующих компонент вектора наблюдения от своих i =1 n n ∑x ∑x 2 ij i =1 2 im i =1 средних значений. Коэффициент корреляции чаще всего используется для группирования не объектов, а составляющих (переменных) векторов. Расстояние между объектами как мера сходства выражается через функцию расстояния. Наиболее распространенные из них: n 1)Функция Хемминга: d ( x j , x m ) = ∑ x ij − x im i =1 2) евклидово расстояние: d ( x , x ) = j m ∑ (x n − xim ) 2 ij i =1 3) взвешенное евклидово расстояние отличается дополнительным подбором весов wj: d w ( x j , xm ) = n ∑ w (x j ij − xim ) 2 Под решением задачи классификации понимается установление правил i =1 отнесения нового объекта к одной (или нескольким) группе на основе измерения некоторого числа его характеристик и описание классов. Эффективность и целесообразность применения различных методов классификации обусловлена исходной математической моделью и постановкой задачи, а также качеством исходной информации. 2. Кластерный анализ. Кластерный анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого критерия классификации, удовлетворяющего следующим требованиям: - внутри групп объекты должны быть тесно связаны между собой; - объекты разных групп должны быть далеки друг от друга; - при прочих равных условиях распределение объектов по группам должно быть равномерным. Относительно априорной информации об окончательном числе классов, на которые требуется разбить исследуемую совокупность объектов, задачи кластер-анализа разделяются на три типа: 1) число классов априори задано; 2) число классов неизвестно и подлежит определению (оценке); 3) число классов неизвестно, но его определение и не входит в условие задачи, требуется построить иерархическое дерево исследуемой совокупности. 3. Иерархические методы (параллельные и последовательные) Задачи кластер-анализа разделяются на иерархические и неирархические (последовательные и параллельные). Иерархические алгоритмы предназначены для наглядного представления о структуре всей исследуемой совокупности объектов, они основаны на последовательном объединении или последовательном разбиении. На первом шаге в таких процедурах все объекты считаются отдельными кластерами. Затем на каждом последующем шаге два наиболее близких объекта объединяются. На каждом шаге число кластеров уменьшается на единицу, пока не образуется единственный класс. В результате получается иерархическое дерево – дендрограмма. Построение неирархических (параллельных и последовательных) процедур основано на общих понятиях: мера близости или расстояние между группами, порог, эталонные точки или множеств, функционал качества разбиения. Параллельные процедуры используются при небольшом количестве наблюдений. Оптимальное разбиение в смысле заданного критерия качества можно получить лишь при использовании полного перебора вариантов разбиений. Но это не всегда осуществимо с вычислительной точки зрения для задач большой размерности. Последовательные методы предназначены для разбиения совокупностей, состоящих из сотен или даже тысяч наблюдений. Наиболее распространенным является метод k-средних. Сначала выбираются представители k-классов, затем каждое наблюдение приписывается к тому классу, к которому это наблюдение ближе всего. Далее пересчитывается «центр тяжести» класса и меняется «представитель». Таким образом, все наблюдения разбиваются на классы. При распределении всего множества на F-кластеров определяются переменные, которые представляют вероятности того, что объект j принадлежит кластеру h. Тогда функция принадлежности – распределение вероятностей наблюдений по всем кластерам. Величина вероятности лежит в пределах от 0 до 1. Минимизируется следующая целевая функция: J F Fu = ∑ h =1 J ∑∑ u 2 ( j , h)u 2 ( z, h)diss( j , z ) j =1 z =1 , J 2∑ u ( j , h ) 2 z =1 где u2(j,h) и u2(z,h) – обозначают принадлежность наблюдений j(z) классу h; diss(j,z) – неоднородность между наблюдениями; F – число кластеров Применение процедур кластерного анализа обосновано при неизвестных законах распределения классов (разбиваемых совокупностей). Однако при увеличении объема выборки можно выдвигать и проверять статистические гипотезы о виде закона распределения наблюдений в классах. Поэтому применение кластерного анализа должно носить вспомогательный характер при решении задачи построения системы классификации (определения правил классификации). Вопросы для самоконтроля: 1.Какие существую методы многомерного анализа данных? 2. Дайте количественную характеристику класса, перечислите их виды? 3. Как определяются коэффициенты подобия? 4. Как определяется коэффициент корреляции? 5. Как определяются расстояния между объектами в задаче классификации? 6. Дайте определение кластерного анализа. 7. Какие существуют методы кластерного анализа? Рекомендуемая литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Колемаев В.А. Математическая экономика - М: Юнити, 2005 г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 6. Планы практических занятий № Тема Содержание практического занятия 1 1. Особенности экономики как объекта Анализ данных и математического моделирования. прогнозирование 2. Понятия моделирования и модели экономики как наука. 3. Этапы экономико-математического моделирования 2 1. Предварительный анализ данных Информационное 2. Графические формы описания данных обеспечение прогнозирования в 3. Решение задач экономике. 3 Статистический и 1. Проверка гипотезы о законе распределения. Теория моментов. регрессионный анализ 2. Статистические оценки. Доверительные области. 3. Решение задач №1-3 [1] стр193 4 Статистический и 1. Содержание задачи корреляционного анализа. Этапы построения регрессионной регрессионный анализ модели. 2. Методы оценки адекватности регрессионной модели 3. Решение задач 5 Отбор факторов при построении Статистический и 1. множественной регрессии регрессионный анализ 2. Использование модели множественной линейной регрессии для прогнозирования экономических показателей 3. Решение задач 6 1. Основные элементы временного ряда. Анализ временных 2. Автокорреляция уровней временного ряда и рядов её оценка. Основные виды трендов. 3. Решение задач 7 Анализ временных 1. Сглаживание временных рядов. 2. Решение задач рядов 8 1. Виды динамических эконометрических Анализ временных моделей. рядов 2. Интерпретация параметров модели авторегрессии 3. Сущность модели адаптивных ожиданий и модели неполной корректировки. Оценка её параметров. 9 1. Аддитивные и мультипликативные методы Прогнозирование прогнозирования. временных рядов 2. Решение задач по анализу аддитивной и мультипликативной моделей временного ряда. 10 Прогнозирование 1. Экспоненциальное сглаживание. 2.Решение задач временных рядов 11 Прогнозирование 1. Методы прогонозирования социальноэкономических процессов. временных рядов 2. Оценка параметров авторегрессионной модели 12 Многомерный 1.Факторный анализ. статистический анализ 2. Решение задач Неделя 1 Литература [1]- [6] 2 [1]- [5] 3 [1] - [5] 4 [7] -[21] 5 [1] - [21] 6 [1] - [21] 7 [1] - [21] 8 [1] - [21] 9 [1] - [21] 10 [1] - [21] 11 [1] - [21] 12 [1] - [21] 13 Многомерный статистический анализ 1. Классификация моделей многомерного шкалирования. 2. Метрические модели многомерного шкалирования, модель Торгерсона. 3. Не метрические модели многомерного шкалирования. 13 [1] - [21] 14 Многомерный статистический анализ 1.Ранговая корреляция. Таблица сопряженности 2. Коэффициенты Спирмена, Кендалла. 14 [1] - [21] 15 Многомерный статистический анализ 3. Решение задач 1. Критерии качества классификации 2. Дискриминантный анализ 3. Решение задач по многомерному анализу данных 15 [1] - [21] 7. Методические указания по изучению дисциплины Методические указания для практических занятий Практическое занятие №1 Тема: Анализ данных и моделирование экономики как наука. Цель: Рассмотреть преимущества методов моделирования экономики и основные понятия данной дисциплины. Задание №1. Ответить на вопросы: 1. Особенности экономики как объекта математического моделирования. 2. Понятия моделирования и модели 3. Этапы экономико-математического моделирования Задание №2. Выполните тест: 1. Как называется объект, который замещает D) Математический метод объект-оригинал с определенной степенью 3.Как называются модели, которые представляют приближения и опережает его важнейшие собой материальные объекты той же природы, что характеристики и поведение? и объект-оригинал? А) Сценарий А) Предметно-математические В) Прогноз В) Мысленные С) Норматив С) Логико-математические D) Модель D) Физические 2. Как в экономике называется метод 4. Как классифицируются предметные модели? опосредованного познания с помощью А) На физические и предметно-математические использования объектов-заменителей? В) На знаковые и физические А) Экстраполяция С) На предметно-математические и предметноВ) Моделирование логические С) Планирование D) На знаковые и логические Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Ответить на тестовые задания в конце занятия для закрепления материала. Литература: 1.Прогнозирование и планирование в условиях рынка. Под редакцией Морозовой Т.Г., Пикулькина В.Н., М.Финансы и статистика, 2003г 2.Парсаданов Г.А., Егоров В.В. Прогнозирование национальной экономики - М.- Финансы и статистика, 2002г 3. Прогнозирование и планирование экономики. Под редакцией Кандауровой Г.А., Борисевича В.И.- М.: Финансы и статистика, 2005г 4.Найденков В.И. Прогнозирование и моделирование национальной экономики. -М.: Приор-издат, 2004г 5.Лугачев М.И., Ляпунцов Ю.П. «Методы социально-экономического прогнозирования.- М.:ТЕИС, 1999г Практическое занятие №2 Тема: Информационное обеспечение прогнозирования в экономике. Цель: Научить обучающихся проводить предварительный анализ данных Задание №1. Ответить на вопросы: 1. Предварительный анализ данных 2. Графические формы описания данных Задание №2. Решить задачи: №1. Проанализировать уровень еженедельной зарплаты (тенге) рабочих фирмы на основании выборки из 30 рабочих: 6500 4580 5670 7460 7650 8760 6960 6540 7490 3760 5430 6540 6750 4390 7830 6200 5700 6430 7950 2300 6490 5630 7890 5680 6430 5890 7900 5370 5890 3500 Методические указания пол выполнению задания: Данные, в таком первоначальном виде, трудно анализировать. Чтобы они имели содержательный характер представим их в виде таблицы частот. Для этого, чтобы определить обший диапазон таблицы частот, находим наибольшее и наименьшее значения. В примере наибольшее значение – 8760 тенге, а наименьшее значение - 2300 тенге. В Excel для этих целей можно применить функции МАКС и МИН. Далее необходимо разбить указанный диапазон на группы или интервалы группировки. Во многих случаях целесообразно проводить разбивку на большее или меньшее число групп. При группировке данных возникает вопрос о том, на сколько групп будет разбита изучаемая совокупность. Если распределение признака в границах его вариации достаточно равномерно или близко к нормальному, диапозон колебаний признака разбивают на равные интервалы, длину которых определяют по формуле: h= где xmax, xmin –максимальное и минимальное значение признака в совокупности; k - число групп. Число групп можно определит по формуле Стерджесса k=1+3,322lgN, где N- число единиц в совокупности. h= = Полученное значение следует корректировать для облегчения расчетов, в нашем примере по 1000. Таким образом представим в виде таблицы 1. Таблица 1- Частота группировки № Недельное жалование Количество рабочих 1 От 2000 до 2990 1 2 От 3000 до 3990 2 3 От 4000 до 4990 2 4 От 5000 до 5990 8 5 От 6000 до 6990 9 6 От 7000 до 7990 7 7 От 8000 до 8990 1 По этой таблице видно, что основная часть, из 30 рабочих 24 зарабатывают в пределах 5000-8000 тенге. При приеме рабочих на работу можно им сказать что, в среднем многие рабочие зарабатывают от 5000 до 8000 тенге. Исходные данные могут быть сведены в таблицу с открытыми границами, как это показано ниже: Таблица 2- Группировка по удельному весу Недельное жалование 2000- 3000- 4000- 5000- 6000- 7000 8000 Количество рабочих 1 2 2 8 9 7 1 Процент 3 7 7 27 30 23 3 По этой таблице 2 видно, что на фирме из 30 рабочих 80% рабочих получают от 5000 до 8000 тенге. Распределение частот. Для больших наборов данных следует создавать сводные таблицы, распределяя данные по группам (или категориям). Такой способ представления данных называется распределением частот. Для более углубленного анализа распределения частот можно построить либо распределение относительных частот либо процентное распределение. Распределение относительных частот вычисляется путем деления количества элементов каждой группы, образующей распределение частот, на общее количества наблюдений. Процентное распределение вычисляется путем умножения каждой относительной частоты, или доли, на 100. (Таблица 3) Таблица 3 – Процентное распределение частот № Недельное жалование Количество рабочих Распределение относительных частот Процентное распределение 1 От 2000 до 2990 1 0,03 3 2 От 3000 до 3990 2 0,07 7 3 От 4000 до 4990 2 0,07 7 4 От 5000 до 5990 8 0,27 27 5 От 6000 до 6990 9 0,3 30 6 От 7000 до 7990 7 0,23 23 7 От 8000 до 8990 1 0,03 3 Итого 30 1 100 Работать с долями или процентами удобнее, чем с количеством элементов группе. Распределение относительных частот, как и процентное распределение, позволяет сравнивать даже наборы данных, имеющие разные объемы. №2. Данные, представленные ниже, описывают стоимость потребления электричества на протяжении апреля в 50 случайно выбранных двухквартирных домах в большом городе. Затраты на оплату услуг Электрокомпании 158 123 156 145 187 146 125 165 135 144 154 162 149 157 198 178 187 193 138 139 128 159 179 172 142 164 169 173 156 138 184 189 181 194 197 196 111 124 121 134 138 106 108 110 113 119 127 199 108 157 1)Постройте распределение частот: - по 5 интервалам группирования; -по 6 интервалам группирования; -по 7 интервалам группирования. 2).Постройте распределение частот по 7 интервалам группирования с границами по 30 тенге 3) Постройте распределение процентных долей по распределению частот, построенному в п.2. 4) Постройте процентную гистограмму 5) Постройте процентный полигон 6) Постройте распределение накопленных частот 7) Постройте распределение интегральных процентов 8) Нарисуйте кривую распределения 9) Вокруг какого значения концентрируется плата за услуги энергетических компаний? 10) Какой график лучше всего отражает характеристики распределения платы за услуги энергетической компаний. Обоснуйте свой ответ. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи в соответствии с условием (задание № 2). Литература: 1.Колемаев В.А. Математическая экономика – М.:ЮНИТИ, 2005 г 2.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 3.Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г 4.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 5.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 6.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г. Практическое занятие №3 Тема: Статистический и регрессионный анализ Цель: Научить обучающихся проводить проверку статистических гипотез и строить доверительные интервалы. Задание №1. Ответить на вопросы: 1. Проверка гипотезы о законе распределения. Теория моментов. 2. Статистические оценки. Доверительные области. Задание №2. Решите следующие задачи: №1. Станок, работающий со стандартным отклонением σ = 0,5 мм, производит детали средней длины а=20 мм. В случайной выборке объема п=16 деталей средняя длина Х = 19,8 мм. Правильно ли настроен станок? Доверительная вероятность р=99%. №2. Производитель утверждает, что средний вес плитки шоколада не меньше а=50 гр. Инспектор отобрал 10 плиток шоколада и взвесил. Их вес оказался 49, 50, 51, 52, 48, 47, 49, 52 48, 51г соответственно. Не противоречит ли это утверждение производителя? Предполагается, что вес плитки шоколада распределен нормально. Доверительная вероятность р=95%. №3.Автомат фасует чай в пачки. Проведена случайная выборка объемом п=30 пачек. Средний вес пачки чая в выборке х =101 г, выборочное стандартное отклонение s=4 г. Найти доверительный интервал для среднего веса пачки чая в генеральной совокупности с доверительной вероятностью γ =95%. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи статистического анализа в соответствии с условием (задание № 2). Литература: 1. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 2. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 3. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №4 Тема: Статистический и регрессионный анализ Цель: Научить обучающихся строить модели статистического анализа и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Чем отличаются между собой статистические модели: структурные, динамические, модели связи? 2. В чем отличие взаимосвязей статистических признаков: функциональной, стохастической, корреляционной? 3. Сформулируйте содержание задачи корреляционного анализа и её отличие от задачи регрессионного анализа? 4. Перечислите этапы решения задачи построения регрессионной модели. 5. Каковы методы оценки адекватности регрессионной модели? Задание №2. Решите следующие задачи: №1. Фирма провела рекламную компанию. Через 10 недель фирма решила проанализировать эффективность этого вида рекламы, сопоставив недельные объемы продаж (у, тыс.тенге) с расходами на рекламу (х, тыс. тенге). Полагая, что между переменными х, у имеет место линейная зависимость, определить выборочное уравнение линейной регрессии. х 5 8 6 5 3 9 12 4 3 10 у 72 76 78 70 68 80 82 65 62 90 Найти ожидаемое значение еженедельного объема продаж у при расходах на рекламу х=5,5 тыс. тенге. №2. При исследовании корреляционной зависимости между ценой на нефть Х и индексом нефтяной компании Y получены следующие данные: х = 16,2 (ден. ед.), у = 4000 (усл. ед.), s x2 = 4, s y2 = 500, côv( x, y) = 40 . Необходимо: 1)составить уравнение регрессии Y по Х; 2) используя уравнение регрессии, найти среднее значение индекса при цене на нефть 16,5 ден.ед. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи статистического анализа в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №6 Тема: Анализ временных рядов Цель: Научить обучающихся строить модели временных рядов и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Перечислите основные элементы временного ряда. 2. Что такое автокорреляция уровней временного ряда и как её можно оценить количественно? 3. Перечислите основные виды трендов. Какова интерпретация параметров линейного и экспоненциального трендов? Задание №2 . Решите следующую задачу: В таблице указан объем продаж (тыс. ден. ед.) за последние 11 кварталов. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем продаж 64 75 81 110 66 77 91 120 68 78 92 Построить модель временного ряда с помощью метода аналитического выравнивания временного ряда и дать на основании этой модели прогноз объема продаж на следующие два квартала. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачу прогнозирования экономических процессов в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №7 Тема: Анализ временных рядов Цель: Научить обучающихся строить модели временных рядов и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Сезонные и циклические колебания. 2. Сглаживание временных рядов. Задание №2 . Решите следующие задачи: №1.Имеются следующие данные об урожайности озимой пшеницы у t (ц/га) за 10 лет: t уt 1 16,3 2 20,2 3 17,1 4 7,7 5 15,3 6 16,3 7 19,9 8 14,4 9 18,7 10 20,7 Найти среднее значение, среднее квадратическое отклонение и коэффициенты автокорреляции (для лагов τ =1; 2) временного ряда. №2.По данным предыдущей задачи провести сглаживание временного ряда у t методом скользящей средней, используя простую среднюю арифметическую с интервалом сглаживания: а) т=3; б) т=5. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачу прогнозирования экономических процессов в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №8 Тема: Анализ временных рядов Цель: Научить обучающихся строить модели авторегрессии и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Какие виды эконометрических моделей относятся к динамическим? 2. Как называются динамические модели, в которых в качестве факторных переменных содержаться лаговые значения результативной переменной? 3. Какова интерпретация параметров модели авторегрессии? 4. В чем сущность модели адаптивных ожиданий? Какова методика оценки её параметров? 5. В чем сущность модели неполной корректировки? Какова методика оценки её параметров? 6. Изложите методику применения метода инструментальных переменных для оценки параметров модели авторегрессии. Задание №2. Решите следующие задачи: №1. После приведения модели адаптивных ожиданий к лагированной модели и её оценки методом наименьших квадратов получено уравнение: yˆ t = 1,2 + 0,2 xt + 0,3 y t −1 . Найти оценки параметров исходной модели адаптивных ожиданий. №2. Методом наименьших квадратов получено следующее уравнение: yˆ t = 2 − 0,2 x t + 0,1y t −1 (0,03) (0,04) Значение статистики Дарбина-Уотсона d=1,9. Какой следует сделать вывод о наличии автокорреляции в модели? Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи прогнозирования экономических процессов в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Практическое занятие №9 Тема: Прогнозирование временных рядов Цель: Научить обучающихся строить модели временных рядов и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Запишите общий вид аддитивной и мультипликативной модели временного ряда 2. Перечислите этапы построения аддитивной и мультипликативной модели временного ряда. 3. С какими целями проводятся выявление и устранение сезонного эффекта в аддитивной и мультипликативной моделях временного ряда? Задание №2 . Решите следующую задачу: В таблице указан объем продаж (тыс. ден. ед.) за последние 11 кварталов. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем продаж 64 75 81 110 66 77 91 120 68 78 92 Построить аддитивную и мультипликативную модели временного ряда и дать на основании этих моделей прогноз объема продаж на следующие два квартала. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачу прогнозирования экономических процессов в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Практическое занятие №10 Тема: Прогнозирование временных рядов Цель: Научить обучающихся строить модели временных рядов и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Дайте характеристику методов экстраполяции, их классификацию. 2. Чем отличаются трендовые модели экономической динамики на основе кривых роста: полиномиальные, экспоненциальные, логистические? 3. Перечислите этапы экстраполяционного прогнозирования. 4. Как осуществляется оценка качества получаемого прогноза? 5. Охарактеризуйте адаптивные методы прогнозирования? 6. Дайте математическое описание базовых моделей «скользящего среднего». Задание №2. Решите следующие задачи: №1. Имеются следующие данные об урожайности озимой пшеницы у t (ц/га) за 10 лет: t уt 1 16,3 2 20,2 3 17,1 4 7,7 5 15,3 6 16,3 7 19,9 8 14,4 9 18,7 10 20,7 Найти среднее значение, среднее квадратическое отклонение и коэффициенты автокорреляции (для лагов τ =1; 2) временного ряда. №2. По данным предыдущей задачи провести сглаживание временного ряда у t методом скользящей средней, используя простую среднюю арифметическую с интервалом сглаживания: а) т=3; б) т=5. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи прогнозирования экономических процессов в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №11 Тема: Прогнозирование временных рядов Цель: Научить обучающихся строить модели временных рядов и прогнозировать экономические показатели по данным моделям Задание №1. Ответить на вопросы: 1. Методы прогонозирования социально-экономических процессов. 2. Оценка параметров авторегрессионной модели Задание №2. Выполните индивидуальное задание по теме «Прогнозирование временных рядов» В таблице представлены данные, отражающие динамику курса акций некоторой компании (д.ед): t 1 2 3 4 5 6 7 8 9 10 11 yt 971 1166 1044 907 957 727 752 1019 972 815 823 t 12 13 14 15 16 17 18 19 20 21 22 yt 1112 1386 1428 1364 1241 1145 1351 1325 1226 1189 1213 Используя авторегрессионную модель 1-го порядка, дать точечный и интервальный прогноз среднего и индивидуального значений курса акций в t=23, т.е. на глубину один интервал. Методические указания по выполнению задания: В соответствии с условием применим авторегрессионную модель y t = β 0 + β 1 y t −1 + ε t (t = 1,2,..., n) . Получим yt = 284,0 + 0,7503 y t −1 . Найденное уравнение регрессии значимо на 5%-м уровне по F- критерию, т.к. фактически наблюдаемое значение статистики F=24,32>F0,05;1;19=4,35. Вычисляем точечный прогноз по уравнению: y t = 23 = 284,0 + 0,7503 ⋅ 1213 = 1194,1 и интервальный на уровне значимости 0,05 для среднего и индивидуального значений - 1046,6 ≤ yt =23 ≤ 1341,6 879,1 ≤ yt*0 = 23 ≤ 1509,1 Итак, с надежностью 0,95 среднее значение курса данной компании на момент t=23 будет заключено в пределах от 1046,6 до 1341,6 (д.ед.), а его индивидуальное значение – от 879,1 до 1509,1 (д.ед.) Задание №3. Защитите выполненное задание, ответив на следующие вопросы: 1. Общий вид записи модели авторегрессии. 2. С помощью какого метода оцениваются параметры модели авторегрессии? 3. Как проверяется статистическая значимость модели авторегрессии? 4. Как выполняется точечный прогноз на основе построенной модели авторегрессии? 5. Как выполняется интервальный прогноз на основе построенной модели авторегрессии? Методические рекомендации: Индивидуальное задание выполняется в отдельных тетрадях. Выполненное задание должно содержать исходные данные, расчетную таблицу, расчет указанных в задании показателей и анализ полученных результатов. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Практическое занятие №12 Тема: Многомерный статистический анализ Цель: Научить обучающихся методы факторного анализа. Задание №1. Ответить на вопросы: 1. Факторный анализ. 2. Метод главных факторов Задание №2. Решите следующую задачу: В результате решения задачи, имеющей семь признаков, получено два общих фактора. Необходимо определить: 1)вклады общих и характерного фактора в дисперсию признаков, % 2)вклад всех семи признаков в каждый общий фактор, % 3)вклад каждого общего фактора в суммарную дисперсию, % 4)составить таблицу относительного вклада факторов в суммарную дисперсию. 0,90 − 0,30 0,80 − 0,30 0,60 0,30 Матрица А весовых коэффициентов общих факторов имеет вид: A = 0,50 0,20 0,50 0,50 − 0,30 0,60 0,20 0,80 Порядок выполнения: 1.Результаты расчета вклада общих и характерного фактора в дисперсию признаков оформить в таблицу: Расчетные значения № переменной j 1 2 3 4 5 6 7 a 2j1 a 2j 2 h 2j и a 2j 2 h 2j = a 2j1 + a 2j 2 a 2j 2 =1- h 2j 2. Определить вклады признаков: а) в дисперсию общего фактора. За 100% принять дисперсию первого общего фактора. Дисперсия первого 7 фактора равна сумме элементов: λ1 = V1 = ∑ a 2j1 j =1 Вклад первого признака в дисперсию первого фактора составит a112 V1 б) в дисперсию общего фактора. За 100% принять дисперсию второго общего фактора. Дисперсия первого 7 фактора равна сумме элементов: λ2 = V2 = ∑ a 2j 2 j =1 a122 Вклад первого признака в дисперсию второго фактора составит V2 в) заполнить таблицу: № фактора,r 1 2 Вклады признаков в дисперсии общих факторов Вклады признаков, % у2 у3 у4 у5 у1 у6 у7 3. Рассчитать вклады общих факторов в суммарную общность и определить а) суммарную общность 7 2 j =1 r =1 ∑ h 2j = V0 = ∑Vr = V1 + V2 V1 :V2 в) вклад второго фактора в суммарную общность: 1 − V1 : V2 б) вклад первого фактора в суммарную общность: г) вклады каждого признака в общность первого и второго факторов с точностью до 1%. Для этого надо вклад каждого признака (табл.2) умножить на вес соответствующего фактора в суммарной общности процесса, или значения № фактора,r 1 2 у1 a 2j1 и a 2j 2 (табл.1) разделить на суммарную общность. Вклады признаков с учетом вкладов факторов в суммарную общность Вклады признаков, % у2 у3 у4 у5 у6 4. Составить итоговую таблицу долей дисперсий Доли дисперсий факторов № Наименование дисперсии Формула фактора,r 1 Дисперсия процесса (полная S2 ∑ дисперсия) 2 Дисперсия первого фактора 3 Дисперсия второго фактора 4 Общность процесса (суммарная общность) Значение вклада у7 Вклад, % 7 7 V1 = ∑ a 2j1 j =1 7 V2 = ∑ a 2j 2 j =1 5 Суммарная характерная дисперсия 7 ∑h 2 j = V0 = V1 + V2 j =1 7 Vx = ∑ d 2j j =1 Следует отметить, что дисперсия процесса равна 7 и совпадает с числом признаков. Дисперсия каждого нормированного признака равна 1, поэтому полная дисперсия при семи показателях равна 7. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи факторного анализа в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №13 Тема: Многомерный статистический анализ Цель: Рассмотреть сущность многомерного шкалирования в многомерном анализе данных. Задание. Ответьте на вопросы: 1. Понятие многомерного шкалирования. 2. Основные задачи многомерного шкалирования. 3. Исходные данные для многомерного шкалирования.: мера сходства и мера различия. 4. Классификация моделей многомерного шкалирования. 5. Метрические модели многомерного шкалирования, модель Торгерсона. 6. Не метрические модели МШ: меры соответствия; общая схема алгоритма не метрического многомерного шкалирования и сущность его этапов. Алгоритмы реализации не метрического и метрического этапов. Методические рекомендации: Выступления с докладами по вопросам составленных с использованием различных источников. Литература: 1.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 2.Лугачев М.И., Ляпунцов Ю.П. «Методы социально-экономического прогнозирования.- М.:ТЕИС, 1999г 3.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 4.Экономико-статистический анализ. Под редакцией Ильенковой С.Д. – М.:ЮНИТИ, 2002г 5.Многомерный статистический анализ в экономике. Под редакцией Тамашевича В.Н.- М.:ЮНИТИ, 1999г Практическое занятие №14 Тема: Многомерный статистический анализ Цель: Научить обучающихся применять методы ранговой корреляции Задание №1. Ответить на вопросы: 1. В чем заключается сущность ранговой корреляции? 2. Как рассчитываются коэффициенты Спирмена и Кендалла? Задание №2. Решите следующие задачи: №1. При помощи коэффициентов корреляции рангов Спирмена и Кенделла оценить тесноту связи между факторами на основании следующих данных: № предприятия Объем реализации, млн. тенге Затраты по маркетингу, тыс. тенге 1 13,0 153 2 15,5 560 3 13,5 120 4 13,0 263 5 14,4 123 6 16,2 150 7 14,0 230 8 15,2 230 №2. Используя коэффициент конкордации, оценить тесноту связи между приведенными в таблице факторами: № Объем реализованной Прибыль, Численность работающих, предприятия продукции, млн. тенге млн.тенге человек 1 5070 962 450 2 2850 890 260 3 4355 1450 500 3700 960 350 4 5 2860 1560 340 6 2355 1150 240 7 5920 870 190 8 2645 1040 235 905 240 9 2945 10 4530 2400 550 Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачи ранговой корреляции в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Практическое занятие №15 Тема: Многомерный статистический анализ Цель: Рассмотреть методы кластерного анализа и научить применять их при классификации объектов. Задание №1. Ответить на вопросы: 1. Можно ли отнести методы классификации многомерных наблюдений к задачам экономикоматематического моделирования? Почему? 2. Что такое «класс переменных»? Дайте количественную характеристику класса, перечислите их виды. 3. Как определяются коэффициенты подобия, корреляции, расстояния в задаче классификации? 4. Сформулируйте задачу классификации объектов (состояний объекта) как задачу экономикоматематического моделирования. 5. В чем заключается сущность дискриминантного анализа 6. Перечислите методы кластерного анализа. 7. Что такое дендрограмма? Поясните на графике структурные основные элементы дендрограммы. Задание №2. Решите следующую задачу: Провести классификацию объектов методами кластерного анализа и построить дендрограмму. № объекта Классификационные признаки наблюдения Стоимость сырья и Заработная плата, тыс. д.ед. Основные материалов, тыс. д.ед. производственные фонды, тыс. д.ед. 1 65 51 625 2 125 198 105 3 334 210 145 4 97 115 240 5 115 123 350 6 89 124 190 7 97 271 420 Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на занятии согласно плану. Решить задачу кластерного анализа в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Методические указания по проведению СРСП Неделя 1 СРСП 1-2 Тема: Анализ данных и моделирование экономики как наука. Цель: Проверить уровень знаний студентов по основам моделирования экономики Форма проведения: выступления с минидокладами Задание № 1. Ответьте на вопросы: 1.Объективная необходимость моделирования и прогнозирования экономических процессов. 2.История развития экономико-математического моделирования. 3. Методологические принципы прогнозирования и моделирования. 4. Понятие прогноза. Виды прогнозов, их классификация. 5. Типы прогнозирования Задание №2. Выполните тест: 1.Как называется метод опосредованного B) Точечные и интервальные познания с помощью использования объектовC) Вариантные и инвариантные заменителей? D) Пассивные и активные A) Прогнозирование 3. Какие существуют типы прогнозирования? B) Планирование A) Логико-математическое; функциональное; C) Моделирование макроэкономическое. D) Математический метод B) Прогнозирование, основанное на творческом 2. Как подразделяются прогнозы в зависимости от видении будущего; поисковое прогнозирование и типов прогнозирования? нормативное прогнозирование. A) Поисковые, нормативные и основанные на C) Структурное; дескриптивное; предметнотворческом видении математическое; динамическое. D) Балансовое; вероятностное; локальное. 4. Как подразделяются модели по объекту 5. Как подразделяются модели по способу исследования? отражения фактора времени? A) Макроэкономические и локальные. A) Жестко-детерминированные и вероятностные B) Теоретико-аналитические и прикладные B) Теоретико-аналитические и прикладные C) Статические и динамические C) Статические и динамические D) Открытые и закрытые D) Структурные и функциональные Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. Ответить на тестовые задания в конце занятия для закрепления материала. Литература: 1.Прогнозирование и планирование в условиях рынка. Под редакцией Морозовой Т.Г., Пикулькина В.Н., М.Финансы и статистика, 2003г 2.Парсаданов Г.А., Егоров В.В. Прогнозирование национальной экономики - М.- Финансы и статистика, 2002г 3. Прогнозирование и планирование экономики. Под редакцией Кандауровой Г.А., Борисевича В.И.- М.: Финансы и статистика, 2005г 4.Найденков В.И. Прогнозирование и моделирование национальной экономики. -М.: Приор-издат, 2004г 5.Лугачев М.И., Ляпунцов Ю.П. «Методы социально-экономического прогнозирования.- М.:ТЕИС, 1999г Неделя 2 СРСП 3-4 Тема: Информационное обеспечение прогнозирования в экономике. Цель: Проверить уровень знаний студентов по основам моделирования экономики Форма проведения: выступления с минидокладами, решение задач Задание № 1. Ответьте на вопросы: 1. Роль информации и данных в процессе принятия решений 2. Методы и формы представления данных 3. Генеральная совокупность и выборка 4. Методы группирования (представления) данных Задание № 2. Решите задачи: №1.Найдите наиболее популярный туристический маршрут из четырех реализуемых фирмой, если за неделю последовательно были реализованы следующие маршруты (приводятся номера маршрутов): 1,3,3,2,1,1,4,4,2,4,1,3,2,4,1,4,4,3,1,2,3,4,1,1,3. №2.В рабочей зоне производились замеры концентрации вредного вещества. Получен ряд значений (в мг/м3): 12,16,15,14,10,20,16,14,18,14,15,17,23,16. Необходимо определить основные выборочные характеристики. №3.Рассматривается зарплата основных групп работников гостиницы: администрации, обслуживающего персонала и работников ресторана. Были получены следующие данные: Администрация Персонал Ресторан 4500 2100 3200 4000 2100 3000 3700 2000 2500 3000 2000 2000 2500 2000 1900 1900 1800 1800 1800 Необходимо определить основные статистические характеристики в группах данных. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. Решить задачи в соответствии с условием (задание № 2). Литература: 1.Колемаев В.А. Математическая экономика – М.:ЮНИТИ, 2005 г 2.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 3.Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г 4.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 5.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 6. Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 3 СРСП 5-6 Тема: Статистический и регрессионный анализ Цель: Проверить студентов в умении проводить проверку статистических гипотез Форма проведения: выступления с минидокладами, решение задач Задание № 1.Ответьте на вопросы: 1. Как проводится проверка гипотезы о законе распределения? 2. Какие существуют виды статистических оценок? 3. Как строятся доверительные интервалы? Задание № 2.Решите следующие задачи: №1. Предполагается, что применение новой технологии приведет к увеличению выхода готовой продукции. Результаты контроля двух партий продукции, изготовленных по старой и новой технологии таковы: Технология Изделия Всего годные негодные Новая т11=140 т12=10 150 Старая т21=185 т22=15 200 Всего п1=325 п1=25 п=350 Подтверждают ли эти результаты предположение об увеличении выхода годной продукции? Примете α =0,01. №2. Для определения средней заработной платы работников определенной отрасли было обследовано 100 человек. Результаты представлены в таблице. Зарплата в долларах Число человек Зарплата в долларах Число человек 190-192 1 200-202 19 192-194 5 202-204 11 194-196 9 204-206 4 196-198 22 206-208 1 198-200 28 Выяснить, можно ли на уровне значимости α =0,05, считать нормальным распределение средней заработной платы. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. Решить задачу в соответствии с условием (задание № 2). Литература: 1. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 2. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 3.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 4 СРСП 7-8 Тема: Статистический и регрессионный анализ Цель: Проверить студентов в умении строить модели корреляционно-регрессионного анализа и прогнозировать экономические показатели по данным моделям Форма проведения: выступления с минидокладами, решение задач Задание № 1.Ответьте на вопросы: 1. Дайте определение статистической модели экономического процесса или явления. Какова основная цель статистического моделирования? 2. Перечислите задачи экономического анализа, решаемые с помощью статистических методов. 3. Дайте определения основных элементов задачи статистического анализа (экзогенные и эндогенные переменные, латентные компоненты). 4. Перечислите различные типы задач статистического анализа в зависимости от природы результирующих и объясняющих переменных. 5. Приведите примеры практических задач управления производством, в которых применимы экономикостатистические модели. Задание № 2. Решите следующую задачу: Имеются следующие данные об уровне механизации работ Х (%) и производительности труда Y(т/ч) для 14 однотипных предприятий: 32 30 36 40 41 47 56 54 60 55 61 67 69 76 xi yi 20 24 28 30 31 33 34 37 38 40 41 43 45 48 Необходимо: 1)оценить тесноту и направление связи между переменными с помощью коэффициента корреляции; 2) найти уравнение регрессии Y по Х; 3) найти коэффициент детерминации и пояснить его смысл; 4) проверить значимость уравнения регрессии на 5%-м уровне; 5) оценить среднюю производительность труда на предприятиях с уровнем механизации работ 60% и построить для нее 95%-ный доверительный интервал; аналогичный доверительный интервал найти для индивидуальных значений производительности труда на тех же предприятиях. Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. Решить задачу в соответствии с условием (задание № 2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 5 СРСП 9-10 Тема: Статистический и регрессионный анализ Цель: Проверить студентов в умении строить модели множественной регрессии и проводить оценку качества построенной модели Форма проведения: решение задач Задание. Решить следующую задачу: Изучается зависимость основных (х1) и оборотных средств (х2) на величину валового дохода (у) торговых предприятий. 1.Постройте линейное уравнение множественной регрессии и поясните экономический смысл его параметров. 2. Рассчитайте средние коэффициенты эластичности. 3. Определите парные коэффициенты корреляции 4. Определите стандартизованные коэффициенты регрессии и запишите уравнение регрессии в стандартизованном масштабе. 5. Сделайте вывод о силе связи результата и факторов. 6. Определите парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции. 7. Дайте оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера. Номер Валовой доход за год, Среднегодовая стоимость, млн. д.ед. предприятия млн. д.ед. Основных фондов Оборотных средств 118 105 1 203 2 63 28 56 45 27 54 3 63 4 113 50 5 121 56 28 108 102 50 6 116 54 7 110 42 8 106 124 105 114 36 9 154 106 10 230 88 11 160 115 12 105 98 46 Методические рекомендации: Решить задачу в соответствии с условием (задание № 1).. Литература: 1.Колемаев В.А. Математическая экономика – М.:ЮНИТИ, 2005 г 2.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 3.Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г 4.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 5. Кундышева Е.С. Математическое моделирование в экономике. Учебное пособие – М.: Издательскоторговая корпорация «Дашков и К», 2007г Неделя 6 СРСП 11-12 Тема: Анализ временных рядов Цель: Проверить студентов в умении строить модели временных рядов и прогнозировать экономические показатели по данным моделям Форма проведения: решение задач Задание № 1. Решите следующие задачи: №1. В таблице указан объем продаж (тыс. ден. ед.) за последние 11 кварталов. Дать на основании этих данных прогноз объема продаж на следующие два квартала. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем продаж 4 5 5 6 9 9 8 10 11 13 16 №2. В таблице представлены данные, отражающие динамику роста доходов на душу населения за восьмилетний период: t 1 2 3 1133 1222 1354 у t 4 1389 5 1342 6 1377 7 1491 8 1684 уt (ден. ед.) Полагая, что тренд линейный и условия классической модели выполнены: а) найти уравнение тренда и оценить его значимость на уровне 0,05; б) дать точечный и с надежностью 0,95 интервальный прогнозы среднего и индивидуальных значений доходов на девятый период. Задание №2. Выполните тест: 1. Как называется зависимость, когда в качестве С) y ˆt = a + b / t влияющего фактора выступает время (номер b периода)? D) yˆ t = at А) Экспонента 4. Как называется первый этап В) Парабола экстраполяционного прогнозирования С) Тренд экономической динамики на основе временных D) Корреляция рядов? 2. Какая из моделей временных рядов является А) Установление цели и задачи исследования, экспоненциальным трендом? анализ объекта прогнозирования А) y ˆ t = a + bt В) Подготовка исходных данных С) Фильтрация исходного временного ряда В) y ˆt = a + b / t D) Логический отбор видов аппроксимирующей b функции С) yˆ t = at 5. Как называется процесс распространения a + bt закономерностей, связей и соотношений, D) yˆ t = e действующих в изучаемом периоде, за его 3. Какая из моделей временных рядов является пределы? показательным трендом? А) Фильтрацией В) Экстраполяцией €t = a ⋅ b t А) y С) Сглаживанием a + bt D) Выравниванием В) yˆ t = e Методические рекомендации: Выполнить задания в соответствии с условием (задание № 1). Ответить на тестовые задания в конце занятия для закрепления материала. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 7 СРСП 13 Тема: Анализ временных рядов Форма проведения: решение задач Цель: Проверить студентов в умении анализировать динамические модели экономики Форма проведения: решение задач Задание №1. Решите следующие задачи: На основе помесячных данных о числе браков (тыс.) в регионе за последние три года была построена аддитивная модель временного ряда. Скорректированные значения сезонной компоненты за соответствующие месяцы приводятся в таблице: Месяц Скорректированные Месяц Скорректированные значения сезонной значения сезонной компоненты компоненты Январь -1,0 Июль 3,0 Февраль 2,0 Август 1,0 Март -0,5 Сентябрь 2,5 Апрель 0,3 Октябрь 1,0 Май -2,0 Ноябрь -3,0 Июнь -1,1 Декабрь ? Уравнение тренда выглядит следующим образом: yˆ x = 2,5 + 0,03 ⋅ t , при расчете параметров тренда использовались фактические моменты времени (t=1,2,…,36). Требуется: 1)Определить значение сезонной компоненты за декабрь 2) На основе построенной модели дать прогноз общего числа браков, заключенных в течение первого квартала следующего года. Задание №2. Составить глоссарий основных терминов по темам неделей 1-5 и ответить на поставленные вопросы. Методические рекомендации: Решить задачи в соответствии с условием (задание № 1). Глоссарий терминов (задание №2) должен быть составлен в отдельных тетрадях, который должен содержать наименование термина и его определение. Терминов должно быть не менее 25. Литература: 1.Колемаев В.А. Математическая экономика – М.:ЮНИТИ, 2005 г 2.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 3.Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г 4.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 5.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 6. Кундышева Е.С. Математическое моделирование в экономике. Учебное пособие – М.: Издательскоторговая корпорация «Дашков и К», 2007г СРСП 14 Тема: Анализ временных рядов Цель: Развитие аналитических и познавательных способностей в области моделирования экономики Форма проведения: защита рефератов Задание. Выступить с кратким докладом к написанному реферату и ответить на заданные вопросы. Методические рекомендации: Реферат должен быть выполнен на бумаге формата А4, содержать титульный лист, план, основное содержание по рассматриваемому вопросу и список использованной литературы. Литература: 1.Колемаев В.А. Математическая экономика – М.:ЮНИТИ, 2005 г 2.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 3.Интрилигатор М. Математические методы оптимизации и экономическая теория. -М., 2003г 4.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 5.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 6.Экономико-статистический анализ. Под редакцией Ильенковой С.Д. – М.:ЮНИТИ, 2002г 7.Замков О.О., Черемных Ю.А., Толстопятенко А.В. «Математические методы в экономике», М.: Дело и сервис, 1999г 8. Афанасьев В.Н., Юзбашев М.М., Гуляева Т.И. Эконометрика М.: Финансы и статистика, 2005г. 9. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 10.Многомерный статистический анализ в экономике. Под редакцией Тамашевича В.Н.- М.:ЮНИТИ, 1999г 11. Смирнов А.Д. Лекции по макроэкономическому моделированию. – М.: Высшая школа, 2000г 12. Малыхин В.И. Математическое моделирование экономики. – М.: УРАО, 1998г 13. Балдин К.В., Быстров О.Ф., Соколов М.М. Эконометрика.- М.: ЮНИТИ, 2004г 14. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 15. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г Неделя 8 СРСП 15-16 Тема: Анализ временных рядов Цель: Проверить уровень знаний студентов по математической формулировке и интерпретации динамических моделей экономики. Форма проведения: выступления с минидокладами Задание № 1. Ответьте на вопросы: 1. Тестирование стационарности. 2. Коинтеграция. 3. Виды динамических эконометрических моделей. 4. Интерпретация параметров модели авторегрессии 5. Сущность модели адаптивных ожиданий и модели неполной корректировки. Оценка её параметров. Задание № 2. Решите следующие задачи: №1. Оценивается модель Y = β X + ε обычным методом наименьших квадратов. Получается уравнение ˆ вида: y = 1,2 x . Известно, что измерения регрессора Х производятся с ошибками, дисперсия которых (0,3) оценивается как 10. Можно ли при этом считать, что истинное значение коэффициента β . Положительно, если: а) дисперсия Х равна 100; б) дисперсия Х равна 10? №2. Для оценки лагового уравнения y t = γy t −1 + ε t применен обычный метод наименьших квадратов и получено уравнение: yˆ t = 0,9 yt −1 , d = 1,95 . Считается, что ошибки регрессии представляют собой (0,1) стационарный регрессионный процесс первого порядка. Можно ли сделать вывод, что коэффициент больше0,5;б)больше0,7? λ : а) Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. В конце занятия решить задачи. Литература: 1. Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Неделя 9 СРСП 17-18 Тема: Прогнозирование временных рядов Цель: Проверить студентов в умении строить аддитивную и мультипликативную модели временного ряда. Форма проведения: решение задач Задание № 1.Решить следующую задачу: Имеются поквартальные данные по розничному товарообороту: Номер Товарооборот, % к Номер Товарооборот, % к квартала предыдущему квартала предыдущему периоду периоду 1 100,0 11 98,8 2 93,9 12 101,9 3 95,6 13 113,1 4 101,8 14 98,4 5 107,8 15 97,3 6 96,6 16 102,1 7 95,7 17 97,6 8 98,2 18 83,7 9 104,0 19 84,3 10 99,0 20 88,4 1. Постройте график временного ряда. 2. Постройте аддитивную и мультипликативную модели временного ряда. 3. Оцените качество модели через показатели средней абсолютной ошибки и среднего относительного отклонения. Задание №2. Выполните тест: 1. Какая модель является аддитивной моделью 3. Какова цель построения аддитивной или временного ряда? мультипликативной модели временного ряда? a) Y=T*S*E a) Построение модели сводится к определению b) Y=T-S-E автокорреляционной зависимости между c) Y=T+S+E последовательными уровнями временного ряда. d) Y=(T+S)-E b) Построение модели сводится к расчету коэффициента e) Y=(T+S)/E автокорреляции уровня временного ряда. 2. Какая модель является мультипликативной c) Построение модели сводится к расчету T, S и E для моделью временного ряда? каждого уровня временного ряда. a) Y=T*S*E d) Построение модели сводится к расчету случайной b) Y=T+S+E компоненты. c) Y=T-S-E e) Построение модели сводится к расчету циклической d) Y=(T+S)-E компоненты. e) Y=(T+S)/E Методические рекомендации: Построить аддитивную и мультипликативную модели временного ряда (задание № 1). Ответить на тестовые задания в конце занятия для закрепления материала. Литература: 1."Эконометрика" под редакцией И.И. Елисеевой, М: Финансы и статистика", 2002 2."Практикум по эконометрике" под редакцией И.И. Елисеевой, М: Финансы и статистика, 2002 3.Кристофер Доугерти "Введение в эконометрику" М: Ифра-М, 1999 4.Мардас А.Н. "Эконометрика" Учебное пособие, С-Пб "Питер", 2001 5.Магнус Я.Р., Катышев П.К., Пересецкий А.А. "Эконометрика. Начальный курс" М: Дело, 1998 Неделя 10 СРСП 19-20 Тема: Прогнозирование временных рядов Цель: Проверить студентов в умении строить модели временных рядов и прогнозировать экономические показатели по данным моделям Форма проведения: решение задач Задание № 1. Ответить на вопросы 1.Экспоненциальное сглаживание. 2. Экспоненциальное сглаживание с поправкой на тренд 3. Дисперсионный анализ влияния качественных факторов Содержание занятия. Задание № 2..Выполнените индивидуальное задание по теме «Прогнозирование временных рядов» В таблице указан объем продаж (тыс. ден. ед.) за последние 11 кварталов. Дать на основании этих данных прогноз объема продаж на следующие два квартала с помощью экспоненциального сглаживания и экспоненциальным сглаживанием с поправкой на тренд. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем продаж 4 5 5 6 9 9 8 10 11 13 16 Методические рекомендации: Выполнить задания в соответствии с условием (задания № 1 и №2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 11 СРСП 21-22 Тема: Прогнозирование временных рядов Цель: Проверить студентов в умении строить модели временных рядов и прогнозировать экономические показатели по данным моделям Форма проведения: решение задач Задание № 1. Решите следующие задачи: №1. Имеются следующие данные об урожайности озимой пшеницы у t (ц/га) за 10 лет: t уt 1 16,3 2 20,2 3 17,1 4 7,7 5 15,3 6 16,3 7 19,9 8 14,4 9 18,7 10 20,7 Найти уравнение тренда временного ряда, полагая, что он линейный, и проверить его значимость на уровне 0,05. №2. По данным за 30 месяцев некоторого временного ряда хt были получены значения коэффициентов автокорреляции уровней: r1=0,63; r2=0,38; r3=0,72; r4=0,97; r5=0,55; r6=0,40; r7=0,65. Требуется: 1.Охарактеризовать структуру этого ряда, используя графическое изображение. 2. Для прогнозирования значений хt в будущие периоды предполагается построить уравнение авторегрессии. Выбрать наилучшее уравнение, обосновать выбор. Указать общий вид этого уравнения. Задание №2. Ответить на следующие вопросы: 1. Какие виды моделей относятся к динамическим эконометрическим моделям? 2. Общий вид записи модели авторегрессии. 3. С помощью какого метода оцениваются параметры модели авторегрессии? 4. Как проверяется статистическая значимость модели авторегрессии? 5. Как выполняется точечный прогноз на основе построенной модели авторегрессии? 6. Как выполняется интервальный прогноз на основе построенной модели авторегрессии? Методические рекомендации: Выполнить задания в соответствии с условием (задания № 1 и №2). Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г Неделя 12 СРСП 23-24 Тема: Многомерный статистический анализ Цель: Проверить уровень знаний студентов по многомерному анализу данных. Форма проведения: выступления с минидокладами Задание. Ответьте на вопросы: 1. Понятие многомерного шкалирования. 2. Основные задачи многомерного шкалирования. 3. Исходные данные для многомерного шкалирования.: мера сходства и мера различия. 4. Классификация моделей многомерного шкалирования. 5. Метрические модели многомерного шкалирования, модель Торгерсона. 6. Не метрические модели МШ: меры соответствия; общая схема алгоритма не метрического многомерного шкалирования и сущность его этапов. Алгоритмы реализации не метрического и метрического этапов. Методические рекомендации: Выступления с докладами по вопросам СРСП составленных с использованием различных источников. Литература: Литература: 1.Дуброва Т.А. Статистические методы прогнозирования. - М.:ЮНИТИ, 2003г 2.Лугачев М.И., Ляпунцов Ю.П. «Методы социально-экономического прогнозирования.- М.:ТЕИС, 1999г 3.Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы.- М.: Финансы и статистика, 2003г 4.Экономико-статистический анализ. Под редакцией Ильенковой С.Д. – М.:ЮНИТИ, 2002г 5.Многомерный статистический анализ в экономике. Под редакцией Тамашевича В.Н.- М.:ЮНИТИ, 1999г Неделя 13 СРСП 25-26 Тема: Многомерный статистический анализ Цель: Проверить уровень знаний студентов по многомерному анализу данных. Форма проведения: выступления с минидокладами Задание № 1. Ответьте на вопросы: 1.Дисперсионный анализ влияния качественных факторов. 2. Факторный анализ. 3 Метод главных факторов Задание 2. По таблице, содержащей две составляющие дисперсии, найти три другие составляющие Компоненты № заданий дисперсии признака 1 2 3 4 5 6 0,10 0,15 0,20 0,25 Специфичность b 2j = d 2j − c 2j Дисперсия ошибок c = 1− r = d − b 2 j 2 j 2 j 0,20 0,05 Надежность 0,10 8 0,30 2 j Характерность d 2j = 1 − h 2j = b 2j + c 2j Общность h 2j = 1 − d 2j 7 0,35 0,45 0,75 0,60 0,85 0,50 0,75 0,90 r j2 = 1 − c 2j Задание № 3. Выполните тест: 1. Как называется раздел математической В) Дискриминантных функций статистики, который позволяет изучать различия С) Ортогональной компоненты между двумя (и более) группами объектов и на D) Индикатора основе найденных характеристик 3. Как называется направление экономикоидентифицировать объекты с неизвестной математического моделирования, которое классовой принадлежностью? позволяет количественно диагностировать А) Дискриминантный анализ состояние многомерных экономических объектов, В) Индикативный анализ классифицировать состояния системы и С) Факторный анализ предупреждать системные кризисы? D) Компонентный анализ А) Индикативный анализ 2. На основе чего проводится диагностика В) Факторный анализ состояний сложной системы в индикативном С) Компонентный анализ анализе? D) Дискриминантный анализ А) Индексов Методические рекомендации: Составить письменный конспект (минидоклад) по вопросам (задание № 1) и выступить на СРСП, согласно плану. Решить задачу.Ответить на тестовые задания в конце занятия для закрепления материала. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г Неделя 14 СРСП 27-28 Тема: Многомерный статистический анализ Цель: Проверить студентов в умении применять методы ранговой корреляции Форма проведения: решение задач Задание № 1. Решите следующие задачи: №1. По данным 30 нефтяных компаний получено следующее уравнение регрессии между оценкой Y (ден.ед.) и фактической стоимостью Х (ден.ед) этих компаний: ух=195+0,875х. Найти: 95%-ные доверительные интервалы для среднего и индивидуального значений оценки предприятий, фактическая стоимость которых составила 1300 ден. ед., если коэффициент корреляции между переменными равен 0,76, а среднее квадратическое отклонение переменной Х равно 270 ден. ед. №2. При приеме на работу семи кандидатам было предложено два теста. Результаты тестирования приведены в таблице: Тест Результаты тестирования кандидатов (в баллах) 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26 Вычислить коэффициент ранговой корреляции Спирмена между результатами тестирования по двум тестам и на уровне 0,05 оценить его значимость. Задание №2 Выполните индивидуальное задание по теме «Многомерный анализ данных» Методические указания по выполнению задания: Два человека дегустируют 10 сортов чая. Каждый из них расположил эти сорта в порядке убывания предпочтений (второй и третий столбцы) Есть ли какая-нибудь разница между этими результатами? Доверительная вероятность р=95%. Сорт чая Дегустатор 1 Дегустатор 2 А 6 5 Б 4 6 В 3 4 Г 10 7 Д 5 1 Е 1 2 Ж 8 8 З 2 3 И 7 9 К 9 10 Заполним таблицу: Сорт чая Дегустатор 1 Дегустатор 2 d d2 А 6 5 1 1 Б 4 6 -2 4 В 3 4 -1 1 Г 10 7 3 9 Д 5 1 4 16 Е 1 2 -1 1 Ж 8 8 0 0 З 2 3 -1 1 И 7 9 -2 4 К 9 10 -1 1 Сумма 38 d- это разность между значениями дегустаторов для одного и того же сорта чая, то есть 4-й столбец – это разность 2-го и 3-го столбцов. Каждое число 4-го столбца возводим в квадрат и результат записываем в 5й столбец. В последней строке указана сумма чисел 5-го столбца. Гипотеза Н0: между результатами этих исследований нет связи, они несогласованны друг с другом. Гипотеза Н1: между результатами этих исследований существует связь. р = 0,95, α = 1 − р = 1 − 0,95 = 0,05 ⇒ z α = z 0 , 05 = 1,645 . Это граничная точка Ранговый коэффициент корреляции Спирмена: r = 1 − 6 s ∑d ( 2 38 ) = 1 − 6 10(10 n n −1 2 2 − 1) = 0,77 Статистика z = rs n − 1 = 0,77 10 − 1 = 2,31 > 1,645 Гипотезу Н0 отвергаем и принимаем гипотезу Н1 на уровне значимости 5%. Между результатами исследований существует некая связь. Задание №3. Выполненное задание защитить, ответив на следующие вопросы: 1. В чем заключается сущность ранговой корреляции? 2. Дайте определение ранга. С помощью какого показателя оценивается теснота связи между переменными, если объекты ранжированы по двум признакам? 3. Какие показатели относятся к ранговым коэффициентам корреляции? 4. Как определяется коэффициент корреляции рангов Спирмена? 6.С помощью какого показателя оценивается теснота связи между факторами, если объекты ранжированы по трем и более признакам? 7.Как определяется коэффициент корреляции Кендалла для связанных рангов? 8.Как определяется коэффициент конкордации, если ранги не повторяются? 9.В каких пределах изменяется коэффициент конкордации (множественный коэффициент ранговой корреляции)? 10.В каких пределах изменяется коэффициент ранговой корреляции Спирмена? Методические рекомендации: Индивидуальное задание выполняется в отдельных тетрадях. Выполненное задание должно содержать исходные данные, расчетную таблицу, расчет указанных в задании показателей и анализ полученных результатов. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г СРСП 29 Тема: Многомерный статистический анализ Цель: Проверить студентов в умении применять методы кластерного анализа. Форма проведения: выполнение индивидуального задания Задание №1 Выполните индивидуальное задание №2 по теме: «Многомерный анализ данных» Методические указания по выполнению задания: Пять производственных объектов характеризуются двумя признаками: объемом продаж и среднегодовой стоимостью основных производственных фондов. Объект 1 2 3 4 5 Объем продаж 1 3 6 13 12 Среднегодовая стоимость 9 10 8 5 7 производственных фондов Провести классификацию этих объекта с помощью принципа «ближайшего соседа» Найдем расстояние между объектами по формуле р (х , x ) = i j ∑ (x k im 2 − x jm ) . m =1 Заполним таблицу. Объекты 1 2 3 4 5 1 0 2,24 5,10 12,65 11,18 2 0 3,61 11,18 9,49 3 0 7,62 6,08 4 0 2,24 5 0 На пересечении строки «i» и столбца «j» указано расстояние р хi , x j ( Например, р( х1 , x3 ) = р ( х3 , x 5 ) = на пересечении строки «1» и столбца ) «3» указано расстояние (1 − 6) + (9 − 8) = 5,10 , а на пересечении строки «3» и столбца «5» указано расстояние (6 − 12)2 + (8 − 7 )2 = 6,08 . Применим принцип «ближайшего соседа». Находим в таблице 2 2 наименьшее из расстояний (если таких несколько, то выберем любое из них). Это р1, 2 = р 4 ,5 = 2,24 . Пусть р min = р 4,5 = 2,24 . Тогда мы можем объединить в одну группу объекты 4 и 5, то есть в объединенном столбце «4 и 5» будет наименьшее из соответствующих чисел столбцов «4» и «5» первоначальной таблицы расстояний. Аналогично поступаем и со строками «4» и «5». Получим новую таблицу. Объекты 1 2 3 4и5 1 0 2,24 5,10 11,18 2 0 3,61 9,49 3 0 6,08 4и5 0 Находим в полученной таблице наименьшее из расстояний: р min = р1, 2 = 2,24 . Тогда мы можем объединить в одну группу объекты 1 и 2, то есть в объединенном столбце «1 и 2» будет наименьшее из соответствующих чисел столбцов «1» и «2» предыдущей таблицы расстояний. Аналогично поступаем и со строками «1» и «2». Получим новую таблицу. Объекты 1и2 3 4и5 1и2 0 3,61 9,49 3 0 6,08 4и5 0 Находим в полученной таблице наименьшее из расстояний: р min = р1, 2;3 = 3,61 . Тогда мы можем объединить в одну группу объекты 1, 2 и 3, то есть в объединенном столбце «1,2 и 3» будет наименьшее из соответствующих чисел столбцов «1 и 2» и «3» предыдущей таблицы расстояний. Аналогично поступаем и со строками «1 и 2» и «3». Получим новую таблицу. Объекты 1, 2 и 3 4и5 1, 2 и 3 0 6,08 4и5 0 Мы получили два кластера: (1,2,3) и (4,5). Задание №2. Защитить выполненное задание, ответив на следующие вопросы: 1. Сущность метода кластерного анализа. 2. Этапы кластерного анализа. 3. Понятие меры сходства, их виды. 4. Какая мера сходства использовалась при классификации объектов в данной задаче? 5. Что такое дендрограмма? Методические рекомендации: Индивидуальное задание выполняется в отдельных тетрадях. Выполненное задание должно содержать исходные данные, расчетные таблицы, расчет расстояний между объектами и дендрограмму. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.: Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г СРСП 30 Тема: Многомерный статистический анализ Цель: Проверить уровень знаний студентов по многомерному анализу данных. Форма проведения: решение задач Задание № 1.Решите следующую задачу: Семь сельскохозяйственных предприятий характеризуются тремя признаками: площадью с/х угодий, среднегодовой стоимостью основных производственных фондов числом занятых работников. Объект 1 2 3 4 5 6 7 Площадь с/х угодий, тыс. га 15 23 18 17 20 25 23 Среднегодовая стоимость производственных 25 30 19 17 26 23 31 фондов, млн. д.ед. Число занятых работников, тыс. чел. 2 3 1,5 2,1 1,8 1,6 1,7 Провести классификацию этих объектов с помощью принципа «ближайшего соседа» Задание № 2.Выполните тест: 1. Какие существуют методы классификации 4. Какие существуют меры сходства между многомерных наблюдений? объектами при классификации многомерных А) Факторный анализ, нечеткие множества наблюдений? В) Корреляционно-регрессионный анализ, А) Линейный коэффициент корреляции, ранговая корреляция коэффициент детерминации, показатели С) Кластерный анализ, дискриминантный анализ, расстояния индикативный анализ В) Мера «похожести», кластеры, внутригрупповая D) Методы сетевого планирования, методы сумма квадратов отклонений корреляционно-регрессионного анализа С) Классы, дискриминанты, коэффициенты 2. Как называется совокупность объектов, подобия обладающих определенным свойством в теории D) Коэффициенты подобия, коэффициенты связи, распознавания? показатели расстояния А) Состояние 5. В каких пределах изменяется коэффициент В) Класс подобия при классификации многомерных С) Набор наблюдений? D) Система А) 0 ≤ S jm ≤ 1 3. Что является количественной характеристикой В) − 1 ≤ S jm ≤ 1 класса при классификации многомерных наблюдений? С) S jm ≤ 1 А) Мера сходства В) k-средняя D) S jm ≥ 1 С) Внутригрупповая сумма квадратов отклонений 6. Как рассчитывается функция корреляционное D) Кластеры расстояния при классификации многомерных наблюдений? А) d ( x j , x m ) = n ∑ xij − xim С) d w ( x , x ) = j m ∑ (x n − xim ) 2 ij j ( xij − xim ) 2 i =1 i =1 В) d ( x j , x m ) = n ∑w D) d ( x j , x m ) = 1 − r jm i =1 Задание №3. Составить глоссарий основных терминов по темам неделей 7-15 и ответить на поставленные вопросы. Методические рекомендации: Выполнить задания в соответствии с условием (задание № 1). Ответить на тестовые задания в конце занятия для закрепления материала. Глоссарий терминов (задание №3) должен быть составлен в отдельных тетрадях, который должен содержать наименование термина и его определение. Терминов должно быть не менее 25. Литература: 1.Ильиченко А.Н. Экономико-математические методы – М.:Финансы и статистика, 2006г 2. Эконометрика. Под редакцией Елисеевой И.И.. -М.: Финансы и статистика, 2005г 3. Шелобаев С.И. «Математические методы и модели в экономике», М: ЮНИТИ, 2000г 4. Эконометрика. Под редакцией Кремера Н.Ш. – М.:ЮНИТИ, 2003г 5.Просветов Г.И. Прогнозирование и планирование. Задачи и решение. М.- РДЛ, 2005г 7. Методические рекомендации и указания по типовым расчетам, выполнению расчетно-графических, лабораторных работ, курсовых проектов (работ) Курсовая работа не запланирована. 9. Материалы для самостоятельной работы обучающегося: Тема: Статистический и регрессссионный анализ Задача №1 Данные опроса восьми групп семей о расходах на продукты питания в зависимости от уровня доходов семьи приведены в таблице (числа относительные): Доходы семьи (х) 1,4 3,3 5,5 7,6 9,8 12,0 14,7 18,9 Расходы на продукты 1,1 1,4 2,0 2,4 2,8 3,1 3,5 4,0 питания (у) Требуется: 1) рассчитать коэффициент корреляции и оценить тесноту связи между доходами семьи и расходами на продукты питания; 2) построить линейную однофакторную модель зависимости расходов на питание от дохода семьи; 3) рассчитать коэффициент детерминации, коэффициент эластичности и пояснить их экономический смысл; 4) найти среднюю ошибку аппроксимации и оценить точность построенной регрессионной модели. Задача №2 Результаты обследования 10 статистически однородных филиалов фирм приведены в таблице (числа условные): Номер Производительность Фондовооруженность Энерговооруженность филиала труда (у) (х1) (х2) 33 56 1 74 2 84 34 58 67 73 36 3 35 70 4 93 5 56 33 73 77 6 71 37 78 117 39 7 8 111 42 99 93 9 135 43 96 125 44 10 Требуется: 1) рассчитать парные коэффициенты корреляции и пояснить их экономический смысл; 2) найти коэффициент множественной корреляции и совокупный коэффициент детерминации и охарактеризовать степень совместного влияния факторов фондовооруженности и энерговооруженности на производительность труда; 3) построить модель множественной линейной регрессии производительности труда от факторов фондо- и энерговооруженности; 4) рассчитать частные коэффициенты корреляции, детерминации, эластичности и частные бетакоэффициенты и с их помощью оценить влияние отдельных факторов (при неизменном значении других). Тема: Многомерный статистический анализ Задача №1 Пять производственных объектов характеризуются двумя признаками: Объемов продаж и среднегодовой стоимостью основных производственных фондов. Объект 1 2 3 4 5 Объем продаж 2 5 7 12 13 Среднегодовая стоимость основных 7 9 10 8 5 производственных фондов Провести классификацию этих объектов с помощью принципа «ближайшего соседа». Задача №2. Прогнозируемая доля рынка нового товара подчиняется нормальному распределению с параметрами х =15% и σ х =2%. Определить вероятность того, что ожидаемая доля рынка будет от 14% до 17%. Тема: Прогнозирование временных рядов Задача №1 В таблице указан объем продаж (тыс. д.ед) за последние 11 кварталов. Дать на основании этих данных прогноз объема продаж на следующие два квартала. Квартал 1 2 3 4 5 6 7 8 9 10 11 Объем 4 5 5 6 9 9 8 10 11 13 16 продаж Прогноз сделать с помощью аддитивной и мультипликативной модели. Задача №2 В предыдущей задаче дать прогноз объема продаж на 12 квартал методом простого экспоненциального сглаживания. α = 0,8, F1 = 3 . Задача №3 В таблице представлены данные, отражающие динамику роста доходов на душу населения yt (ден.ед) за восьмилетний период: t 1 2 3 4 5 6 7 8 yt 1133 1222 1354 1389 1342 1377 1491 1684 Полагая, что тренд линейный и условия классической модели выполнены: 1) найти уравнение тренда и оценить его значимость на уровне 0,05; 2) дать точечный прогноз и с надежностью 0,95 интервальный прогнозы среднего и индивидуального значений доходов на девятый год. Тематика рефератов по дисциплине «Анализ данных и прогнозирование экономики» 1.Место математического моделирования в экономической науке. 2.Особенности измерения и анализа статистических данных в экономике. 3.Характеристика статистических данных в экономике. 4.Особенности статистико-экономических данных и их влияние на анализ предприятия 5.Методы прогнозирования временных рядов 6.Прогнозирование экономических показателей на основе корреляционно-регрессионного анализа. 7.Прогнозирование экономических показателей с использованием функции экспоненциального сглаживания 8.Прогнозирование экономических показателей на основе аддитивной модели временного ряда 9.Прогнозирование экономических показателей на основе мультипликативной модели временного ряда 10.Прогнозы с применением метода скользящего среднего 11.Прогнозирование в условиях неопределенности 12.Прогнозирование экономической динамики на основе временных рядов 13.Прогнозирование экономических показателей на основе трендовых моделей 14.Адаптивные методы прогнозирования экономических процессов 15.Использование авторегрессионных моделей для прогнозирования экономических процессов 16.Методы классификации многомерных наблюдений 17.Использование методов кластерного анализа 18.Использование методов дискриминантного анализа 19.Методы описательной статистики. 20. Представление информации в многомерном пространстве. 21. Ранговая корреляция. 22. Ранговые методы. 23. Факторный анализ. 24. Метод главных факторов. 25. Многомерное шкалирование. 26. Классическая модель многомерного шкалирования Торгерсона. 27. Неметрические методы анализа. 28. Методы кластерного анализа. 29. Экспертные оценки. 30. Прогнозирование неустойчивости методами теории катастроф. 10. Методические указания по прохождению учебной, производственной и преддипломных практик, формы отчетной документации (спецификой дисциплины не предусмотрено) 11. Материалы по контролю и оценке учебных достижений обучающихся «Схема оценки знаний по дисциплине» № 1 2 3 4 6 7 8 9 10 11 12 Схема оценки знаний по дисциплине «Анализ данных и прогнозирование экономики» Оценка вида Неделя % за кол-во 1 2 3 4 5 6 7 8 9 10 11 12 13 работу выполн. работ Активность на 100 15 + + + + + + + + + + + + + Критерии оценки лекции Активность на практических занятиях Активность на занятии СРСП Выполнение заданий СРС Индивидуальные задания Глоссарий Рубежный контроль Промежуточная аттестация (Р1,Р2) Текущий контроль Рейтинг допуска Итоговый контроль (экзамен) Итого 14 15 + + 100 15 + + + + + + + + + + + + + + + 100 15 + + + + + + + + + + + + + + + 100 15 + + + + + + + + + + + + + + + 100 5 100 100 2 2 100 среднеариф. сумма оценок + + + + + + + (Р1+Р2)/2 Текущий контроль*0,6 100*0,4 Рейтинг допуска+ итоговый контроль Примерные тестовые вопросы 1. Как подразделяются модели по целевому назначению? A) теоретико-аналитические и прикладные B) жестко детерминированные и вероятностные C) статические и динамические D) дескриптивные и нормативные 2. Как подразделяются модели по типу содержащейся в моделях информации? A) дескриптивные и нормативные B) структурные и функциональные C) открытые и закрытые D) статические и динамические 3. Как подразделяются прогнозы в зависимости от типов прогнозирования? A) поисковые, нормативные и основанные на творческом видении B) точечные и интервальные C) вариантные и инвариантные D) пассивные и активные 4. Как подразделяются прогнозы по способу представления результатов? A) точечные и интервальные B) пассивные и активные C) статические и динамические D) вариантные и инвариантные 10.Как подразделяются задачи кластер-анализа? A) иерархические и неиерархические B) параллельные и перпендикулярные C) групповые и внегрупповые D) постоянные и переменные 11.Как в кластерном анализе называется дерево объединения кластеров? A) дендрограмма B) коррелограмма + + C) симплекс D) изокоста 12. В каких случаях применяется метод «ближайшего соседа» в кластерном анализе? A) если группировки имеют цепочечную структуру B) группировки образуют шарообразные «облака наблюдений» в пространстве признаков C) если группировки имеют непрерывную структуру 16.С помощью какого показателя оценивается теснота связи между переменными, если объекты ранжированы по двум признакам? A) коэффициента ранговой корреляции B) коэффициента детерминации C) F–критерия Фишера D) t–критерия Стьюдента 18. Дайте определение временного ряда. A) временной ряд – это совокупность значений случайных величин за месяц; B) временной ряд – это значения, характеризующие определенную экономическую модель за период времени; C) временной ряд – это совокупность значений какого-либо экономического показателя за несколько последовательных периодов; D) временной ряд – это совокупность значений в данный момент времени; A) последовательность построения временного ряда называется автокорреляцией уровней временного ряда; B) корреляционная зависимость между последовательными уровнями временного ряда называется автокорреляции уровней временного ряда; C) зависимость между лагами временного ряда называется автокорреляцией уровней временного ряда; D) корреляционную зависимость между параметрами временного ряда называется автокорреляцией уровней ряда 22. Общий вид записи уравнения парной линейной регрессии. A) B) y = f ( x1 , x2 ) y = f ( x1 , x 2 ...x k ) y = f (x ) у D) y = f x C) 31. С помощью какого показателя проверяется значимость коэффициента ранговой корреляции Кендалла? A) t–критерия Стьюдента B) Коэффициента детерминации C) F–критерия Фишера D) Критерия 19.Какая модель временного ряда называется аддитивной? A) модель, в которой временной ряд представлен как частное от деления трендовой и циклической компонент; B) модель, в которой временной ряд представлен как сумма трендовой, циклической и случайной компонент; C) модель, в которой временной ряд представлен как произведение трендовой, циклической и случайной компонент; D) модель, в которой временной ряд представлен как разность трендовой, циклической и случайной компонент; 20.Какой способ называют аналитическим выравниванием временного ряда? A) построение статистической функции, характеризующей зависимость между данными за определенный период времени называют аналитическим выравниванием временного ряда; B) построение аналитической функции, характеризующей зависимость уровней ряда от времени называют аналитическим выравниванием временного ряда; C) метод отклонений от тренда называют аналитическим выравниванием временного ряда; D) метод определения остатков корреляционной зависимости называется аналитическим выравниванием временного ряда. 21. Дайте определение автокорреляции уровней временного ряда. χ2 32. Какие существуют методы классификации многомерных наблюдений? A) Кластерный анализ, дискриминантный анализ, индикативный анализ B) Факторный анализ, нечеткие множества C) Корреляционно-регрессионный анализ, ранговая корреляция D) Методы сетевого планирования, методы корреляционно-регрессионного анализа 33. Какие существуют меры сходства между объектами при классификации многомерных наблюдений? A) Коэффициенты подобия, коэффициенты связи, показатели расстояния B) Линейный коэффициент корреляции, коэффициент детерминации, показатели расстояния C) Мера «похожести», кластеры, внутригрупповая сумма квадратов отклонений D) Классы, дискриминанты, коэффициенты подобия 34. Как рассчитывается функция евклидово расстояния при классификации многомерных наблюдений? A) d ( x , x ) = j m ∑ (x n − xim ) 2 ij i =1 B) d w ( x , x ) = j m n ∑ w (x j i =1 ij − xim ) 2 C) d ( x j , x m ) = 1 − r jm C) Верификация D) Идентификация n D) d ( x j , x m ) = ∑ xij − xim i =1 35. К какому виду задач кластерного анализа относится метод «ближайшего соседа»? A) Иерархические B) Неирархические C) Параллельные D) Цепочечные 36. Какие модели служат для выработки управляющих решений в условиях определенных закономерностей и взаимосвязей? A) Модели нормативного анализа B) Модели позитивного анализа C) Модели системного анализа D) Модели дискретного анализа 37. Какой этап решения задачи построения регрессионной модели включает определение параметров выбранной модели? A) Параметризация B) Спецификация 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 38. Как называются модели, которые описывают экономику в развитии? A) Динамические B) Статистические C) Стохастические D) Развивающиеся 39. Как называется процесс распространения закономерностей, связей и соотношений, действующих в изучаемом периоде, за его пределы? A) Экстраполяцией B) Фильтрацией C) Сглаживанием D) Выравниванием 40. Что включает фильтрация исходного временного ряда? A) Сглаживание и выравнивание временного ряда B) Упорядочивание временного ряда C) Экстраполяцию временного ряда D) Аппроксимацию временного ряда Вопросы для проведения контроля по материалам 1 – 15 недели: Понятия моделирования и модели Виды моделирования. Классификация моделей. Понятие экономико-математической модели. Основные понятия теории математического программирования Теория статистического моделирования. Основные элементы задачи статистического анализа. Типы задач статистического анализа Корреляционный анализ. Регрессионный анализ. Факторный и компонентный анализ Метод главных факторов. Ранговая корреляция. Коэффициенты Спирмена и Кендала. Методы классификации многомерных наблюдений. Мера сходства. Коэффициенты подобия. Формы представления коэффициентов подобия. Кластерный анализ. Иерархические методы кластерного анализа. Индикативный анализ. Способы нахождения оценок состояния в индикативном анализе. Основные требования для построения дискриминантного анализа. Временные ряды. Аддитивная и мультипликативная модели временных рядов Экспоненциальное сглаживание. Экспоненциальное сглаживание с поправкой на тренд Дисперсионный анализ влияния качественных факторов. Авторегрессионные модели Модель адаптивных ожиданий Модель частичной (неполной) корректировки. 12. Программное и мультимедийное сопровождение учебных занятий (в зависимости от содержания дисциплины). Надстройки MS Excel «Анализ данных» 13. Перечень специализированных аудиторий, кабинетов и лабораторий. Корпус № 3 , аудитории № 104, 106.