Uploaded by nurbekkadyr7182

Основы статистического моделирования

advertisement
Основы статистического моделирования
исследовательских работ
1. Сущность статистического моделирования
2. Основы корреляционно-регрессионного
анализа
3. Принципы составления прогнозных моделей
Сущность модели и моделирования
Модель – это упрощенное подобие реального
объекта, который отражает существенные
особенности (свойства) изучаемого реального
объекта, отвечающие цели моделирования.
Сущность модели и моделирования
Модель нужна для изучения, представления и
замены определенного объекта или процесса.
Этого объекта называет прототипом или
оригиналом.
Вид модели
• Моделирование – это процесс исследования
реального объекта с помощью модели.
• Моделирование – метод решения задач, при
использовании которого исследуемая система
заменяется более простым объектом,
описывающим реальную систему и
называемым моделью.
• Моделирование – это совокупность действии
создание модели для достижения
поставленной цели.
Статистическая модель -это
математическое выражение которая
строится на основе статистических данных
изучемого явления или процесса.
Примеры
У=f(X1,X2,…….Xn)
где
X1,X2,…….Xn- причинные факторы
У- результат
Виды статистических моделей
Y= a+b1x1+b2x2+…+bnxn+e - аддитивная
Y= a*x1b1*x2b2*…*xnbn+e- мультипликативная
где
У- результат
X1,X2,…….Xn- причинные факторы
a,b1,bn-параметры модели
е-отклонение
Основу статистического моделирования
составляет корреляционно-регрессионный
анализ.
• Корреляционный анализ исследует
степень взаимозависимости
факторов.
• Регрессионный анализ
устанавливает форму взаимосвязи
факторов
Временные ряды описывает изучаемый
процесс или объект в зависимости от
времени.
Факторный анализ выявляет на основе
реально существующих связей латентные
характеристики организационной структуры.
Кластерный анализ предназначен для
классификации исследуемых объектов и
явлении с целью создания однородных
групп и классов.
Дискриминантный анализ предназначен
для решения задач различения объектов
наблюдения по определенным признакам.
Корреляция происходит от слова correlation
означает родственность и связанность. Она
используется для исследования тесноты связи
изучаемых факторов.
Все процессы и явления происходят из за
определенных факторов и причин. Знание и
исследование этих факторов очень важно для
их анализа, контроля и управления.
При исследовании взаимосвязей между
экономическими показателями на
основе статистических данных часто между
ними наблюдается стохастическая
зависимость. Она проявляется в том, что
изменение закона распределения одной
случайной величины происходит под
влиянием изменения другой. Взаимосвязь
между величинами может быть полной
(функциональной) и неполной (искаженной
другими факторами).
Раздел математической статистики,
посвященный изучению взаимосвязей
между случайными величинами, называется
корреляционным анализом ( от лат.
correlatio соотношение, соответствие).
Виды корреляции
Коэффициенты корреляции изменяются в
пределах от -1.00 до +1.00. Обратите внимание на
крайние значения коэффициента корреляции.
Значение -1.00 означает, что переменные имеют
строгую отрицательную корреляцию. Значение
+1.00 означает, что переменные имеют строгую
положительную корреляцию.
Для измерения тесноты связи используется
коэффициент корреляции rx,y
Где:
Сov(x,y) -ковариация между факторами х,у
σх, σу - стандартное отклонение факторов х,у
Численная мера rx,y 0 <= rx,y <=1
Если rx,у =0 то между факторами Х и У у нет
линейной связи.
Если 0 <= |rx,y |< =0,25 то между факторами Х и У
имеется очень слабая связь.
Если 0,25 < |rx,y |< =0,45 то между факторами Х и
У имеется слабая связь.
Если 0,45 <|rx,y |< =0,65 то между
факторами Х и У имеется средняя связь.
Если 0,65 < |rx,y |< =0,80 то между
факторами Х и У имеется значимая
связь.
Если 0,80 < |rx,y |< =0,9 то между
факторами Х и У имеется сильная связь.
Если 0,9 <|rx,y |< =0,99 то между
факторами Х и У имеется очень сильная
связь.
Если |rx,y | =1 то между факторами Х и У
имеется функциональная связь.
Для вычисления коэффициента корреляции
используются специальные программные
функции.
Например в ЭТ ЕХСЕL есть специальная
функция КОРРЕЛ.
Пример на ЕХСЕL
Под регрессией понимает уравнение
описывающее статистическую взаимосвязь
между объясняющим фактором Х и между
объясняемым фактором У в форме
У=F(x)+e
где
х –объясняющий фактор
У- объясняемый фактор
е- отклонение
Регрессионный анализ своей целью имеет
вывод, определение (идентификацию)
уравнения регрессии, включая статистическую
оценку его параметров. Уравнение
регрессии позволяет найти значение
зависимой переменной, если величина
независимой или независимых переменных
известна.
Практически, речь идет о том, чтобы,
анализируя множество точек на графике
(т.е. множество статистических данных), найти
линию, по возможности точно
отражающую заключенную в этом множестве
закономерность (тренд, тенденцию), линию
регрессии.
По числу факторов различают одно-, двух- и
многофакторные уравнения регрессии.
Виды регрессии
По характеру связи однофакторные уравнения регрессии
подразделяются:
а) на линейные: Y=a+bx+е
где x экзогенная (независимая) переменная, y эндогенная
(зависимая, результативная) переменная, a , b параметры;
б) степенные У=a*xb: ,
в) показательные: Y=a*bx ,
c) многофакторные Y=a+b1x1+b2x2+…..bnxn+e
Коэффициент детерминации
Качество и прогностическую силу регрессии
определяет коэффициент детерминации и
обозначается как R2
Принимает значение от 0 до 1 то есть
R2ϵ[0;1]
Коэффициент детерминации
Качество и прогностическую силу регрессии
определяет коэффициент детерминации и
обозначается как R2
Принимает значение от 0 до 1 то есть
R2ϵ[0;1]
Коэффициент детерминации
R 
2
2
ˆ
 ( y  y)
 ( y  y)
2
 1
Где
𝑦-расчетное значение
𝑦-среднее значение
у-фактическое значение
е-отклонение
e
2
 ( y  y)
2
С приближением значения к единице полагается
что качество и прогнозирующая сила регрессии
увеличивается с приближением к нулю
соответственно уменьшается.
Если R2 =0,75 то можно полагать что объясняемый
фактор У на 75 процентов зависит от изменения
фактора Х.
Для определения значимости регрессии
используют критерии Фишера
Принцип использования критерия Фишера
заключается в следующем
Выдвигается гипотеза Н0 о том что R2 не значим.
Рассчитывается значение где n количество
наблюдении m-количество факторов в регрессии
Сравнивается Fнабл c Fкрит.
Если Fнабл>Fкрит то Н0 гипотеза отвергается
Если Fнабл<Fкрит то Н0 принимается
При использовании критерии Стюдента и
Фишера возможны статистические ошибки
первого и второго рода
Статистическая ошибка 1-рода это когда
отвергает правильную гипотезу
Статистическая ошибка 2-рода это когда
принимает неправильную гипотезу
Уровень значимости это вероятность
совершения ошибки 1-рода обозначается
буквой α и принимает значения 0,01 0,05 0,1
Уровень значимости это вероятность
совершения ошибки 1-рода обозначается
буквой α и принимает значения 0,01; 0,05; 0,1.
Мощность критерия это вероятность не
совершения ошибки 2-рода обозначается
буквой β и принимает значения 0,99; 0,95; 0,9.
Динамические ряды
Часто для нахождения уравнений регрессии
используются динамические ряды,
т.е. последовательность экономических
показателей за ряд лет (кварталов, месяцев),
следующих друг за другом.
Пусть уравнение регрессии построено и имеет
вид:
Y=a+bxt+ut t=1,2,,3….n
где ut погрешность уравнения регрессии в год t .
Явление автокорреляции остатков состоит в том,
что в любой год t остаток u t не
является случайной величиной, а зависит от
величины остатка предыдущего года u t- 1
В результате при использовании уравнения
регрессии могут быть большие ошибки.
Для определения наличия или отсутствия
автокорреляции применяется
критерий Дарбина-Уотсона:
Моделирование временного ряда
Временной ряд– это последовательность
значений, описывающих протекающий во
времени процесс, измеренных в
последовательные моменты времени, обычно
через равные промежутки.
Временной ряд выражается с помощью формулы
У=f(T,S,E)
Где
Т-тренд
S-сезон
Е-ошибка
Тренд означает долговременную тенденцию.
Например рост числа населения,изменение
структуры потребления.
Сезонность означает отклонения от тренда в
течении одного года.
Виды временных рядов
Если модель выражается так
Y=T+S+E
то она называется аддитивной моделью.
Если модель выражается так
Y=T*S*E
то она называется мультипликативной моделью.
Временные ряды
Моделирование временных рядов означает
нахождение численных значении параметров и
рассчитать прогнозные значения.
Этапы моделирования временного ряда
1. Описание особенности временного ряда и вывод
графика
2. Определение численных значении тренда,
сезонного фактора и отклонении
3. Сглаживание отклонении и их фильтрация
4. Исследование отклонении и адекватности
модели
5. Вычисление прогнозных значении и их оценка
Для выявления тренда используется методы
1. Регрессии
2. Скользящее среднее
3. Экспоненциального сглаживания
Download