Линейная модель парной регрессии и корреляции

advertisement
Линейная модель парной
регрессии и корреляции
Корреляция – это статистическая зависимость между
случайными величинами,
не
имеющими
строго
функционального характера, при которой изменение одной из
случайных величин приводит к изменению математического
ожидания другой.
1. Парная корреляция – связь между двумя признаками
(результативным и факторным).
2. Множественная корреляция – зависимость результативного и
двух или более факторных признаков, включенных в
исследование.
3. Частная корреляция – зависимость между результативным и
одним факторным признаками при фиксированном значении
других факторных признаков.
Корреляционный анализ имеет своей задачей количественное определение
тесноты связи между двумя признаками (при парной связи) и
между результативным
признаком
и
множеством
факторных
признаков (при многофакторной связи).
Теснота связи количественно
2
выражается величиной коэффициентов корреляции.
Регрессионный анализ предназначен для исследования
зависимости исследуемой переменной от различных
факторов и отображения их взаимосвязи в форме функции,
которая называется регрессионной моделью.
Обычно модели строятся на основе двух типов исходных
данных:
- данные, характеризующие совокупность различных объектов
в определенный момент (период) времени;
- данные, характеризующие один объект за ряд
последовательных моментов (периодов) времени.
Модели, построенные по данным первого типа, называются
пространственными моделями.
Модели, построенные на основе второго типа данных,
3
называются моделями временных рядов.
Рассмотрим два показателя Х и Y.
Предположим, что они зависимы, то есть изменение одного
из них влечет за собой изменение другого.
Если при этом, зная точно значение одного показателя можно
точно определить значение другого, то связь между
показателями называется функциональной.
Однако на практике в подавляющем большинстве
встречаются зависимости иного вида, когда изменение
одного показателя лишь в среднем приводит к изменению
другого. Такие зависимости называются статистическими
или корреляционными. При них, зная значение Х, нельзя
точно определить Y , так как на Y кроме Х влияет еще
множество неучтенных факторов. Поэтому, зная Х можно
лишь в среднем оценить значение Y.
Примеры таких зависимостей в экономике: зависимости
между ценой и спросом, затратами на производство и
объемом продукции и т.д.
4
По виду функции различают модели:
- линейные;
- нелинейные.
По количеству включенных факторов:
- однофакторные (парной регрессии);
- многофакторные (множественной регрессии).
5
6
Для выбора вида аналитической зависимости можно
использовать следующие методы:
– графический (вид зависимости определяется на основе
анализа поля корреляций);
– аналитический (на основе качественного анализа
изучаемой взаимосвязи);
– экспериментальный (построение нескольких моделей
различного вида с выбором наилучшей согласно
применяемому критерию качества).
7
Рассмотрим простейшую модель парной регрессии –
линейную регрессию.
Линейная регрессия находит широкое применение ввиду
четкой экономической интерпретации ее параметров.
Предположим, что произведено n наблюдений двух
показателей Х и Y.
Исходными данными для построения уравнения регрессии
служат пары значений
(x1, y1), (x2, y2), … , (xn, yn)
8
ПРИМЕР .
Торговая организация желает выяснить, как влияет
количество вложенных в рекламную акцию денег - X (тыс.руб.)
на количество проданного товара – Y (тыс. шт.). Для этого
проводились наблюдения в разных городах региона и были
получены следующие данные.
Ставиться задача проверить, влияют ли затраты на рекламу
на объемы продаж, и если влияют, то какой характер имеет
это влияние.
9
Корреляционное поле
Визуальный анализ поля корреляций позволяет определить
форму кривой регрессии, ее особенности.
Зная типичный вид графиков различных функций можно
подобрать соответствующую аналитическую зависимость.
10
Линейная регрессия сводится к нахождению уравнения вида
y x  ba  ab  x
или
y  ab  ba  x  
Уравнение вида y x  b
a  ba x
позволяет по заданным значениям фактора x находить
теоретические значения результативного признака, подставляя
в него фактические значения фактора.
  y  yˆ - отклонение
11
Построение линейной регрессии сводится к оценке ее
параметров – a и b.
Классический подход к оцениванию параметров линейной
регрессии основан на методе наименьших квадратов
(МНК)

n
i 1
yi  y xi

2
   i2  min
ba  y  b  x
cov  x, y 
ba 
2
x
1
x  x
n
n
1
y  y
n
i 1
______
cov  x, y   y  x  y  x
____
2
  x x
2
x
2
______
1
yx  yx
n
____
2
1
x   x2
n
12
Параметр a называется коэффициентом регрессии. Его
величина показывает среднее изменение результата с
изменением фактора на одну единицу.
Линейный коэффициент корреляции
 x cov  x, y 
rxy  ba 

y
 x  y
1  rxy  1
Для
оценки
качества
подбора
линейной
функции
рассчитывается квадрат линейного коэффициента корреляции
rxy2
, называемый коэффициентом детерминации.
13
Чтобы иметь общее суждение о качестве модели из
относительных отклонений по каждому наблюдению,
определяют среднюю ошибку аппроксимации:
y  yx
1
A 
 100%
n
y
Средняя ошибка аппроксимации не должна превышать
8–10%.
14
Парная нелинейная регрессия
15
Download