Статистика: Учебник /Под ред. Елисеевой.- М., 2006. С.146- 149

advertisement
Статистика: Учебник /Под ред. Елисеевой.- М., 2006. С.146149
Оглавление
Уравнение парной регрессии ................................................................ 1
Проблема измерения связи имеет две стороны: определение
формы связи и установление тесноты связи.
Под формой корреляционной связи понимают тип аналитичсекой
формулы, выражающей зависимость между изучаемыми признаками,
то есть уравнение регрессии. Порядок выбора типа функции, условия
оценки и построения уравнения регрессии отражает следующий
фрагмент учебника “Статистика””
Уравнение парной регрессии
Если изучается связь между двумя переменными, которые
можно рассматривать как фактор и результат (т.е. вероятно наличие
зависимости), то эту зависимость целесообразно представить в
математическом виде.
С этой целью подбирают функцию yˆ  f ( x) , которая наилучшим
образом соответствует исходным данным, иначе говоря, обеспечивает
наилучшую аппроксимацию поля корреляции.
При выборе типа функции руководствуются характером
расположения точек на поле корреляции, а также содержанием
изучаемой связи.
Так, например, при изучении зависимости себестоимости
единицы продукции (y) от объема производства (x) теоретический
анализ показывает, что такая зависимость должна описываться
b
x
уравнением гиперболы: yˆ  a  , поскольку при увеличении объема
производства себестоимость снижается до определенного предела,
по достижении которого ее дальнейшего снижения не происходит.
Однако расположение точек на поле корреляции может показать,
что наилучшим образом исходным данным соответствует линейная
функция yˆ  a  bx .
Математическое описание зависимости в среднем изменений
переменной y от x называется уравнением парной регрессии.
Чаще всего в экономике используется линейное уравнение
парной регрессии:
yˆ x  a  bx ,
где ŷ x - среднее значение результативного признака при
определенном значении факторного признака x;
a – свободный член уравнения регрессии;
b – коэффициент регрессии, который показывает, на сколько
единиц в среднем изменится результативный признак у при
изменении факторного признака х на одну единицу его измерения.
При
такой
интерпретации
коэффициента
регрессии
предполагается, что сила воздействия x на y постоянна при любых
значениях x.
Знак при коэффициенте регрессии b соответствует направлению
зависимости y от x:
b  0 - зависимость прямая;
b  0 - зависимость обратная.
Если в исходных данных имеется нулевое значение x, то
свободный член a показывает среднее значение y при x=0.
Во всех остальных случаях a – доводка, обеспечивающая
следующее равенство:
y  a  bx .
В этом случае значение a не интерпретируется. Знак при
свободном члене a зависит от соотношения между интенсивностью
вариации переменных x от y. Как известно, интенсивность вариации
измеряется коэффициентом вариации v. Тогда:
если v y  v x , то
a  0;
если v y  v x , то a  0 ,
где a - свободный член уравнения парной регрессии.
Как уже отмечалось, в линейном уравнении регрессии
предполагается, что влияние изменения x на у постоянно. Если это
условие не выполняется, то необходимо использовать уравнение
нелинейной зависимости y от x – нелинейные уравнения регрессии.
Наиболее распространены следующие нелинейные уравнения парной
регрессии:
b
yˆ  a  ,
x
yˆ  a  bx  cx 2 ,
yˆ  ab x ,
b
yˆ  a  ,
x
и т. д.
Выбираемые функции должны быть линейны по параметрам.
Перечисленные
регрессии
приводятся
к
линейному
виду
(линеаризуются)
путем
замены
переменных
или
их
логарифмированием.
Параметры линейного уравнения парной регрессии находятся
методом наименьших квадратов (МНК). Исходное условие МНК
формулируется следующим образом:
n
n
f (a, b)   ( yi  yˆ i )  [ yi  (a  bxi )] 2  min ,
2
i 1
i 1
т.е. должна быть обеспечена минимальность суммы квадратов
отклонений фактических значений результативной переменной от ее
теоретических значений, получаемых на основе уравнения регрессии.
Для отыскания значений параметров a и b, при которых f(a,b)
принимает минимальное значение, приравниваем нулю первые
частные производные функции:
n
f '
 2 ( yi  a  bx)( 1)  0 ,
a
i 1
'
n
f
 2 ( yi  a  bx)(  x)  0 .
b
i 1
Преобразуя
полученные
уравнения,
нормальных уравнений МНК для прямой:
получаем
систему
n
n

na  b xi   y i

i 1
i 1
 n
n
n
.
a x  b x 2 
y
x


i
i
i i
 
i 1
i 1
i 1
Отсюда:
a
a

;b  b ,


где  - определитель системы;  a - частный определитель,
получаемый путем замены коэффициентов при a членами правой
части системы уравнений;  b - частный определитель, получаемый
путем замены коэффициентов при b членами правой части системы
уравнений.
n
n
n
i 1
i 1
  n  xi   xi  y i .
i 1
Тогда
2
n
a
n
y x
i
i 1
i 1
2
i
n
n
i 1
i 1
2
  y i xi  xi


2
n xi    xi 
i 1
 i 1 
n
b
n
n
n
n
i 1
i 1
i 1
;
n y i xi   xi  y i


2
n xi    xi 
i 1
 i 1 
n
n
2
.
Можно найти параметр a, разделив на n первое уравнение
системы:
a  bx  y ,
отсюда
a  y  bx .
Параметр b может быть выражен следующим образом:
b
yx  y  x
x 2  (x ) 2
.
Так как знаменатель этого выражения есть не что иное, как
дисперсия переменной x, формула коэффициента регрессии b может
быть записана следующим образом:
b
yx  y  x
 x2
.»
Download