Метод. указ. к заданию №3 по МС

advertisement
Методические указания и рабочие формулы (2 стр.)
1
Задание №3
Регрессионный анализ материалов наблюдений
Цель задания: освоение методики проведения регрессионного анализа.
Исходные данные: парные значения
состояние системы
xi
и
y i ( i  1,2, ...,n )
случайных величин
X и Y , представляющие
( X , Y ) в разные моменты ее наблюдения.
План
Построить поле корреляции - точечную диаграмму (график).
На основании поля корреляции выдвинуть гипотезу о линейной корреляционной зависимости величин
1.
2.

X и Y с функцией регрессии M Y
  Ax  B .
3.
Вычислить оценки
4.
Оценить средние квадратические отклонения
5.
Вычислить выборочный коэффициент корреляции
X
и
X x
Y
математических ожиданий случайных величин
X
и
Y
rXY
случайных величин
X иY.
X иY.
- оценку действительного коэффициента
корреляции.
6.
Проверить гипотезу о не значимости выборочного коэффициента корреляции.
7.
Получить оценку функции регрессии - уравнение регрессии Y на X . Записать уравнение регрессии в
числовом виде. Нанести прямую регрессии на график.
8.
Оценить точность регрессии (точность прогнозов).
9.
Выполнить точечную и интервальную оценку точности коэффициентов a и b уравнения регрессии.
10.
Оценить значимость коэффициента a уравнения регрессии.
11.
Оценить надежность коэффициента корреляции согласно критерию Фишера.
12.
Сделать вывод о наличии, тесноте и форме корреляционной зависимости между случайными
величинами X и Y .
Исходные данные получить у преподавателя.
Указания:
1. Проверку всех гипотез выполнить на 5%-м уровне значимости (т. е. q=0.05 и
2. Необходимые вычисления выполнить в рабочей таблице.
3. Указать свою группу и фамилию в области верхнего колонтитула!
  0.95 ).
Методические указания и рабочие формулы
Для построения поля корреляции (графика) в прямоугольной системе координат нанести точки с
1.
координатами
 xi , yi  .
Выдвижение нулевой гипотезы о форме связи оформить в виде линейной зависимости:
2.
H0  Y  AX  B .
Рекомендуемая рабочая таблица имеет вид:
i
xi
yi
1
2
x1
x2
y1
y2
...
…
…
n
xn
yn
xi  X
yi  Y
( xi  X )2
( yi  Y )2
( xi  X )( yi  Y )
yi
( yi  yi ) 2
…
…
…
…
…
…
…
  xi  yi
X
 ( xi  X )2
~
Y
X
n
3.
X
n
 ( yi  yi ) 2
rXY
~ ост.
математических ожиданий случайных величин
X иY
Y
n
 xi
i 1
 ( xi  X )( yi  Y )
 ( yi  Y )2
~
,
Y 
y
i 1
n
i
- оценки
соответственно (средние арифметические).
X
и
Y
Методические указания и рабочие формулы (2 стр.)
n
  xi  X 
X 
4.
n
n 1
 Y случайных величин X и Y
 x
i
i 1
 y
2
i 1
n
2
Y 
,
i 1
i
Y 
2
n 1
 X  yi  Y 
rXY 
6.
Нулевая гипотеза о не значимости коэффициента корреляции:
. - оценка коэффициента корреляции между
n X  Y
значения критерия проверки
tЭ =rXY
n2
2
1  rXY
. Критическое значение
tT
взять для 5%-го уровня значимости из
  n2.
y  ax  b - оценка функции регрессии, где
Уравнение регрессии (формула прогнозов)
Y
,
X
X иY.
H0   XY  0 . Эмпирическое
таблиц распределения Стьюдента по уровню значимости и числу степеней свободы
ar
и
соответственно.
5.
7.
X
- средние квадратические отклонения
b  Y  aX . (Записываем уравнение ŷ  ax  b в числовом виде и наносим прямую на
график).
n
 ост . 
8.
 y
i 1
i
 yi 
2
- остаточное среднее квадратическое отклонение, характеризует точность
n2
регрессии (точность прогнозов);
yi  axi  b
i  1,2,...,n  .
9.
Оценка точности коэффициентов уравнения регрессии:
а) точечная:
a 
 ост.
X
 n  2
, b 
 ост.
 n  2
- средние квадратические отклонения коэффициентов
a
и
b.
б) интервальная:
P  a  t   a  A  a  t   a    - доверительный интервал для коэффициента A функции регрессии;
P  b  t   b  B  b  t   b    - доверительный интервал для коэффициента B функции регрессии.
t  - аргумент функции Лапласа, соответствующий принятой доверительной вероятности  . (Записываем
интервалы в числовом виде).
10.
Для проверки значимости коэффициента
a
H0   A  0 о не значимости коэффициента A
распределение Стьюдента с 
 n2
уравнения регрессии проверить нулевую гипотезу
функции регрессии. Критерий проверки:
степенями свободы. Критическое значение
tT
tЭ 
a
a
имеет
взять для 5%-го уровня
значимости из этих таблиц.
11.
Критерий Фишера заключается в построении доверительного интервала для коэффициента корреляции
 XY
по формуле:
P  thZ1   XY  thZ2   
,
где th - символ гиперболического тангенса;
Z1  Z  t   Z , Z 2  Z  t   Z ,
Лапласа:
Если
1  1  rXY 
1
. tβ
Z  ln 
, Z 
2  1  rXY 
n3
-
аргумент
функции
Ф(t β )=β .
thZ2  thZ1   r , равно, как и rmin  thZ1 , где rmin  

n  36  n / 6 , то значение выборочного
коэффициента корреляции считать надежным, а линейную корреляционную зависимость – установленной.
Download