Проверка значимости уравнения регрессии

advertisement
Проверка гипотез на примере
уравнения регрессии
Проверка гипотез на примере уравнения регрессии
Проверка гипотез и соответствующие статистические выводы
являются одними из центральных задач математической и прикладной
статистики.
В частности, проверка гипотез используется при оценке
значимости воздействия факторных признаков на результативный.
Проверка гипотез на примере уравнения регрессии
Проверка гипотез и соответствующие статистические выводы
являются одними из центральных задач математической и прикладной
статистики.
В частности, проверка гипотез используется при оценке
значимости воздействия факторных признаков на результативный.
Например, мы нашли уравнение регрессии вида:
y  aˆ  bˆx
 a   b 
Вычислили стандартные ошибки для a, b.
Проверка гипотез на примере уравнения регрессии
Проверка гипотез и соответствующие статистические выводы
являются одними из центральных задач математической и прикладной
статистики.
В частности, проверка гипотез используется при оценке
значимости воздействия факторных признаков на результативный.
Например, мы нашли уравнение регрессии вида:
y  aˆ  bˆx
 a   b 
Вычислили стандартные ошибки для a, b.
Теперь мы хотим узнать, воздействует ли параметр x на y.
Сначала выдвигаем гипотезу.
Проверка гипотез на примере уравнения регрессии
Гипотеза - это предположение, которое можно принять или
опровергнуть.
Затем гипотезу проверяем.
Проверка гипотез на примере уравнения регрессии
Гипотеза - это предположение, которое можно принять или
опровергнуть.
Затем гипотезу проверяем.
Итак, мы хотим узнать, воздействует ли параметр x на y, для
этого составляем нулевую и альтернативную гипотезы:
Проверка гипотез на примере уравнения регрессии
Гипотеза - это предположение, которое можно принять или
опровергнуть.
Затем гипотезу проверяем.
Итак, мы хотим узнать, воздействует ли параметр x на y, для
этого составляем нулевую и альтернативную гипотезы:
1. Нулевая гипотеза обозначается H0 и обычно формулируется
как b=0. Иными словами, гипотеза о том, что x имеет нулевой эффект
на y (x не влияет на y).
2. Альтернативная гипотеза обозначается H1 и обычно
формулируется как b0. Иными словами, гипотеза о том, что x имеет
ненулевой эффект на y (x существенно влияет на y).
Проверка гипотез на примере уравнения регрессии
Статистический тест
Статистическим тестом или просто тестом называется любая
процедура, основанная на наблюдениях (x1, … ,xn), результатом
которой является одно из двух возможных решений:
Проверка гипотез на примере уравнения регрессии
Статистический тест
Статистическим тестом или просто тестом называется любая
процедура, основанная на наблюдениях (x1, … ,xn), результатом
которой является одно из двух возможных решений:
1. не отвергать (принять) нулевую гипотезу H0;
2. отвергнуть нулевую гипотезу H0 в пользу альтернативной
гипотезы H1.
Проверка гипотез на примере уравнения регрессии
Ошибки 1-го и 2-го рода
Поскольку тест основан на наблюдениях, т.е. использует
случайную выборку, то, естественно, могут возникать ошибочные
решения.
Проверка гипотез на примере уравнения регрессии
Ошибки 1-го и 2-го рода
Поскольку тест основан на наблюдениях, т.е. использует
случайную выборку, то, естественно, могут возникать ошибочные
решения.
В связи с этим иногда возникают две ошибки теста:
- ошибка 1-го рода: отвергается верная гипотеза.
- ошибка 2-го рода: принимается ошибочная гипотеза.
Проверка гипотез на примере уравнения регрессии
Ошибки 1-го и 2-го рода в повседневной жизни
Проблема ошибок 1-го и 2-го рода известна всем. Типичным
примером этого является расследование уголовного преступления.
Проверка гипотез на примере уравнения регрессии
Ошибки 1-го и 2-го рода в повседневной жизни
Проблема ошибок 1-го и 2-го рода известна всем. Типичным
примером этого является расследование уголовного преступления.
Если за нулевую гипотезу принять вариант, что подсудимый
невиновен, то ошибка 1-го рода происходит, когда суд присяжных
признает его виновным.
Проверка гипотез на примере уравнения регрессии
Ошибки 1-го и 2-го рода в повседневной жизни
Проблема ошибок 1-го и 2-го рода известна всем. Типичным
примером этого является расследование уголовного преступления.
Если за нулевую гипотезу принять вариант, что подсудимый
невиновен, то ошибка 1-го рода происходит, когда суд присяжных
признает его виновным.
Ошибка 2-го рода имеет место в том случае, когда суд
присяжных ошибочно оправдывает виновного подсудимого.
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Мы знаем оценку коэффициента b , которая равна b̂ , и его
стандартное отклонение - σb. Истинное значение b неизвестно.
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Мы знаем оценку коэффициента b , которая равна b̂ , и его
стандартное отклонение - σb. Истинное значение b неизвестно.
Проверка гипотезы всегда производится для заданного уровня
значимости .
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Мы знаем оценку коэффициента b , которая равна b̂ , и его
стандартное отклонение - σb. Истинное значение b неизвестно.
Проверка гипотезы всегда производится для заданного уровня
значимости .
Найдем доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Мы знаем оценку коэффициента b , которая равна b̂ , и его
стандартное отклонение - σb. Истинное значение b неизвестно.
Проверка гипотезы всегда производится для заданного уровня
значимости .
Найдем доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
t - квантиль распределения Стьюдента при уровне значимости .
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Мы знаем оценку коэффициента b , которая равна b̂ , и его
стандартное отклонение - σb. Истинное значение b неизвестно.
Проверка гипотезы всегда производится для заданного уровня
значимости .
Найдем доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
t - квантиль распределения Стьюдента при уровне значимости .
b - истинное значение коэффициента.
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Для больших выборок справедлив закон трех сигм. Если мы
имеем доверительную вероятность:
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Для больших выборок справедлив закон трех сигм. Если мы
имеем доверительную вероятность:
p = 99,7%, то t  3 (три сигмы),
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Для больших выборок справедлив закон трех сигм. Если мы
имеем доверительную вероятность:
p = 99,7%, то t  3 (три сигмы),
p = 95%, то t  2 (две сигмы),
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Для больших выборок справедлив закон трех сигм. Если мы
имеем доверительную вероятность:
p = 99,7%, то t  3 (три сигмы),
p = 95%, то t  2 (две сигмы),
p = 68%, то t  1 (одна сигма);
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
1. Если ноль попадает в доверительный интервал, то
принимаем нулевую гипотезу, и делаем вывод, что x имеет
незначительное воздействие на y, и его можно убрать из уравнения.
Проверка гипотез на примере уравнения регрессии
Проверка нулевой гипотезы
Доверительный интервал для b:
bˆ  t * b  b  bˆ  t * b
1. Если ноль попадает в доверительный интервал, то
принимаем нулевую гипотезу, и делаем вывод, что x имеет
незначительное воздействие на y, и его можно убрать из уравнения.
2. Если же ноль не попадает, то мы отвергаем нулевую
гипотезу и принимаем альтернативную, т.е. b значимо отличается от 0.
Делаем вывод, что x воздействует на y, и его надо оставить в составе
уравнения регрессии.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
Проверка значимости уравнения регрессии в целом делается с
помощью коэффициента детерминации R2.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
Проверка значимости уравнения регрессии в целом делается с
помощью коэффициента детерминации R2.
R2 - это показатель влияния факторных признаков на
результативный. Он показывает, какая доля вариации результативного
признака объясняется влиянием факторных признаков:
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
Проверка значимости уравнения регрессии в целом делается с
помощью коэффициента детерминации R2.
R2 - это показатель влияния факторных признаков на
результативный. Он показывает, какая доля вариации результативного
признака объясняется влиянием факторных признаков:
2

объясненна я
2
R 
,
2
 полная
где
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
Проверка значимости уравнения регрессии в целом делается с
помощью коэффициента детерминации R2.
R2 - это показатель влияния факторных признаков на
результативный. Он показывает, какая доля вариации результативного
признака объясняется влиянием факторных признаков:

2
2

объясненна я
2
R 
,
2
 полная
где
объясненная - характеризует вариацию результативного
признака у, вызванную изменением факторного признака х в
соответствии с уравнением регрессии;
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
Проверка значимости уравнения регрессии в целом делается с
помощью коэффициента детерминации R2.
R2 - это показатель влияния факторных признаков на
результативный. Он показывает, какая доля вариации результативного
признака объясняется влиянием факторных признаков:

2
2

объясненна я
2
R 
,
2
 полная
где
объясненная - характеризует вариацию результативного
признака у, вызванную изменением факторного признака х в
соответствии с уравнением регрессии;
 2полная - дисперсия у.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2

объясненная
2
R 
;
2
 полная
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
y
2

объясненная
2
R 
;
2
 полная
y
0
x
На графике заштрихованная часть
относится к полной дисперсии
(2полная)
y - среднее значение y.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
y
y
2

объясненная
2
R 
;
2
 полная
линия регрессии
y
y
0
x 0
x
На графике заштрихованная часть На графике заштрихованная часть
относится к полной дисперсии
относится к объясненной дисперсии
(2полная)
(2объясненная)
y - среднее значение y.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

2
1  R n  m 1


Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

,
2
1  R n  m 1


m – число параметров уравнения регрессии;
где
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

,
2
1  R n  m 1


m – число параметров уравнения регрессии;
n – объем выборки или число значений xi и yi.
где
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

2
1  R n  m 1


Затем по таблице распределения Фишера определяется
критическое значение Fкритич. для заданного уровня значимости ,
числа степеней свободы m, n-m-1.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

2
1  R n  m 1


Затем по таблице распределения Фишера определяется
критическое значение Fкритич. для заданного уровня значимости ,
числа степеней свободы m, n-m-1.
Теперь, если Fфактич. > Fкритич., то H0 - отклоняется, т.е.
уравнение регрессии статистически значимо.
Проверка гипотез на примере уравнения регрессии
Проверка значимости уравнения регрессии
2
2 находим
По
значению
R

объясненная
2
R 
; фактическое значение
2
 полная
F-статистики.
2
Fфактич.
R m

2
1  R n  m 1


Затем по таблице распределения Фишера определяется
критическое значение Fкритич. для заданного уровня значимости ,
числа степеней свободы m, n-m-1.
Теперь, если Fфактич. > Fкритич., то H0 - отклоняется, т.е.
уравнение регрессии статистически значимо.
В противном случае - уравнение статистически незначимо.
СПАСИБО ЗА
ВНИМАНИЕ
Download