Лекция 5.4 Классическая линейная регрессия. Проверка гипотез о конкретном значении коэффициентов регрессии. 1 Классическая линейная регрессия для случая множественной регрессии Пусть для регрессионной модели Y = b1 + b2X2 +…+βkXk + u выполнены условия теоремы Гаусса – Маркова и ui , i = 1,…,n распределены нормально, т.е. ui ~ N(0, σu2) 2 Проверка гипотез о конкретном значении коэффициентов регрессии при двусторонней альтернативной гипотезе Y = b1 + b2X2 +…+βkXk + u H 0 : b j b , j {1,..., k} 0 j H1 : b j b 0 j Проверка гипотез о конкретном значении коэффициентов регрессии проводится аналогично случаю парной регрессии. 3 Проверка гипотез о конкретном значении коэффициентов регрессии при двусторонней альтернативной гипотезе 1) Оцениванием коэффициенты множественной регресс с помощью МНК Yˆ b1 b2 X 2 ... bk X k 2) Вычисляем значение тестовой статистики (имеющей распределение t(n-k)) t bj b 0 j s.e.(b j ) ~ t (n k ) 4 Таблицы для t - распределения t Distribution: Critical values of t Degrees of Two-tailed test freedom One-tailed test 1 2 3 4 5 … … 18 19 20 … … 120 10% 5% 5% 2.5% 2% 1% 1% 0.5% 0.2% 0.1% 0.1% 0.05% 6.314 12.706 31.821 63.657 318.31 636.62 2.920 4.303 6.965 9.925 22.327 31.598 2.353 3.182 4.541 5.841 10.214 12.924 2.132 2.776 3.747 4.604 7.173 8.610 2.015 2.571 3.365 4.032 5.893 6.869 … … … … … … … … … … … … 1.734 2.101 2.552 2.878 3.610 3.922 1.729 2.093 2.539 2.861 3.579 3.883 1.725 2.086 2.528 2.845 3.552 3.850 … … … … … … … … … … … … 1.658 1.980 2.358 2.617 3.160 3.373 1.645 1.960 2.326 2.576 3.090 3.291 5 Проверка гипотез о конкретном значении коэффициентов регрессии при двусторонней альтернативной гипотезе H0 : b j b 0 j H1 : b j b 0j 3) Правило принятия решения при выбранном уровне значимости α: нулевая гипотеза отвергается, если t t cr /2 /2 /2 tcr/ 2 tcr/ 2 6 Проверка гипотезы о значимости коэффициента H0 : b j 0 H1 : b j 0 t bj s.e.(b j ) /2 /2 tcr/ 2 tcr/ 2 Если нулевая гипотеза отвергается, то коэффициент b j называется значимым (при выбранном уровне значимости). В противном случае этот коэффициент называется незначимым. 7 P – VALUE для проверки гипотезы о значимости коэффициента Y b1 b 2 X 2 ... b k X k u H0 : b j 0 H1 : b j 0 t bj s.e.(b j ) p value / 2 t p value / 2 t P – value – минимальный уровень значимости, при котором основная гипотеза не отвергается. Если P-value для коэффициента регрессии меньше выбранного уровня значимости α, то нулевая гипотеза отвергается и выбранный коэффициент является значимым (при выбранном уровне значимости). 8 Связь доверительных интервалов с проверкой гипотез (1-α)100% доверительный интервал для bj t cr /2 Если b 0j bj : s.e.(b j ) b j b j t cr /2 s.e.(b j ) попадает в (1 – α)∙100% доверительный интервал для коэффициента βj, то при уровне значимости α гипотеза H 0 : b j b 0j при альтернативной гипотезе H1 : b j b 0j не отвергается. 9 Пример . reg EARNINGS S EXP Source | SS df MS -------------+-----------------------------Model | 22513.6473 2 11256.8237 Residual | 89496.5838 537 166.660305 -------------+-----------------------------Total | 112010.231 539 207.811189 Number of obs = 540 F( 2, 537) = 67.54 Prob > F = 0.0000 R-squared = 0.2010 Adj R-squared = 0.1980 Root MSE = 12.91 -----------------------------------------------------------------------------EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------S | 2.678125 .2336497 11.46 0.000 2.219146 3.137105 EXP | .5624326 .1285136 4.38 0.000 .3099816 .8148837 _cons | -26.48501 4.27251 -6.20 0.000 -34.87789 -18.09213 ------------------------------------------------------------------------------ 10