Свойства коэффициентов регрессии и проверка гипотез 1. Случайные составляющие коэффициентов регрессии • Модель : y x u • x – неслучайная экзогенная переменная • Уравнение регрессии : yˆ a bx • Коэффициенты регрессии – случайные величины • Теорема Cov( x, y ) Cov( x, u ) b Var ( x) Var ( x) 2. Условия Гаусса-Маркова (предположения о случайном члене) • 1. E (u ) 0 • 2. Var (u ) • 3. Cov(ui , u j ) 0 • 4. Cov( xi , ui ) 0 или постоянна для всех наблюдений i j E ( xi , ui ) 0 Дополнительно: u распределено по нормальному закону Необходимо понимать • Если условия не выполнимы, вы должны это сознавать • Если корректирующие действия возможны, то аналитик должен быть в состоянии их выполнить • Если ситуацию исправить невозможно, вы должны быть способны оценить, насколько серьезно это может влиять на результаты 3. Несмещенность коэффициентов регрессии • 1. Cov( x, u ) E (b) E Var ( x) – И если x – неслучайная величина, то E (b) • 2. E (a ) 4.Точность коэффициентов регрессии • Теоретические дисперсии оценок a и b u2 x2 Var (a) 1 n Var ( x) Var (b) 2 u nVar ( x) • Выводы: – a и b прямо пропорциональны дисперсии остаточного члена – чем больше число наблюдений, тем меньше дисперсии – чем больше дисперсия x, тем меньше дисперсии коэффициентов Оценки стандартных отклонений коэффициентов • Термин «стандартная ошибка» mb ma 2 y yx /n 2 x x 2 2 y yx n2 S2 2 x x 2 x n x x 2 S2 2 x n x x • Применение: 1) проверка существенности коэффициента регрессии • 2) построение доверительных интервалов 2 5. Оценка существенности коэффициента регрессии и свободного члена • Фактическое значение t-критерия сравнивается с • табличным значением при определенном уровне • значимости и числе степеней свободы (n-2) • b tb , mb b ta ma 2 • Теорема tb • Доказательство: - фактические значения F 2 b t 2 b2 / mb 2 b 2 ˆ ( y y ) /( n 2) x (x x) 2 Продолжение доказательства 2 ˆ ( yx y) b (x x) 2 2 ( y yˆ x ) /( n 2) ( y yˆ x ) ( n 2) 2 Dфакт Dост 2 F Дисперсионный анализ результатов регрессии Источники вариации Число степеней свободы Сумма квадратов отклонений Общая 6 1 5 0 0 0 О б ъ я с н е н н а я 1 1 4 7 3 5 О с т а т о ч н а я 5 2 6 5 Дисперсия на одну степень свободы F-отношение фактическое табличное при α=0,05 - 1 4 7 3 5 5 3 53 mb 2,21 10,857 36,84 tb 16,67 t табл 2,57 2,21 - - - - 2 7 8 6 ,6 1 1 - - Значимость коэффициента корреляции • Стандартная ошибка коэффициента корреляции 1 r2 mr n2 • Фактическое значение t-критерия Стьюдента tr r 1 r 2 n2 Теорема t t F 2 r 2 b • Доказательство: – Смотри выражения для tr и F. • Вывод: проверка гипотез о значимости коэффициента регрессии b и коэффициента корреляции r равносильна проверке гипотезы о существенности линейного уравнения в целом. 6. Доверительные интервалы параметров регрессии • Доверительный интервал для коэффициента регрессии (b tтабл mb , b tтабл mb ) • Доверительный интервал для свободного члена регрессии (a tтабл ma , a tтабл ma ) • Доверительный интервал для коэффициента корреляции • (r tтабл mr , r tтабл mr ) 7. Интервалы прогноза по линейному уравнению регрессии • Точечный прогноз yp дополняется интервальной оценкой прогнозного значения y x m y x y* y x m y x • Теорема 1 xk x m y x S 2 n x x 2 Доказательство. y x y b x b x y b x x • Тогда m m m x x 2 yˆ x • т.к. 2 y Var ( y ) 2 2 2 y ,то S2 x x S S 2 m xk x 2 n x x 2 yˆ x 2 S m n 2 n mb2 • и 2 2 b 2 2 xk x 2 1 S n x x 2 Доверительные границы для ŷ x : ( y xk t m y x , y xk t m y x ) • Средняя ошибка прогнозируемого индивидуального значения y составит 1 x p x s 1 2 n x x 2 my ( xk )