ЛЕКЦИЯ 11 y = ax+b РЕГРЕССИОННЫЙ АНАЛИЗ: ЧАСТЬ 2 11.1. Оценка значимости регрессии с помощью доверительных интервалов Значимость линейной регрессии оценивается путем проверки гипотезы: H0: β = 0 100(1 – α)-процентный доверительный интервал для β: b – tαsb < β < b + tαsb Пример расчета 95%-ного доверительного интервала для β: Число степеней свободы df = n – 2 = 8 t0.05,8 = 2.306 0.44 – 2.306х0.068 < β < 0.44 + 2.306х0.068 0.28 < β < 0.60 Интерпретация: Рассчитанный доверительный интервал не содержит 0. Следовательно, нулевую гипотезу об отсутствии связи между признаками следует отклонить. Доверительный интервал для α: а – tαsа < α < а + tαsа -6.0 – 2.306х2.53 < α < -6.0 + 2.306х2.53 -11.8 < α < -0.17 11.2. Доверительная область для линии регрессии Стандартная ошибка регрессии: s yˆ s y|x 1 ( xi x ) 2 n (n 1) sx 2 100(1 – α)-процентный доверительный интервал для каждого значения уравнения регрессии в точке xi yˆ t s yˆ y yˆ t s yˆ Доверительная область регрессии Гланц, 1999 11.3. Дисперсионный анализ регрессии Сравнение остаточной и «естественной» дисперсий: F s 2 y| x 2 y s Таблица с результатами регрессионного анализа в программе STATISTICA содержит значение F-критерия: 11.4. Анализ остатков Остатки – вертикальные расстояния от выборочных точек до регрессионной прямой 1. Остатки должны распределяться нормально: 2. Дисперсия остатков должна оставаться неизменной во всем диапазоне значений анализируемых переменных: Выбросы (=аутсайдеры) www.statsoft.ru Наиболее обычные причины появления выбросов: инструментальные ошибки измерений; ошибки, возникающие при вводе данных в компьютер 11.5. Связь регрессии и корреляции Связь между коэффициентом корреляции и коэффициентом регрессии: sx r b sy Коэффициент детерминации (=аппроксимации): s n 2 2 r 1 n 1 s 2 y|x 2 y 0< 2 r <1 11.6. Понятие о множественной и нелинейной регрессии Пример линейной регрессии с двумя независимыми переменными: у = a + bх + cz Свободный член уравнения Коэффициенты регрессии Основные виды нелинейных зависимостей между биологическими признаками: y a bx cx y ae xb b ya x 2 y ax b y ae N y c a bt 1 10 xb Диаграмма рассеяния (Scatterplot): Логарифмирование степенной зависимости позволяет ее «выровнять»: log y a b log x Обратно пропорциональное преобразование данных: 1 x x b y a y a bx x