Гетероскедастичность и автокоррелированность случайного

advertisement
Предпосылки МНК
Предположения о случайном
члене
y  a  b1 x1  b2 x2  ...  bm xm  

y  yx
- ненаблюдаемая величина
- не являются реальными случайными остатками, их можно считать
некоторой выборочной реализацией неизвестного остатка заданного
уравнения  i
В задачу регрессионного анализа входит не только построение самой
модели, но и исследование случайных отклонений
Исследования остатков предполагают проверку наличия следующих пяти
предпосылок МНК:
1) случайный характер остатков;
2) нулевая средняя величина остатков, не зависящая от xi ;
3) гомоскедастичность – дисперсия каждого отклонения  i одинакова для всех
наблюдений;
4) отсутствие автокорреляции остатков – значения остатков распределены
независимо друг от друга;
5) остатки подчиняются нормальному распределению.
Проверка 1 условия
Для проверки условия 1 строится график зависимости остатков от теоретических
значений результативного признака y x
Проверка 1 условия
Примеры случаев, если  i зависит от y x :
• остатки не случайны (рис. 1);
• остатки не имеют постоянной дисперсии (рис. 2);
• остатки носят систематический характер (рис. 3).
В этих случаях необходимо либо применять другую функцию, либо вводить
дополнительную информацию и заново строить уравнение регрессии
до тех пор, пока остатки не будут случайными величинами.
Проверка 2 условия
Вторая предпосылка МНК относительно нулевой средней величины
 y  y x   0
остатков означает, что
Это выполнимо для линейных моделей и моделей, нелинейных
относительно включаемых переменных.
Если остатки на графике зависимости случайных остатков от факторов x j ,
включенных в регрессию, расположены в виде горизонтальной полосы,
то они независимы от значений x j.
Если же график показывает наличие зависимости  i и x j , то модель неадекватна
Гетероскедастичность- не
соблюдение 3 условия.
Примеры гетероскедастичности
x
Дисперсия остатков растет
по мере увеличения x
Дисперсия остатков
достигает максимальной
величины при средних
значениях x
и уменьшается при
минимальных и
максимальных
значениях x
Максимальная дисперсия
остатков при малых
значениях x
и дисперсия остатков
однородна по мере
увеличения значений x
Обнаружение гетероскедастичности
• Тест Гольдфелда-Квандта
H0-гипотеза о гомоскедастичности
Алгоритм:
1) наблюдения упорядочиваются по возрастанию величины x;
2) средние C наблюдений отбрасываются, где (n- C ):2>k, k- число
оцениваемых параметров;
3) разделение совокупности из (n-C) на две группы и определение по
каждой из групп уравнений регрессии;
4) определение остаточной суммы квадратов для первой ( S1 ) и второй ( S 2 )
групп и нахождение их отношения R=S1/S2 , где S1  S2
При выполнении нулевой гипотезы о гомоскедастичности отношение R
будет удовлетворять F – критерию с (n-C-2k):2 степенями свободы для
каждой остаточной суммы квадратов.
Проверка 4 условия
• Автокорреляция остатков означает наличие
корреляции между остатками текущих и предыдущих
(последующих) наблюдений
Коэффициент корреляции между  i и  j
ri j 
cov   i ,  j 
 i    j
• При несоблюдении основных предпосылок
МНК приходится корректировать модель,
изменяя ее спецификацию, добавлять
(исключать) некоторые факторы,
преобразовывать исходные данные для того,
чтобы получить оценки коэффициентов
регрессии, которые обладают свойством
несмещенности, имеют меньшее значение
дисперсии остатков и обеспечивают в связи с
этим более эффективную статистическую
проверку значимости параметров регрессии
Download