Учебный курс Эконометрика: идентификация, оценивание и анализ статических моделей Лекция 11 кандидат технических наук, доцент Поляков Константин Львович Лукавая статистика 2 100 $ 100 $ 100 $ 100 $ Каков средний заработок ? 1400$/5=280$ Все пятеро будут сильно удивлены ! 1000 $ 3 F1 .14 .12 F2 .5 .4 .10 .3 .08 .06 .2 .04 .02 .00 50 e<0.5 !!! .1 .0 Измерения из распределения F2 – Доля: 1-e Доля: e анормальные измерения. «Меньшинство» образует анормальные измерения. 100 150 200 250 300 50 100 150 200 250 300 Fe x 1 e F1 x eF2 x Пока e<0.5 !!! «Модель больших ошибок» 4 «Выброс» это измерение, Выбросы нельзя удалять «Выброс» (outlier) это … из «плохо» массива данных. которое описывается Их надо изучать ! с помощью выбранной модели. 5 Y Пример X Выбросы 6 C=a0+a1X+v C=a0+a1X+a2dwar+v d war 1, year 1941,1945 0, year 1941,1945 7 Обнаружение выбросов относительно модели линейной регрессии 8 Содержит ли выборка значения независимых переменных, которые могут сильно повлиять на значения оценок ? 9 Проанализируйте силу воздействия (leverage) измерений ˆ Y PY MY Y e При больших значениях ptt трудно понять, в каком измерении 1 1 находится выброс. M I X X ' X X ' P X X ' X X ' et mtt yt mtj y j 1 ptt yt mtj y j j t j t T leverage : 0 ptt 1, ptt n t 1 10 1 ptt T xt x T 2 xt x 2 xt x 1 T T 1Dˆ xt 2 t 1 Пример для двумерной T 1 yt y регрессии aˆ p 1 tt y a a x v T xt x t 1 t 0 1 t t Наклон прямой проходящей через точки : xt , yt и x , y . 11 Большая сила влияния x, y Измерение «притягивает» к себе линию регрессии. 12 x, y 13 Расстояние Махаланобиса (Mahalanobis distance ) MDx x Ex Covx x Ex ' 1 1 MD xt T 1 ptt T 2 14 Содержит ли выборка резко выделяющиеся значения зависимых переменных ? 15 Проанализируйте стьюдентизированные удаленные остатки Удаленные остатки (deleted residual) et t ~ ~ et 1yt pttaˆ ,extt ~ et Оценка значения параметра получена без измерения с номером ‘t’ 16 Стьюдентизированные удаленные остатки (studentized deleted residual) Det 1 ptt 1 ptt s 2 2 t s 2 Дисперсия апостериорной Оценка дисперсии случайной остаточной разности не составляющей по выборке постоянна ! без измерения ‘t’ Det d t 1 ptt s 2 t 17 Дисперсияetстьюдентизированной et est удаленной остаточной разности t 2 dпостоянна 1! p s t tt t est ~ St T n t Пусть выполняется нормальная ! ‘t’ является Наблюдение гипотеза с номером выбросом, если: estt t1 2 T n 18 Расстояние Кука (Cook’s distance) 1 ' 1 1 t 2 ' t CDt aˆ aˆ s X X aˆ aˆ n выполняется нормальная Пусть гипотеза, CDet ~ F(n,T-n) 1тогда ˆ D y t CDt n s 2 1 ptt Det t Чувствительность Мера анормальности оценки наблюдения к выбросу 19