влияние ошибок измерения на точность оценок коэффициентов

advertisement
УДК 512.8:519.2
Е.С. Савельева
ВЛИЯНИЕ ОШИБОК ИЗМЕРЕНИЯ НА ТОЧНОСТЬ ОЦЕНОК
КОЭФФИЦИЕНТОВ ПАРНОЙ РЕГРЕССИИ
In given work are considered base aspects regression analysis, being the basis of creation and
improvements of economic models. On the example of fresh single-line regression is analyses errors of
variables.
Зависимость, выражаемая соотношением
M (Y | x) = f ( x)
называется функцией регрессии Y на X. При этом X называется независимой (объясняющей)
переменной (регрессором), Y — зависимой (объясняемой) переменной. При рассмотрении
зависимости двух случайных величин говорят о парной регрессии.
Для отражения того факта, что реальные значения зависимой переменной не всегда
совпадают с ее условными математическими ожиданиями и могут быть различными при
одном и том же значении объясняющей переменной, фактическая зависимость должна быть
дополнена некоторым слагаемым ε, которое, по существу, является случайной величиной и
указывает на стохастическую суть зависимости. Из этого следует, что связи между
зависимой и объясняющей переменными выражаются соотношением
Y = M (Y | x) + ε
называемым регрессионной моделью (уравнением).
Возникает вопрос о причинах обязательного присутствия в регрессионных моделях
случайного фактора (отклонения). Среди таких причин можно выделить наиболее
существенные: не включение в модель всех объясняющих переменных, неправильный выбор
1
функциональной
ограниченность
формы
модели,
статистических
агрегирование
данных,
переменных,
непредсказуемость
ошибки
измерений,
человеческого
фактора.
Подробно рассмотрим влияние ошибок на измерения в парной линейной регрессии.
Уравнение парной линейной регрессии имеет вид
Y = α + β * X , где X ∈ [a, b]. Из
уравнения регрессии следует, что ошибки возникают при измерениях независимой
переменной X и зависимой переменной Y.
При ошибках в измерениях независимой переменной Х происходит изменение
дисперсии, причем в сторону увеличения.
Переменная Х подвержена воздействию существенной ошибки измерения, которая
сдвигает наблюдения вправо при их положительном значении и влево – при их
отрицательном значении. По причине горизонтального рассеивания множества точек
оцененная линия регрессии имеет тенденцию к занижению угла наклона истинной линии
зависимости. Причем следует отметить, что чем больше дисперсия ошибки измерения по
отношению к дисперсии Х, тем больше окажется эффект уменьшения угла наклона и тем
сильнее будет смещение.
Рассмотрим ошибки в измерениях зависимой переменной Y.
Предположим, что истинной является модель Y = X * β + ε , но вектор Y изменяется с
ошибкой, т.е. наблюдается вектор Y * = Y + u , где u – ошибки, не зависящие от ε и Х,
u ~ N (0, σ ) . Тогда нетрудно понять, что построение МНК-оценок на основании Y *
эквивалентно регрессии Y * = X * β + (ε + u ) откуда очевидно, что оценка параметра β будет
несмещенной и состоятельной, так как M (ε + u ) = 0 и cov( X , ε + u ) = 0 . Наличие же ошибок
приводит лишь к увеличению дисперсии D(ε + u ) = σ ε + σ u .
2
2
Следовательно, ошибки измерения зависимой переменной не имеют столь большого
значения. На практике их можно считать составляющими случайного члена. Они
2
нежелательны, так как приводят к уменьшению точности оценок коэффициентов регрессии,
тем не менее они не вызывают смещения этих оценок.
Очевидно, что с введением ошибки независимой переменной Х происходит
изменение дисперсии, причем в сторону увеличения. Следовательно, если переменная Х
является случайной или она распределена независимо от u то МНК – по-прежнему будет
давать несмещенные оценки.
Все выше описанные выводы были сделаны на основании проведенного исследования
конкретной линейной функции на заданном промежутке, при исследовании которой были
введены ошибки в измерениях независимой переменной X и зависимой переменной Y.
Можно предположить, что для нелинейной парной регрессии влияние ошибок
измерения объясняющей переменной X и объясняемой переменной Y будут такими же как и
в случае линейной парной регрессии.
________________________
1.
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Г. 15. 621-626 с.
2.
Бородич С.А. Эконометрика. Минск: Новое издание, 2001. 98-143 с.
3.
Медик В.А., Токмачев М.С., Фишман Б.Б. Статистика в медицине и биологии. Т.1. 148, 348-363 с.
3
Download