ЛЕКЦИЯ 3. ТЕМА: НЕЛИНЕЙНЫЕ МОДЕЛИ РЕГРЕССИИ И ИХ ЛИНЕАРИЗАЦИЯ Линейность по переменным и линейность по параметрам Линейный регрессионный анализ строится на предположении, что исследуемая зависимость имеет вид, близкий к функции Y a1 X 1 a2 X 2 ... ak X k b Величины Y , X 1 , X 2 ,..., X k являются переменными; их выборочные значения известны. Величины a1 , a 2 ,..., a k , b являются параметрами, истинные значения которых неизвестны и должны быть оценены. Записанная функция линейна как по переменным, так и по параметрам. , Нелинейность по переменным Допустим, что истинное соотношение между объясняемой переменной Y и тремя объясняющими переменными X1 , X 2 и X 3 имеет вид, близкий к функции a1 Y a 2 X 1 X 2 a 3 X 32 b X1 Данная функция является нелинейной по переменным, но линейной по параметрам. Действительно, каждое слагаемое по-прежнему представляет собой произведение параметра на некоторый коэффициент. Нелинейность по переменным (продолжение) Если в выражении Y a1 a 2 X 1 X 2 a 3 X 32 b X1 ввести новые переменные 1 Z1 , Z 2 X 1 X 2 , Z 3 X 32 X1 то соотношение станет линейным и по параметрам, и по переменным: Y a1 Z 1 a 2 Z 2 a 3 Z 3 b Значит, возможно применение линейного регрессионного анализа. !!! Нелинейность по переменным не является препятствием для применения линейного регрессионного анализа. Такая модель легко линеаризуется введением новых переменных. Пример В течение 10 сезонов регистрировались данные о количестве отдыхавших в санатории (X, человеко-дни) и среднедневном уровне затрат в расчёте на одного отдыхающего (Y, у.д.е/ человеко-дни). Год 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 X 650 550 480 580 690 870 840 750 920 1050 Y 12.6 13.5 14.3 13.2 12.3 11.5 11.6 12.0 11.3 11.0 Требуется оценить регрессию Y по X. Пример (продолжение) На рисунке показаны исходные данные и полученная по ним линия регрессии y x 0.0057 x 16.52 Коэффициент детерминации составляет r2 = 0.931, т.е. качество регрессии − неплохое. И всё же, вид графика настораживает. Скорее всего, точки соответствуют какой-то нелинейной зависимости. СПЕЦИФИКАЦИЯ модели выбрана неверно! 15 Y 14.5 14 13.5 13 12.5 12 11.5 11 10.5 X 10 400 600 800 1000 Пример (продолжение) Обсудим экономическую суть рассматриваемого явления. Полные издержки санатория, скорее всего, можно представить в виде I I 0 kX где I0 – часть издержек, не зависящая от числа отдыхающих (содержание помещений, значительная часть расходов на зарплату персонала и коммунальных платежей и т.п.), а второе слагаемое представляет собой ту часть издержек, которая прямо пропорциональна числу отдыхающих (расходы на питание, лечение и др.). Тогда затраты в расчёте на один человеко-день равны I0 Y k X т.е. истинное соотношение между Y и X не линейно и характеризуется гиперболической зависимостью. (Конечно, речь идёт не о строгой функциональной зависимости) Пример (окончание) Итак, предположим, что имеет место зависимость Y I0 k X Вводя новую переменную Z = 1 / X, получаем линейную функцию Y = I0Z + k. Поскольку выборочные значения Z легко получаются пересчётом значений X, можно оценить линейную регрессию Y по Z, после чего снова вернуться к переменной X. В результате этих операций получаем уравнение 2958 .9 yx 8.09 x при очень высоком качестве регрессии (r2 = 0.998). Степенная функция: что мешает применить тот же способ линеаризации? Пусть истинное соотношение между двумя количественными признаками близко к функции Y bX a то есть является нелинейным как по переменной X, так и по параметрам a и b. Что мешает нам линеаризовать эту модель тем же способом, т.е. вводя новую переменную Z Xa и получив линейное соотношение Y bZ ? По выборке значений X мы не сможем рассчитать значения Z, т.к. величина a нам не известна! Линеаризация степенной модели с мультипликативным случайным членом Пусть в модель регрессии случайный член входит в виде множителя: y i bx ia i Прологарифмируем (по основанию e) обе части заданного соотношения: ln y i ln( bx ia i ) ln b a ln x ia ln i Если ввести обозначения vi ln y i , c ln b, u i ln x i , i ln i то модель становится линейной как по новой переменной, так и по новым параметрам: vi au i c i Теперь можно по выборочным данным найти оценки параметров линейной регрессии a * и c * , и затем от уравнения ln y x a * ln x c * прийти к уравнению c* yx e x a* Понятие эластичности Как известно, эластичностью y по x называется величина Э dy dx dy y : : y x dx x которая показывает, во сколько раз относительное изменение функции отличается от соответствующего относительного изменения аргумента. Например, для степенной функции вида y bx a эластичность равна baxa a 1 y Э bax : x y А вот для линейной функции y ax b ax b ax Э a: x ax b a Функции спроса Соотношение между потреблением какоголибо продукта Y и доходом X потребителя исследуется в экономике с помощью функций спроса, которые могут иметь различный вид (кривые Энгеля). a Функции вида Y bX удобны тем, что имеют постоянную, т.е. не зависящую от x эластичность спроса по доходу (равную, как мы убедились, коэффициенту a). Пример оценивания функции спроса Имеются данные о среднедушевых годовых доходах X и потребительских расходах на питание Y (тыс. руб.). Оценена линейная регрессия Y по X уравнением * * и найден коэффициент детерминации этой модели: y x a x b y x 0.386 x 6.152 r 2 0.762 Интерпретация: с ростом среднедушевых годовых доходов на 1 тыс. рублей потребительские расходы на питание увеличиваются в среднем на 0.386 тыс. рублей. 0.6553 y 1 . 924 x Оценены параметры степенной модели x r 2 0.841 Эластичность расходов на питание по доходу равна 0.6553. Интерпретация: Расходы на питание увеличатся в среднем на 0.66% при росте дохода на 1%. !!! Сравнение коэффициентов детерминации степенной и линейной модели показывает, что более высокое качество регрессии в данном случае обеспечивает степенная модель. Интерпретация значения эластичности спроса по доходу, полученного при оценивании степенной модели Эластичность расходов на питание по доходу равна 0.6553. Расходы на питание увеличатся на 0.66% при росте дохода на 1%. Полученное значение эластичности показывает, что рост дохода не приводит к прямо пропорциональному росту расходов на питание (в этом случае эластичность была бы равна единице). Действительно, потребности человека в еде ограничены и обычно удовлетворяются полностью при определённом уровне дохода. Дальнейший рост дохода приводит к росту расходов на иные товары и услуги.