Лекция 3. Нелинейные модели Файл

реклама
ЛЕКЦИЯ 3.
ТЕМА: НЕЛИНЕЙНЫЕ МОДЕЛИ
РЕГРЕССИИ И ИХ ЛИНЕАРИЗАЦИЯ
Линейность по переменным
и линейность по параметрам
Линейный регрессионный анализ строится на предположении,
что исследуемая зависимость имеет вид, близкий к функции
Y  a1 X 1  a2 X 2  ...  ak X k  b
Величины Y , X 1 , X 2 ,..., X k являются переменными; их
выборочные значения известны. Величины a1 , a 2 ,..., a k , b
являются параметрами, истинные значения которых
неизвестны и должны быть оценены. Записанная функция
линейна как по переменным, так и по параметрам.
,
Нелинейность по переменным
Допустим, что истинное соотношение между объясняемой
переменной Y и тремя объясняющими переменными
X1 , X 2 и X 3
имеет вид, близкий к функции
a1
Y
 a 2 X 1 X 2  a 3 X 32  b
X1
Данная функция является нелинейной по переменным, но
линейной по параметрам. Действительно, каждое
слагаемое по-прежнему представляет собой
произведение параметра на некоторый коэффициент.
Нелинейность по переменным
(продолжение)
Если в выражении
Y
a1
 a 2 X 1 X 2  a 3 X 32  b
X1
ввести новые переменные
1
Z1 
, Z 2  X 1 X 2 , Z 3  X 32
X1
то соотношение станет линейным и по параметрам, и по переменным:
Y  a1 Z 1  a 2 Z 2  a 3 Z 3  b
Значит, возможно применение линейного регрессионного анализа.
!!! Нелинейность по переменным не является препятствием для
применения линейного регрессионного анализа. Такая модель легко
линеаризуется введением новых переменных.
Пример
В течение 10 сезонов регистрировались данные о количестве
отдыхавших в санатории (X, человеко-дни) и среднедневном
уровне затрат в расчёте на одного отдыхающего (Y, у.д.е/
человеко-дни).
Год
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
X
650
550
480
580
690
870
840
750
920
1050
Y
12.6
13.5
14.3
13.2
12.3
11.5
11.6
12.0
11.3
11.0
Требуется оценить регрессию Y по X.
Пример (продолжение)
На рисунке показаны
исходные данные и
полученная по ним линия
регрессии
y x  0.0057 x  16.52
Коэффициент детерминации
составляет r2 = 0.931, т.е.
качество регрессии −
неплохое. И всё же, вид
графика настораживает.
Скорее всего, точки
соответствуют какой-то
нелинейной зависимости.
СПЕЦИФИКАЦИЯ модели
выбрана неверно!
15
Y
14.5
14
13.5
13
12.5
12
11.5
11
10.5
X
10
400
600
800
1000
Пример (продолжение)
Обсудим экономическую суть рассматриваемого явления. Полные
издержки санатория, скорее всего, можно представить в виде
I  I 0  kX
где I0 – часть издержек, не зависящая от числа отдыхающих
(содержание помещений, значительная часть расходов на зарплату
персонала и коммунальных платежей и т.п.), а второе слагаемое
представляет собой ту часть издержек, которая прямо
пропорциональна числу отдыхающих (расходы на питание, лечение
и др.). Тогда затраты в расчёте на один человеко-день равны
I0
Y  k
X
т.е. истинное соотношение между Y и X не линейно и характеризуется
гиперболической зависимостью. (Конечно, речь идёт не о строгой
функциональной зависимости)
Пример (окончание)
Итак, предположим, что имеет место зависимость
Y
I0
k
X
Вводя новую переменную Z = 1 / X, получаем линейную функцию
Y = I0Z + k.
Поскольку выборочные значения Z легко получаются пересчётом
значений X, можно оценить линейную регрессию Y по Z, после
чего снова вернуться к переменной X. В результате этих
операций получаем уравнение
2958 .9
yx 
 8.09
x
при очень высоком качестве регрессии (r2 = 0.998).
Степенная функция:
что мешает применить тот же способ
линеаризации?
Пусть истинное соотношение между двумя количественными
признаками близко к функции
Y  bX a
то есть является нелинейным как по переменной X, так и по
параметрам a и b. Что мешает нам линеаризовать эту модель
тем же способом, т.е. вводя новую переменную
Z Xa
и получив линейное соотношение Y  bZ ?
По выборке значений X мы не сможем рассчитать значения Z, т.к.
величина a нам не известна!
Линеаризация степенной модели с
мультипликативным случайным членом
Пусть в модель регрессии случайный член входит в виде множителя:
y i  bx ia  i
Прологарифмируем (по основанию e) обе части заданного
соотношения:
ln y i  ln( bx ia  i )  ln b  a ln x ia  ln  i
Если ввести обозначения vi  ln y i , c  ln b, u i  ln x i ,  i  ln  i
то модель становится линейной как по новой переменной, так и по
новым параметрам: vi  au i  c   i
Теперь можно по выборочным данным найти оценки параметров
линейной регрессии a * и c * , и затем от уравнения
ln y x  a * ln x  c *
прийти к уравнению
c*
yx  e x
a*
Понятие эластичности
Как известно, эластичностью y по x называется величина
Э
dy dx dy y
:  :
y x dx x
которая показывает, во сколько раз относительное
изменение функции отличается от соответствующего
относительного изменения аргумента.
Например, для степенной функции вида y  bx a
эластичность равна
baxa
a 1 y
Э  bax
:
x

y
А вот для линейной функции y  ax  b
ax  b
ax
Э  a:

x
ax  b
a
Функции спроса
Соотношение между потреблением какоголибо продукта Y и доходом X потребителя
исследуется в экономике с помощью
функций спроса, которые могут иметь
различный вид (кривые Энгеля).
a
Функции вида Y  bX удобны тем, что имеют
постоянную, т.е. не зависящую от x
эластичность спроса по доходу (равную, как
мы убедились, коэффициенту a).
Пример оценивания функции спроса
Имеются данные о среднедушевых годовых доходах X и потребительских
расходах на питание Y (тыс. руб.).
Оценена линейная регрессия Y по X уравнением
*
*
и найден коэффициент детерминации этой модели: y x  a x  b
y x  0.386 x  6.152
r 2  0.762
Интерпретация: с ростом среднедушевых годовых доходов на 1 тыс. рублей
потребительские расходы на питание увеличиваются в среднем на 0.386
тыс. рублей.
0.6553
y

1
.
924
x
Оценены параметры степенной модели x
r 2  0.841
Эластичность расходов на питание по доходу равна 0.6553.
Интерпретация: Расходы на питание увеличатся в среднем на 0.66% при
росте дохода на 1%.
!!! Сравнение коэффициентов детерминации степенной и линейной модели
показывает, что более высокое качество регрессии в данном случае
обеспечивает степенная модель.
Интерпретация значения эластичности спроса по
доходу, полученного при оценивании степенной
модели
Эластичность расходов на питание по доходу равна
0.6553. Расходы на питание увеличатся на 0.66% при
росте дохода на 1%.
Полученное значение эластичности показывает, что рост
дохода не приводит к прямо пропорциональному
росту расходов на питание (в этом случае
эластичность была бы равна единице).
Действительно, потребности человека в еде
ограничены и обычно удовлетворяются полностью
при определённом уровне дохода. Дальнейший рост
дохода приводит к росту расходов на иные товары и
услуги.
Скачать