Исследование функции спроса

advertisement
Федеральное агентство по образованию
ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ
УНИВЕРСИТЕТ
УТВЕРЖДАЮ
Декан АВТФ
________________ Гайворонский С.А.
« _____ » _______________ 2009 г.
ИССЛЕДОВАНИЕ ФУНКЦИИ СПРОСА
МЕТОДОМ ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ
методические указания по курсу
«СИСТЕМНЫЙ АНАЛИЗ»
для студентов специальности 080116«Математические методы в
экономике»
ТОМСК 2009
УДК 519.2
ИССЛЕДОВАНИЕ ФУНКЦИИ СПРОСА МЕТОДОМ
ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ
Mетодические указания по курсу методические указания по курсу
«Системный анализ»
для студентов специальности 080116«Математические методы в
экономике»
- Томск: Изд. ТПУ, 2009. - 17 с.
Составители:
Кочегуров А.И.
Рецензент:
Бабушкин Ю.В.
Методические указания обсуждены на заседании кафедры прикладной
математики 23.05.2008 г.
Зав. кафедрой
В.П.Григорьев
2
Содержании
1. Изучение функции спроса с помощью метода эконометрического моделирования.
1.1. Построение математических моделей функции спроса с помощью аппарата парного
регрессионного анализа.
1.2.
Построение
математических
моделей
функции
спроса
с
помощью
аппарата
множественного регрессионного анализа.
2.
Примеры
исследования
элементов
эконометрического
анализа
для
построения
регрессионных моделей.
2.1. Построение линейной парной регрессионной модели.
2.2. Построение линейной множественной регрессионной модели.
3. Оценка значимости уравнения регрессии. Коэффициент детерминации.
4. Оценка значимости множественной регрессии. Коэффициенты детерминации R2 и R2.
Список литературы.
3
1. Изучение функции спроса с помощью метода эконометрического моделирования.
1.1. Построение математических моделей функции спроса с помощью аппарата
парного регрессионного анализа.
К так называемым парным зависимостям типа y=f(x) относится подавляющее
большинство всех формул, используемых в естественнонаучных и технических дисциплинах.
По результатам экспериментов такие формулы обычно строили, применяя метод наименьших
квадратов, однако только с появлением новейших ЭВМ, пригодных для выполнения расчётов
очень большого объёма, удаётся построить парные зависимости оптимальной формы.
Сама по себе процедура линейного парного регрессионного анализа (метода наименьших
квадратов на плоскости) очень проста. Пусть имеется n пар наблюдений значений функции
отклика yi , полученных при фиксированных (в смысле записанных) значениях независимой
переменной фактора xi. Для графического изображения этих пар наблюдений в виде
экспериментальных точек с координатами (х; у) на плоскости применяется система
декартовых координат.
Задача линейного регрессионного анализа (метода наименьших квадратов) состоит в
том, чтобы, зная положения точек на плоскости, так провести линию регрессии, чтобы сумма
квадратов отклонений S, вдоль оси Оу (ординаты) была минимальной.
Для проведения вычислений по классическому методу наименьших квадратов (для
проведения регрессионного анализа) предъявляется такое требование: это уравнение должно
быть линейным по параметрам или допускать возможность линеаризации. Так, например,
процедура проведения регрессионного анализа одинакова для уравнений y=a0+ a1x и
y=a0+a1z2, так как подстановка x=z2 приводит второе уравнение к первому.
Уравнение прямой на плоскости в декартовых координатах:
 ( x)  a0  a1 x
(1.1.)
Задачу МНК для данного уравнения аналитически можно выразить следующим образом:
n
n
i 1
i 1
S (a0 , a1 )   ( ( xi )  yi ) 2   (( a0  a1 xi )  y i ) 2  min
(1.2)
Запишем систему нормальных уравнений, где выполнена операция дифференцирования:
n
 S
(a0  a1 xi )  y i   0

2

 a
i 1
0
 S
n

 2 ( a 0  a1 xi )  y i xi  0
 a 0
i 1
(1.3)
Преобразуем полученную систему нормальных уравнений:
4
n
n

a
n

a
x

yi

0
1 i

i 0
i 1
 n
n
n
a 0  xi  a1  xi 2   ( y i xi )
 i o
i 1
i 1
(1.4)
Из первого уравнения системы выразим коэффициент а0 следующим образом:
n
a0 
y
i 0
n
i
 a1  xi
i 0
(1.5)
n
Подставим (1.5) во второе уравнение (1.4) и найдём коэффициент а1.
И разделив числитель и знаменатель правой части на n, получим запись уравнения с
использованием средних:
a1 
xy  x y
(1.6)
x 2  (x) 2
Как известно из теории вероятности оценка дисперсии равна среднему квадратов
значений переменной минус квадрат общей средней:
ˆx 2  x 2  ( x) 2
(1.7)
ˆ y 2  y 2  ( y ) 2
(1.8)
Оценка дисперсии показывает рассеяние возможных значений случайной величины
вокруг её среднего значения. Она имеет размерность, равную квадрату размерности случайной
величины, поэтому в тех случаях, когда желательно, чтобы оценка рассеяния имела
2
размерность случайной величины, вычисляют среднее квадратическое отклонение ˆx для х и
ˆy 2 для у, а не дисперсию. Учитывая выше сказанное, подставим (1.7) в выражение (1.6) и
умножим правую и левую части полученного уравнения на
a1
ˆx 2
:
ˆ y 2
ˆx 2 xy  x y

ˆ y 2 ˆx 2ˆ y 2
(1.9)
Правая часть уравнения (1.9) является оценкой коэффициента корреляции r, который
используется для определения степени взаимосвязи между двумя случайными величинами
(количественная характеристика зависимости случайных величин):
r
xy  x y
ˆ 2ˆ 2
x
(1.10)
y
Когда связь функциональная, понятие корреляции практически не имеет смысла
(коэффициент парной корреляции всегда равен -1 или 1). Для статистической связи
5
вычисление коэффициента парной корреляции r между у и х его статистическая оценка –
важная процедура, результаты проведения которой позволяют судить о тесноте связи.
Коэффициент r может изменяться от -1 до 1. Чем ближе r к 1, тем ближе изучаемая
зависимость к функциональной. Если, например, коэффициент r- величина отрицательная, то
это значит, что х уменьшается с увеличением у. Если r положителен, то х увеличивается с
увеличением у. Коэффициент r равен нулю тогда и только тогда, когда линия регрессии у по х
представляет собой горизонтальную прямую, проходящую через центр распределения, т.е.
если у и х некоррелируемы.
Теперь формулу (1.9) можно переписать в следующем виде:
a1 
ˆy
r
ˆx
(1.11)
Подставив (1.11) в уравнение получим:
a0  y 
ˆy
rˆ x
ˆx
(1.12)
И, наконец, подставим (1.11) и (1.12) в уравнение линейной регрессии (2.2.1):
 ( x)  y 
ˆy
rˆ( x  x)
ˆx
(1.13)
Уравнение (1.13) является выборочным уравнением регрессии.
1.2. Линейная множественная регрессия.
На практике при анализе результатов научных исследований часто имеет место
ситуация, когда значение функции у зависит не от одной, а от нескольких переменных х. При
проведении экспериментов в такой множественной ситуации исследователь записывает
показания приборов о состоянии функции отклика (у) и всех факторов, от которых она зависит
(хj). Результатами наблюдений являются уже не два вектор – столбца (у и х), как при
проведении парного регрессионного анализа, а матрица результатов наблюдений:
y1
x11
x12
x13
... x1 j
... x1 p
y2
x 21
x 22
x 23
... x 2 j
... x 2 p
y3
x31
x32
x33
... x3 j
... x3 p
yi
xi1
xi 2
xi 3
...
xij
...
xip
yn
x n1
xn2
xn3
...
x nj
...
x np
(2.1)
где n- количество опытов;
p- число факторов;
хij- значение j- ого фактора для i- ого опыта;
уi- значение функции отклика для i- ого опыта.
6
Задача множественного регрессионного анализа состоит в построении такого уравнения
плоскости в (р+1)- мерном пространстве, отклонения результатов наблюдений yi, от которой
были бы минимальными. Или, другими словами, следует вычислить значения коэффициентов
а0,...,аj в линейном полиноме:
n
yˆ  a 0   a j x j
(2.2)
i 1
что равносильно минимизации выражения (в дальнейшем индексы при знаке

опущены):
( y
i

 yˆ i ) 2   yi  (a0  a1 xi1  a2 x21  ...  a j x j1  ...  a p x p1 )

2
(2.3)
где ŷi - вычисляемые значения исследуемой характеристики.
Для отыскания минимума выражения (2.3) необходимо найти частные производные по
всем неизвестным а0, а1,...,аj,...,ар и приравнять их нулю.
Полученные уравнения образуют систему нормальных уравнений или в матричной
форме:
(Х*Х)А=Х*У
(2.4)
где В- вектор столбец искомых коэффициентов аппроксимирующего полинома (2.2.2):
a0
a1
a2
A  ...
aj
(2.5)
...
ap
Х- матрица всех значений рассматриваемых факторов, полученных при проведении
измерений или наблюдений:
X 
x10
x11
x12
...
x1 j
...
x1 p
x 20
x 21
x 22
... x 2 j
... x 2 p
xi1
xi1
xi 2
...
xij
...
xip
xn0
x n1
xn 2
...
x nj
...
x np
(2.6)
хi0- вектор – столбец, определяющий свободный член уравнения регрессии. В матрице
исходных данных этот столбец состоит из единиц; У- вектор – столбец опытных значений
изучаемой характеристики:
7
y1
y2
y3
Y  ...
yj
(2.7)
...
yp
Х*- матрица, транспонированная к матрице Х.
Для решения системы нормальных уравнений в матричной форме (2.2.4) следует
умножить её слева на матрицу, обратную матрице системы нормальных уравнений, если
таковая существует:
(Х*Х)-1(Х*Х)А=(Х*Х)-1(Х*У)
(2.8)
(Х*Х)-1(Х*Х)=Е
(2.9)
где Е- единичная матрица.
Таким образом, решение системы нормальных уравнений в матричной форме запишется
следующим образом:
А=(Х*Х)-1(Х*У)
(2.10)
Каждый коэффициент уравнения регрессии можно найти по формуле:
n
n
аj=  cij  y i xij
i 0
(2.11)
i 1
где сij – элементы обратной матрицы (Х*Х) .
-1
В результате проведения всех этих операций получаем полином первой степени (2.2) с
известными коэффициентами а0...аj,. Этот полином является аппроксимацией функции
у=f(x1,x2,x3,..,xj,…,xp), вид которой неизвестен. Целесообразно напомнить ещё раз, что
обычным методом наименьших квадратов можно построить только линейные по параметрам
модели(парные и множественные).
Во множественном корреляционном анализе расчёты обычно начинают с вычисления
парных коэффициентов корреляции, характеризующих
тесноту связи
между двумя
величинами. В множественной ситуации вычисляют два типа парных коэффициентов
корреляции:
1)
ryxj- коэффициенты, определяющие тесноту связи между функцией отклика у и
одним из факторов хj.
2)
rxjxm- коэффициенты , показывающие тесноту связи между одним из факторов xj и
фактором xm (j,m=1…p).
8
Формула для вычисления ryxj отличается от формулы (2.10), предназначенной для
вычисления коэффициента парной корреляции, только индексом при х
ryxj 
xj y  xj y
ˆ ˆ
xj
(2.12)
xm
Аналогично записывается формула и для вычисления коэффициента rxjxm.
Если один из коэффициентов rxjxm окажется равным 1, то это означает, что факторы xj и
xm функционально связаны между собой и тогда целесообразно один из них исключить из
рассмотрения, причём оставляют тот фактор, у которого коэффициент rxjxm больше.
После вычисления всех парных коэффициентов корреляции и исключения из
рассмотрения того или иного фактора можно построить матрицу коэффициентов корреляции
вида, где на главной диагонали стоят единицы.
Используя эту матрицу, можно вычислить частные коэффициенты корреляции, которые
показывают степень влияния одного из факторов xj на функцию отклика у при условии, что
остальные факторы закреплены на постоянном уровне.
Формула для вычисления частных коэффициентов корреляции такова:
ryx1x2 ... x j ... x p  D1 j / D11 D jj
(2.13)
где D1j- определитель матрицы, образованной из матрицы вычёркиванием 1-ой строки jого столбца. Определители D11 и Djj вычисляют аналогично. Как и парные коэффициенты,
частные коэффициенты корреляции изменяются от -1 до 1.
Для изучения тесноты связи между функцией отклика у и несколькими факторами
используют коэффициент множественной корреляции R.
Коэффициент множественной корреляции служит, как указывалось выше, и для оценки
качества предсказания; R всегда положителен и изменяется от 0 до 1. Чем больше R, тем
лучше качество предсказаний данной моделью опытных данных. Для вычисления
коэффициента множественной корреляции используют матрицу:
R yx1x2 x3 ... x j ... x p  1  D / D11
Рассмотрение
парного
регрессионного
анализа
было
(2.14)
начато
с
графической
интерпретации, что удобно для понимания сущности метода наименьших квадратов). При
изучении множественного регрессионного анализа такая возможность существует лишь когда
число факторов = 2. Уравнение имеет вид:
yˆ  a0  a1 x1  a2 x2
(2.15)
9
Тогда для геометрической иллюстрации этой зависимости необходима трёхмерная
диаграмма с отдельными осями для у, х1,х2.
Рис.1- Диаграмма модели с двумя независимыми переменными.
Основание диаграммы содержит оси для х1, х2. Наклонная плоскость над ним показывает
величину у, соответствующую любому сочетанию х1и х2, измеренную расстоянием по
вертикали от данной точки до этой плоскости. Но так как мы имеем статистическую
зависимость, то фактические значения у будут лежать несколько выше или несколько ниже
значений, соответствующих наклонной плоскости. Следовательно, теперь мы имеем
трёхмерный аналог для двухмерной задачи, но вместо нахождения линии, соответствующей
двухмерному рассеянию точек, мы теперь должны расположить плоскость так, чтобы она
соответствовала трёхмерному рассеянию.
Проанализируем расположение плоскости на диаграмме модели (рис. 1). Если бы обе
величины х1и х2 оказались равными нулю, то величина у равнялась бы а0 . При сохранении
х1=0 уравнение (2.15) означает, что для любого положительного значения х2 величина у будет
равна а0+а2х2. При сохранении х2=0, для любого отрицательного значения х1 величина у будет
равна а0+а1х1.
10
2. Примеры исследования элементов эконометрического анализа для построения
регрессионных моделей.
2.1. Построение линейной парной регрессионной модели.
Исходные данные:
х
27
35
29
25
27
31
29
21
23
у
33.36
49.46
40.59
35.5
36.25
43.56
42.5
35.4
32.8
Требуется:
1.
Построить корреляционное поле.
2.
Определить линейный коэффициент корреляции.
3.
Определить уравнение теоретической линии регрессии и построить.
Решение.
Определим Линейный коэффициент корреляции по формуле:
n
r
 (x
i 1
i
 x)( y i  y )
n x y
Рассчитываем требуемые составляющие:
x
y
27  35  29  25  27  31  29  21  23
 27.44
9
33.36  49.46  40.59  35.5  36.25  43.56  42.5  35.4  32.8
 38.82
9
 ( x) 
 (( x  x))
n
n
2
 ( y) 
 (( y  y))
2
n
n
Отсюда: r= 0.78
Определим теоретическую линию регрессии методом наименьших квадратов.
t=60.77+1.16х
Представляем графически корреляционное поле и теоретическую линию регрессии:
11
2.2. Построение линейной множественной регрессионной модели.
Пусть заданы следующие данные, характеризующие динамику предприятия за 6 лет:
1
2
3
4
5
6
х1
77
77
81
80
89
96
х2
5.9
5.9
4.9
5.3
3.9
4.3
у
1070
1001
789
779
606
221
Где у – прибыль предприятия (тыс. рб.)
х1- затраты на 1 рб. Произведённой продукции (коп.)
х2- стоимость основных фондов (млн.рб.)
Требуется:
1.
Рассчитать коэффициенты уравнения регрессии а0, а1, а2;
2.
Найти оценки дисперсии  x1  x 2  y .
2
2
2
Решение.
Расчёты коэффициентов для решения задачи были проведены в математическом пакете
MATHCAD.
Найдём коэффициенты уравнения регрессии а0, а1, а2 с помощью функции regress:
3




3




1

regress ( x, y,1)  
  41.173 
  21.716 


 4.285  10 3 


где х- вектор столбец, состоящий из х1 и х2:
 77

 77
 81
x
 80
 89

 96

5.9 

5.9 
4.9 

5.3 
3.9 
4.3 
Отсюда: а0= 4.285*103, а1=-21.716, а2=-41.173.
12
Найдём оценки дисперсии  x1  x 2  y :
2
5
 x1 2  
i 0
( x1i  M ( x1 )) 2
6
5
M ( x1 )  
i 0
Отсюда:
x1i
6
2
2
5
 x2 2  
i 0
( x2i  M ( x2 )) 2
6
5
M ( x2 )  
i 0
5
 y2  
x 2i
6
i 0
( yi  M ( y)) 2
где
6
5
M ( y)  
i 0
yi
6
 x1 2  48.222,  x 2 2  0.569,  y 2  7.802  10 4
Представим графически уравнение плоскости t=a0+a1x1+a2x2.
t
13
3. Оценка значимости уравнения регрессии. Коэффициент детерминации.
Проверить значимость уравнения регрессии – значит, установить, соответствует ли
математическая модель, выражающая зависимость между переменными, экспериментальным
данным и достаточно ли включённых в уравнение объясняющих переменных (одной из
нескольких) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного
анализа.
В математической статистике дисперсионный анализ рассмотрен как самостоятельный
инструмент статистического анализа.
Здесь же он применяется как вспомогательное средство для изучения качества
регрессионной модели.
Согласно основной идее дисперсионного анализа
n
n
n
n
n
i 1
i 1
i 1
i 1
i 1
 ( y i  y) 2   {( y i  y)  ( y i  y i )}2   ( y i  y i ) 2   ( y i  y i ) 2  2 ( y i  y)( y i  y i ),
или
Q=QR+ Qe,
Где Q – общая сумма квадратов отклонения зависимой переменной от средней, а QR и
Qe – соответственно сумма квадратов, обусловленная регрессией, и остаточная сума
квадратов, характеризующая влияние неучтённых факторов.
n
Убедимся в том, что пропущенное третье слагаемое Q3= 2 ( y i  y )( y i  y i ) равно 0.
i 1
имеем
yi-y=b1 (xi-x);
yi-yi=yi-b0-b1 xi=yi-(y-b1x)-b1 xi= (yi-y)-b1 (xi-x).
Теперь
n
n
Q3= 2 ( y i  y )( y i  y i )  2b1  ( x i  x)( y i  y )  2b1
i 1
i 1
2 n
 (x
i 1
i
 x) 2  0
Схема дисперсионного анализа имеет вид, представленный в таблице:
Компоненты
Сумма квадратов
дисперсии
Число
степеней свободы
Регрессия
QR=
i 1
квадраты
S2R=QR/m-1
2
n
(y
m-1
Средние
i
 y )( y i  y i )
14
Остаточная
n
2
n-m
2
n-1
Qe=  ( y i  y )( y i  y i )
S2=Qe/n-m
i 1
Общая
n
Q=  ( y i  y )( y i  y i )
i 1
Средние квадраты S2R и S2 представляют собой несмещённые оценки дисперсий
зависимой переменной, обусловленных соответственно регрессией или объясняющей
переменной Х и воздействием неучтённых случайных факторов и ошибок; m- число
оцениваемых параметров уравнения регрессии; n- число наблюдений.
Замечание. При расчёте общей суммы квадратов Q полезно иметь ввиду, что
n
n
Q=  y i 
2
( y i ) 2
i 1
n
i 1
При отсутствии линейной зависимости между зависимой и объясняющими переменными
случайные величины S2R=QR/(m-1) и S2=Qe/(n-m) имеют 2- распределение соответственно с m1и n-m степенями свободы, а их отношение- F- распределение с теми же степенями свободы.
Поэтому уравнение регрессии значимо на уровне , если фактически наблюдаемое значение
статистики
F= QR (n-m)/ Qe (m-1) = S2R/ S2F; k1; k2,
Где F;k1;k2 – табличное значение F – критерия Фишера- Снедекора, определённое на
уровне значимости  при к1=m-1 и к2=n-m степенях свободы.
Учитывая смысл величин S2R и S2, можно сказать, что значение F показывает, в какой
мере регрессия лучше оценивает значение зависимой переменной по сравнению с её средней.
В случае линейной парной регрессии m=2, и уравнение регрессии значимо на уровне ,
если
F= QR (n-2)/ QeF; 1; n-2,
Следует отметить, что значимость уравнения парной линейной регрессии можно быть
проведена и другим способом, если оценить значимость коэффициента регрессии b1, который
имеет t- распределение Стьюдента с k=n-2 степенями свободы.
Уравнение парной линейной регрессии или коэффициент регрессии b1 значимы на уровне
,если фактически наблюдаемое значение статистики
t=
b1  0
s
n
 (x
i 1
i
 x) 2
больше критического, т.е. t t1 ;n2
15
Можно показать, что для парной линейной модели оба способа проверки значимости с
использованием F- и t- критериев равносильны, ибо эти критерии связаны соотношением F=t2.
Коэффициент корреляции r значим на уровне , если
t 
r n2
1 r2
t1 ;n  2
где t1-;n-2 – табличное значение t – критерия Стьюдента, определённое на уровне
значимости  при числе степеней свободы n-2.
Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой
качества уравнения регрессии, характеристикой прогностической силы анализируемой
регрессионной модели является коэффициент детерминации, определяемый по формуле
R2=QR/Q=1-Qe/Q
Величина R2 показывает, какая часть вариации зависимой переменной обусловлена
вариацией объясняющей переменной.
Так как 0 QR Q, то0 Q R21.
Чем ближе R2 к 1, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее
наблюдения примыкают к линии регрессии и между переменными Y и X существует линейная
функциональная зависимость. Если R2=0, то вариация зависимой переменной полностью
обусловлена воздействием неучтённых в модели переменных, и линия регрессии параллельна
оси абсцисс.
Заметим, что коэффициент R2 имеет смысл рассматривать только при наличии свободного
члена в уравнении регрессии, так как лишь в этом случае, верно равенство(1), а, следовательно,
и (2).
Если известен коэффициент детерминации R2, то критерий значимости (3) уравнения
регрессии или самого коэффициента детерминации может быть записан в виде
F
R ( n  m)
 F ; r1; k 2
(1  R 2 )( m  1)
В случае парной линейной регрессионной модели коэффициент детерминации равен
квадрату коэффициента корреляции, т.е. R2=r2.
n
 ( yi  y) 2
2
R =QR/Q=
i 1
n
(y
i 1
i
 y) 2
n

 b1 ( xi  x) 2
2
i 1
n
(y
i 1
i
 y) 2
b1

2
n
 (x
i 1
n
(y
i 1
i
i
 x) 2 / n
 y) 2 / n
2

b1 s x
sy
2
(
b1 s x 2
)  r2.
sy
16
4. Оценка значимости множественной регрессии.
Коэффициенты детерминации R2 и R2.
Как и в случае парной регрессионной модели, в модели множественной регрессии общая
вариация Q- сумма квадратов отклонений зависимой переменной от средней (1) может быть
разложена на две составляющие
Q=QR+ Qe,
Где QR,Qe- соответственно сумма квадратов отклонений, обусловленная регрессией, и
остаточная сумма квадратов, характеризующая влияние неучтённых факторов.
Получим более удобные формулы для сумм квадратов Q, QR, Qe, не требующие
вычисления значений yi , обусловленных регрессией, и остатков ei.
2
n
n
i 1
i 1
Q=  ( y i  y ) 2   y i
2
 n

  yi 
 i 1 

 Y / Y  ny 2
n
Имеем:
2
n
Qe=
(y
i 1
i
 y i )  Y / Y  2b / X / Y  b / X / Xb  Y / Y  b / X / Y
Наконец,
QR= Q  Qe  Y / Y  ny 2  (Y / Y  b / X / Y )  b / X / Y  ny 2
Уравнение множественной регрессии значимо, если
F
QR (n  p  1)
 F ; p;n  p 1
Qe p
где F;p;n-p-1- табличное значение F- критерия Фишера- Снедекора, а QR и Qe определяются
по двум последним формулам.
Множественный коэффициент детерминации R2 определяется по формуле (4):
R2=QR/Q= (b/ X/ Y/-ny2)/(Y/ Y-ny2)
Отметим ещё одну формулу для коэффициента детерминации:
Qe
(Y  Xb) / (Y  Xb)
R 1
1
Q
(Y  Y ) / (Y  Y )
2
или
e/e
R 1 /
y y
2
где e=Y-Xb, Y=(y,y,…,y), y=(Y-Y)- n- мерные векторы;
17
n
n
e / e   ei   ( y i  y i ) 2
2
i 1
i 1
n
y / y   ( yi  y) 2
i 1
R2 характеризует долю вариации зависимой переменной, обусловленной регрессией или
изменчивостью объясняющих переменных; чем ближе R2 к единице, тем лучше регрессия
описывает зависимость между объясняющими и зависимой переменными.
Вместе с тем использование только одного коэффициента детерминации R2 для выбора
наилучшего уравнения регрессии может оказаться недостаточным. На практике встречаются
случаи, когда плохо определённая модель регрессии может дать сравнительно высокий
коэффициент R2.
Недостатком коэффициента детерминации является то, что он увеличивается при
добавлении новых объясняющих переменных, хотя это и не обязательно означает улучшение
качества
регрессионной
модели.
В
этом
смысле
предпочтительнее
использовать
скорректированный(адаптированный) коэффициент детерминации R2, определяемый по
формуле:
 2
R 1
n 1
(1  R 2 )
n  p 1
или
 2
R 1
(n  1)e / e
(n  p  1) y / y
 2
Из(5) следует, что чем больше число объясняющих переменных p, тем меньше R по
 2
сравнению с R .В отличие от R скорректированный коэффициент R может уменьшаться при
2
2
введении в модель новых объясняющих переменных, не оказывающих существенного влияния
на зависимую переменную. Однако даже увеличение скорректированного коэффициента
 2
детерминации R при введении в модель новой объясняющей переменной не всегда означает,
 2
что её коэффициент регрессии значим, т.е. t 1 . Другими словами, увеличение R ещё не
означает улучшение качества регрессионной модели.
Если известен коэффициент детерминации R2 , то критерий значимости уравнения
регрессии может быть записан в виде:
R 2 (n  p  1)
F
 F ;r1;k 2
(1  R 2 ) p
18
где к1=р, к2=n-p-1, ибо в уравнении множественной регрессии вместе со свободным
членом оценивается m=p+1 параметров.
Список литературы.
1.
Замков О.О. и др.Математические методы в экономике:
Уч.- М.: МГУ,
Изд.”ДИС”,1997.-368с.
2.
Ферстер Э., Ренц Б.Методы корреляционного и регрессионного анализа.
Руководство для экономистов: Пер. С нем.- М.: Фин. И стат.,1983.-302с.
3.
Дрейпер
Н.,
Смит
Г.Прикладной
регрессионный
анализ:
Пер.с
англ.-
М.:Стат.,1973.-183с.
4.
Кремер, Путко. Эконометрика: Уч.-М.:МГУ,2002.-с.
19
ИССЛЕДОВАНИЕ ФУНКЦИИ СПРОСА МЕТОДОМ
ЭКОНОМЕТРИЧЕСКОГО МОДЕЛИРОВАНИЯ
Методические указания по выполнению практических занятий
Составитель: доцент, к.т.н. Кочегуров Александр Иванович
Подписано к печати
Формат 60х84/16. Бумага писчая №2.
Плоская печать. Усл.печ.л. Уч.-изд.л.
Тираж 50 экз. Заказ
. Цена свободная.
ИПФ ТПУ. Лицензия ЛТ №1 от 18.07.94.
Типография ТПУ. 634034, Томск, пр.Ленина, 30.
20
Download