Загрузил info-kuz

Эконометрика Вариант 1

реклама
Вариант 1
1
Задача 1. «Моделирование социально-экономических показателей»
Построить
эконометрическую
модель
социально-экономического
показателя для всех субъектов Российской Федерации (исключив города
федерального значения).
Требуется исследовать зависимость результирующего признака Y,
соответствующего варианту задания, от факторных переменных Х1, Х2 и Х3:
Y1
Х1
Х2
Х3
Потребительские расходы в среднем на душу населения (в месяц), руб.
Среднедушевые денежные доходы (в месяц), руб.
Среднемесячная номинальная начисленная заработная плата работников
организаций, руб.
Индекс потребительских цен (декабрь к декабрю предыдущего года), %
Исходные данные к задаче 1 [1]
За 2018 год
Белгородская область
Брянская область
Владимирская область
Воронежская область
Ивановская область
Калужская область
Костромская область
Курская область
Липецкая область
Московская область
Орловская область
Рязанская область
Смоленская область
Тамбовская область
Тверская область
Тульская область
Ярославская область
Республика Карелия
Республика Коми
Архангельская область
Ненецкий автономный округ
Архангельская область
Вологодская область
Калининградская область
Ленинградская область
Мурманская область
Новгородская область
Псковская область
Республика Адыгея
Республика Калмыкия
Y1
X1
X2
X3
24596
30778
31852
104,4
22871
26585
27251
104,9
19761
23539
30460
105,2
26530
30289
31207
104,6
19407
24503
25729
105,1
23354
29129
38197
104,6
19569
23716
27724
104,6
21566
27275
29937
105,7
24919
30010
31622
105,3
35199
44707
51938
105,3
20217
24895
27476
104
19709
25441
31916
106
20633
25888
29397
104,9
21764
26828
26660
105
19992
25125
31049
104,4
22394
27208
34662
104,7
21314
27055
33474
105,1
23733
29150
39402
104,3
23220
33961
50413
105,1
27662
33830
48307
103,8
30516
78549
82786
101,8
27549
32054
45427
104
19929
26982
35497
103,9
22834
27461
33385
104,8
24285
31341
43631
104
30699
41564
58045
104,4
22013
25292
31462
104,9
20033
23880
26871
104,9
22569
27553
27469
104,2
10611
17082
26049
104,3
2
Республика Крым
Краснодарский край
Астраханская область
Волгоградская область
Ростовская область
Республика Дагестан
Республика Ингушетия
Кабардино-Балкарская Республика
Карачаево-Черкесская Республика
Республика Северная Осетия – Алания
Чеченская Республика
Ставропольский край
Республика Башкортостан
Республика Марий Эл
Республика Мордовия
Республика Татарстан
Удмуртская Республика
Чувашская Республика
Пермский край
Кировская область
Нижегородская область
Оренбургская область
Пензенская область
Самарская область
Саратовская область
Ульяновская область
Курганская область
Свердловская область
Тюменская область
Ханты-Мансийский автономный округ – Югра
Ямало-Ненецкий автономный округ
Тюменская область
Челябинская область
Республика Алтай
Республика Тыва
Республика Хакасия
Алтайский край
Красноярский край
Иркутская область
Кемеровская область
Новосибирская область
Омская область
Томская область
Республика Бурятия
Республика Саха (Якутия)
Забайкальский край
Камчатский край
Приморский край
Хабаровский край
3
16602
31248
20273
19567
25161
22409
9360
16668
11121
18586
16041
21746
25043
15233
14176
28792
18699
15345
24060
18334
25998
18779
18237
23863
17375
18052
16133
31757
32422
33916
35341
29733
18237
13484
9878
18855
17258
23115
17855
17749
22895
20844
20314
20681
32080
18352
33201
27638
32997
21524
34372
23670
22813
29095
25755
16163
20782
18051
23270
23197
23408
28967
19802
18651
33725
23827
18462
28708
22247
31408
23385
21804
28180
21423
22797
20334
36735
46124
50717
79398
29162
24386
19503
15603
21571
22829
30015
24434
23166
28852
25431
27296
24081
42669
23992
48758
34619
39084
29640
33846
33630
30894
31448
25155
25367
25776
25430
26958
26177
29065
33753
28143
26712
35172
31808
27036
35802
27932
32949
30371
28968
33754
26823
28353
28159
38052
68664
70896
97204
44913
35219
30953
35779
37874
25519
45635
42647
38023
35686
32613
41901
36047
68871
40740
73896
42199
47153
105,5
104,3
104
104,3
104,5
102,8
101,9
103,5
103,7
103,4
103,5
104,5
104,3
105,4
103,4
103,7
103,8
104,7
103,8
104,3
104,7
104,3
104,2
104,5
104,2
104,5
104,4
103,9
102,4
102
102,9
102,9
103,5
102,9
103,8
105,2
104,1
104,3
105
104,6
103,5
103,9
104,5
105
102,7
104
103,4
104,2
104
Амурская область
Магаданская область
Сахалинская область
Еврейская автономная область
Чукотский автономный округ
24938
35242
43147
19064
29505
30937
59774
53783
24696
78812
42315
85631
77499
39242
98864
104,6
104,7
102,8
104,6
104,9
Порядок выполнения работы
1. На основе корреляционного анализа:
а) проанализировать тесноту связи результирующего признака Y с
каждым из факторов Х;
б) выбрать наиболее информативный фактор;
в) проанализировать
связи
между
факторами
на
наличие
мультиколлинеарности.
2.
Построить модель парной регрессии с наиболее информативным
фактором. Для нее:
а) оценить влияние факторной переменной на Y по коэффициенту
регрессии;
б) исследовать качество модели (принять уровень значимости α=5%) и
сделать выводы;
в) с доверительной вероятностью γ=80% осуществить прогнозирование
среднего значения показателя y (приняв прогнозное значение фактора
равным 90% от его максимального значения);
г) представить на графике исходные данные, результаты моделирования
и прогнозирования.
3.
Построить двухфакторную модель, включив в нее наиболее подходящие
факторы на основе корреляционного анализа (объяснить выбор
переменных):
4.
а)
дать экономическую интерпретацию ее коэффициентов;
б)
оценить качество построенной модели.
Оценить параметры линейной модели с полным перечнем факторов. Для
нее:
4
а) Оценить влияние факторных переменных на Y по коэффициентам
регрессии.
б) Оценить качество трехфакторной модели.
5.
Провести сравнительный анализ всех построенных моделей для
выявления лучшей модели среди трех построенных. Улучшилось ли
качество множественных модели по сравнению с парной?
6.
Для лучшей многофакторной модели: вычислить коэффициенты
эластичности,
бета-
и
дельта-
коэффициенты,
сделать
выводы,
выполнить точечный прогноз Y для заданных прогнозных значений Х*.
Замечание.
В качестве прогнозных значений факторных переменных задать
следующие величины:
𝑋1∗ - 80% от ее максимального значения;
𝑋2∗ - минимальное значение, увеличено в 2 раза;
𝑋3∗ - 170% от среднего значения.
Решение:
1.
На основе корреляционного анализа:
а)
проанализировать тесноту связи результирующего признака Y с
каждым из факторов Х;
б)
выбрать наиболее информативный фактор;
в)
проанализировать
связи
между
факторами
на
мультиколлинеарности.
Используем Excel (Данные / Анализ данных / КОРРЕЛЯЦИЯ):
5
наличие
Получим матрицу коэффициентов парной корреляции между всеми
имеющимися переменными:
Y1
X1
X2
X3
Y1
1
X1
0,797128
1
X2
0,735093 0,930443
1
X3
-0,20482 -0,30173 -0,34123
1
Проанализируем коэффициенты корреляции между результирующим
признаком Y и каждым из факторов Xj:
r Y , X 1   0.8
> 0, следовательно, между переменными Y и Х1 наблюдается
прямая корреляционная зависимость: чем выше среднедушевые денежные
доходы, тем больше потребительские расходы в среднем на душу населения.
0.7  | r Y , X 1  | 0,8  0,9
r Y , X 2   0,74 >
– эта зависимость является сильной.
0, значит, между переменными Y и Х2 наблюдается прямая
корреляционная зависимость: чем выше среднемесячная номинальная
начисленная заработная плата работников организаций, тем больше
потребительские расходы в среднем на душу населения.
0.7  | r Y , X 2  | 0,74  0,9
r Y , X 3   0,2 <
– эта зависимость является сильной.
0, значит, между переменными Y и Х3 наблюдается
обратная корреляционная зависимость: чем выше индекс потребительских
цен, тем меньше потребительские расходы в среднем на душу населения.
0.1  | r Y , X 3  | 0,2  0,3
– эта зависимость является слабой.
6
Для проверки значимости найденных коэффициентов корреляции
используем критерий Стьюдента.


Для каждого коэффициента корреляции r Y , Х j вычислим t-статистику
по формуле t 
r 2 n  2 
1 r
2
и занесем результаты расчетов в дополнительный
столбец корреляционной таблицы:
Y1
Y1
X1
X2
X3
X1
X2
1
0,797128
1
0,735093 0,930443
1
-0,20482 -0,30173 -0,34123
X3
t-статистики
1
11,95457
9,818402
1,894879
По таблице критических точек распределения Стьюдента при уровне
значимости   5%  0,05 и числе степеней свободы k  n  2  84  2  82
определим критическое значение t кр  1.99 (или функция СТЬЮДРАСПОБР).
Сопоставим фактические значения t с критическим tkp, и сделаем выводы
в соответствии со схемой:
t rY , X1   11.95
> t кр  1.99 , следовательно, коэффициент r Y , X 1 
значимо отличается от нуля. На уровне значимости 5% выборочные данные
позволяют сделать вывод о наличии линейной корреляционной связи между
признаками Y и Х1, зависимость потребительских расходов в среднем на
душу населения Y от среднедушевых денежных доходов Х1 является
достоверной.
t rY , X 2   9.82 > t кр  1.99 , следовательно, коэффициент r Y , X 2  значимо
отличается от нуля. На уровне значимости 5% выборочные данные
позволяют сделать вывод о наличии линейной корреляционной связи между
признаками Y и Х2, зависимость потребительских расходов в среднем на
7
душу населения Y от среднемесячной номинальной начисленной заработной
платы работников организаций Х2 является достоверной.
t r Y , X 3   1.89 < t кр  1.99 , следовательно, коэффициент r Y , X 3  значимо
не отличается от нуля. На уровне значимости 5% выборочные данные
позволяют сделать вывод об отсутствии линейной корреляционной связи
между признаками Y и Х3, зависимость потребительских расходов в среднем
на душу населения Y от индекса потребительских цен Х3 не является
достоверной.
Таким образом, наиболее тесная и значимая зависимость наблюдается
между потребительскими расходами в среднем на душу населения Y и
среднедушевыми денежными доходами Х1; фактор Х1 является наиболее
информативным.
2.
Построить модель парной регрессии с наиболее информативным
фактором. Для нее:
а)
оценить влияние факторной переменной на Y по коэффициенту
регрессии;
б)
исследовать качество модели (принять уровень значимости
α=5%) и сделать выводы;
в)
с
доверительной
вероятностью
γ=80%
осуществить
прогнозирование среднего значения показателя y (приняв прогнозное
значение фактора равным 90% от его максимального значения);
г)
представить
на
графике
исходные
данные,
результаты
моделирования и прогнозирования.
Для построения парной линейной модели
YТ  a  b  X 1
используем
программу РЕГРЕССИЯ (Данные / Анализ данных). В качестве «входного
интервала Х» покажем значения фактора Х1.
8
Результаты вычислений представлены в таблицах:
9
Коэффициенты
модели
содержатся
в
третьей
таблице
итогов
РЕГРЕССИИ (столбец Коэффициенты).
Таким образом, модель парной регрессии (модель 1) построена, ее
уравнение имеет вид
YT  10440.29  0.406  X 1 .
Коэффициент регрессии
b  0,406 ,
следовательно, при увеличении
среднедушевых денежных доходов (Х1) на 1 руб. потребительские расходы в
среднем на душу населения (Y) увеличиваются в среднем на 0,406 руб.
Свободный член а  10440.29 в данном уравнении не имеет реального
смысла.
Для вычисления средней относительной ошибки аппроксимации
рассмотрим остатки модели Ei  yi  yTi , содержащиеся в столбце Остатки
итогов программы РЕГРЕССИЯ (таблица «Вывод остатка»). Дополним
таблицу столбцом относительных погрешностей, которые вычислим по
E
формуле Eотн i  i  100 с помощью функции ABS.
yi
ВЫВОД ОСТАТКА
Наблюдение
Предсказанное Y
1
22926,51468
2
21225,47015
3
19989,74832
82
83
84
32259,33828
20459,12788
42413,27186
Остатки
1669,485324
1645,529853
-228,7483165
Отн. погр-ти
6,7876
7,1948
1,1576
10887,66172
-1395,127882
-12908,27186
25,2339
7,3181
43,7494
По столбцу относительных погрешностей найдем среднее значение
Е отн  13.18% (функция СРЗНАЧ).
Оценим точность построенной модели в соответствии со схемой:
10
Е отн  13.18%  5 %, 15% 
–
точность
модели
является
(1)
удовлетворительной.
Коэффициент
РЕГРЕССИЯ
детерминации
(таблица
R-квадрат
«Регрессионная
определен
статистика»)
программой
и
составляет
R 2  0,6354
Таким образом, вариация (изменение) потребительских расходов в
среднем на душу населения Y на 63,54% объясняется по уравнению модели
вариацией среднедушевых денежных доходов Х1.
Проверим значимость полученного уравнения с помощью F – критерия
Фишера.
F
–
статистика
определена
программой
РЕГРЕССИЯ
(таблица
«Дисперсионный анализ») и составляет F = 142,9.
Критическое значение Fкр= 3,96 найдено для уровня значимости =5% и
чисел степеней свободы k1=1, k2=84-2=82 (функция FРАСПОБР).
Схема проверки:
Сравнение показывает: F = 142,9 > Fкр = 3,96; следовательно, уравнение
модели является значимым, его использование целесообразно, зависимая
переменная Y достаточно хорошо описывается включенной в модель
факторной переменной Х1.
t – статистики для коэффициентов уравнения регрессии приведены в
таблице 4.
Для свободного коэффициента a  10440.29 определена статистика
t a   9.49 .
Для коэффициента регрессии b  0,406 определена статистика t b  11.95
Критическое значение t kp  1.99 найдено для уровня значимости =5% и
числа степеней свободы k  84  1  1  82 (функция СТЬЮДРАСПОБР).
Схема критерия:
11
Сравнение показывает:
t a   9.49 > t kp  1.99 , следовательно, свободный коэффициент а является
значимым, его нельзя исключить из модели.
t b  11.95 >
t kp  1.99 , значит, коэффициент регрессии b является
значимым, его и фактор среднедушевых денежных доходов нужно сохранить
в модели.
Согласно условию задачи прогнозное значение факторной переменной
Х1 составляет 90% от его максимального значения: х*  79398 * 0,9  71458.2 .
Рассчитаем по уравнению модели прогнозное значение показателя Y:
yT*  10440.29  0.406  х*  71458.2 .
Таким образом, если среднедушевые денежные доходы составят 71458,2
руб., то ожидаемые потребительские расходы в среднем на душу населения
будут около 39429,9 руб.
Зададим
доверительную
вероятность
  1
и
построим
доверительный прогнозный интервал для среднего значения Y.
Для этого нужно рассчитать стандартную ошибку прогнозирования для
среднего значения результирующего признака
 
1

n
S yT*  S E 
x*  x2
 xi  x 
2
.
Предварительно подготовим:
- стандартную ошибку модели
S E  3886.27
(таблица «Регрессионная
статистика» итогов РЕГРЕССИИ);
- по столбцу исходных данных Х1 найдем среднее значение
x  29927.58
(функция СРЗНАЧ) и определим
(функция КВАДРОТКЛ);
12
 x
i

2
 x  13114509948
- t кр 20 %, 82  1,29 (функция СТЬЮДРАСПОБР).
Следовательно, стандартная ошибка прогнозирования для среднего
значения составляет
 
1 71458.2  29927.58

 1471.8 .
84
13114509948
2
S yT*  3886.27 
Размах доверительного интервала для среднего значения
 
 
U yТ*  t kp  S yT*  1,29 1471.8  1901.5 .
Границами прогнозного интервала будут
 
U нижн  yT*  U yT*  39429.9  1901.5  37528.4 ;
 
U верх  yT*  U yT*  39429.9  1901.5  41331.4 .
Таким образом, с надежностью 80% можно утверждать, что если
среднедушевые денежные доходы составят 71458,2 руб., то ожидаемые
потребительские расходы в среднем на душу населения будут от 37528,46 до
41331,41 руб.
Для построения чертежа используем Мастер диаграмм (точечная) –
покажем исходные данные (поле корреляции).
Затем с помощью опции Добавить линию тренда… построим линию
модели:
тип → линейная; параметры → показывать уравнение на диаграмме.
Покажем на графике результаты прогнозирования. Для этого в опции
Исходные данные добавим ряды:
Имя → прогноз; значения Х → х*; значения Y → у*;
Имя → нижняя граница; значения Х → х*; значения Y → Uнижн;
Имя → верхняя граница; значения Х → х*; значения Y → Uверх.
13
Потребительские расходы в среднем на душу
населения, Y
Результаты моделирования и
прогнозирования
50000
y = 0,4057x + 10440
45000
40000
Исходные данные
35000
прогноз
30000
25000
нижняя граница
20000
15000
верхняя граница
10000
Линейная (Исходные
данные)
5000
0
0
20000
40000
60000
80000
100000
Среднедушевые денежные доходы, X1
3.
Построить двухфакторную модель, включив в нее наиболее
подходящие факторы на основе корреляционного анализа (объяснить выбор
переменных):
а)
дать экономическую интерпретацию ее коэффициентов;
б)
оценить качество построенной модели.
Построим
двухфакторную
модель,
сохраняя
в
ней
наиболее
информативный фактор – среднедушевые денежные доходы (Х1), а также
фактор – среднемесячная номинальная начисленная заработная плата
работников организаций (Х2), т.к. t-статистика данного фактора больше, чем
фактора Х3.
Используем в качестве «входного интервала Х» значения факторов Х1 и
Х2, с помощью программы РЕГРЕССИЯ найдем:
Коэффициенты
Y-пересечение
10486,94
Х1
0,428923
Х2
-0,01911
14
Таким образом, модель (2) зависимости потребительских расходов в
среднем на душу населения Y от среднедушевых денежных доходов Х1 и
среднемесячной номинальной начисленной заработной платы работников
организаций Х2 построена, ее уравнение имеет вид
YT  10486.94  0.43  Х 1  0.02 X 2 .
Коэффициент регрессии
среднедушевых
денежных
b1  0.43 ,
доходов
следовательно, при увеличении
(Х1)
на
1
руб.
и
неизменной
среднемесячной номинальной начисленной заработной плате работников
организаций потребительские расходы в среднем на душу населения (Y)
увеличиваются в среднем на 0,43 руб.
Коэффициент регрессии
b2  0.02 ,
следовательно, при увеличении
среднемесячной номинальной начисленной заработной платы работников
организаций (Х2) на 1% и неизменных среднедушевых денежных доходах
потребительские расходы в среднем на душу населения (Y) уменьшаются в
среднем на 0,02 руб.
Свободный коэффициент не имеет экономического смысла.
Средняя относительная ошибка аппроксимации Е отн  13.08%
Е отн  13.08%  15% – модель (2) является точной.
Коэффициент детерминации составляет
R 2  0,6357
Таким образом, вариация (изменение) потребительских расходов в
среднем на душу населения Y на 63,57% объясняется по уравнению модели
вариацией факторов X1 и X2.
Проверим значимость полученного уравнения с помощью F –
критерия Фишера: F = 70,68.
Критическое значение Fкр= 3,11 найдено для уровня значимости =5%
и чисел степеней свободы k1=2, k2=84-2-1=81 (функция FРАСПОБР).
Сравнение показывает: F = 70,68 > Fкр = 3,11; следовательно, уравнение
модели является значимым, его использование целесообразно, зависимая
15
переменная Y достаточно хорошо описывается включенными в модель
факторными переменными Х1, Х2.
t – статистики для коэффициентов уравнения регрессии приведены в
таблице 4.
Критическое значение t kp  1.99 найдено для уровня значимости =5% и
числа степеней свободы k  84  2  1  81 (функция СТЬЮДРАСПОБР).
Сравнение показывает:
t a  9.36 >
t kp  1.99 ,
следовательно,
свободный
коэффициент
а
является значимым, его нельзя исключить из модели.
t b1   4.61 >
t kp  1.99 , значит, коэффициент регрессии b1 является
значимым, его нельзя исключить из модели.
t b2   0.27 < t kp  1.99 , значит, коэффициент регрессии b2 не является
значимым, его можно исключить из модели.
4.
Оценить параметры линейной модели с полным перечнем
факторов. Для нее:
а)
Оценить
влияние
факторных
переменных
на
Y
по
коэффициентам регрессии.
б)
Оценить качество трехфакторной модели.
Построим множественную модель регрессии, учитывая все факторы
(Х1, Х2 и Х3):
Коэффициенты
Y-пересечение
-19108,05109
Х1
0,426704285
Х2
-0,012594708
Х3
282,2377069
Таким образом, трехфакторная модель (3) зависимости потребительских
расходов в среднем на душу населения Y от среднедушевого денежного
дохода Х1, среднемесячной номинальной начисленной заработной платы
16
работников организаций Х2 и индекса потребительских цен Х3 построена, ее
уравнение имеет вид
YT  19108.051  0.4267  Х 1  0,0126  X 2  282.2377  Х 3
Коэффициент регрессии
среднедушевого
денежного
b1  0.4267 ,
дохода
следовательно, при увеличении
(Х1)
на
1
руб.
и
неизменных
среднемесячной номинальной начисленной заработной плате и индексе
потребительских цен работников организаций потребительские расходы в
среднем на душу населения (Y) увеличиваются в среднем на 0,4267 руб.
Коэффициент регрессии
b2  0,0126 ,
следовательно, при увеличении
среднемесячной номинальной начисленной заработной платы (Х2) на 1 руб. и
неизменных среднедушевом денежном доходе и индексе потребительских
цен работников организаций потребительские расходы в среднем на душу
населения (Y) уменьшается в среднем на 0,0126 руб.
Коэффициент регрессии
b3  282.2377 ,
следовательно, при увеличении
индекса потребительских цен работников организаций (Х3) на 1% и
неизменных
среднедушевом
денежном
доходе
и
среднемесячной
номинальной начисленной заработной плате потребительские расходы в
среднем на душу населения (Y) увеличиваются в среднем на 282,2377 руб.
Свободный коэффициент не имеет экономического смысла.
Средняя относительная ошибка аппроксимации Е отн  13.027%
Е отн  13.027%  15% – модель (3) является точной.
Коэффициент детерминации составляет
R 2  0,637
Таким образом, вариация (изменение) потребительских расходов в
среднем на душу населения Y на 63,7% объясняется по уравнению модели
вариацией всех факторов.
Проверим значимость полученного уравнения с помощью F –
критерия Фишера: F = 46,79.
Критическое значение Fкр= 2,72 найдено для уровня значимости =5%
и чисел степеней свободы k1=3, k2=84-3-1=80 (функция FРАСПОБР).
17
Сравнение показывает: F = 46,79 > Fкр = 2,72; следовательно, уравнение
модели является значимым, его использование целесообразно, зависимая
переменная Y достаточно хорошо описывается включенными в модель
факторными переменными Х1, Х2, Х3.
t – статистики для коэффициентов уравнения регрессии приведены в
таблице 4.
Критическое значение t kp  1.99 найдено для уровня значимости =5% и
числа степеней свободы k  84  3 1  80 (функция СТЬЮДРАСПОБР).
t a   0,33 < t kp  1.99 , следовательно, свободный коэффициент а является
не значимым, его можно исключить из модели.
t b1   4.56 > t kp  1.99 , значит, коэффициент регрессии b1 является
значимым, его нельзя исключить из модели.
t b2   0,17 < t kp  1.99 , значит, коэффициент регрессии b2 не является
значимым, его можно исключить из модели.
t b3   0,52 < t kp  1.99 , значит, коэффициент регрессии b3 не значимым,
его можно исключить из модели.
5. Провести сравнительный анализ для выявления лучшей модели среди
трех построенных. Улучшилось ли качество множественной модели по
сравнению с парной?
При
добавлении
в
модель
новых
факторных
переменных
автоматически увеличивается коэффициент детерминации R2 и уменьшается
средняя ошибка аппроксимации, хотя при этом не всегда улучшается
качество модели. Поэтому для сравнения моделей с различным количеством
учтенных в них факторов рассмотрим коэффициенты детерминации и
средние ошибки аппроксимации. Модель тем лучше, чем больше величина
коэффициента детерминации и меньше величина ее ошибки.
18
RСредняя ошибка
квадрат аппроксимации
0,6354
13,18
0,6357
13,08
Модель
YT  10440.29  0.406  X 1
(1)
YT  10486.94  0.43  Х 1  0.02 X 2
(2)
YT  19108.051  0.4267  Х 1  0,0126  X 2  282.2377  Х 3
(3)
Таким
образом,
лучшей
потребительских
расходов
в
среднедушевого
денежного
является
среднем
дохода
Х1,
на
0,637
13,027
модель
душу
(3)
зависимости
населения
среднемесячной
Y
от
номинальной
начисленной заработной платы работников организаций Х2 и индекса
потребительских цен Х3:
YT  19108.051  0.4267  Х 1  0,0126  X 2  282.2377  Х 3 .
6. Для лучшей многофакторной модели вычислить коэффициенты
эластичности, бета- и дельта- коэффициенты, сделать выводы, выполнить
точечный прогноз Y для заданных прогнозных значений Х*.
Средние коэффициенты эластичности в случае линейной модели
определяются формулами
Эj bj 
Xj
, j = 1, 2, … ,
Y
где Х j , Y – выборочные средние признаков Xj и Y; b j – коэффициенты
регрессии.
Подготовим
X 1  29927.58;
X 2  38838.7;
X 3  104.2;
Y  22581.51
(функция СРЗНАЧ)
и
найдем
Э3  282.24 
Э1  0.4267 
29927.58
 0.57 ,
22581.51
Э2  0.0126 
38838.7
 0.02
22581.51
,
104.2
 1.3 .
22581.51
Следовательно, при увеличении среднедушевого денежного дохода Х1
на 1% и неизменных среднемесячной номинальной начисленной заработной
плате
и
индексе
потребительских
19
цен
работников
организаций
потребительские расходы в среднем на душу населения (Y) увеличивается в
среднем на 0,57%.
Увеличение среднемесячной номинальной начисленной заработной
платы работников организаций Х2 на 1% приводит к уменьшению
потребительских расходов в среднем на душу населения Y в среднем на
0,02% (при неизменных среднедушевом денежном доходе и индексе
потребительских цен).
Увеличение индекса потребительских цен Х3 на 1% приводит к
увеличению потребительских расходов в среднем на душу населения Y в
среднем на 1,3% (при неизменных среднедушевом денежном доходе и
среднемесячной номинальной начисленной заработной плате работников
организаций).
Бета-коэффициенты определяются формулами
 j  bj 
где
S xj , S y
S xj
Sy
,
j  1, 2, ... ,
- выборочные средние квадратичные (стандартные)
отклонения признаков Xj и Y; b j - коэффициенты регрессии.
Подготовим
S X 1  12570.05;
SX2  16430.13;
SX3  0.84;
SY  6397.35
(функция
СТАНДОТКЛОН) и рассчитаем
1  0.4267 
 3  282.2377
12570.05
 0.84 ,
6397.35
 2  0.0126 
16430.13
 0.03
6397.35
,
0.84
 0,04
6397.35
Таким образом, при увеличении только фактора Х1 на одно свое
стандартное отклонение результат Y увеличивается в среднем на 0,84 своего
стандартного отклонения Sy, при увеличении только фактора Х2 на одно свое
стандартное отклонение результат Y уменьшается в среднем на 0,03 своего
стандартного отклонения Sy, а при увеличении только фактора Х3 на одно его
стандартное отклонение – увеличивается на 0,04 Sy.
20
Дельта-коэффициенты определяются формулами
j j


r Y, X j
где r Y , X j
R
2
–

,
j  1, 2, ... ,
соответствующие выборочные коэффициенты парной
корреляции.
Коэффициенты
r Y , X 3   0,2
задачи),
парной
корреляции
r Y , X 1   0.8 ,
r Y , X 2   0.74
и
найдены с помощью программы КОРРЕЛЯЦИЯ (п.1 данной
коэффициент
детерминации
R 2  0,64
определен
для
рассматриваемой многофакторной модели программой РЕГРЕССИЯ.
Вычислим дельта-коэффициенты
1  0.84 
0.8
0,74
 0,2
 1.05;  2  0.03 
 0,04;  3  0.04 
 0.01
0,64
0,64
0,64
Значит, по уравнению полученной линейной многофакторной модели
(3) изменение результирующего фактора Y (потребительские расходы в
среднем на душу населения) на 105% объясняется воздействием фактора Х1
(среднедушевой денежный доход), на -4% объясняется воздействием фактора
Х2 (среднемесячная номинальная начисленная заработная плата) и на -1%
влиянием фактора Х3 (индекс потребительских цен).
Согласно условию задачи прогнозное значение факторных переменных
составляет:
𝑋1∗ - 80% от ее максимального значения: х1  79398 * 0,8  63518.4
*
𝑋2∗ - минимальное значение, увеличено в 2 раза: х2  25155 * 2  50310
*
𝑋3∗ - 170% от среднего значения: х3  104.2 *1,7  177.1
*
Рассчитаем по уравнению модели прогнозное значение показателя Y:
yT*  19108.05  0.4267  63518.4  0,0126  50310  282.2377 177.1  57356.3
.
Таким образом, если ожидаемые потребительские расходы в среднем
на душу населения будет около 57356,3 руб.
21
Задача 2. Исследование динамики экономического показателя на
основе анализа одномерного временного ряда
Приведены временные ряды Y(t) социально-экономических показателей
по Алтайскому краю за период с 2006 г. по 2017 г.
Y1
год
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
Потребительские расходы в среднем на душу населения (в месяц), руб.
Y1
5685
7385
7065
8165
9766
11236
13535
14492
15334
15717
16286
17258
Порядок выполнения работы
1.
Проверить наличие аномальных наблюдений, используя метод
Ирвина (α=5%) или метод Стьюдента.
2.
Построить
линейную
модель
временного
ряда
yt=a+b∙t,
параметры которой оценить МНК. Пояснить смысл коэффициента регрессии.
3.
Оценить
адекватность
посторенной
модели
на
основе
предпосылок теоремы Гаусса-Маркова.
4.
Оценить качество модели, используя среднюю относительную
погрешность
аппроксимации,
критерий
Фишер
и
коэффициент
детерминации.
5.
Осуществить прогнозирование рассматриваемого показателя на
год вперед (прогнозный интервал рассчитать при доверительной вероятности
70%).
6.
Представить графически фактические значения показателя,
результаты моделирования и прогнозирования.
22
7.
Составить уравнения нелинейной регрессии (гиперболической;
степенной; показательной). По каждой модели необходимо: привести
графики построенных уравнений регрессии; найти средние относительные
ошибки аппроксимации, коэффициенты детерминации и коэффициенты
эластичности. По этим характеристикам сравнить нелинейные модели между
собой и сделать вывод.
8.
Лучшую нелинейную модель сравнить с линейной моделью.
9.
С помощью лучшей нелинейной модели осуществить точечное
прогнозирование рассматриваемого показателя на год вперед. Сопоставить
полученный
результат
с
доверительным
прогнозным
интервалом,
построенным при использовании линейной модели.
Решение:
1.
Проверить наличие аномальных наблюдений, используя метод
Ирвина (α=5%) или метод Стьюдента.
Используем метод Ирвина
𝜆𝑡 =
|𝑌𝑡 −𝑌𝑡−1 |
𝜎𝑦
, где 𝜎𝑦 – вычислим с помощью функции СТАНДОТКЛ
Выполним все вычисления, используя MS Excel:
В результате получим:
23
𝑡
𝑌̅
𝜎𝑦
𝑌𝑡
5685
7385
7065
8165
9766
11236
13535
14492
15334
15717
16286
17258
1
2
3
4
5
6
7
8
9
10
11
12
11827
3926,072
|𝑌𝑡 − 𝑌𝑡−1 |
𝜆𝑡
1700
320
1100
1601
1470
2299
957
842
383
569
972
0,43
0,08
0,28
0,41
0,37
0,59
0,24
0,21
0,10
0,14
0,25
Так как по всем уровням t значение  не превосходит табличное 1,6,
значит, аномальных наблюдений нет.
Вывод: аномальных наблюдений нет.
2. Построить линейную модель временного ряда
yˆ t  a  b  t ,
параметры которой оценить МНК. Пояснить смысл коэффициента
регрессии.
С помощью программы «РЕГРЕССИЯ» найдем
Коэффициенты
Y-пересечение
t
4547,5
1119,92
Таким образом, a  4547.5 ; b  1119.92 .
Модель построена, ее уравнение имеет вид yˆ t  4547.5  1119.92  t .
Коэффициент
регрессии
b  1119.92
показывает,
что
ежегодно
потребительские расходы в среднем на душу населения Y  увеличиваются в
среднем на 1119,92 руб.
24
3. Оценить адекватность построенной модели на основе предпосылок
теоремы Гаусса-Маркова.
Предпосылками построения классической линейной регрессионной
модели являются четыре условия, известные как условия Гаусса-Маркова.
1)
В уравнении линейной модели Y  a  b  X   слагаемое ε –
случайная величина, которая выражает случайный характер результирующей
переменной Y.
2)
Математическое
ожидание
случайного
члена
в
любом
наблюдении равно нулю, а дисперсия постоянна.
3)
Случайные
члены
для
любых
двух
разных
наблюдений
независимы (некоррелированы).
4)
Распределение случайного члена является нормальным.
Проверка перечисленных свойств состоит в исследовании Ряда
остатков et , который содержится в таблице «Вывод остатка» итогов
РЕГРЕССИИ.
Наблюдение
1
2
3
4
5
6
7
8
9
10
11
12
Для
проверки
Предсказанное Y
5667,423
6787,346
7907,269
9027,192
10147,12
11267,04
12386,96
13506,88
14626,81
15746,73
16866,65
17986,58
свойства
случайности
Остатки
17,57692308
597,6538462
-842,2692308
-862,1923077
-381,1153846
-31,03846154
1148,038462
985,1153846
707,1923077
-29,73076923
-580,6538462
-728,5769231
остаточной
компоненты
используем критерий поворотных точек (пиков), основой которого является
определение количества поворотных точек для ряда остатков.
С помощью Мастера диаграмм построим график остатков et .
25
Остатки
1500
1000
500
Остатки
0
1
2
3
4
5
6
7
8
9
10 11 12
-500
-1000
Поворотными считаются точки максимумов и минимумов на этом
графике (в данном случае – вторая, четвертая и седьмая). Их количество
p  3.
По формуле
2
16n  29 
p кр   (n  2)  1,96
 при n  12 вычислим
90 
3
критическое значение ркр  4.03  4 .
Сравним значения p и pкр и сделаем вывод согласно схеме:
p  3 < p кр  4 , следовательно, свойство случайности для ряда остатков
не выполняется.
Равенство
нулю
математического
ожидания
остаточной
компоненты для линейной модели, коэффициенты которой определены по
МНК, выполняется автоматически. С помощью функции СРЗНАЧ для ряда
остатков можно проверить: E  0 .
Свойство
постоянства
дисперсии
остаточной
компоненты
проверим по критерию Гольдфельда–Квандта.
В упорядоченных по возрастанию переменной X исходных данных (
n  12 ) выделим первые 5 и последние 5 уровней, средние 2 уровня не
рассматриваем.
26
С помощью программы РЕГРЕССИЯ построим модель по первым пяти
наблюдениям (регрессия-1), для этой модели остаточная сумма квадратов
SS1  1013648 .
Дисперсионный анализ
df
Регрессия
1
Остаток
3
Итого
4
SS
MS
7995936
337882,8
7995936
1013648
9009585
F
23,66482
Значимость F
0,016592
С помощью программы РЕГРЕССИЯ построим модель по последним
пяти наблюдениям (регрессия-2), для этой модели остаточная сумма
квадратов SS2  91129.6 .
Дисперсионный анализ
df
Регрессия
1
Остаток
3
Итого
4
SS
4204225,6
91129,6
4295355,2
MS
F
4204225,6
138,4037
30376,53333
Значимость F
0,00132
Рассчитаем статистику критерия:
F
SS max 1013648

 11.1 .
SS min 91129.6
Критическое значение при уровне значимости   5% и числах
степеней свободы k1  k2  5 1 1  3 составляет Fкр  9.28 .
Схема критерия:
Сравним
F  11.1  Fкр  9.28 ,
следовательно, свойство
постоянства
дисперсии остатков не выполняется, модель гетероскедастичная.
Для проверки свойства независимости остаточной компоненты
используем критерий Дарбина-Уотсона.
Согласно этому критерию вычислим по формуле статистику
27
n
 et  et 1 2
d  t 2
.
n
 et2
t 1
Подготовим для вычислений:
12
e
t 1
t 2
 5613937.15 (функция СУММКВ),
2
12
 e
2
t
t
 et 1   5126714.14 (функция СУММКВРАЗН).
Таким образом,
d
5126714.14
 0.91 .
5613937.15
По таблице d – статистик Дарбина–Уотсона определим критические
уровни: нижний d1 = 0,97 и верхний d2 = 1,33.
Сравним полученную фактическую величину d с критическими
уровнями d1 и d2 и сделаем вывод согласно схеме:
d  0.91 0; d1  0,97
, следовательно, свойство независимости остатков
для построенной модели не выполняется.
Для проверки соответствия ряда остатков нормальному закону
распределения используется R/S критерий.
В соответствии с этим критерием вычислим по формуле статистику
e
 emin
R / S  max
.
S e 
Подготовим для вычислений:
emax  1148.04
- максимальный уровень ряда остатков (функция МАКС);
emin  862.19
- минимальный уровень ряда остатков (функция МИН);
S e  749.26
- стандартная ошибка модели (таблица «Регрессионная
статистика» вывода итогов РЕГРЕССИИ).
Получим
R/S 
1148.04   862.19 
 2.68 .
749.26
28
По
таблице
критических
границ
отношения
R/S
критический интервал. При n  12 можно использовать 2,80;
определим
3,91 .
Сопоставим фактическую величину R/S с критическим интервалом и
сделаем вывод согласно схеме:
2.68  2,80; 3,91 ,
значит, для построенной модели свойство нормального
распределения остаточной компоненты не выполняется.
Проведенная проверка показывает, что для построенной модели не
выполняются все свойства. Таким образом, данная трендовая модель не
является адекватной реальному ряду наблюдений, её нельзя использовать для
построения прогнозных оценок.
4. Оценить качество модели, используя среднюю относительную
погрешность
аппроксимации,
критерий
Фишер
и
коэффициент
детерминации.
Используем
исходные
РЕГРЕССИЯ остатки
E отн t 
et
 100
yt
данные
yt
и
найденные
программой
et (таблица «Вывод остатка»). По формуле
рассчитаем столбец относительных погрешностей и найдем
среднее значение E отн  5.24 % .
Сравнение показывает, что 5.24%  15% . Следовательно, точность
модели удовлетворительная.
Коэффициент детерминации R-квадрат определен программой
РЕГРЕССИЯ (таблица «Регрессионная статистика») и составляет
R 2  0,97
Таким образом, вариация (изменение) потребительских расходов в
среднем на душу населения Y на 97% объясняется по уравнению модели
вариацией года.
Проверим значимость полученного уравнения с помощью F –
критерия Фишера.
29
F – статистика определена программой РЕГРЕССИЯ (таблица
«Дисперсионный анализ») и составляет F = 319,48.
Критическое значение Fкр= 4,96 найдено для уровня значимости =5%
и чисел степеней свободы k1=1, k2=10 (функция FРАСПОБР).
Схема проверки:
Сравнение показывает: F = 319,48 > Fкр = 4,96; следовательно,
уравнение модели является значимым, его использование целесообразно,
зависимая переменная Y достаточно хорошо описывается включенной в
модель факторной переменной t.
5. Осуществить прогнозирование рассматриваемого показателя на
год
вперед
(прогнозный
интервал
рассчитать
при
доверительной
вероятности 70%).
«Следующий год» соответствуют периоду упреждения
k1  1 ,
при этом
t1*  n  k1  13 .
Согласно уравнению модели получим точечные прогнозные оценки
*
yˆ13
 4547.5  1119.92 13  19106.5 .
Таким образом, ожидаемые потребительские расходы в среднем на
душу населения в следующем году будут составлять около 19106,5 руб.
Для
оценки
точности
прогнозирования
рассчитаем
границы
прогнозных интервалов для индивидуальных значений результирующего
признака (доверительная вероятность р  70% ).
Подготовим:
t kp  1,09 (функция СТЬЮДРАСПОБР при   30%, k  12 - 2  10 );
S e  749.26
t  6.5
(строка «стандартная ошибка» итогов РЕГРЕССИИ);
(функция СРЗНАЧ);
 t  t 
12
2
 143 (функция КВАДРОТКЛ).
t 1
Вычислим
размах
прогнозного
значений, используя формулу
30
интервала
для
индивидуальных

2
1
t*  t
.
u  t kp  S e   1  
n
n
2
 t t
 
t 1
*
При t1  13 получим
u13  961.67
и определим границы доверительного
интервала:
Таким
*
uниж13  yˆ13
 u13  18144.83 ;
*
uверх13  yˆ13
 u13  20068.2 .
образом,
70%
с
надежностью
можно
утверждать,
что
потребительские расходы в среднем на душу населения в следующем (13-ом)
году будут составлять от 18144,83 до 20068,2 руб.
6.
Представить
графически
фактические
значения
показателя,
результаты моделирования и прогнозирования.
Для построения чертежа используем Мастер диаграмм (точечная) –
покажем исходные данные.
Затем с помощью опции Добавить линию тренда… построим линию
модели:
тип → линейная; параметры → показывать уравнение на диаграмме.
Покажем на графике результаты прогнозирования. Для этого в опции
Исходные данные добавим ряды:
*
*
*
Имя → прогноз; значения Х → t1 и t 2 ; значения Y → y12 и y13* ;
*
*
Имя → нижние границы; значения Х → t1 и t 2 ; значения Y → uниж12 и
uниж13 ;
*
*
Имя → верхние границы; значения Х → t1 и t 2 ; значения Y → u верх12
и u верх13 .
31
Потребительские расходы в среднем на душу
населения, руб.
Результаты моделирования и
прогнозирования
25000
20000
фактические значения
y = 1119,9x + 4547,5
прогноз
15000
нижняя граница
10000
верхняя граница
5000
Линейная (фактические
значения)
0
0
2
4
6
8
10
12
14
Годы
8. Составить уравнения нелинейной регрессии (гиперболической;
степенной;
показательной)
По
каждой
модели:
привести
графики
построенных уравнений регрессии; найти средние относительные ошибки
аппроксимации,
коэффициенты
детерминации
и
коэффициенты
эластичности. По этим характеристикам сравнить нелинейные модели
между собой и сделать вывод.
Гиперболическая модель
Модель гиперболической регрессии имеет вид:
yт  a 
b
t.
Для ее построения выполним линеаризацию: обозначим
~ 1
t 
и
t
~
получим вспомогательную модель yт  a  b t . Вспомогательная модель
является
линейной.
Ее
можно
построить
с
помощью
программы
РЕГРЕССИЯ, предварительно подготовив исходные данные: столбец
значений уi (остается без изменений) и столбец преобразованных значений
~ 1
ti  (таблица 7).
ti
32
Y
5685
7385
7065
8165
9766
11236
13535
14492
15334
15717
16286
17258
t
1
2
3
4
5
6
7
8
9
10
11
12
1/t
1,00
0,50
0,33
0,25
0,20
0,17
0,14
0,13
0,11
0,10
0,09
0,08
С помощью программы РЕГРЕССИЯ получим
Коэффициенты
Таким образом,
Y-пересечение
14934,62
1/t
-12017,04
a  14934.62; b  12017.04 ,
гиперболической модели yТ  14934.62 
С
помощью
полученного
следовательно, уравнение
12017.04
.
t
уравнения
рассчитаем
теоретические
значения yTi для каждого уровня исходных данных t i .
Покажем линию гиперболической модели на графике. Для этого
добавим к ряду исходных данных ti , yi  ряд теоретических значений ti , yTi  .
Гиперболическая модель
20000,00
18000,00
16000,00
14000,00
12000,00
10000,00
8000,00
6000,00
4000,00
2000,00
0,00
Гиперболический (Y)
Y
1 2 3 4 5 6 7 8 9 10 11 12
33
Степенная модель
Модель степенной регрессии имеет вид: yT  at b
Осуществим линеализацию модели. Прологарифмируем уравнение,
получим lg yT  lg a  b lg t . Представим, что Y  lg yT ; A  lg a; X  lg t . Тогда
получим линейную модель Y  A  bX
t
Y  lg yT
Y
X  lg t
1
5685
2
7385
3,8684
0,3010
3
7065
3,8491
0,4771
4
8165
3,9120
0,6021
5
9766
3,9897
0,6990
6
11236
4,0506
0,7782
7
13535
4,1315
0,8451
8
14492
4,1611
0,9031
9
15334
4,1857
0,9542
10
15717
4,1964
1
11
16286
4,2118
1,0414
12
17258
4,2370
1,0792
3,7547
0
С помощью функции MS Excel составим дополнительные таблицы для
расчета и используем функцию РЕГРЕССИЯ для нахождения параметров a и
b. Получим a=3,69, b=0,487
Перейдем к исходным переменным t и y, выполнив потенцирование
данного уравнения.
yT  103.69  t 0.487
Получим уравнение степенной модели регрессии:
yT  4932.67  t 0.487
34
Степенная модель
20000,0000
18000,0000
16000,0000
14000,0000
12000,0000
10000,0000
8000,0000
6000,0000
4000,0000
2000,0000
0,0000
Степенная модель
Поле корреляции
0
5
10
15
Показательная модель
Уравнение показательной кривой yT  a  bt
Линеализируем переменные: ln yT  ln a  ln t  b Введем обозначения:
Y  ln yT ; B  ln b; A  ln a , получим Y  A  Bt
35
Y  ln yT
Х
Y
1
5685
2
7385
3,8684
3
7065
3,8491
4
8165
3,9120
5
9766
3,9897
6
11236
4,0506
7
13535
4,1315
8
14492
4,1611
9
15334
4,1857
10
15717
4,1964
11
16286
4,2118
12
17258
4,2370
3,7547
Найдем значение Y=ln y, с помощью функции РЕГРЕССИЯ найдем
параметры А=8,65, В=0,103. Тогда a=5688,09, b=1,1085. Тогда модель
показательной регрессии примет вид yT  5688.09 *1,1085t
Показательная модель
25000,0000
20000,0000
15000,0000
Показательная
модель
10000,0000
Поле корреляции
5000,0000
0,0000
0
5
10
15
Заполним для каждой модели расчетную таблицу, в которую занесем
теоретические
значения
yTi  f xi  ,
найденные
по
соответствующему
уравнению для каждого уровня исходных данных xi ; ошибки модели
Ei  yi  yTi и относительные погрешности Eотн i 
36
Ei
 100 .
yi
Среднюю относительную погрешность E отн найдем по столбцу Eотн i с
помощью функции СРЗНАЧ.
Индекс детерминации вычислим по формуле R 2  1 
E
 y  y
2
i
2
, для чего
i
подготовим числитель дроби
и знаменатель
Y
5685
7385
7065
8165
9766
11236
13535
14492
15334
15717
16286
17258
t
1
2
3
4
5
6
7
8
9
10
11
12
 y
i
y

2
E
2
i
- функция СУММКВ для столбца ошибок
- функция КВАДРОТКЛ для столбца У.
гиперболическая модель
Yт
Е
Е отн
2917,58
8926,10
10928,94
11930,36
12531,21
12931,78
13217,90
13432,49
13599,39
13732,91
13842,16
13933,20
2767,4216
-1541,0976
-3863,9374
-3765,3572
-2765,2091
-1695,7771
317,1029
1059,5130
1734,6097
1984,0870
2443,8412
3324,8030
степенная модель
Y
t
Yт
5685
1
4932,6655
7385
2
6915,2483
7065
3
8426,3027
8165
4
9694,6894
9766
5
10808,5929
11236
6
11813,0808
13535
7
12734,8535
14492
8
13591,2693
15334
9
14394,3631
15717
10
15152,8832
16286
11
15873,4247
17258
12
16561,1044
48,6794
20,8679
54,6913
46,1158
28,3147
15,0924
2,3428
7,3110
11,3122
12,6238
15,0058
19,2653
Е
Е отн
752,3345
469,7517
-1361,3027
-1529,6894
-1042,5929
-577,0808
800,1465
900,7307
939,6369
564,1168
412,5753
696,8956
13,2337
6,3609
19,2683
18,7347
10,6757
5,1360
5,9117
6,2154
6,1278
3,5892
2,5333
4,0381
37
квадроткл(Y)=
суммкв(Е)=
R-квадрат=
Е ср.отн.=
суммкв(Е)=
R-квадрат=
Е ср.отн.=
184968498
74858841,69
0,5953
23,47
9708368,27
0,9475
8,49
показательная модель
Y
t
Yт
5685
1
6305,0471
7385
2
6988,9200
7065
3
7746,9687
8165
4
8587,2387
9766
5
9518,6480
11236
6
10551,0820
13535
7
11695,4983
14492
8
12964,0430
15334
9
14370,1796
15717
10
15928,8318
16286
11
17656,5423
17258
12
19571,6478
Е
Е отн
-620,0471
396,0800
-681,9687
-422,2387
247,3520
684,9180
1839,5017
1527,9570
963,8204
-211,8318
-1370,5423
-2313,6478
10,9067
5,3633
9,6528
5,1713
2,5328
6,0957
13,5907
10,5435
6,2855
1,3478
8,4155
13,4062
суммкв(Е)=
R-квадрат=
15638594,28
0,9155
Е ср.отн.=
7,78
Составим сводную таблицу характеристик качества построенных
моделей:
сводная таблица характеристик качества
модель
R-квадрат
Е ср.отн.
гиперболическая
0,5953
23,47
степенная
8,49
0,9475
показательная
0,9155
7,78
Столбец средних относительных погрешностей показывает, что
наиболее точной является показательная модель, ее погрешность –
наименьшая.
По величине индекса детерминации лучшая модель степенная (индекс
детерминации
наибольший).
R 2  94.75% ,
Таким
образом,
вариация
(изменение) потребительских расходов в среднем на душу населения на
94,75% объясняется по уравнению степенной модели вариацией года.
Для нелинейных моделей
yТ  f t 
определяются соотношением Эt   f t  
t
f t 
коэффициенты эластичности
, согласно которому:
для степенной модели yт  a  t b коэффициент эластичности Э  b и
представляет собой постоянную величину;
для показательной модели
yт  a  b t
Эt   t  ln b и зависит от значения фактора t;
38
коэффициент эластичности
для гиперболической модели y т  a  b коэффициент эластичности
t
Э t   
b
at  b
и также зависит от значения фактора t.
Для построенной степенной модели yT  4932.67  t 0.487 получим Э  0.487 .
Следовательно, согласно этой модели ежегодно происходит увеличение
потребительских расходов в среднем на душу населения на 0,487%.
Для показательной и гиперболической моделей результаты расчета
коэффициентов эластичности приведены в таблице
t
1
2
3
4
5
6
7
8
9
10
11
12
Коэффициенты эластичности
Показательная модель
Гиперболическая модель
0,10
4,12
0,21
0,67
0,31
0,37
0,41
0,25
0,51
0,19
0,62
0,15
0,72
0,13
0,82
0,11
0,93
0,10
1,03
0,09
1,13
0,08
1,24
0,07
Таким образом, согласно показательной модели ежегодно происходит
увеличение потребительских расходов в среднем на душу населения на
величину от 0,1% до 1,24%. Согласно гиперболической модели ежегодно
происходит увеличение потребительских расходов в среднем на душу
населения на величину от 0,07% до 4,12%.
Логично предположить, что наиболее подходящей является степенная
модель,
т.к.
наблюдаемое
увеличение
коэффициента
эластичности
соответствует реальной ситуации: ежегодно увеличиваются потребительские
расходы в среднем на душу населения.
39
8. Лучшую нелинейную модель сравнить с лучшей линейной моделью.
Сравним степенную модель с линейной регрессией
модель
yˆ t  4547.5  1119.92  t
yT  4932.67  t
R-квадрат
Е ср.отн.
0,97
0,9475
5,24
8,49
0.487
Столбец средних относительных погрешностей показывает, что
наиболее точной является линейная модель, ее погрешность – наименьшая.
По величине индекса детерминации лучшая модель также линейная
(индекс детерминации наибольший). R 2  97% .
9. С помощью лучшей нелинейной модели осуществить точечное
прогнозирование рассматриваемого показателя на год вперед. Сопоставить
полученные
результаты
с
доверительным
прогнозным
интервалом,
построенным при использовании линейной модели.
Рассчитаем по уравнению степенной модели прогнозные значения
показателя Y:
в следующем году
t *  13; y *Т  4932.67 *130.487  17212 .
Полученные прогнозные оценки не попадают в доверительные
прогнозные
интервалы,
построенные
в
п.
4.
Это
может
служить
подтверждением ошибочности прогноза, разработанного на основании
линейной модели.
40
Список использованных источников
1.
Данные Федеральной службы государственной статистики. –
Регионы России. Cоциально-экономические показатели. – 2018г.
2.
Кремер Н.Ш. Математика для экономистов: от Арифметики до
Эконометрики: учеб. – справоч. пособие/ Н. Ш. Кремер, Б. А. Путко, И. М.
Тришин; под ред. Н.Ш. Кремера. – 4-е изд., пер. и доп. – М.: Юрайт, 2016. –
724 с. (ЭБС Юрайт).
3.
Орлова И.В. Экономико-математические методы и модели:
компьютерное моделирование: учеб. пособие/ И. В. Орлова, В. А.
Половников. – 3-е изд., перераб. и доп. – М.: Вузовский учебник: Инфра-М,
2014. – 389 с. (ЭБС Znanium.com).
4.
Экономико-математические методы в примерах и задачах: учеб.
пособие / под ред. А.Н. Гармаша. – М.: Вузовский учебник: ИНФРА-М, 2014.
– 416 с. (ЭБС Znanium.com).
41
Скачать