Uploaded by Nurlan80-mir

Контрольная по статистике

advertisement
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«Оренбургский государственный аграрный университет»
Экономический факультет
Кафедра «Статистики и экономического анализа»
КОНТРОЛЬНАЯ РАБОТА
по дисциплине «Эконометрика»
Вариант № 1
Работу выполнила студентка
Направления
подготовки
38.03.01
Экономика
Профиля
подготовки
«Финансы
кредит»
Артамонова В.Е.
Работу проверила
Кибатаева Аида Нурабековна
Оренбург - 2019
и
Содержание
Задание 1. Парная линейная регрессия
3
Задание 2. Нелинейная регрессия
9
Задание 3. Множественная линейная регрессия
15
Список литературы
18
2
Задание 1. Парная линейная регрессия
1.
Постройте поле корреляции и сформулируйте гипотезу о форме
связи между темпом прироста затрат электроэнергии и темпом прироста
выпуска продукции предприятия.
Рисунок 1 - Поле корреляционной зависимости темпа прироста
выпуска продукции от темпа прироста затрат электроэнергии
По расположению точек на графике делается вывод о виде
корреляционной зависимости. Анализ рисунка 1 позволяет предположить
наличие прямой линейной корреляционной зависимости между темпом
прироста выпуска продукции и темпом прироста затрат электроэнергии
2.
Рассчитайте оценки параметров парной линейной регрессии, х –
темп прироста затрат электроэнергии (%), а у– темп прироста выпуска
продукции (%).
Параметры а и b линейной регрессии𝑦 = 𝑎 + 𝑏𝑥 рассчитываются
результате решения системы нормальных уравнений относительно а и b:
∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑥
{
∑ 𝑦𝑥 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2
По исходным данным рассчитаем ∑ 𝑦, ∑ 𝑥,∑ 𝑥𝑦, ∑ 𝑥 2 ,∑ 𝑦 2 .
Система нормальных уравнений составит:
821.1 = 12𝑎 + 472𝑏
{
36884.06 = 472𝑎 + 26749.56𝑏
3
Решаем ее методом определителей: определитель системы ∆ равен:
472
| = (12 ∗ 26749.56 − 472 ∗ 472) = 98210.72,
26749.56
∆𝑎
821.1
472
∆𝑎 = |
| = 4554787,39, 𝑎 = ∆ = 46.38,
36884.06 26749.56
∆𝑏
12
821
∆𝑏 = |
| = 55049.52, 𝑏 = ∆ = 0.561.
472 36884.06
∆= |
12
472
Получаем уравнение регрессии: 𝑦̃𝑥 = 46.38 + 0.561𝑥
Этот же результат можно получить, используя следующие формулы
длянахождения параметров:
𝑏=
где, 𝜎𝑥2 =
∑ 𝑥2
𝑛
Получаем 𝑏 =
̅̅̅̅−𝑦̅𝑥̅
𝑦𝑥
𝜎𝑥2
, 𝑎 = 𝑦̅ − 𝑏𝑥̅
− 𝑥̅ 2 –дисперсия по факторному признаку.
3073.67−68.43∗39.33
2229.13−39.33
= 0.561, 𝑎 = 68.43 − 0.561 ∗ 39.33 = 46.37
При решении с помощью компьютера уравнение регрессии составило:
𝑦̃𝑥 = 46.38 + 0.561𝑥
Величина коэффициента регрессии 𝑏 = 0.561означает, что с ростом
темпа прироста затрат электроэнергии на 1 %, темп прироста выпуска
продукции увеличивается на 0,561 % .
4
Номер
предприятия
1
2
3
4
5
6
7
8
9
10
11
12
Сумма
Среднее
значение
x
y
yx
x^2
y^2
y͂
y-y͂
(y-y͂)^2
(y-y
ср)^2
(y͂-y
ср)^2
(x - x ср)^2
|(yy͂)/y|*100
6,4
12,3
13,5
19,7
20
27,1
42,5
44
56,9
66,5
72,9
90,2
472
31,7
53,3
46,2
65,7
63,3
70,2
75,1
76,3
83,2
83,2
85,1
87,8
821,1
202,88
655,59
623,7
1294,29
1266
1902,42
3191,75
3357,2
4734,08
5532,8
6203,79
7919,56
36884,06
40,96
151,29
182,25
388,09
400
734,41
1806,25
1936
3237,61
4422,25
5314,41
8136,04
26749,56
1004,89
2840,89
2134,44
4316,49
4006,89
4928,04
5640,01
5821,69
6922,24
6922,24
7242,01
7708,84
59488,67
49,97
53,27
53,94
57,42
57,59
61,57
70,20
71,04
78,27
83,65
87,24
96,94
821,1
-18,27
0,03
-7,74
8,28
5,71
8,63
4,90
5,26
4,93
-0,45
-2,14
-9,14
0
333,61
0,00
59,98
68,56
32,62
74,51
24,01
27,66
24,29
0,20
4,58
83,49
733,52
1348,73
228,77
493,95
7,43
26,27
3,15
44,56
62,02
218,30
218,30
278,06
375,39
3304,90
340,77
229,61
209,68
121,11
117,44
47,02
3,15
6,84
96,95
231,88
354,00
812,94
2571,38
1084,60
730,80
667,36
385,47
373,78
149,65
10,03
21,78
308,59
738,03
1126,72
2587,42
8184,23
57,62
0,05
16,76
12,60
9,02
12,30
6,52
6,89
5,92
0,54
2,51
10,41
141,16
39,33
68,43
3073,67
2229,13
4957,39
-
-
-
-
-
-
-
Таблица 1 – Расчетные данные
5
Оцените тесноту связи между признаками.
3.
Линейное уравнение регрессии дополняется расчетом линейного
коэффициента корреляции:
𝑟𝑦𝑥 =
̅̅̅̅−𝑦̅𝑥̅
𝑦𝑥
𝜎𝑦 𝜎𝑥
или 𝑟 = 𝑏
𝜎𝑥
𝜎𝑦
Так как 𝜎𝑥 = √2229.13 − 39.332 = 26.11, 𝜎𝑦 = √4957.39 − 68.432 = 16.59, то
26.11
𝑟 = 0.561 16.59 = 0.882, что означает тесную прямую связь рассматриваемых
признаков.
4.
Рассчитайте коэффициент детерминации.
2
Коэффициент детерминации составит: 𝑟𝑦𝑥
= 0.8822 = 0.778, т.е.вариация
у на 77.8% объясняется вариацией х. На долю прочих факторов,
неучитываемых в регрессии, приходится 22,2 %.
5.
Проверьте значимость оценки коэффициента регрессии с
помощью критерия Стьюдента при уровне значимости α=0,05.
Оценку статистической значимости коэффициента регрессии проведем
с помощью t - критерия Стьюдента.
Выдвигаем две гипотезы:
Н0 – коэффициент регрессии является статистически незначимым, т.е.
b=0;
Н1 – коэффициент регрессии статистически значим, т.е. b≠0.
Определим стандартную ошибку для коэффициента регрессии mb:
∑(𝑦−𝑦̃ )2
733.5
𝑥
𝑚𝑏 = √∑(𝑥−𝑥̅ )2 (𝑛−2)
= √8184.23∗10 = 0.095.
Далее вычисляем значения t – критерия Стьюдента:
𝑡=
𝑏
0.561
=
= 5.92
𝑚𝑏 0.095
Фактическое значение t – критерии превосходит табличное значение на
5 %-м уровне значимости при числе степеней свободы𝑛 − 2 = 10 𝑡табл = 2,228
Поэтому гипотеза Н0 отклоняется, т.е. b отличается от нуля не
случайно икоэффициент регрессии является статистически значимым.
6
6.
Постройте
доверительный
интервал
для
коэффициента
регрессии.
Рассчитаем доверительный интервал для коэффициента регрессии, для
чего определим предельную ошибку для параметра b.
∆𝑏 = 𝑡табл 𝑚𝑏 = 2.228 ∗ 0.095 = 0.211
Доверительные интервалы: 𝛾𝑏 = 𝑏 ± ∆𝑏 = 0.561 ± 0.211, т.е.
0.350 ≤ 𝑏 ≤ 0.771
Анализ верхней и нижней границ доверительного интервала приводит
к выводу о том, что с вероятностью 95% коэффициент регрессии, находясь в
указанных границах, не принимает нулевых значение, т.е. не является
статистически незначимым и существенно отличен от нуля.
7.
Составить таблицу дисперсионного анализа.
Результаты дисперсионного анализа приведены в таблице 2.
Таблица 2 – Таблица дисперсионного анализа
Вариация
результата
Число
степеней
свободы
Общая
Факторная
Остаточная
8.
Оцените
11
1
10
с
Сумма
квадратов
отклонений
Дисперсия
на одну
степень
свободы
3304,9
2571,38
733,52
помощью
F - критерий
факт
35,055
табл
4,96
2571,38
27,08
F
–
критерия
Фишера-Снедекора
значимость уравнения линейной регрессии.
В силу того, что 𝐹факт = 35,05 > 𝐹табл = 4,96, гипотеза о случайности
различий факторной и остаточной дисперсий отклоняется. Эти различия
существенны,статистически
значимы,
уравнение
значимо,
показатель
тесноты связи надежени отражает устойчивую зависимость темпа прироста
выпуска продукции от темпа прироста затрат электроэнергии.
9.
Рассчитайте,
каковы
будут
темпы
прироста
выпуская
продукции, если темп прироста затрат электроэнергии составит 39 %.
7
Полученные оценки уравнения регрессии позволяют использовать его
для прогноза. Если примем прогнозное значение темпа прироста затрат
электроэнергии
х=38, то точечный прогноз темпа прироста выпуска
продукции составит:𝑦 𝑝 = 46.37 + 0.561 ∗ 39 = 68,24 %
Чтобы получить интервальный прогноз, найдем стандартную ошибку
предсказываемого значения расходов 𝑚𝑝 :
(𝑥 𝑝 −𝑥̅ )
1
𝑚𝑝 = 𝑆√1 + + ∑(𝑥−𝑥̅ )2,
𝑛
Где𝑆 = √
∑(𝑦−𝑦̃)2
𝑛−2
- стандартная ошибка регрессии.
𝑆=√
𝑚𝑝 = 8.564√1 +
733.52
= 8.564
10
1 (39 − 39.3)2
+
= 0.103
13
8184.23
Предельная ошибка прогнозируемого расхода составит:
∆𝑦𝑝 = 𝑡табл 𝑚𝑝 = 2.228 ∗ 0.103 = 0.231
Доверительный интервал прогнозируемого расхода составит:
𝑦𝑝 = 68.24 ± 0.231
Т.е. при темпе прироста затрат электроэнергии 39 %, темп прироста
выпуска продукции не меньше чем 68,009 % и не больше чем 68,47 %.
10. Рассчитайте средний коэффициент эластичности.
Средний
коэффициент
эластичности
для
линейной
регрессии
рассчитывается по формуле:
Э=𝑏
𝑥̅
39,33
= 0,561
= 0,322
𝑦̅
68,43
Таким образом, получаем, что с ростомтемпа прироста затрат
электроэнергии на 1 %, темп прироста выпуска продукции увеличивается на
0,322 %.
11. Определить среднюю ошибку аппроксимации.
8
Средняя
ошибка
аппроксимации
находится
как
средняя
арифметическая простая из индивидуальных ошибок:
1
𝑦−𝑦̃
141.16
𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 11.76 %
Так как средняя ошибка аппроксимации меньше 10-13%, что говорит о
высокой точности модели.
Задание 2. Нелинейная регрессия
1. Рассчитать параметры следующих функций:
- степенной;
- равносторонней гиперболы;
- показательной.
2. Найти показатели тесноты связи по каждой модели.
3. Оценить каждую модель через показатель детерминации, F –
критерий Фишера, ошибку аппроксимации и выбрать наилучшую из них.
Регрессия в виде степенной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑥 𝑏
Для
оценки
параметров
модели
линеаризуем
модель
путем
логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑏 𝑙𝑛 𝑥
Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑥 = 𝑋 . Тогда получим: 𝑌 = 𝐴 + 𝑏𝑋
Для расчетов составим таблицу 3.
Таблица 3 - Расчетные данные для степенной функции
Номер
предприятия
X
Y
XY
X^2
Y^2
Y͂
y͂
(y-y͂)^2
|(y-y͂)/y|*100
1
2
3
4
5
6
7
8
9
10
11
1,856
2,510
2,603
2,981
2,996
3,300
3,750
3,784
4,041
4,197
4,289
3,456
3,976
3,833
4,185
4,148
4,251
4,319
4,335
4,421
4,421
4,444
6,416
9,978
9,976
12,474
12,426
14,027
16,193
16,403
17,868
18,557
19,060
3,446
6,298
6,774
8,884
8,974
10,887
14,059
14,320
16,332
17,617
18,396
11,946
15,808
14,692
17,515
17,205
18,074
18,652
18,789
19,547
19,547
19,748
3,653
3,880
3,912
4,043
4,048
4,154
4,310
4,322
4,411
4,465
4,497
38,603
48,415
50,003
57,003
57,302
63,666
74,414
75,314
82,334
86,907
89,720
47,657
23,861
14,463
75,645
35,976
42,693
0,471
0,973
0,749
13,740
21,341
21,777
9,165
8,232
13,238
9,475
9,308
0,914
1,293
1,040
4,455
5,428
9
12
Сумма
4,502
40,808
4,475
50,264
20,147
173,526
20,268
146,255
20,026
211,550
Среднее
значение
3,401
4,189
14,460
12,188
17,629
Запишем
систему
{
4,571
50,264
96,593
820,273
77,318
354,887
нормальных
10,015
94,341
уравнений:
50.264 = 12𝐴 + 40.808𝑏
173.526 = 40.808𝐴 + 146.255𝑏
Отсюда ∆= 89.789, ∆𝐴 = 270.251, 𝐴 = 3.009 ∆𝑏 = 31.126, 𝑏 = 0.347.
Получаем уравнение регрессии: 𝑙𝑛𝑦 = 3.009 + 0.347𝑙𝑛𝑥
Выполнив потенцирование, получим:𝑦̃𝑥 = 𝑒 3.009 ∙ 𝑥 0.347 = 20.28 ∙ 𝑥 0.347
Параметр 𝑏 = 0.347 означает коэффициент эластичности, который
показывает, что с ростом темпа прироста затрат электроэнергии на 1 %, темп
прироста выпуска продукции увеличивается на 0,347 %.
Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив
в уравнение𝑙𝑛𝑦 = 3.009 + 0.347𝑙𝑛𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 .
В таблице 3представлены𝑙𝑛𝑦̃𝑥 = 𝑌̃𝑥 и 𝑦̃𝑥 .
Показателем тесноты связи выступает индекс корреляции:
𝑅 = √1 −
∑(𝑦 − 𝑦̃)2
∑(𝑦 − 𝑦̅)2
Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 1
В результате имеем:
∑(𝑦−𝑦̃)2
𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,892 = 0,945
Коэффициент
детерминации
составит:
2
𝑅𝑦𝑥
= 0.9452 = 0.892,
т.е.вариация у на 89.2% объясняется вариацией х. На долю прочих факторов,
неучитываемых в регрессии, приходится 10.8 %.
F – критерий Фишера составит:
𝐹=
𝑅2
0.892
(𝑛 − 2) =
(12 − 2) = 83.12
2
1−𝑅
1 − 0.89
Эта величина превышает табличное значение на 5 %-м уровне
значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии𝑦̃𝑥 =
20.28 ∙ 𝑥 0.347 статистически значимо.
10
Для расчета средней ошибки аппроксимации воспользуемся последней
графой таблицы 3.
1
𝑦−𝑦̃
94.341
𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 7.86т.е. среднее отклонение фактических и
расчетных значений у составляет 7.86 %, что свидетельствует о хорошем
качестве модели.
Регрессия в виде показательной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑏 𝑥
Для
оценки
параметров
модели
линеаризуем
модель
путем
логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑥 𝑙𝑛 𝑏
Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑏 = 𝐵 . Тогда получим: 𝑌 = 𝐴 + 𝑥𝐵
Для расчетов составим таблицу 4.
Таблица 4 - Расчетные данные для показательной функции
Номер
предприятия
x
1
2
3
4
5
6
7
8
9
10
11
12
Сумма
6,4
12,3
13,5
19,7
20
27,1
42,5
44
56,9
66,5
72,9
90,2
472
Среднее
значение
39,33333
Y
xY
x^2
Y͂
y͂
3,456
22,120
40,960
3,892 49,000
3,976
48,904
151,290
3,945 51,676
3,833
51,745
182,250
3,956 52,238
4,185
82,446
388,090
4,012 55,241
4,148
82,958
400,000
4,014 55,391
4,251 115,212
734,410
4,078 59,052
4,319 183,550 1806,250 4,217 67,847
4,335 190,726 1936,000 4,231 68,770
4,421 251,569 3237,610 4,347 77,251
4,421 294,013 4422,250 4,434 84,235
4,444 323,955 5314,410 4,491 89,238
4,475 403,651 8136,040 4,647 104,299
50,264 2050,848 26749,560 50,264 814,239
4,189
Запишем
170,904
y-y͂
-17,300
1,624
-6,038
10,459
7,909
11,148
7,253
7,530
5,949
-1,035
-4,138
-16,499
6,861
(y-y͂)^2
(y-y
ср)^2
299,275 1348,726
2,636
228,766
36,462
493,951
109,385
7,426
62,554
26,266
124,275
3,151
52,610
44,556
56,695
62,016
35,385
218,301
1,071
218,301
17,121
278,056
272,222 375,391
1069,693 3304,903
|(yy͂)/y|*100
54,573
3,046
13,070
15,919
12,495
15,880
9,658
9,868
7,150
1,244
4,862
18,792
166,557
2229,130
систему
{
нормальных
уравнений:
50.264 = 12𝐴 + 472𝐵
2050.84 = 472𝐴 + 26749.56𝐵
В результате:𝑙𝑛𝑎 = 3.834 𝑙𝑛𝑏 = 0.009.
Получаем
уравнение
регрессии:
𝑙𝑛𝑦 = 3.834 + 0.009𝑥.Теперь
потенцируем оба параметра, чтобы получить уравнение регрессии в
формепоказательной кривой:
11
𝑎 = 𝑒 3.834; 𝑏 = 𝑒 0.009 ; 𝑎 = 46.25; 𝑏 = 1.009
𝑦̃𝑥 = 46.25 ∙ 1.009𝑥
Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив
в уравнение𝑙𝑛𝑦 = 3.834 + 0.009𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 .
Показателем тесноты связи выступает индекс корреляции:
𝑅 = √1 −
∑(𝑦 − 𝑦̃)2
∑(𝑦 − 𝑦̅)2
Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 4
В результате имеем:
∑(𝑦−𝑦̃)2
𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,676 = 0,882
Коэффициент
детерминации
составит:
2
𝑅𝑦𝑥
= 0.8822 = 0.676,
т.е.вариация у на 67.6% объясняется вариацией х. На долю прочих факторов,
неучитываемых в регрессии, приходится32.4 %.
F – критерий Фишера составит:
𝐹=
𝑅2
0.676
(𝑛
(12 − 2) = 20.89
−
2)
=
1 − 𝑅2
1 − 0.676
Эта величина превышает табличное значение на 5 %-м уровне
значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии
𝑦̃𝑥 = 46.25 ∙ 1.009𝑥 статистически значимо.
Для расчета средней ошибки аппроксимации воспользуемся последней
графой таблицы 3.
1
𝑦−𝑦̃
𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 13.87т.е.
среднее
отклонение
фактических
и
расчетных значений у составляет13.87 %, что свидетельствует о хорошем
качестве модели.
𝑏
Регрессия в виде равносторонней гиперболы имеет вид:𝑦̃𝑥 = 𝑎 + 𝑥
Чтобы оценить параметры уравнения приведем модель к линейному
1
виду,заменив = 𝑧. Тогда 𝑦̃ = 𝑎 + 𝑏𝑧. Применяя МНК, получаем систему
𝑥
нормальных уравнений:
12
∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑧
{
∑ 𝑦𝑧 = 𝑎 ∑ 𝑧 + 𝑏 ∑ 𝑧 2
Для расчета параметров составим таблицу 5.
Таблица 5 - Расчетные данные для равносторонней гиперболы
Номер
предприятия
x
y
1/x=z
yz
z^2
y͂
y-y͂
(y-y͂)^2
1
2
3
4
5
6
7
8
9
10
11
12
Сумма
6,4
12,3
13,5
19,7
20
27,1
42,5
44
56,9
66,5
72,9
90,2
472
31,7
53,3
46,2
65,7
63,3
70,2
75,1
76,3
83,2
83,2
85,1
87,8
821,1
0,156
0,081
0,074
0,051
0,050
0,037
0,024
0,023
0,018
0,015
0,014
0,011
0,553
4,953
4,333
3,422
3,335
3,165
2,590
1,767
1,734
1,462
1,251
1,167
0,973
30,154
0,024
0,007
0,005
0,003
0,003
0,001
0,001
0,001
0,000
0,000
0,000
0,000
0,045
24,767
54,468
57,332
66,570
66,872
72,063
77,361
77,679
79,721
80,726
81,250
82,292
821,100
6,933
-1,168
-11,132
-0,870
-3,572
-1,863
-2,261
-1,379
3,479
2,474
3,850
5,508
0,000
48,068
1,364
123,911
0,757
12,756
3,470
5,114
1,902
12,103
6,118
14,826
30,336
260,723
Среднее
значение
39,33
68,43
0,05
2,51
0,00
Запишем систему нормальных уравнений:
{
821,1 = 12𝑎 + 0.0053𝑏
30.154 = 0.553𝑎 + 0.045𝑏
Отсюда ∆= 0.232, ∆𝐴 = 20.164, 𝐴 = 86.68 ∆𝑏 = −92.183, 𝑏 = −396.27.
Получаем уравнение регрессии:𝑦̃𝑥 = 86.68 −
369.27
𝑥
Показателем тесноты связи выступает индекс корреляции:
𝑅 = √1 −
∑(𝑦 − 𝑦̃)2
∑(𝑦 − 𝑦̅)2
Величина ∑(𝑦 − 𝑦̅)2 = 3304.9 представлена в таблице 4
В результате имеем:
∑(𝑦−𝑦̃)2
𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,921 = 0,959
13
|(y-y͂)/y|*100
21,871
2,191
24,094
1,324
5,642
2,653
3,011
1,808
4,181
2,973
4,525
6,273
80,546
Коэффициент
детерминации
составит:
2
𝑅𝑦𝑥
= 0.9592 = 0.921,
т.е.вариация у на 92.1% объясняется вариацией х. На долю прочих факторов,
неучитываемых в регрессии, приходится 7.9 %.
F – критерий Фишера составит:
𝐹=
𝑅2
0.921
(𝑛 − 2) =
(12 − 2) = 228.8
2
1−𝑅
1 − 0.921
Эта величина превышает табличное значение на 5 %-м уровне
значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии
𝑦̃𝑥 = 86.68 −
369.27
𝑥
статистически значимо.
Для расчета средней ошибки аппроксимации воспользуемся последней
графой таблицы 3.
1
𝑦−𝑦̃
𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 6.71т.е.
среднее
отклонение
фактических
и
расчетных значений у составляет 6.71 %, что свидетельствует о хорошем
качестве модели.
Выберем наилучшую модель, для чего объединим результаты
построения парных регрессий в одну таблицу.
Таблица 6 - Сводная таблица построенных уравнений
Функции
Степенная
Показательная
Равносторонняя
гипербола
Коэффициент
детерминации
0,892
0,676
F- критерий
Фишера
83,1
20,89
Средняя ошибка
аппроксимации
7,86
13,87
0,921
228,8
6,71
Все уравнения регрессии достаточно хорошо описывают исходные
данные. Некоторое предпочтение можно отдать равносторонней гиперболе,
длякоторой значение коэффициента детерминации наибольшее, а ошибка
аппроксимации – наименьшая.
14
Задание 3. Множественная линейная регрессия
В процессе изучения зависимости прибыли (тыс. руб.) у от выработки
продукции на одного работника (ед.) х1 и индекса цен на продукцию (%)
х2получены данные по 30 предприятиям.
Признак
Среднее
Парный
Среднее
квадратическое коэффициент
значение
отклонение
корреляции
y
x1
x2
250
47
112
38 ryx1=0,68
12 ryx2=0,63
21 rx1x2=0,42
Построить уравнение множественной линейной регрессии
1.
стандартизованном масштабе и в естественной форме.
Линейное уравнение множественной регрессии у от х1 и х2 имеет вид:
𝑦̃𝑥 = 𝑎 + 𝑏1 𝑥1 + 𝑏2 𝑥2
Для расчета его параметров применим метод стандартизации
переменны и построим искомое уравнение в стандартизованном масштабе:
𝑡𝑦 = 𝛽1 𝑡𝑥1 + 𝛽2 𝑡𝑥2
Расчет β – коэффициентов выполним по формулам
𝛽1 =
𝑟𝑦𝑥1 − 𝑟𝑦𝑥2 𝑟𝑥1𝑥2 0.68 − 0.63 ∙ 0.42
=
= 0.504
1 − 𝑟𝑥1𝑥2 2
1 − 0.42
𝛽2 =
𝑟𝑦𝑥2 − 𝑟𝑦𝑥1 𝑟𝑥1𝑥2 0.63 − 0.68 ∙ 0.42
=
= 0.418
1 − 𝑟𝑥1𝑥2 2
1 − 0.42
Получим уравнение 𝑡𝑦 = 0.504𝑡𝑥1 + 0.418𝑡𝑥2
Для
построения
уравнения
в
естественной
рассчитаем𝑏1 и 𝑏2 используя формулы для перехода от𝛽𝑖 к 𝑏𝑖
𝛽1 = 𝑏𝑖
𝑏1 = 0.504
38
12
𝜎𝑥
𝜎𝑦
; 𝑏1 = 𝛽𝑖
𝜎𝑦
𝜎𝑥
= 1.59; 𝑏2 = 0.418
38
21
= 0.757
Значение a определим из соотношения
𝑎 = 𝑦̅ − 𝑏1 𝑥̅1 − 𝑏2 𝑥̅2 = 250 − 1.59 ∙ 47 − 0.757 ∙ 112 = 90.18
𝑦̃𝑥 = 90.18 + 1.59𝑥1 + 0.757𝑥2
15
форме
Рассчитайте частные коэффициенты эластичности.
2.
Рассчитаем средние коэффициенты эластичности для определения
относительной силы влияния х1 и х2 на у:
Э𝑦𝑥𝑗 = 𝑏𝑗 ∙
𝑥̅𝑗
𝑦̅
47
112
= 0.3Э𝑦𝑥2 = 0.757 ∙
= 0.339
250
250
С увеличением выработки продукции на одного работника х1 на 1% от
Э𝑦𝑥1 = 1.59 ∙
ее среднего уровня прибыль у возрастет на 0,3 % от своего среднего уровня;
при увеличениих2 на 1 % прибыль уувеличивается на 0,339 % от своего
среднего уровня. Очевидно, что сила влияния индекса цен на продукциюх2
на прибыль у оказалась большей, чем сила влияния выработки продукции на
одного работника х1. К аналогичным выводам о силе связи приходим при
сравнении модулей значений β1 и β2.
3.
Рассчитать линейные коэффициенты частной корреляции и
коэффициент множественной корреляции.
Линейные коэффициенты частной корреляции здесь рассчитываются
по рекуррентной формуле:
𝑟𝑦𝑥1=
𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2
0.68−0.63∙0.42
=
=0.589
2
2
√(1−𝑟𝑦𝑥 )(1−𝑟𝑥 𝑥 ) √(1−0.632 )(1−0.422 )
2
1 2
𝑥2
𝑟𝑦𝑥2=
𝑥1
𝑟𝑦𝑥2 −𝑟𝑦𝑥1 𝑟𝑥1 𝑥2
0.63−0.68∙0.42
=
=0.515
2
2
2
√(1−𝑟2
𝑦𝑥1 )(1−𝑟𝑥1 𝑥2 ) √(1−0.68 )(1−0.42 )
При сравнении значений коэффициентов парной и частной корреляции
приходим к выводу, что из-за слабой межфакторной связи коэффициенты
парной и частной корреляции отличаются незначительно: выводы о тесноте и
направлении связи на основе коэффициентов парной и частной корреляции
совпадают:
𝑟𝑦𝑥1 = 0.684,𝑟𝑦𝑥2 = 0.63,
𝑟𝑥1𝑥2 = 0.42
𝑟𝑦𝑥1 = 0.589,𝑟𝑦𝑥2 = 0.518, 𝑟𝑥1𝑥2 = 0.594
𝑥2
𝑥1
𝑦
16
Расчет линейного коэффициента множественной корреляции выполним
с использованием коэффициентов и
𝑅𝑦𝑥1𝑥2 = √𝑟𝑦𝑥1 ∙ 𝛽1 + 𝑟𝑦𝑥2 ∙ 𝛽2 = √0.68 ∙ 0.504 + 0.63 ∙ 0.418 = 0.778
Зависимость у от х1 и х2 характеризуется как тесная, в которой 77.8%
вариации прибыли определяются вариацией учтенных в модели факторов:
выработки продукции на одного работника и индекса цен на продукцию.
Прочие факторы, не включенные в модель, составляют соответственно 22.2%
отобщей вариации у.
4.
Оцените значимость уравнения регрессии в целом с помощью F –
критерия Фишера.
Общий F – критерий проверяет гипотезу Н0 о статистической
значимости уравнения регрессии и показателя тесноты связи (R2=0):
𝐹=
𝑅𝑦𝑥1𝑥2
𝑚−1
0.778
27
÷
=
∙
= 77.5
1 − 𝑅𝑦𝑥1𝑥2 𝑛 − 𝑚 1 − 0.778 2
𝐹табл = 3.35
Эта величина превышает табличное значение на 5 %-м уровне
значимости𝐹табл = 3.35.Делаем выводо статистической значимости уравнения
в целом и показателя тесноты связи, которые сформировались под
неслучайным
воздействием
факторов
17
х1
и
х2.
.
Список литературы
1.
Гладилин, А. В. Практикум по эконометрике / А.В. Гладилин,
А.Н. Герасимов, Е.И. Громов. - М.: Феникс, 2016. - 336 c.
2.
Дайитбегов, Д. М. Компьютерные технологии анализа данных в
эконометрике / Д.М. Дайитбегов. - Москва: ИЛ, 2015. - 592 c.
3.
Колемаев, В. А. Эконометрика / В.А. Колемаев. - М.: ИНФРА-
М, 2016. - 160 c.
4.
Кочетыгов, А. А. Основы эконометрики / А.А. Кочетыгов, Л.А.
Толоконников. - М.: Издательский центр "МарТ", 2015. - 352 c.
5.
Кремер, Н. Ш. Математика для экономистов. От Арифметики до
Эконометрики. Учебно-справочное пособие / Н.Ш. Кремер, Б.А. Путко, И.М.
Тришин. - М.: Юрайт, 2017. - 724 c.
6.
Математика для экономистов. От Арифметики до Эконометрики
/ Н.Ш. Кремер и др. - М.: Юрайт, 2017. - 688 c.
7.
Математика для экономистов. От Арифметики до Эконометрики.
- Москва: Мир, 2017. - 648 c.
8.
Новак, Эдвард Введение в методы эконометрики. Сборник задач
/ Эдвард Новак. - М.: Финансы и статистика, 2016. - 248 c
9.
(+
Плохотников, К. Э. Основы эконометрики в пакете STATISTICA
CD-ROM)
/
К.Э.
Плохотников.
18
-
Москва: ИЛ, 2015.
-
304
c.
Download