Загрузил Ольга Яковская

3041919

реклама
Вариант 9
Задача 1
По 10 однотипным предприятиям имеются данные о реализованной продукции (х, тыс.
руб.) и накладных расходах по реализации этой продукции (у, тыс. руб.):
x
y
11,0 12,0 15,4 17,5
0,462 0,506 0,765 0,804
18,8
0,872
20,8
0,939
23,4
0,998
26,1
1,002
29,0
1,108
35,6
1,368
1) Найти линейный коэффициент корреляции. Сделать вывод.
2) Найти коэффициент детерминации. Сделать вывод.
3) Найти МНК-оценки параметров уравнения парной линейной регрессии вида
y   0  1 x   . Пояснить экономический смысл полученных результатов.
4) Проверить значимость коэффициента детерминации при уровне значимости
0,05. Сделать вывод.
5) Проверить значимость оценок параметров уравнения регрессии при уровне
значимости 0,05. Сделать вывод.
6) Найти предсказание для x  23,4 при доверительной вероятности 0,95 и
определить остаток e7 . Сделать вывод.
7) Найти доверительные интервалы для условного среднего
M [Y / x ]
и
индивидуального значения зависимой переменной y x для x  9,0 . Сделать вывод.
2
Решение
В
соответствии с требованием использовать пакеты вычислительных и
статистических программ выбираем MS Excel.
Проводим регрессионный анализ. Выбираем «Данные»  «Анализ данных» 
«Регрессия»:
Рис. 1. Построение регрессионной модели
Получаем:
Рис. 2. Результаты регрессионного анализа
3
1) Найти линейный коэффициент корреляции. Сделать вывод
Данные о накладных расходах по реализации
этой продукции (у, тыс. руб.)
Строим поле корреляции:
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
0
5
10
15
20
25
30
35
40
Данные реализованной продукции (х, тыс. руб.)
Рис. 3. Поле корреляции
По графическому представлению данных можно утверждать, что между факторной
и результативной переменными существует прямая зависимость.
Из результатов регрессионного анализа видно, что значение коэффициента
корреляции rxy  0,9746 .
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии
оцениваются по шкале Чеддока:
0,1  rxy  0,3
0,3  rxy  0,5
0,5  rxy  0, 7
0, 7  rxy  0,9
0,9  rxy  1
Слабая
Умеренная
Заметная
Высокая
весьма высокая
В нашем случае связь между объемом реализованной продукции и накладными
расходами весьма высокая и прямая.
2) Найти коэффициент детерминации. Сделать вывод.
Коэффициент детерминации равен R 2  0,97462  0,9499
В 94,99% случаев изменения объема реализованной продукции приводят к
изменению накладных расходов. Другими словами – точность подбора уравнения
регрессии – высокая. Остальные 5,01% изменения накладных расходов объясняются
факторами, не учтенными в модели (а также ошибками спецификации).
4
3) Найти МНК-оценки параметров уравнения парной линейной регрессии
вида y   0  1 x   . Пояснить экономический смысл полученных результатов.
Из результатов регрессионного анализа значения коэффициентов модели будут
равны:
у
х
0,169323051
0,034020847
Тогда уравнение регрессии будет иметь вид: уˆ  0,1693  0, 034 х
4)
Проверить
значимость
коэффициента
детерминации
при
уровне
значимости 0,05. Сделать вывод.
Значимость коэффициента детерминации проверим при помощи критерия Фишера.
Fнабл 
R2
n  m 1
0,9499 10  1  1



 151,6851
2
1 R
m
1  0,9499
1
Табличное значение критерия со степенями свободы k1  1 и k2  8 , находим с
помощью статистической функции MS Excel F.ОБР.ПХ(0,05;1;8): Fтабл  5,3177 .
Поскольку фактическое значение Fнабл  Fтабл , то коэффициент детерминации
статистически значим (найденная оценка уравнения регрессии статистически надежна).
5) Проверить значимость оценок параметров уравнения регрессии при уровне
значимости 0,05. Сделать вывод.
Проверяем значимость при помощи t-статистик, значения которых берем из
результатов регрессионного анализа:
0
1
Коэффициенты
0,169323051
0,034020847
t-статистика
2,760244699
12,31604936
Критическое значение tкрит при уровне значимости 0,05 и числе степеней свободы
k n–2
находим
с
помощью
статистической
функции
MS
Excel
СТЬЮДЕНТ.ОБР.2Х(0,05;8): tкрит  2,306
Проверяем значимость коэффициента 0 – поскольку 2, 76024  2,306 , то его
статистическая значимость подтверждается.
Проверяем значимость коэффициента 1 – поскольку 12,32  2,306 , то его
статистическая значимость подтверждается.
5
6) Найти предсказание для x  23,4 при доверительной вероятности 0,95 и
определить остаток e7 . Сделать вывод.
Находим предсказанное значение для x7  23, 4 по полученному уравнению
регрессии:
уˆ7  0,034  23, 4  0,1693  0,9649 .
Отсюда
остаток
будет
равен
е7  0,998  0,9649  0,0331 . Значение остатка существенно мало. Это говорит о
небольшом расхождении предсказанного значения накладных расходов от фактического.
7) Найти доверительные интервалы для условного среднего M [Y / x ] и
индивидуального значения зависимой переменной y x для x  9,0 . Сделать вывод.
Находим значение y x для x  9,0 : y*х  0, 034  9  0,169  0, 476
Найдем предельную ошибку для условного математического ожидания:
1  х  хр 
1  20,96  9 
 р  tкрит   

 2,306  0, 0641

 0, 2116
2
п
n  ˆ x
10 10  7,3376
2
2
Значение   0, 0641 находим из результата регрессионного анализа (Стандартная
ошибка).
Значение ˆ х2  53,8404 находим с помощью статистической функции MS Excel
ДИСП.Г.
Тогда доверительный интервал для среднего значения на уровне значимости α=0,05
будет иметь вид:
 0, 476  0, 2116;0, 476  0, 2116 или  0, 2644;0,6876
Таким образом, накладные расходы при объеме реализованной продукции 9 тыс.
руб. с вероятностью 0,95 будет находиться в интервале (0,2644; 0,6876) тыс. руб.
Находим
доверительный
интервал
индивидуального
значения
зависимой
переменной y x для x  9,0
Рассчитаем границы интервала, в котором будет сосредоточено не менее 95%
накладных расходов при объеме реализованной продукции x p  9 тыс. руб., т.е.
доверительный интервал для индивидуального значения y*х  0, 476 . Найдем предельную
ошибку для индивидуального значения:
2
х  хр 

1
1  20,96  9 
  tкрит    1  
 2,306  0, 0641 1  
 0,1727
п   xi  x 2
10
538, 404
2
6
Тогда интервал, в котором будут находиться, по крайней мере, 95% накладных
расходов при объеме реализованной продукции x p  9 тыс. руб., имеет вид:
 0, 476  0,1727;0, 476  0,1727  или  0,3033;0,6487 
Задача 2.
В табл. представлены результаты наблюдений за x1 , x2 и y :
x1 3101 3543 3237 3330 3808 2415 3295 3504 3056 3007 2844 2861
x 2 68 77,2 77,2 77,2 75,7 62,6 78 78,2 79 67,6 69,8 68,4
y 0,763 0,923 0,918 0,906 0,905 0,545 0,894 0,9 0,932 0,74 0,701 0,744
1) Найти МНК-оценки параметров уравнения множественной линейной
регрессии вида y   0  1 x1   2 x2   . Пояснить смысл полученных результатов.
Используем матричный метод.
Записываем значения факторных и результативных показателей в виде матриц Х и
Y:
Матрицу Х транспонируем:
7
Находим необходимые матрицы:
Значения коэффициентов регрессии находим по формуле: i   X T X    X TY  :
1
Проверим полученные результаты при помощи надстройки «Пакет анализа».
Выбираем «Данные»  «Анализ данных»  «Регрессия»:
Рис. 4. Построение множественной регрессионной модели
8
Получаем:
Рис. 5. Результаты регрессионного анализа
Уравнение регрессии имеет вид: у  0,6699  0,0000879 х1  0,0166 х2
Увеличение х1 на 1 ед. изм. приводит к увеличению у в среднем на 0,000879 ед.
изм.; увеличение х2 на 1 ед. изм. приводит к увеличению у в среднем на 0,0166 ед. изм.
2) Проверить значимость оценок параметров уравнения регрессии при уровне
значимости 0,05. Сделать выводы.
Проверяем значимость при помощи t-статистик, значения которых берем из
результатов регрессионного анализа:
0
1
2
Коэффициенты
-0,669886121
8,78644E-05
0,016578335
t-статистика
-5,571371281
2,335606083
6,604448132
Критическое значение tкрит при уровне значимости 0,05 и числе степеней свободы
k  n – т 1
находим
с
помощью
статистической
функции
MS
Excel
СТЬЮДЕНТ.ОБР.2Х(0,05;8): tкрит  2, 2622
Проверяем значимость коэффициента 0 – поскольку 5,57137  2, 2622 , то его
статистическая значимость подтверждается.
Проверяем значимость коэффициента 1 – поскольку 2,33561  2, 2622 , то его
статистическая значимость подтверждается.
Проверяем значимость коэффициента 2 – поскольку 6, 60445  2, 2622 , то его
статистическая значимость подтверждается.
9
3) Найти доверительные интервалы для параметров уравнения регрессии при
доверительной вероятности 0,95. Пояснить смысл полученных результатов.
Доверительные интервалы коэффициентов регрессии, которые с надежность 95%
будут следующими:

 tкрит    i ; i  tкрит    i 
i
Значения  i находим из таблицы регрессионного анализа:
Стандартная ошибка

0
0,120237207

1
3,76195E-05

2
0,002510177
Доверительный интервал для коэффициента  0 :
 0,6699  2, 2622  0,12024; 0,6699  2, 2622  0,12024 или  0,9419; 0,3979
Доверительный интервал для коэффициента 1 :
 0,0000879  2, 2622  0,0000376;0,0000879  2, 2622  0,0000376 или
 0,00000284;0,000173
Доверительный интервал для коэффициента  2 :
 0,0166  2, 2622  0,00251;0,0166  2, 262  0,00251 или  0,0109;0,0223
С вероятностью 95% можно утверждать, что значения данных параметров  i
будут лежать в найденных интервалах.
4) Найти коэффициент детерминации. Сделать вывод.
Коэффициент детерминации находим из результатов регрессионного анализа
R2  0,9516 . Следовательно, в исследуемой ситуации 95,16% общей вариабельности у
объясняется изменением факторов х j .
5) Проверить значимость уравнения регрессии (коэффициента детерминации)
при уровне значимости 0,05. Сделать вывод.
Значимость коэффициента детерминации проверим при помощи критерия Фишера.
Fнабл
R2
n  m 1
0,9516 12  2  1




 88, 43138
2
1 R
m
1  0,9516
2
10
Табличное значение критерия со степенями свободы k1  2 и k2  12  2  1  9 ,
находим
с
помощью
статистической
функции
MS
Excel
F.ОБР.ПХ(0,05;2;9):
Fтабл  4, 2565 .
Поскольку фактическое значение Fнабл  Fтабл , то коэффициент детерминации
статистически значим (найденная оценка уравнения регрессии статистически надежна).
6) Проверить наличие гомоскедастичности при уровне значимости 0,05 (с
помощью теста ранговой корреляции Спирмена). Сделать вывод.
Для определения гетероскедастичности используем тест ранговой корреляции
Спирмена. При использовании данного теста предполагается, что дисперсия отклонений
будет либо увеличиваться, либо уменьшаться с увеличением значений х. Поэтому для
регрессии, построенной по МНК, абсолютные величины отклонений ei и значения xi
будут коррелированы. Определим коэффициент ранговой корреляции по формуле:
di2

rx, e  1  6 
nn 2  1 ,
где
d i – разность между рангами xi и ei , n – число наблюдений.
Находим остатки из результатов регрессионного анализа, а ранги с помощью
формулы РАНГ().
Таблица 1
Исходные данные для определения наличия гетероскедастичности
х1
х2
Остатки
(e)
Ранг х1
Ранг х2
Ранг е
(Рх1-Ре)2
(Рх2-Ре)2
3101
3543
3237
3330
3808
2415
3295
3504
3056
3007
2844
2861
68
77,2
77,2
77,2
75,7
62,6
78
78,2
79
67,6
69,8
68,4
0,033092
0,001735
0,023622
0,00345
-0,01468
-0,03511
-0,01874
-0,03442
0,023684
0,024982
-0,03617
0,028548
6
11
7
9
12
1
8
10
5
4
2
3
3
7
7
7
6
1
10
11
12
2
5
4
12
6
8
7
5
2
4
3
9
10
1
11
Сумма
36
25
1
4
49
1
16
49
16
36
1
64
298
81
1
1
0
1
1
36
64
9
64
16
49
323
11
Определим коэффициент ранговой корреляции по формуле:
di2

rx, e  1  6 
nn 2  1 ,
где
di - разность между рангами xi и |ei|, n – число наблюдений.
И далее найдем tнабл по формуле:
t
rx, e n  2
1  rx2, e
Результаты представим в таблице:
Таблица 2
tнабл
-0,041958042
-0,132799926
-0,129370629
-0,412572987
tкрит (0, 05;10)
2,2281
2,2281
r
Имеем распределение Стьюдента с числом степеней свободы
 n  2 ,
=0,05.
tкрит  0,05;10  2, 2281 , tнабл для x1  0,1328 , для x2  0, 4126 .
Результаты показывают, что как для x1 , так и для x2 tнабл  tкрит , следовательно,
гипотеза об отсутствии гетероскедастичности принимается.
7) Проверить наличие автокорреляции при уровне значимости 0,05 (с
помощью теста Дарбина-Уотсона). Сделать вывод.
Наблюдение
1
2
3
4
5
6
7
8
9
10
11
12
Сумма
Предсказанное у
0,729908145
0,921264889
0,894378382
0,902549772
0,919681454
0,580110158
0,912737185
0,934416512
0,908315927
0,715017557
0,737167996
0,715452022
Остатки
0,033091855
0,001735111
0,023621618
0,003450228
-0,014681454
-0,035110158
-0,018737185
-0,034416512
0,023684073
0,024982443
-0,036167996
0,028547978
e2
0,001095
3,01E-06
0,000558
1,19E-05
0,000216
0,001233
0,000351
0,001184
0,000561
0,000624
0,001308
0,000815
0,00796
(ei-ei-1)2
0,000983
0,000479
0,000407
0,000329
0,000417
0,000268
0,000246
0,003376
1,69E-06
0,003739
0,004188
0,014434
12
Для анализа коррелированности отклонений используют статистику ДарбинаУотсона:
 e  e 
DW 
e
i 1
i
2
i
2

0, 014434
 1,813327
0, 00796
Критические значения d1 и d2 определяются на основе специальных таблиц для
требуемого уровня значимости α, числа наблюдений n = 12 и количества объясняющих
переменных m=2.
Автокорреляция отсутствует, если выполняется следующее условие: d1  DW и
d2  DW  4  d 2 .
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что
автокорреляция остатков отсутствует, если 1,5  DW  2,5 .
Поскольку 1,5  1,813327  2,5 , то автокорреляция остатков отсутствует.
13
Список использованных источников
1. Ежова Л.Н. Основы эконометрики. Учебное пособие. Иркутск, 2010. – 395 с.
2. Кремер Н.Ш. Эконометрика. / Н.Ш. Кремер, Б.А.Путко. — М., ЮНИТИ, 2011. –
456 с.
3. Катышев П.К. Сборник задач к начальному курсу эконометрики / П.К. Катышев,
А.А. Пересецкий – М.: Дело, 2009. – 72 с.
4. Магнус Я.Р. Эконометрика. Начальный курс / Я.Р. Магнус, П.К. Катышев, А.А.
Пересецкий – М.: Дело, 2010. – 400 с.
5. Практикум по эконометрике: учеб. пособие / под ред. И. И. Елисеевой. – М.:
Финансы и статистика, 2011. – 192 с.
6. Эконометрика: учебное пособие / под ред. И. И. Елисеевой. – М.: Финансы и
статистика, 2011. – 245 с.
14
Скачать