Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Волгоградский государственный технический университет» Факультет подготовки инженерных кадров Контрольная работа по предмету «Эконометрика» Вариант № 8 Выполнила: студентка группы № зачетной книжки Проверила: Тарасова И.А. Волгоград 2024 Задание 1. 1) Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии. 2) Оцените тесноту связи с помощью коэффициентов корреляции и детерминации, проанализируйте их значения. 3) С вероятностью 0,95 оцените статистическую значимость параметров уравнения регрессии по критерию Стьюдента. 4) Построить доверительные интервалы для параметров регрессии, коэффициента корреляции. 5) Рассчитайте прогнозное значение результата у, если прогнозное значение фактора х составит 1,062 от среднего (х ) . Определите доверительный интервал прогноза (для α=0,05). 6) В Excel с помощью надстройки Анализ данных получить параметры регрессии, коэффициенты корреляции, детерминации, доверительные интервалы и сравнить с вычисленными. Решение 1) Исходные данные приводятся по 14 территориям Приволжского федерального округа, т.е. n = 14. Территории Приволжского федерального округа Республика Башкортостан Республика Марий Эл Республика Мордовия Республика Татарстан Республика Удмуртия Чувашская республика Кировская область Нижегородская область Оренбургская область Пензенская область Пермская область Самарская область Саратовская область Ульяновская область Среднедушевые денежные расходы за месяц в 2006 г., тыс. руб. у8 4,62 2,48 2,65 4,78 3,4 3,12 3,69 4,71 3,34 3,54 5,82 7,01 3,51 3,43 Среднемесячная начисленная заработная плата работающих в экономике в 2006 г., тыс. руб. х8 5,5 3,9 4,09 5,55 5,16 4,06 4,55 5,17 4,87 4,22 6,42 6,31 4,49 4,47 Уравнение парной линейной регрессии в общем виде: y b0 b1 x . Найдем коэффициенты b0 и b1 . Промежуточные вычисления запишем в таблицу: xi yi 1 5,5 2 3,9 3 4,09 4 5,55 5 5,16 6 4,06 7 4,55 8 5,17 9 4,87 10 4,22 11 6,42 12 6,31 13 4,49 14 4,47 Итого 68,76 Ср. 4,91 знач. x2 yixi 4,62 25,41 30,25 2,48 9,67 15,21 2,65 10,84 16,73 4,78 26,53 30,80 3,4 17,54 26,63 3,12 12,67 16,48 3,69 16,79 20,70 4,71 24,35 26,73 3,34 16,27 23,72 3,54 14,94 17,81 5,82 37,36 41,22 7,01 44,23 39,82 3,51 15,76 20,16 3,43 15,33 19,98 56,10 287,70 346,23 4,01 20,55 24,73 y2 ŷ 21,34 6,15 7,02 22,85 11,56 9,73 13,62 22,18 11,16 12,53 33,87 49,14 12,32 11,76 245,25 17,52 4,85 2,56 2,83 4,92 4,36 2,79 3,49 4,38 3,95 3,02 6,16 6,00 3,41 3,38 56,10 4,01 yi yˆ ( yi yˆ ) 2 xi x ( xi x) 2 -0,23 -0,08 -0,18 -0,14 -0,96 0,33 0,20 0,33 -0,61 0,52 -0,34 1,01 0,10 0,05 0,00 0,00 0,05 0,01 0,03 0,02 0,93 0,11 0,04 0,11 0,37 0,27 0,12 1,01 0,01 0,00 3,08 0,22 0,59 -1,01 -0,82 0,64 0,25 -0,85 -0,36 0,26 -0,04 -0,69 1,51 1,40 -0,42 -0,44 0,00 0,00 0,35 1,02 0,67 0,41 0,06 0,72 0,13 0,07 0,00 0,48 2,28 1,96 0,18 0,19 8,52 0,61 Рассчитаем параметры уравнения парной линейной регрессии: n n n i 1 i 1 xy x y b1 i1n 2 20,55 4,91 4,01 1,4277 24,73 4,912 2 n x x i 1 i1 b0 y b1 x 4,01 1,4277 4,91 3,0047 Таким образом, получено уравнение парной линейной регрессии: yˆ 3,0047 1,4277 х С увеличением среднемесячной начисленной заработной платы работающих в экономике на 1 тыс. руб. среднедушевые денежные расходы за месяц увеличатся в среднем на 1,4277 тыс. руб. 2) Тесноту связи изучаемых явлений определим через линейный коэффициент парной корреляции для линейной регрессии ( 1 rxy 1 ): rxy xy x y x ( x) y ( y) 2 2 2 2 20,55 4,91 4,01 0,922 24,73 4,912 17,52 4,012 rxy 0,922 2 0,849 Это означает, что 84,9 % вариации 1 тыс. руб. среднедушевых денежных расходов за месяц (y) объясняется вариацией фактора х – среднемесячной начисленной заработной платой работающих в экономике. Найдем фактическое значение F-критерия Фишера: R 2 (n m 1) 0,849 (14 1 1) Fнабл 67,692 1 R2 m (1 0,849) 1 (где m=1 – число параметров при переменной х). Из таблицы значений найдем критическое Fкр 4,75 . 2 Т.к. Fнабл Fкр , то отклоняется гипотеза H0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи, т.е. зависимость y от x статистически значима. 3) Выдвигается гипотеза H0 о статистически незначимом отличии показателей от нуля: b0 b1 0 . t кр 2,18 для числа степеней свободы df 14 2 12 и 0,05 . Определяем стандартные ошибки: y yˆ i 3,08 Sˆ 2 i 0,257 ; Sˆ 0,257 0,506 n2 14 2 Sˆ 2 xi2 0,257 346,23 ˆ Sb 0,863 2 2 14 346,23 68,76 2 n xi xi 2 0 Sˆ 2 0,257 0,174 2 8 , 52 ( x х ) i Тогда фактические значения t-статистики Стьюдента равны: b 3,0047 b 1,4277 tb 0 3,482 и tb 1 8,227 . 0,863 0,174 Sˆb Sˆb Фактическое значение t-статистики для коэффициента b1 превосходит табличное значение tb 8,227 tкр 2,18 , поэтому гипотеза Н0 отклоняется, Sˆb 1 0 1 0 1 1 т.е. b1 не случайно отличен от нуля, а статистически значим. Фактическое (по модулю) значение t-статистики для коэффициента b0 превосходит табличное значение tb 3,482 tкр 2,18 , поэтому гипотеза Н0 отклоняется, т.е. b0 0 неслучайно отличен от нуля и статистически значим. 4) Рассчитаем доверительный интервал для b0 и b1 : b t Sˆ 3,0047 2,18 0,863; 0 4,886 и b t Sˆ 1,4277 2,18 0,174 ; 0 0 кр b0 1 1 кр b1 1 min min 0 max 1,123 1,049 и 1max 1,806 Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p 1 1 0,05 0,95 оба параметра b0 и b1 , находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля. 5) Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Точечный прогноз среднедушевых денежных расходов за месяц при прогнозном значении среднемесячной начисленной заработной платы работающих в экономике x p 1,062 х 5,22 тыс. руб. составит: yˆ p 3,0047 1,4277 5,22 4,44 тыс. руб. Чтобы получить интервальный прогноз, следует найти стандартную ошибку прогноза: 2 xp x 1 1 5,22 4,91 ˆ ˆ S yˆ S 1 0,527 2 0,506 1 n xi x 14 8,52 p 2 Доверительный интервал прогнозируемой прибыли составит: y p yˆ p t кр Sˆ yˆ 4,44 2,18 0,527 p 6) Заносим в Excel столбцы исходных данных: Строим точечную диаграмму: 8 7 6 Среднедушевые денежные расходы 5 за месяц в 2006 г., тыс. руб. 4 y = 1,4277x - 3,0047 R² = 0,849 3 2 3 3,5 4 4,5 5 5,5 6 6,5 7 Среднемесячная начисленная заработная плата работающих в экономике в 2006 г., тыс. руб. Полученные на диаграмме уравнение и коэффициент детерминации совпадают с уравнением парной линейной регрессии и коэффициентом детерминации, найденные вручную. Далее используем надстройку Анализ данных «Регрессия»: Получаем: Строка «Y-пересечение» и строка «Xi» столбца «Коэффициенты» - это параметры регрессии b0 и b1 , которые совпадают с найденными вручную. Строки «Множественный R» и «R-квадрат» - это коэффициенты корреляции и детерминации, они также совпадает с коэффициентами корреляции и детерминации, найденными вручную. Строка «Стандартная ошибка» также совпадает со значением Sˆ 0,506 , найденным вручную. Значение по строке «Регрессия» столбца «F» совпадает со значением фактического Fнабл 67,692 . Столбец «Значимость F» = 0,00000282 меньше заданного уровня значимости 0,05 , то гипотеза H0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи отклоняется. У нас так же получилось при вычислениях в пункте 2. Строка «Y-пересечение» и строка «Xi» столбца «Стандартная ошибка» - это стандартные ошибки параметров уравнения парной линейной регрессии, которые также совпадают с найденными вручную Sˆb 0,863 и Sˆ 0,174 . 0 b1 Строки «Y-пересечение» и «Xi» столбца «t-статистика» - это значения t-статистики, которые совпадают с вычисленными вручную tb 3,482 и 0 tb 8,227 . Т.к. «Р-значение» = 0,005 по строке «Y-пересечение» для коэффициента b0 меньше заданного уровня значимости 0,05 , то данный коэффициент не случайно отличен от нуля и статистически значим. Т.к. «Р-значение» = 0,000 по строке «Xi» для коэффициента b1 меньше заданного уровня значимости 0,05 , то данный коэффициент не случайно отличен от нуля и статистически значим. У нас тоже самое получилось при вычислениях в пункте 3. Значения по строкам «Y-пересечение» и «Xi» столбцов «Нижние 95%» и «Верхние 95%» совпадают с доверительными интервалами коэффициентов с ранее найденными в пункте 4. 1 Задание 2. 1) Построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров. 2) Определить стандартизированные коэффициенты регрессии. 3) Рассчитать частные коэффициенты эластичности, сравнить их с β1 и β2, пояснить различия между ними. 4) Определить парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции. 5) Провести дисперсионный анализ для проверки статистической значимости уравнения множественной регрессии и его показателя тесноты связи на уровне значимости 0,05 . 6) Рассчитать частные F-критерии Фишера. 7) Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных x1 и x 2 множественного уравнения регрессии. Решение Исходные данные приводятся по 18 банкам, т.е. n = 18. Банк Сбербанк Внешторгбанк Газпромбанк Альфа-банк Банк Москвы Росбанк Промстройбанк Уралсиб Промсвязьбанк Петрокоммерц Номос-банк Зенит Транскредитбанк ЕврофинансМоснарбанк Никойл Импэксбанк Союз Татфондбанк Работающие активы, млн. руб., y 1917403 426484 362532 186700 157286 151849 85365 76617 54848 53701 52473 50666 41332 38245 36946 34032 33062 11949 Средства частных лиц, % х1 60 13 9 15 30 19 24 22 11 26 6 10 8 5 11 37 8 20 Выпущенные ценные бумаги, %, х2 3 12 22 3 5 10 11 10 11 11 24 17 27 37 9 11 31 18 Линейное уравнение множественной регрессии имеет вид: yˆ b0 b1 х1 b2 x 2 . Расчет параметров произведем в Excel с помощью надстройки Анализ Данных «Регрессия»: Получаем: Столбец «Коэффициенты» содержит численные значения коэффициентов регрессии: yˆ 388150 ,1 26351,18 х1 7194 ,48 x2 . При увеличении средств частных лиц на 1 % размер работающих активов увеличивается на 26351,18 млн. руб., а при увеличении выпущенных ценных бумаг на 1 % размер работающих активов увеличивается на 7194,48 млн. руб. Значение линейного коэффициента множественной корреляции расположено в строке «Множественный R» таблицы: Ryx x 0,727 . Множественный коэффициент детерминации (строка «R-квадрат»): R yx2 x 0,529 . Зависимость y от х1 и х2 характеризуется как средняя связь, в которой 52,9% вариации размера работающих активов определяется вариацией учтенных в модели факторов: средств частных лиц и выпущенных ценных бумаг. Стандартные ошибки коэффициентов регрессии расположены в столбце «Стандартная ошибка»: Sˆb 277194 ,699 , Sˆb 7374,121 и Sˆ 10473,031 . 1 2 1 2 0 1 b2 Оценка значимости коэффициентов b1 и b2 с помощью t-критерия Стьюдента предполагает сопоставление их значений с величиной их стандартных ошибок. Значения t-критерия Стьюдента для коэффициентов регрессии расположены в столбце «t-статистика»: tb 3,573 и tb 0,687 . Табличное значение t-критерия Стьюдента равно t кр 2,13 для числа 1 2 степеней свободы df 18 3 15 и 0,05 . Сравнивая t кр и t набл можно прийти к выводу, что коэффициент регрессии b1 является статистически значимым и надежным, а коэффициент регрессии b2 является статистически незначимым. Несмотря на полученную незначимость коэффициента регрессии b0 ( tb 1,4 t кр 2,13 ), принято оставлять константу в уравнении для 0 поглощения неучтенных в модели факторов. Интервальные значения коэффициентов регрессии составят: 10633,609 1 42068,742 и 15128 ,256 2 29517 ,22 С вероятностью 0,95 истинная сила влияния переменной х1 на у будет не меньше 10633,609 и не больше 42068,724; переменной х2 – не меньше -15128,256 и не больше 29517,22. Для характеристики относительной силы влияния х1 и х2 на у следует рассчитать средние коэффициенты эластичности. Для этого рассчитаем с помощью функции СРЗНАЧ( ) средние значения: х1 18,56 , х2 15,11 и у 209527 ,22 . x 18,56 Э yx b1 1 26351,18 2,33 209527 ,22 y x 15,11 Э yx b2 2 7194,48 0,52 209527 ,22 y С увеличением средств частных лиц на 1% от его среднего уровня размер работающих активов увеличивается на 2,33% от своего среднего уровня; при увеличении выпущенных ценных бумаг на 1 % от своего среднего уровня размер работающих активов увеличивается на 0,52% от своего среднего уровня. Очевидно, что сила влияния средств частных лиц на размер работающих активов оказалась большей, чем сила влияния выпущенных ценных бумаг. Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент Анализа Данных «Корреляция»: 1 2 Получаем: Линейные коэффициенты ryx ryx rx x частной корреляции рассчитаем по 0,717 (0,357 ) (0,63) формулам: ryx x 0,678 1 ryx2 1 rx2x (1 (0,357) 2 ) (1 (0,63) 2 ) ryx ryx rx x 0,357 0,717 (0,63) ryx x 0,175 1 ryx2 1 rx2x (1 0,717 2 ) (1 (0,63) 2 ) rx x ryx ryx 0,63 0,717 (0,357 ) rx x y 0,574 1 ryx2 1 ryx2 (1 0,717 2 ) (1 (0,357 ) 2 ) Из-за низкой межфакторной связи ( rx x 0,63 ) коэффициенты парной и частной корреляции отличаются: выводы о тесноте и направлении связи на основе парных и частных коэффициентов не совпадают. Задача дисперсионного анализа состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи. Результаты дисперсионного анализа представлены в таблице «Дисперсионный анализ»: Столбец SS содержит суммы квадратов отклонений, столбец MS – дисперсии на одну степень свободы. По таблице значений F-критерия Фишера при уровне значимости 0,05 и степенях свободы k1 2 , k 2 15 : Fкр 3,68 . 1 2 1 2 1 2 2 2 1 1 2 1 2 2 1 1 1 2 1 2 1 2 1 2 1 2 1 2 Так как Fнабл 8,413 Fкр 3,68 , гипотеза Н0 о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость размера работающих активов от средств частных лиц и выпущенных ценных бумаг. С вероятностью 0,95 делается заключение о статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов x1 и х2. Частные F-критерии оценивают статистическую значимость присутствия факторов x1 и х2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора. Ryx2 x ryx2 n m 1 0,727 2 (0,357 ) 2 18 2 1 Fх набл 12,77 1 Ryx2 x 1 1 0,727 2 1 1 2 2 1 1 2 Fх набл 2 R 2 yx1 x2 ryx2 1 1 Ryx2 x 1 2 n m 1 0,727 2 0,717 2 18 2 1 0,472 1 1 0,727 2 1 По таблице значений F-критерия Фишера при уровне значимости 0,05 и степенях свободы k1 1 , k 2 16 : Fкр 4,49 . Так как Fx набл 12,77 Fкр 4,49 , то гипотеза Н0 несущественности прироста R2y за счет включения дополнительного фактора х1 отклоняется и делается вывод о статистически подтвержденной целесообразности включения фактора х1 после фактора x2. Так как Fx набл 0,472 Fкр 4,49 , то можно прийти к выводу о нецелесообразности включения в модель фактора х2 после фактора x1. Гипотеза Н0 несущественности прироста R2y за счет включения дополнительного фактора х2 принимается и делается вывод о статистически подтвержденной нецелесообразности включения фактора х2 после фактора x1. 1 2