Федеральное государственное бюджетное образовательное учреждение высшего образования «Оренбургский государственный аграрный университет» Экономический факультет Кафедра «Статистики и экономического анализа» КОНТРОЛЬНАЯ РАБОТА по дисциплине «Эконометрика» Вариант № 3 Работу выполнила студентка Направления подготовки 38.03.01 Экономика Профиля подготовки «Финансы кредит» Квасова В.О. Работу проверила Кибатаева Аида Нурабековна Оренбург - 2019 и Содержание Задание 1. Парная линейная регрессия 3 Задание 2. Нелинейная регрессия 9 Задание 3. Множественная линейная регрессия 15 Список литературы 18 2 Задание 1. Парная линейная регрессия. Постройте поле корреляции и сформулируйте гипотезу о форме 1. связи между объемом продаж товара и ценой товара. Объем продаж товара, тыс. ед. 7 6 5 4 3 2 1 0 0 0,5 1 1,5 2 2,5 3 3,5 Цена товара, $ Рисунок 1 - Поле корреляционной зависимости объема прожат товара от цены товара По расположению точек на графике делается вывод о виде корреляционной зависимости. Анализ рисунка 1 позволяет предположить наличие обратной линейной корреляционной зависимости между объемом продаж и ценой товара. Рассчитайте оценки параметров парной линейной регрессии, х – потребление электроэнергии (кВт/ч), а у – объем выпуска продукции (тыс.шт.). Параметры а и b линейной регрессии𝑦 = 𝑎 + 𝑏𝑥 рассчитываются результате решения системы нормальных уравнений относительно а и b: ∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑥 { ∑ 𝑦𝑥 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2 По исходным данным рассчитаем ∑ 𝑦, ∑ 𝑥,∑ 𝑥𝑦, ∑ 𝑥 2 ,∑ 𝑦 2 . Система нормальных уравнений составит: { 43,4 = 12𝑎 + 21,3𝑏 66,84 = 21,3𝑎 + 45,19𝑏 Решаем ее методом определителей: определитель системы ∆ равен: 3 ∆= | 12 21,3 | = (12 ∗ 45,19 − 21,3 ∗ 21,3) = 88,59, 21,3 45,19 43,4 21,3 ∆𝑎 ∆𝑎 = | | = 537,55, 𝑎 = ∆ = 6,067, 66,84 45,19 12 43,4 ∆𝑏 ∆𝑏 = | | = −122, 𝑏 = ∆ = −1,381. 21,3 66,84 Получаем уравнение регрессии: 𝑦̃𝑥 = 6,067 − 1,381𝑥 Этот же результат можно получить, используя следующие формулы длянахождения параметров: 𝑏= где, 𝜎𝑥2 = ∑ 𝑥2 𝑛 Получаем 𝑏 = ̅̅̅̅−𝑦̅𝑥̅ 𝑦𝑥 𝜎𝑥2 , 𝑎 = 𝑦̅ − 𝑏𝑥̅ − 𝑥̅ 2 –дисперсия по факторному признаку. 45,19∗3,62∗1,78 3,76−1,78 = −1,381, 𝑎 = 3,62 + 1,381 ∗ 1,78 = 6,067 При решении с помощью компьютера уравнение регрессии составило: 𝑦̃𝑥 = 6,067 − 1,381𝑥 Величина коэффициента регрессии 𝑏 = −1,381означает, ростомцены товарана 1 $, объем продажснижается на 1,381 % . 4 что с Номер фирмы 1 2 3 4 5 6 7 8 9 10 11 12 x y yx x^2 y^2 y͂ y-y͂ (y-y͂)^2 (y-y ср)^2 (y͂-y ср)^2 (x - x ср)^2 |(y-y͂)/y|*100 0,3 1 1,2 1,3 1,5 1,4 1,6 2,1 2,5 2,8 2,7 2,9 5,8 4,6 5,2 4,2 4,5 3,4 3,6 2,4 2,5 2,4 2 2,8 1,74 4,6 6,24 5,46 6,75 4,76 5,76 5,04 6,25 6,72 5,4 8,12 0,09 1 1,44 1,69 2,25 1,96 2,56 4,41 6,25 7,84 7,29 8,41 33,64 21,16 27,04 17,64 20,25 11,56 12,96 5,76 6,25 5,76 4 7,84 5,65 4,69 4,41 4,27 4,00 4,13 3,86 3,17 2,62 2,20 2,34 2,06 0,02 0,01 0,62 0,01 0,25 0,54 0,07 0,59 0,01 0,04 0,12 0,54 4,77 0,97 2,51 0,34 0,78 0,05 0,00 1,48 1,25 1,48 2,61 0,67 4,15 1,15 0,63 0,43 0,14 0,27 0,06 0,20 1,00 2,00 1,63 2,41 2,18 0,60 0,33 0,23 0,08 0,14 0,03 0,11 0,53 1,05 0,86 1,27 2,52 1,89 15,18 1,73 11,19 21,60 7,18 31,99 4,62 8,28 16,96 26,32 Сумма 21,3 43,4 66,84 45,19 173,86 43,4 0,15 -0,09 0,79 -0,07 0,50 -0,73 -0,26 -0,77 -0,12 0,20 -0,34 0,74 1,42E14 2,82 16,90 14,08 7,38 149,47 Среднее значение 1,78 3,62 5,57 3,77 14,49 Таблица 1 – Расчетные данные 5 1. Оцените тесноту связи между признаками. Линейное уравнение регрессии дополняется расчетом линейного коэффициента корреляции: 𝑟𝑦𝑥 = ̅̅̅̅−𝑦̅𝑥̅ 𝑦𝑥 𝜎𝑦 𝜎𝑥 или 𝑟 = 𝑏 𝜎𝑥 𝜎𝑦 Так как 𝜎𝑥 = √5,57 − 1,782 = 0,784, 𝜎𝑦 = √5,57 − 3,622 = 1,187, то 𝑟 = 0,784 −1,381 1,187 = −0,912, что означает тесную обратную связь рассматриваемых признаков. 2. Рассчитайте коэффициент детерминации. 2 Коэффициент детерминации составит: 𝑟𝑦𝑥 = 0.9122 = 0.833, т.е.вариация у на 83,3% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 16,7 %. 3. Проверьте значимость оценки коэффициента регрессии с помощью критерия Стьюдента при уровне значимости α=0,05. Оценку статистической значимости коэффициента регрессии проведем с помощью t - критерия Стьюдента. Выдвигаем две гипотезы: Н0 – коэффициент регрессии является статистически незначимым, т.е. b=0; Н1 – коэффициент регрессии статистически значим, т.е. b≠0. Определим стандартную ошибку для коэффициента регрессии mb: ∑(𝑦−𝑦̃ )2 2,82 𝑥 𝑚𝑏 = √∑(𝑥−𝑥̅ )2 (𝑛−2) = √7,38∗10 = 0,195. Далее вычисляем значения t – критерия Стьюдента: 𝑡= |𝑏| 1,381 = = 7,06 𝑚𝑏 0,195 Фактическое значение t – критерии превосходит табличное значение на 5 %-м уровне значимости при числе степеней свободы𝑛 − 2 = 10 𝑡табл = 2,228 Поэтому гипотеза Н0 отклоняется, т.е. b отличается от нуля не случайно икоэффициент регрессии является статистически значимым. 6 4. Постройте доверительный интервал для коэффициента регрессии. Рассчитаем доверительный интервал для коэффициента регрессии, для чего определим предельную ошибку для параметра b. ∆𝑏 = 𝑡табл 𝑚𝑏 = 2.228 ∗ 0,195 = 0,435 Доверительные интервалы: 𝛾𝑏 = 𝑏 ± ∆𝑏 = −1,381 ± 0435, т.е. −1,816 ≤ 𝑏 ≤ −0,946 Анализ верхней и нижней границ доверительного интервала приводит к выводу о том, что с вероятностью 95% коэффициент регрессии, находясь в указанных границах, не принимает нулевых значение, т.е. не является статистически незначимым и существенно отличен от нуля. 5. Составить таблицу дисперсионного анализа. Результаты дисперсионного анализа приведены в таблице 2. Таблица 2 – Таблица дисперсионного анализа Вариация результата Число степеней свободы Общая Факторная Остаточная 6. Оцените Сумма квадратов отклонений 11 1 10 с Дисперсия на одну степень свободы 16,89 14,07 2,81 помощью F - критерий факт 49,9 табл 4,96 14,07 1,67 F – критерия Фишера-Снедекора значимость уравнения линейной регрессии. В силу того, что 𝐹факт = 49,9 > 𝐹табл = 4,96, гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны,статистически значимы, уравнение значимо, показатель тесноты связи надежени отражает устойчивую зависимость объемы выпуска продукции от потребления электроэнергии. 7. Рассчитайте объем продаж данного товара, если его цена составит 11 $. 7 Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если примем прогнозное значение темпа прироста затрат электроэнергии х=11, то точечный прогноз темпа прироста выпуска продукции составит:𝑦 𝑝 = 6.06 − 1.381 ∗ 11 = −9.12 тыс. шт Чтобы получить интервальный прогноз, найдем стандартную ошибку предсказываемого значения расходов𝑚𝑝 : (𝑥 𝑝 −𝑥̅ ) 1 𝑚𝑝 = 𝑆√1 + + ∑(𝑥−𝑥̅ )2, 𝑛 Где𝑆 = √ ∑(𝑦−𝑦̃)2 𝑛−2 - стандартная ошибка регрессии. 2.82 𝑆=√ = 0.531 10 𝑚𝑝 = 0.531√1 + 1 (11 − 1.78)2 + = 4.54 12 7.38 Предельная ошибка прогнозируемого расхода составит: ∆𝑦𝑝 = 𝑡табл 𝑚𝑝 = 2.228 ∗ 4.54 = 10.12 Доверительный интервал прогнозируемого расхода составит: 𝑦𝑝 = −9.12 ± 10.12 Т.е. при цене товара 11 $, объем продаж данного товара не меньше чем -19,24 тыс. ед. и не больше чем 0,996 тыс. ед. 10. Рассчитайте средний коэффициент эластичности. Средний коэффициент эластичности для линейной регрессии рассчитывается по формуле: Э=𝑏 𝑥̅ 1,78 = −1,381 = −0,678 𝑦̅ 3,62 Таким образом, получаем, что с ростомцены товара на 1 $, объем выпуска продукции снижается на 0,678%. 11. Определить среднюю ошибку аппроксимации. Средняя ошибка аппроксимации находится арифметическая простая из индивидуальных ошибок: 8 как средняя 1 𝑦−𝑦̃ 149,47 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 12,45 % Так как средняя ошибка аппроксимации меньше 10-13%, что говорит о высокой точности модели. Задание 2. Нелинейная регрессия 1. Рассчитать параметры следующих функций: - степенной; - равносторонней гиперболы; - показательной. 2. Найти показатели тесноты связи по каждой модели. 3. Оценить каждую модель через показатель детерминации, F – критерий Фишера, ошибку аппроксимации и выбрать наилучшую из них. Регрессия в виде степенной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑥 𝑏 Для оценки параметров модели линеаризуем модель путем логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑏 𝑙𝑛 𝑥 Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑥 = 𝑋 . Тогда получим: 𝑌 = 𝐴 + 𝑏𝑋 Для расчетов составим таблицу 3. Таблица 3 - Расчетные данные для степенной функции Номер фирмы X Y XY X^2 Y^2 Y͂ y͂ (y-y͂)^2 |(y-y͂)/y|*100 1 2 3 4 5 6 7 8 9 10 11 12 Сумма -1,204 0,000 0,182 0,262 0,405 0,336 0,470 0,742 0,916 1,030 0,993 1,065 5,198 1,758 1,526 1,649 1,435 1,504 1,224 1,281 0,875 0,916 0,875 0,693 1,030 14,766 -2,116 0,000 0,301 0,377 0,610 0,412 0,602 0,650 0,840 0,901 0,688 1,096 4,360 1,450 0,000 0,033 0,069 0,164 0,113 0,221 0,550 0,840 1,060 0,987 1,134 6,620 3,090 2,329 2,718 2,059 2,262 1,498 1,641 0,766 0,840 0,766 0,480 1,060 19,510 1,994 1,433 1,348 1,310 1,243 1,276 1,213 1,087 1,005 0,952 0,969 0,936 14,766 7,345 4,189 3,848 3,707 3,468 3,581 3,365 2,964 2,733 2,592 2,636 2,550 42,978 2,388 0,169 1,828 0,243 1,066 0,033 0,055 0,318 0,054 0,037 0,405 0,063 6,658 26,643 8,925 26,001 11,739 22,941 5,324 6,533 23,502 9,303 7,996 31,812 8,935 189,653 Среднее значение 0,433 1,231 0,363 0,552 1,626 9 Запишем систему { нормальных уравнений: 14,76 = 12𝐴 + 5,198𝑏 4,36 = 5,198𝐴 + 6,620𝑏 Отсюда ∆= 52,42, ∆𝐴 = 75,09, 𝐴 = 1,433 ∆𝑏 = −24,45, 𝑏 = −0,466. Получаем уравнение регрессии: 𝑙𝑛𝑦 = 1,433 − 0,466𝑙𝑛𝑥 Выполнив потенцирование, получим:𝑦̃𝑥 = 𝑒1,433 ∙ 𝑥 −0,466 = 4,189 ∙ 𝑥 −0,466 Параметр 𝑏 = −0,466 означает коэффициент эластичности, который показывает, что с ростом цены товара на 1 $, объем продаж данного товараснижается на 0,466 тыс. ед. Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив в уравнение𝑙𝑛𝑦 = 1,433 − 0,466𝑙𝑛𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 . В таблице 3представлены𝑙𝑛𝑦̃𝑥 = 𝑌̃𝑥 и 𝑦̃𝑥 . Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 16,90 представлена в таблице 1 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,999 = 0,999 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.9992 = 0.999, т.е.вариация у на 99,9% объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится0,1 %. F – критерий Фишера составит: 𝐹= 𝑅2 0.999 (𝑛 − 2) = (12 − 2) = 89104,82 2 1−𝑅 1 − 0,99 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии𝑦̃𝑥 = 4,189 ∙ 𝑥 −0,466 статистически значимо. Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 10 1 𝑦−𝑦̃ 189,65 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 12 = 15,8т.е. среднее отклонение фактических и расчетных значений у составляет15,8 %, что свидетельствует о хорошем качестве модели. Регрессия в виде показательной функции имеет вид:𝑦̃𝑥 = 𝑎 ∙ 𝑏 𝑥 Для оценки параметров модели линеаризуем модель путем логарифмирования: ln 𝑦 = ln 𝑎 ∙ 𝑥 𝑙𝑛 𝑏 Обозначимln 𝑦 = 𝑌 , ln 𝑎 = 𝐴, 𝑙𝑛𝑏 = 𝐵 . Тогда получим: 𝑌 = 𝐴 + 𝑥𝐵 Для расчетов составим таблицу 4. Таблица 4 - Расчетные данные для показательной функции Номер фирмы 1 2 3 4 5 6 7 8 9 10 11 12 Сумма Среднее значение x Y xY x^2 Y͂ y͂ y-y͂ (y-y͂)^2 (y-y ср)^2 |(y-y͂)/y|*100 0,3 1 1,2 1,3 1,5 1,4 1,6 2,1 2,5 2,8 2,7 2,9 21,3 1,758 1,526 1,649 1,435 1,504 1,224 1,281 0,875 0,916 0,875 0,693 1,030 14,76 0,527 1,526 1,978 1,866 2,256 1,713 2,049 1,838 2,291 2,451 1,871 2,986 23,35 0,09 1 1,44 1,69 2,25 1,96 2,56 4,41 6,25 7,84 7,29 8,41 45,19 1,801 1,530 1,453 1,414 1,337 1,376 1,298 1,105 0,950 0,834 0,873 0,795 14,76 6,057 4,620 4,276 4,114 3,807 3,958 3,663 3,019 2,586 2,302 2,393 2,215 43,009 -0,257 -0,020 0,924 0,086 0,693 -0,558 -0,063 -0,619 -0,086 0,098 -0,393 0,585 0,391 0,066 0,000 0,854 0,007 0,480 0,311 0,004 0,383 0,007 0,010 0,155 0,342 2,619 4,767 0,967 2,507 0,340 0,780 0,047 0,000 1,480 1,247 1,480 2,614 0,667 16,897 4,429 0,433 17,771 2,056 15,392 16,398 1,746 25,776 3,433 4,064 19,664 20,890 132,052 1,78 1,23 1,95 3,77 Запишем систему { нормальных уравнений: 14,76 = 12𝐴 + 21,3𝐵 23,35 = 21,3𝐴 + 45,19𝐵 В результате:𝑙𝑛𝑎 = 1,919 𝑙𝑛𝑏 = 0,387. Получаем уравнение регрессии: 𝑙𝑛𝑦 = 1,91 − 0,387𝑥.Теперь потенцируем оба параметра, чтобы получить уравнение регрессии в формепоказательной кривой: 𝑎 = 𝑒 1,919; 𝑏 = 𝑒 −0,387; 𝑎 = 6,802; 𝑏 = 0,679 𝑦̃𝑥 = 6,802 ∙ 0,679𝑥 11 Теоретические значения зависимой переменной 𝑦̃𝑥 получим, подставив в уравнение𝑙𝑛𝑦 = 1,91 − 0,387𝑥 значения х и потенцируя значения 𝑙𝑛𝑦̃𝑥 . Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 16,9 представлена в таблице 4 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,845 = 0,919 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.9192 = 0.845, т.е.вариация у на 84,5 % объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 15,5 %. F – критерий Фишера составит: 𝐹= 𝑅2 0,845 (𝑛 − 2) = (12 − 2) = 54,52 2 1−𝑅 1 − 0.845 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии 𝑦̃𝑥 = 6,802 ∙ 0,679𝑥 статистически значимо. Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 1 𝑦−𝑦̃ 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 11т.е. среднее отклонение фактических и расчетных значений у составляет 11 %, что свидетельствует о хорошем качестве модели. 𝑏 Регрессия в виде равносторонней гиперболы имеет вид:𝑦̃𝑥 = 𝑎 + 𝑥 Чтобы оценить параметры уравнения приведем модель к линейному виду, заменив 1 𝑥 = 𝑧. Тогда 𝑦̃ = 𝑎 + 𝑏𝑧. Применяя МНК, получаем систему нормальных уравнений: 12 ∑ 𝑦 = 𝑛𝑎 + 𝑏 ∑ 𝑧 { ∑ 𝑦𝑧 = 𝑎 ∑ 𝑧 + 𝑏 ∑ 𝑧 2 Для расчета параметров составим таблицу 5 Таблица 5 – Расчетные данные для равносторонней гиперболы Номер фирмы x y 1/x=z yz z^2 y͂ 1 2 3 4 5 6 7 8 9 10 11 12 Сумма 0,3 1 1,2 1,3 1,5 1,4 1,6 2,1 2,5 2,8 2,7 2,9 21,3 5,8 4,6 5,2 4,2 4,5 3,4 3,6 2,4 2,5 2,4 2 2,8 43,4 3,333 1,000 0,833 0,769 0,667 0,714 0,625 0,476 0,400 0,357 0,370 0,345 9,890 19,333 4,600 4,333 3,231 3,000 2,429 2,250 1,143 1,000 0,857 0,741 0,966 43,882 11,111 1,000 0,694 0,592 0,444 0,510 0,391 0,227 0,160 0,128 0,137 0,119 15,513 6,382 3,810 3,627 3,556 3,443 3,496 3,397 3,233 3,149 3,102 3,117 3,088 43,400 Среднее значение 1,78 3,62 0,82 3,66 1,29 (yy͂)^2 |(y-y͂)/y|*100 -0,582 0,338 0,790 0,623 1,573 2,475 0,644 0,415 1,057 1,117 -0,096 0,009 0,203 0,041 -0,833 0,694 -0,649 0,421 -0,702 0,493 -1,117 1,247 -0,288 0,083 0,000 7,957 10,029 17,165 30,255 15,331 23,487 2,810 5,635 34,715 25,968 29,249 55,828 10,300 260,773 y-y͂ Запишем систему нормальных уравнений: { 43,4 = 12𝑎 + 9,890𝑏 43,882 = 9,890𝑎 + 15,513𝑏 Отсюда ∆= 88,34, ∆𝐴 = 239,25, 𝐴 = 2,708 ∆𝑏 = 97,34, 𝑏 = 1,102. Получаем уравнение регрессии:𝑦̃𝑥 = 2,708 − 1,102 𝑥 Показателем тесноты связи выступает индекс корреляции: 𝑅 = √1 − ∑(𝑦 − 𝑦̃)2 ∑(𝑦 − 𝑦̅)2 Величина ∑(𝑦 − 𝑦̅)2 = 16,9 представлена в таблице 4 В результате имеем: ∑(𝑦−𝑦̃)2 𝑅 = √1 − ∑(𝑦−𝑦̅)2 = √0,997 = 0,998 13 Коэффициент детерминации составит: 2 𝑅𝑦𝑥 = 0.9982 = 0.997, т.е.вариация у на 99,7 % объясняется вариацией х. На долю прочих факторов, неучитываемых в регрессии, приходится 0,3 %. F – критерий Фишера составит: 𝐹= 𝑅2 0.997 (𝑛 − 2) = (12 − 2) = 8281 2 1−𝑅 1 − 0.997 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 4.96 . Следовательно, найденное уравнение регрессии 𝑦̃𝑥 = 2,708 − 1,102 𝑥 статистически значимо. Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3. 1 𝑦−𝑦̃ 𝐴̅ = 𝑛 ∑ | 𝑦 | ∙ 100% = 21 , 7т.е. расчетных значений у среднее составляет отклонение 21,7 %, фактических что и свидетельствует обудовлетворительном качестве модели. Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одну таблицу. Таблица 6 - Сводная таблица построенных уравнений Функции Степенная Показательная Равносторонняя гипербола Коэффициент детерминации 0,999 0,845 F- критерий Фишера 89104 54,5 Средняя ошибка аппроксимации 15,8 11 0,997 8281,6 21,7 Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать показательной функции, длякоторой значение ошибкиаппроксимации – наименьшее. 14 Тема 3. Множественная линейная регрессия В процессе изучения потребления электроэнергии (тыс. кВт/ч) у от производства продукции (тыс. ед.) х1 и уровня механизации труда (%) х2получены данные по 25 предприятиям. Признак Среднее Парный Среднее квадратическое коэффициент значение отклонение корреляции y x1 x2 12 4,3 10 1,8 2 ryx1=0,52 0,5 ryx2=0,84 rx1x2=0,43 Построить уравнение множественной линейной регрессии 1. стандартизованном масштабе и в естественной форме. Линейное уравнение множественной регрессии у от х1 и х2 имеет вид: 𝑦̃𝑥 = 𝑎 + 𝑏1 𝑥1 + 𝑏2 𝑥2 Для расчета его параметров применим метод стандартизации переменны и построим искомое уравнение в стандартизованном масштабе: 𝑡𝑦 = 𝛽1 𝑡𝑥1 + 𝛽2 𝑡𝑥2 Расчет β – коэффициентов выполним по формулам 𝛽1 = 𝛽2 = 𝑟𝑦𝑥1 − 𝑟𝑦𝑥2 𝑟𝑥1𝑥2 0.52 − 0.84 ∙ 0,43 = = 0.194 1 − 𝑟𝑥1𝑥2 2 1 − 0,43 𝑟𝑦𝑥2 − 𝑟𝑦𝑥1 𝑟𝑥1𝑥2 0.0,84 − 0,52 ∙ 0.43 = = 0.756 1 − 𝑟𝑥1𝑥2 2 1 − 0.43 Получим уравнение 𝑡𝑦 = 0,194𝑡𝑥1 + 0.756𝑡𝑥2 Для построения уравнения в естественной рассчитаем𝑏1 и 𝑏2 используя формулы для перехода от𝛽𝑖 к 𝑏𝑖 𝛽1 = 𝑏𝑖 𝑏1 = 0.194 0,5 2 𝜎𝑥 𝜎𝑦 ; 𝑏1 = 𝛽𝑖 𝜎𝑦 𝜎𝑥 = 0.779; 𝑏2 = 0.756 1,8 2 = 0.840 Значение a определим из соотношения 𝑎 = 𝑦̅ − 𝑏1 𝑥̅1 − 𝑏2 𝑥̅2 = 12 − 0.779 ∙ 4,3 − 0.840 ∙ 10 = 0.246 𝑦̃𝑥 = 0.246 + 0.779𝑥1 + 0.756𝑥2 15 форме Рассчитайте частные коэффициенты эластичности. 2. Рассчитаем средние коэффициенты эластичности для определения относительной силы влияния х1 и х2 на у: Э𝑦𝑥𝑗 = 𝑏𝑗 ∙ 𝑥̅𝑗 𝑦̅ 4,3 10 = 0.279Э𝑦𝑥2 = 0.840 ∙ = 0.700 12 12 С увеличением энерговооруженности труда х1 на 1 кВтч.на одного рабочего Э𝑦𝑥1 = 0.779 ∙ от ее среднего, уровень потребления материалов у возрастет на 0,279 т.от своего среднего уровня; при увеличениих2 на 1 тыс. ед. уровень потребления материала увеличивается на 0.7 т.от своего среднего уровня. Очевидно, что сила влияния объема произведенной продукциих2 на уровень потребления материалов у оказалась большей, чем сила влияния уровня энерговооруженности труда х1. К аналогичным выводам о силе связи приходим при сравнении модулей значений β1 и β2. 3. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле: 𝑟𝑦𝑥1= 𝑥2 𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2 0,52−0,84∙0.43 = =0,324 2 2 √(1−𝑟𝑦𝑥 )(1−𝑟𝑥 𝑥 ) √(1−0.842 )(1−0.432 ) 2 1 2 𝑟𝑦𝑥2= 𝑥1 𝑟𝑦𝑥2 −𝑟𝑦𝑥1 𝑟𝑥1 𝑥2 0.84−0.52∙0,43 = =0,799 2 2 2 √(1−𝑟2 𝑦𝑥1 )(1−𝑟𝑥1 𝑥2 ) √(1−0.52 )(1−0,43 ) При сравнении значений коэффициентов парной и частной корреляции приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: 𝑟𝑦𝑥1 = 0.52,𝑟𝑦𝑥2 = 0,84, 𝑟𝑥1𝑥2 = 0,43 𝑟𝑦𝑥1 = 0.324,𝑟𝑦𝑥2 = 0,799, 𝑟𝑥1𝑥2 =0.756 𝑥2 𝑥1 𝑦 16 Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и 𝑅𝑦𝑥1𝑥2 = √𝑟𝑦𝑥1 ∙ 𝛽1 + 𝑟𝑦𝑥2 ∙ 𝛽2 = √0.52 ∙ 0.194 + 0,84 ∙ 0.756 = 0.858 Зависимость у от х1 и х2 характеризуется как тесная, в которой 73.7 % вариации потребления материалов определяются вариацией учтенных в модели факторов: энерговооруженности труда иобъема произведенной продукции. Прочие факторы, не включенные в модель, составляют соответственно 26,3 % отобщей вариации у. 4. Оцените значимость уравнения регрессии в целом с помощью F – критерия Фишера. Общий F – критерий проверяет гипотезу Н0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2=0): 𝐹= 𝑅𝑦𝑥1𝑥2 𝑚−1 0.858 22 ÷ = ∙ = 66,58 1 − 𝑅𝑦𝑥1𝑥2 𝑛 − 𝑚 1 − 0.858 2 𝐹табл = 3.35 Эта величина превышает табличное значение на 5 %-м уровне значимости𝐹табл = 3.35.Делаем выводо статистической значимости уравнения в целом и показателя тесноты связи, которые сформировались под неслучайным воздействием факторов 17 х1 и х2. . Список литературы 1. Гладилин, А. В. Практикум по эконометрике / А.В. Гладилин, А.Н. Герасимов, Е.И. Громов. - М.: Феникс, 2016. - 336 c. 2. Дайитбегов, Д. М. Компьютерные технологии анализа данных в эконометрике / Д.М. Дайитбегов. - Москва: ИЛ, 2015. - 592 c. 3. Колемаев, В. А. Эконометрика / В.А. Колемаев. - М.: ИНФРА- М, 2016. - 160 c. 4. Кочетыгов, А. А. Основы эконометрики / А.А. Кочетыгов, Л.А. Толоконников. - М.: Издательский центр "МарТ", 2015. - 352 c. 5. Кремер, Н. Ш. Математика для экономистов. От Арифметики до Эконометрики. Учебно-справочное пособие / Н.Ш. Кремер, Б.А. Путко, И.М. Тришин. - М.: Юрайт, 2017. - 724 c. 6. Математика для экономистов. От Арифметики до Эконометрики / Н.Ш. Кремер и др. - М.: Юрайт, 2017. - 688 c. 7. Математика для экономистов. От Арифметики до Эконометрики. - Москва: Мир, 2017. - 648 c. 8. Новак, Эдвард Введение в методы эконометрики. Сборник задач / Эдвард Новак. - М.: Финансы и статистика, 2016. - 248 c Плохотников, К. Э. Основы эконометрики в пакете STATISTICA (+ CD-ROM) / К.Э. Плохотников. - 18 Москва: ИЛ, 2015. - 304 c.