Гафарова Марселя

advertisement
Многофакторный регрессионный анализ
Рассмотрим решение задачи множественной линейной регрессии на примере
данных (данные взяты из:
http://ieu.udsu.ru/moodle/pluginfile.php/467/md_resource/content/1/l3.htm)
о стоимости небольших офисных зданий с различными характеристиками (общая площадь
в квадратных метрах, количество офисов, количество входов («1.5»- означает вход только
для доставки корреспонденции), время эксплуатации здания в годах, оценочная цена
здания под офис).
Таким образом, в матрице А, в которой содержатся характеристики офисных
помещений и их оценочная цена имеет следующий вид:
Далее с помощью статистического пакета R нашли коэффициенты линейной
регрессии.
Для этого применили формулу: 𝜃̂ = (ХТ Х)−1 ХТ 𝑌
И в конечном счете получили следующие значения коэффициента 𝜃 :
-0.02840971 - это 𝜃0 . Это свободный член (коэффициент), который определяет цену
офиса в случае, если все объясняющие переменные равны нулю. (Однако, факторы по
своему экономическому содержанию часто не могут принимать нулевых значений, и
значение свободного члена не имеет экономического смысла.);
0.05072572 - коэффициент влияния общей площади на стоимость квартиры (т.е.
1 кв.м общей площади);
12.54065426 - коэффициент влияния количества офисов в офисном здании на
оценочную цену. Большая величина коэффициента означает, что этот параметр сильно
влияет на оценочную цену
1.24643968 – коэффициент влияния количества входов в офисном здании на
оценочную цену.
- 0.25014782 – коэффициент влияния времени эксплуатации офисного здания.
Коэффициент получился отрицательным, что означает следующее: чем дольше
используется здание, тем ниже его оценочная цена
Найденное нами решение (вектор параметров 𝜃 ) позволяет осуществлять прогноз
значений зависимого признака по известным значениям независимых признаков.
Спрогнозируем с помощью названных коэффициентов значения оценочной цены 3х офисных зданий при заданных значениях исходных данных:
Введем данные первого офиса.
Общая площадь в квадратных метрах: 2530
Количество офисов: 6
Количество входов: 3
Время эксплуатации здания в годах: 35
Теперь оценим стоимость офиса при помощи найденных коэффициентов 𝜃 . В итоге
получим: 198 535 рублей.
Введем данные второго офиса.
Общая площадь в квадратных метрах: 2540
Количество офисов: 2
Количество входов: 6
Время эксплуатации здания в годах: 20
Теперь оценим стоимость нашего офиса при помощи найденных коэффициентов 𝜃 .
В итоге получим: 156 371 рублей.
Для примера, возьмем данные еще одного офисного помещения.
Общая площадь в квадратных метрах: 2550
Количество офисов: 1
Количество входов: 1
Время эксплуатации здания в годах: 25
Оценим стоимость нашего офиса при помощи найденных коэффициентов 𝜃 . В итоге
получим: 136 855 рублей
Из полученных данных можно сделать вывод о том, что в зависимости от количества
офисов, оценочная цена может, как возрастать, так и понижаться. Таким образом,
количество офисов, как одна из характеристик офисных помещений, влияет на цену,
которая в данном случае является зависимой величиной.
В нашем примере во втором случае стоимость офисных помещений снизилась на
42164 рублей, потому что количество офисов поменялась с 6-ти до 2-х.
Как видим, чем меньше количество офисов, тем меньше цена, соответственно.
Поэтому, во втором случае, при меньшем количестве офисов почти в три раза цена
снизилась на 42164 рублей.
Из полученных результатов можно сделать вывод о том, что взятые мной
характеристики очень сильно влияют на цену офисных помещений (зависимую величину).
А рассчитать ориентировочную стоимость любых офисных помещений с известными
значениями указанных выше характеристик нам помогает найденные мной вектор
параметров 𝜃 .
Download