Многофакторный регрессионный анализ Рассмотрим решение задачи множественной линейной регрессии на примере данных (данные взяты из: http://ieu.udsu.ru/moodle/pluginfile.php/467/md_resource/content/1/l3.htm) о стоимости небольших офисных зданий с различными характеристиками (общая площадь в квадратных метрах, количество офисов, количество входов («1.5»- означает вход только для доставки корреспонденции), время эксплуатации здания в годах, оценочная цена здания под офис). Таким образом, в матрице А, в которой содержатся характеристики офисных помещений и их оценочная цена имеет следующий вид: Далее с помощью статистического пакета R нашли коэффициенты линейной регрессии. Для этого применили формулу: 𝜃̂ = (ХТ Х)−1 ХТ 𝑌 И в конечном счете получили следующие значения коэффициента 𝜃 : -0.02840971 - это 𝜃0 . Это свободный член (коэффициент), который определяет цену офиса в случае, если все объясняющие переменные равны нулю. (Однако, факторы по своему экономическому содержанию часто не могут принимать нулевых значений, и значение свободного члена не имеет экономического смысла.); 0.05072572 - коэффициент влияния общей площади на стоимость квартиры (т.е. 1 кв.м общей площади); 12.54065426 - коэффициент влияния количества офисов в офисном здании на оценочную цену. Большая величина коэффициента означает, что этот параметр сильно влияет на оценочную цену 1.24643968 – коэффициент влияния количества входов в офисном здании на оценочную цену. - 0.25014782 – коэффициент влияния времени эксплуатации офисного здания. Коэффициент получился отрицательным, что означает следующее: чем дольше используется здание, тем ниже его оценочная цена Найденное нами решение (вектор параметров 𝜃 ) позволяет осуществлять прогноз значений зависимого признака по известным значениям независимых признаков. Спрогнозируем с помощью названных коэффициентов значения оценочной цены 3х офисных зданий при заданных значениях исходных данных: Введем данные первого офиса. Общая площадь в квадратных метрах: 2530 Количество офисов: 6 Количество входов: 3 Время эксплуатации здания в годах: 35 Теперь оценим стоимость офиса при помощи найденных коэффициентов 𝜃 . В итоге получим: 198 535 рублей. Введем данные второго офиса. Общая площадь в квадратных метрах: 2540 Количество офисов: 2 Количество входов: 6 Время эксплуатации здания в годах: 20 Теперь оценим стоимость нашего офиса при помощи найденных коэффициентов 𝜃 . В итоге получим: 156 371 рублей. Для примера, возьмем данные еще одного офисного помещения. Общая площадь в квадратных метрах: 2550 Количество офисов: 1 Количество входов: 1 Время эксплуатации здания в годах: 25 Оценим стоимость нашего офиса при помощи найденных коэффициентов 𝜃 . В итоге получим: 136 855 рублей Из полученных данных можно сделать вывод о том, что в зависимости от количества офисов, оценочная цена может, как возрастать, так и понижаться. Таким образом, количество офисов, как одна из характеристик офисных помещений, влияет на цену, которая в данном случае является зависимой величиной. В нашем примере во втором случае стоимость офисных помещений снизилась на 42164 рублей, потому что количество офисов поменялась с 6-ти до 2-х. Как видим, чем меньше количество офисов, тем меньше цена, соответственно. Поэтому, во втором случае, при меньшем количестве офисов почти в три раза цена снизилась на 42164 рублей. Из полученных результатов можно сделать вывод о том, что взятые мной характеристики очень сильно влияют на цену офисных помещений (зависимую величину). А рассчитать ориентировочную стоимость любых офисных помещений с известными значениями указанных выше характеристик нам помогает найденные мной вектор параметров 𝜃 .