Факторный анализ Подготовили: Смирнов Евгений, 626 Моисеенко Анна, 627 Сущность • Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. • Факторные признаки (независимые) – те признаки, которые характеризуют причину. • Результативные признаки (зависимые) – те признаки, которые характеризуют следствие. • Факторная система – совокупность факторных и результативных признаков, которые находятся в одной причинно-следственной связи. • Модель факторной системы: Y=f(x1, x2, x3, …, xn) 2 Цели Определить взаимосвязи между переменными Сокращение числа переменных, необходимых для описания 3 Виды связей • Функциональная связь – эта такая связь, при которой каждому значению фактора (факторного признака) соответствует вполне определённое неслучайное значение обобщенного показателя (результативного признака). • Стохастическая связь – такая связь, при которой каждому значению фактора (факторного признака) соответствует множество значений обобщенного показателя (результативного признака). 4 Методы Детерминированный ФА Стохастический ФА Метод цепных подстановок Корреляционный метод Метод абсолютных и относительных разниц Регрессионный метод Балансовый метод Дисперсионный метод 5 Индексный метод Метод кластерного анализа Типы факторного анализа ФА По порядку По периодам По ступеням По состоянию Прямой Ретроспективный Одноступенчатый Статический Обратный Перспективный Многоступенчатый Динамический 6 Условия применения факторного анализа • Все признаки должны быть количественными. • Число наблюдений должно быть не менее чем в два раза больше числа переменных. • Выборка должна быть однородна. • Исходные переменные должны быть распределены симметрично. • Факторный анализ осуществляется по коррелирующим переменным. 7 Психология Политологи я Социология Сферы применения Нейрофизио логия Экономика Статистика 8 Пример Общий фонд отработанного времени зависит от нескольких факторов. Данную зависимость можно представить в виде формулы: ФРВ = Ч*Д*П 9 Метод цепных подстановок • Цель: определить влияние отдельных факторов на изменение величины результативного показателя путем постепенной замены базисной величины каждого факторного показателя в объеме результативного показателя на фактическую в отчетном периоде. 10 Расчет 11 Метод абсолютных разниц • Величина влияния факторов рассчитывается умножением абсолютного прироста на базовую величину факторов, которые находятся справа от него, и на фактическую величину факторов, которые расположены слева от него в модели. Влияние численности работающих: ∆ФРВ4=(Чф-Чпл)*Дпл*Ппл=(9001000)*250*8=-200 тыс. ч/г. Влияние отработанных человеко-дней: ∆ФРВд=Чф*(Дф-Дпл)*Ппл=900*(260250)*8=+72 тыс. ч/г Влияние продолжительности рабочего дня: ∆ФРВп= Чф*Дф*(Пф-Ппл)=900*260*(7,8-8)=-46,8 тыс. ч/г ≈47 12 Метод относительных разниц • Для расчета влияния первого фактора необходимо базисную величину результативного показателя умножить на относительный прирост первого фактора. • Для расчета влияния 2-го фактора, нужно к плановой величине результативного показателя прибавить изменение его за счет первого фактора и затем полученную сумму умножить на относительный прирост второго. 13 Этапы стохастического моделирования • Этап 1 – Качественный анализ • Этап 2 – Предварительный анализ моделируемой совокупности • Этап 3 – Построение регрессионной модели • Этап 4 – Оценка адекватности модели • Этап 5 – Интерпретация и практическое использование модели 14 Корреляционный анализ Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Целью корреляционного анализа является оценка тесноты связи между признаками. Теснота связи количественно выражается величиной коэффициентов корреляции. 15 Практическая реализация корреляционного анализа включает следующие этапы: • 1) постановка задачи и выбор признаков; • 2) сбор информации и ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерного распределения); • 3) предварительная характеристика взаимосвязей (аналитические группировки, графики); • 4) устранение мультиколлинеарности (взаимозависимости факторов) и уточнение набора показателей путем расчета парных коэффициентов корреляции; • 5) исследование факторной зависимости и проверка ее значимости; • 6) оценка результатов анализа и подготовка рекомендаций по их практическому использованию. 16 Корреляционный анализ: 1. Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными). 2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков. 3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование. 17 Виды корреляционных связей: • По форме корреляционная связь может быть прямолинейной или криволинейной. • По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). • По силе корреляционная связь определяется шкалой Чеддока 18 Формула коэффициента корреляции при линейной зависимости 19 Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 — являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 — следовательно произошла ошибка в вычислениях. 20 Положительная корреляция 21 Отсутствие корреляции 22 Отрицательная корреляция 23 Шкала Чеддока 24 Регрессионный анализ • Регрессионный анализ — это количественный метод определения вида математической функции в причинноследственной зависимости между переменными величинами. • Целью регрессионного анализа является установление формы зависимости. 25 Виды регрессий Линейная регрессия: у=а+bх Регрессии, нелинейные по объясняющим переменным: 1) полиномы разных степеней у=а+b1х+b2х2+…; 2) равносторонняя гипербола у=а+b/х. Регрессии, нелинейные по оцениваемым параметрам: 1) степенная у=ахb; 2) показательная у=аbх; 3) экспоненциальная у=еа+bх. 26 Оценки параметров a и b находятся по формулам: 27 28 29 aиb Формально a – значение y при x =0. Если признак-фактор x не может иметь нулевого значения, то вышеуказанная трактовка свободного члена a не имеет смысла, т.е. параметр a может не иметь экономического содержания. Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. 30 Коэффициент детерминации 31 Пример: 32 Решение: 33 Решение: 34 Кластерный анализ Кластерный анализ представляет собой класс методов, используемых для классификации объектов или событий в относительно однородные группы, которые называют кластерами (clusters). 35 Кластерный анализ Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах. Кластерный анализ также называют классификационным анализом (classification analysis) или численной таксономией (систематикой) (numerical taxonomy). 36 Идеальная ситуация кластеризации 37 38 Дисперсионный анализ • Дисперсионный анализ – это статистический метод, позволяющий подтвердить или опровергнуть гипотезу о том, что две выборки данных относятся к одной генеральной совокупности. Например, применительно к анализу деятельности предприятия можно сказать, что дисперсионный анализ позволяет определить, к одной и той же совокупности данных или нет относятся группы разных наблюдений. 39 Спасибо за внимание 40