Лекция 14 Факторный анализ

advertisement
Содержание
Назначение факторного анализа и его отличие от
дисперсионного анализа и множественной регрессии. Стадии
факторного анализа: формулирование проблемы, построение
корреляционной матрицы, выбор метода, определение ряда
факторов, их вращение и интерпретация.
Метод главных компонент и метод общих факторов. Оценка
степени соответствия модели исходным данным. Применение
SPSS для факторного анализа.
© Иванов О.В. 2007
2
В этом виде анализа надо уметь:
1. Объяснять назначение факторного анализа и его отличие от
дисперсионного анализа и множественной регрессии.
2. Проводить факторный анализ: формулирование проблемы,
построение корреляционной матрицы, выбор метода,
определение ряда факторов, их вращение и интепретацию.
3. Понимать различие между методом главных компонент и
методом общих факторов.
4. Оценивать степень соответствия модели исходным данным.
© Иванов О.В. 2007
3
20 ÄÔÂθ
2011
Факторный анализ
Факторный анализ (factor analysis) представляет собой группу
методов, используемых для сокращения числа переменных и их
обобщения.
Фактор (factor) – латентная переменная, конструируемая таким
образом, чтобы можно было объяснить корреляцию между
набором имеющихся переменных.
© Иванов О.В. 2007
5
Схема модели факторного анализа
Общие
факторы
F1
F2
Fm
Переменные
X1
X2
X3
X4
X5
Xk
Уникальные
факторы
U1
U2
U3
U4
U5
Uk
© Иванов О.В. 2007
6
Модель факторного анализа
Каждая переменная выражается как линейная комбинация
латентных факторов:
X i = ai1F1 + ai2 F2 + ...+ aim Fm + U i
И наоборот, латентные факторы также можно выразить
линейными комбинациями наблюдаемых переменных:
€
Fi = bi1 X1 + bi2 X 2 + ...+ bik X k
© Иванов О.В. 2007
€
7
Статистики
Корреляционная матрица
Общность
Собственное значение
Факторные нагрузки
Матрица факторных нагрузок
Значения фактора
Остатки
«Каменистая осыпь»
© Иванов О.В. 2007
Correlation Matrix
Communality
Eigen Value
Factor Loadings
Factor Matrix
Factor Scores
Residuals
Scree Plot
8
20 ÄÔÂθ
2011
Стадии факторного анализа
Постановка проблемы
Построение корреляционной матрицы
Выбор метода факторного анализа
Определение числа факторов
Вращение факторов
Интерпретация факторов
Вычисление значений факторов
Отбор переменных-имитаторов
Оценка качества модели
© Иванов О.В. 2007
10
Я предпочитаю остаться дома, чем пойти на вечеринку
Я всегда смотрю на цены перед покупкой
Магазины меня интересуют больше, чем кинотеатр
Я не покупаю товары, которые активно рекламируют
Я – домосед
Я часто пользуюсь дисконтными картами
Компании напрасно тратят деньги на рекламу
Согласен
Данные наблюдений будут получены при
помощи анкетного опроса:
Не согласен
Постановка проблемы
√
√
√
√
√
√
√
Требуется выявить латентные факторы.
© Иванов О.В. 2007
11
Команда Data Reduction → Factor…
Результаты опроса
© Иванов О.В. 2007
12
Корреляционная матрица
Корреляционная матрица - матрица корреляций между всеми
возможными парами переменных.
Относительно высокое значение корреляции для переменных
V1-V3-V5, V2-V6, V4-V7.
© Иванов О.В. 2007
13
Проверка целесообразности
Целесообразность
выполнения
факторного
анализа
определяется наличием корреляций между переменными.
Критерий сферичности Бартлетта (Bartlett’s Test of Sphericity)
проверяет нулевую гипотезу об отсутствии корреляций между
переменными в генеральной совокупности.
Критерий адекватности выборки Кайзера-Мейера-Олкина
(Kaiser-Meyer-Olkin Measure of Sampling Adequacy) позволяет
проверить, насколько корреляцию между парами переменных
можно объяснить другими переменными (факторами).
© Иванов О.В. 2007
14
Проверка целесообразности
Нулевую гипотезу о том, что корреляционная матрица является единичной,
отклоняем в соответствии с критерием сферичности Бартлетта.
Приближенное значение статистики равно 57,994 с 21 степенью свободы, она
является значимой на уровне 0,05. Значение статистики КМО (0,550)
большое (>0,5).
Вывод: факторный анализ является приемлемым методом для анализа
корреляционной матрицы.
© Иванов О.В. 2007
15
Выбор метода факторного анализа
Методы факторного анализа различают в зависимости от
подходов для нахождения коэффициентов значения факторов.
Методы в SPSS
•  Метод главных компонент.
•  Метод невзвешенных
наименьших квадратов.
•  Обобщенный метод
наименьших квадратов.
•  Метод максимального
правдоподобия.
•  Альфа-факторный метод.
•  Метод распознавания
образов.
© Иванов О.В. 2007
16
Метод главных компонент
Анализ главных компонент (Principal Components Analysis)
основан на определении минимального числа факторов,
которые вносят наибольший вклад в дисперсию данных. Они
называются главными компонентами.
После анализа главных
многомерное шкалирование.
© Иванов О.В. 2007
компонент
удобно
применять
17
Общности (Communalities)
Таблица показывает, какую часть дисперсии каждой из включенных в анализ
переменных объясняет предлагаемая факторная модель. Например, V6
(дисконтные карты) на 84% объясняется предложенной моделью. Если
значение Extraction (Выделенные общности) невелико, переменную следует
исключить из анализа. Initial (Исходные общности) равны единице, это
диагональ корреляционной матрицы.
© Иванов О.В. 2007
18
Общая дисперсия, объясненная моделью
Первая главная компонента объясняет 35,5% общей дисперсии, вторая
26,0%. Всего в модели отобрано три фактора, которые объясняют 80,6%
общей дисперсии.
© Иванов О.В. 2007
19
Определение числа факторов
Наиболее употребим метод «каменистой осыпи».
© Иванов О.В. 2007
20
Задание числа факторов
В меню следует выбрать, будет ли число факторов определено через
значения
собственных
чисел,
либо
непосредственно
задано
исследователем.
© Иванов О.В. 2007
21
Матрица факторных нагрузок
Служит для интерпретации полученных факторов.
Первый фактор имеет высокие корреляции с V1, V3, V5. «Поведение в семье».
Второй фактор имеет высокие корреляции с V2, V6. «Поведение при покупке».
Третий фактор имеет высокие корреляции с V4, V7. «Отношение к рекламе».
© Иванов О.В. 2007
22
Диаграмма факторных нагрузок
© Иванов О.В. 2007
23
Матрица факторных нагрузок после вращения
После вращения матрица факторных нагрузок становится более удобной.
Все нагрузки становятся либо большими, либо маленькими, что упрощает
интерпретацию. Применен метод VARIMAX (вращение, максимизирующее
дисперсию).
© Иванов О.В. 2007
24
Диаграмма после вращения факторов
© Иванов О.В. 2007
25
Матрица коэффициентов значения факторов
Значения фактора (Factor Scores) – суммарное значение фактора,
полученное для каждого респондента на основании измерений.
© Иванов О.В. 2007
26
Выбор переменных-заменителей
Переменные-заменители (Surrogate Variables) выбираются из
исходных переменных для последующего анализа.
Это позволяет проводить анализ с точки зрения исходных
переменных, а не значения факторов. Наиболее приемлемо,
если одна из факторных нагрузок значительно выше остальных.
© Иванов О.В. 2007
27
Оценка качества модели
© Иванов О.В. 2007
28
20 ÄÔÂθ
2011
Вопросы анкеты
Какими характеристиками должен обладать ведущий выпуска новостей.
а.
приятный
б.
знающий
в. непривлекательный
г.
умный
д.
не похожий на вас
е. хорошо выглядящий
ж.
увлекающий
з.
уверенный
и.
дружелюбный
к. не умеющий убеждать
л.
неопытный
м.
некрасивый
н.
легко узнаваемый
о.
компетентный
п.
активный
р.
раздражающий
с.
ненадежный
т.
скучный
у.
неискренний
© Иванов О.В. 2007
неприятный
знающий мало
привлекательный
неумный
похожий на вас
плохо выглядящий
не увлекающий
неуверенный
недружелюбный
умеющий убеждать
опытный
красивый
с трудом узнаваемый
некомпетентный
пассивный
не раздражающий
надежный
интересный
искренний
30
Проверка целесообразности
Проинтерпретируйте полученные величины и сделайте вывод о возможности
проведения факторного анализа.
© Иванов О.В. 2007
31
Общая дисперсия, объясненная моделью
© Иванов О.В. 2007
32
Матрица факторных нагрузок
© Иванов О.В. 2007
33
Матрица факторных нагрузок после вращения
© Иванов О.В. 2007
34
Сколько факторов следует выбрать
© Иванов О.В. 2007
35
Исключение некоторых общностей
© Иванов О.В. 2007
36
Матрица нагрузок после исключения
© Иванов О.В. 2007
37
Download