Содержание Назначение факторного анализа и его отличие от дисперсионного анализа и множественной регрессии. Стадии факторного анализа: формулирование проблемы, построение корреляционной матрицы, выбор метода, определение ряда факторов, их вращение и интерпретация. Метод главных компонент и метод общих факторов. Оценка степени соответствия модели исходным данным. Применение SPSS для факторного анализа. © Иванов О.В. 2007 2 В этом виде анализа надо уметь: 1. Объяснять назначение факторного анализа и его отличие от дисперсионного анализа и множественной регрессии. 2. Проводить факторный анализ: формулирование проблемы, построение корреляционной матрицы, выбор метода, определение ряда факторов, их вращение и интепретацию. 3. Понимать различие между методом главных компонент и методом общих факторов. 4. Оценивать степень соответствия модели исходным данным. © Иванов О.В. 2007 3 20 ÄÔÂθ 2011 Факторный анализ Факторный анализ (factor analysis) представляет собой группу методов, используемых для сокращения числа переменных и их обобщения. Фактор (factor) – латентная переменная, конструируемая таким образом, чтобы можно было объяснить корреляцию между набором имеющихся переменных. © Иванов О.В. 2007 5 Схема модели факторного анализа Общие факторы F1 F2 Fm Переменные X1 X2 X3 X4 X5 Xk Уникальные факторы U1 U2 U3 U4 U5 Uk © Иванов О.В. 2007 6 Модель факторного анализа Каждая переменная выражается как линейная комбинация латентных факторов: X i = ai1F1 + ai2 F2 + ...+ aim Fm + U i И наоборот, латентные факторы также можно выразить линейными комбинациями наблюдаемых переменных: € Fi = bi1 X1 + bi2 X 2 + ...+ bik X k © Иванов О.В. 2007 € 7 Статистики Корреляционная матрица Общность Собственное значение Факторные нагрузки Матрица факторных нагрузок Значения фактора Остатки «Каменистая осыпь» © Иванов О.В. 2007 Correlation Matrix Communality Eigen Value Factor Loadings Factor Matrix Factor Scores Residuals Scree Plot 8 20 ÄÔÂθ 2011 Стадии факторного анализа Постановка проблемы Построение корреляционной матрицы Выбор метода факторного анализа Определение числа факторов Вращение факторов Интерпретация факторов Вычисление значений факторов Отбор переменных-имитаторов Оценка качества модели © Иванов О.В. 2007 10 Я предпочитаю остаться дома, чем пойти на вечеринку Я всегда смотрю на цены перед покупкой Магазины меня интересуют больше, чем кинотеатр Я не покупаю товары, которые активно рекламируют Я – домосед Я часто пользуюсь дисконтными картами Компании напрасно тратят деньги на рекламу Согласен Данные наблюдений будут получены при помощи анкетного опроса: Не согласен Постановка проблемы √ √ √ √ √ √ √ Требуется выявить латентные факторы. © Иванов О.В. 2007 11 Команда Data Reduction → Factor… Результаты опроса © Иванов О.В. 2007 12 Корреляционная матрица Корреляционная матрица - матрица корреляций между всеми возможными парами переменных. Относительно высокое значение корреляции для переменных V1-V3-V5, V2-V6, V4-V7. © Иванов О.В. 2007 13 Проверка целесообразности Целесообразность выполнения факторного анализа определяется наличием корреляций между переменными. Критерий сферичности Бартлетта (Bartlett’s Test of Sphericity) проверяет нулевую гипотезу об отсутствии корреляций между переменными в генеральной совокупности. Критерий адекватности выборки Кайзера-Мейера-Олкина (Kaiser-Meyer-Olkin Measure of Sampling Adequacy) позволяет проверить, насколько корреляцию между парами переменных можно объяснить другими переменными (факторами). © Иванов О.В. 2007 14 Проверка целесообразности Нулевую гипотезу о том, что корреляционная матрица является единичной, отклоняем в соответствии с критерием сферичности Бартлетта. Приближенное значение статистики равно 57,994 с 21 степенью свободы, она является значимой на уровне 0,05. Значение статистики КМО (0,550) большое (>0,5). Вывод: факторный анализ является приемлемым методом для анализа корреляционной матрицы. © Иванов О.В. 2007 15 Выбор метода факторного анализа Методы факторного анализа различают в зависимости от подходов для нахождения коэффициентов значения факторов. Методы в SPSS • Метод главных компонент. • Метод невзвешенных наименьших квадратов. • Обобщенный метод наименьших квадратов. • Метод максимального правдоподобия. • Альфа-факторный метод. • Метод распознавания образов. © Иванов О.В. 2007 16 Метод главных компонент Анализ главных компонент (Principal Components Analysis) основан на определении минимального числа факторов, которые вносят наибольший вклад в дисперсию данных. Они называются главными компонентами. После анализа главных многомерное шкалирование. © Иванов О.В. 2007 компонент удобно применять 17 Общности (Communalities) Таблица показывает, какую часть дисперсии каждой из включенных в анализ переменных объясняет предлагаемая факторная модель. Например, V6 (дисконтные карты) на 84% объясняется предложенной моделью. Если значение Extraction (Выделенные общности) невелико, переменную следует исключить из анализа. Initial (Исходные общности) равны единице, это диагональ корреляционной матрицы. © Иванов О.В. 2007 18 Общая дисперсия, объясненная моделью Первая главная компонента объясняет 35,5% общей дисперсии, вторая 26,0%. Всего в модели отобрано три фактора, которые объясняют 80,6% общей дисперсии. © Иванов О.В. 2007 19 Определение числа факторов Наиболее употребим метод «каменистой осыпи». © Иванов О.В. 2007 20 Задание числа факторов В меню следует выбрать, будет ли число факторов определено через значения собственных чисел, либо непосредственно задано исследователем. © Иванов О.В. 2007 21 Матрица факторных нагрузок Служит для интерпретации полученных факторов. Первый фактор имеет высокие корреляции с V1, V3, V5. «Поведение в семье». Второй фактор имеет высокие корреляции с V2, V6. «Поведение при покупке». Третий фактор имеет высокие корреляции с V4, V7. «Отношение к рекламе». © Иванов О.В. 2007 22 Диаграмма факторных нагрузок © Иванов О.В. 2007 23 Матрица факторных нагрузок после вращения После вращения матрица факторных нагрузок становится более удобной. Все нагрузки становятся либо большими, либо маленькими, что упрощает интерпретацию. Применен метод VARIMAX (вращение, максимизирующее дисперсию). © Иванов О.В. 2007 24 Диаграмма после вращения факторов © Иванов О.В. 2007 25 Матрица коэффициентов значения факторов Значения фактора (Factor Scores) – суммарное значение фактора, полученное для каждого респондента на основании измерений. © Иванов О.В. 2007 26 Выбор переменных-заменителей Переменные-заменители (Surrogate Variables) выбираются из исходных переменных для последующего анализа. Это позволяет проводить анализ с точки зрения исходных переменных, а не значения факторов. Наиболее приемлемо, если одна из факторных нагрузок значительно выше остальных. © Иванов О.В. 2007 27 Оценка качества модели © Иванов О.В. 2007 28 20 ÄÔÂθ 2011 Вопросы анкеты Какими характеристиками должен обладать ведущий выпуска новостей. а. приятный б. знающий в. непривлекательный г. умный д. не похожий на вас е. хорошо выглядящий ж. увлекающий з. уверенный и. дружелюбный к. не умеющий убеждать л. неопытный м. некрасивый н. легко узнаваемый о. компетентный п. активный р. раздражающий с. ненадежный т. скучный у. неискренний © Иванов О.В. 2007 неприятный знающий мало привлекательный неумный похожий на вас плохо выглядящий не увлекающий неуверенный недружелюбный умеющий убеждать опытный красивый с трудом узнаваемый некомпетентный пассивный не раздражающий надежный интересный искренний 30 Проверка целесообразности Проинтерпретируйте полученные величины и сделайте вывод о возможности проведения факторного анализа. © Иванов О.В. 2007 31 Общая дисперсия, объясненная моделью © Иванов О.В. 2007 32 Матрица факторных нагрузок © Иванов О.В. 2007 33 Матрица факторных нагрузок после вращения © Иванов О.В. 2007 34 Сколько факторов следует выбрать © Иванов О.В. 2007 35 Исключение некоторых общностей © Иванов О.В. 2007 36 Матрица нагрузок после исключения © Иванов О.В. 2007 37