Факторный анализ. Алгоритм. Алгоритм 0 Оформление множества полученных данных в форме таблицы вида n x m: Респонденты/ Параметры оценки/ переменные / оцениваемые шкалы ~ оси исходного базиса объекты объем e1 (x) …(y) em выборки 1 … n 1 Центрирование выборочных значений (по каждой переменной в отдельности). n xi xi x , где x x i 1 n i , x - среднее арифметическое, x - сумма всех значений переменной x с 1 по n, n – объем выборки i 1 i 1 2 Стандартизация выборочных значений (по каждой переменной в отдельности). n n x 2 i i 1 xi , где S x D x , S x - стандартное отклонение2, Dx - дисперсия3, n 1 - количество степеней свободы4 n 1 Sx 3 Нахождение попарных корреляций между переменными5 xi n xy x y i 1 i n 1 i n x y i 1 i i (n 1) S x S y Rxy (n 1) S x S y , где Rxy – ковариация между переменными x, y. Переменная – качество или характеристика объекта, подлежащая измерению (например, рост человека). Показатель – мера оценки переменной, результат применения процедуры измерения к объекту (например, для роста: 1. количество сантиметров в вертикально стоящей фигуре от подошвы до макушки, 2. количество прыжков лягушки от подошвы до конца тени, отбрасываемой человеком в четыре часа дня в день весеннего равноденствия). В тексте могут употребляться как синонимы. 2 Отклонение от выборочного среднего (см. формулу). Вычисляется как квадратный корень из дисперсии. 3 Мера вариативности (изменчивости) выборочных значений, то есть мера сходства результатов множества измерений между собой относительно среднего значения. 4 Количество независимых выборочных значений. 5 Этапы 1,2 можно совместить с вычислением коэффициентов корреляций (они входят в полную формулу ρxy). 1 1 и запись их в виде матрицы корреляций (Аe): e1e1 ... ene1 ... e1en ... ... ... enen Содержание матрицы корреляций является обобщенным описанием имеющегося множества точек. Если рассматривать коэффициенты корреляций как показатель угла между векторами-переменными (cosα), можно представить себе пространство, отличное от заданного процедурой измерения (с ортогональными векторами-переменными). В «новом» пространстве векторы-переменные, измеряющие одно и то же, или очень близкие аспекты одного явления, или два субъективно сходных объекта, будут «расти пучком» (пространственная аналогия: часовая и минутная стрелки в 01:06 или 14:15, например) или, наоборот, в противоположных направлениях (12:30, 15:40), а оценки разных явлений, не имеющих отношения друг к другу, сохранят ортогональность. 4 Нахождение собственных значений: поиск решений характеристического уравнения матрицы (Ае- λЕ) - det(Aе-λЕ)=0: e1e1 ... en e1 5 6 7 8 ... e e i i ... ... en en e e 1 n Найденные собственные значения (λ1- λn) упорядочиваются от большего к меньшему. Собственные значения соответствуют дисперсии выборочных значений по векторам-факторам (собственные векторы). Нулевые собственные значения говорят о том, что размерность пространства меньше, чем количество переменных. Собственные значения, близкие к нулевым, позволяют снизить размерность пространства (основная задача ФА) с минимальной потерей информации, убрав измерения соответствующих собственных векторов, т.е. через проекцию всего множества точек в пространство оставшихся собственных векторов. а) Нахождение собственных векторов: ненулевые решения системы уравнений для каждого собственного значения (Ае- λЕ)v=0, б) нормирование собственных векторов (делением каждой координаты вектора на его длину; длина вектора – квадратный корень из суммы квадратов его координат). Матрица перехода С. Факторные нагрузки – вклад фактора в дисперсию по переменным: каждый столбец матрицы перехода (собственный вектор = координаты фактора Fi в старом базисе) домножаются на корень из соответствующего собственного значения. Таким образом, производится стандартизация факторов. (аналогия с длиной: при переходе от сантиметров к метрам единица измерения увеличивается в 100 раз) Факторные значения – координаты точек в новом базисе: координаты каждой точки (результаты испытуемого по всем переменным) переводятся в новый базис через транспонированную матрицу перехода (до транспонирования в м-це С каждый вектор-столбец должен быть разделен на корень из соответствующего собственного значения). Этот этап сочетает в себе как перевод точек в новые координаты, так и их стандартизацию по факторам. (продолжение аналогии: при измерении в новых единицах оценка длины предмета уменьшается в 100 раз) Интерпретация полученной факторной структуры. 2