Загрузил Настя Шерстобитова

Лекции по компьютерной психодиагностике

реклама
Лекции по компьютерной психодиагностике
Факторный анализ
Возник в психометрике. Помимо психологии используется во многих
направлениях. Основные идеи заложены Ф. Гальтоном.
Факторный анализ - многомерный метод, применяемый для изучения
взаимосвязей между значениями переменных.
Главная цель факторного анализа - уменьшение размерности исходных
данных.
Результатом является переход от множества исходных переменных к
меньшему количеству факторов. Фактор интерпретируется как причина
совместной изменчивости нескольких исходных переменных. Изменяются
факторы – изменяются показатели.
Основное назначение - анализ корреляций множества признаков.
Основные понятия:
o Фактор
o Нагрузка
Фактор
-
скрытая
переменная,
искусственный
статистический
показатель, возникающий в результате специальных преобразований внутри
расчетов, в итоге получается таблица коэффициентов корреляции между
изучаемыми признаками.
Нагрузка - аналоги коэффициентов корреляции, показывают степень
взаимосвязи переменных и факторов:
Нужно выделить факторы, которые больше 0,4.
Чем больше абсолютная величина факторной нагрузки, тем сильнее
связь переменной с фактором, тем больше данная переменная обусловлена
действием соответствующего фактора.
Каждый фактор идентифицируется по тем переменным, с которыми он
в наибольшей степени связан, то есть по переменным, имеющим по этому
фактору наибольшие нагрузки.
Чтобы интерпретировать фактор, исследователь пытается найти
глубинное измерение, объединяющее группу переменных, имеющих по нему
высокие нагрузки. Чем больше нагрузка, тем с большей уверенностью можно
считать, что переменная определяет фактор.
Комри и Ли предполагают, что нагрузки, превышающие
o 0.71 (объясняет 50% дисперсии), - превосходные
o 0.63 (40% дисперсии) - очень хорошие
o 0.55 (30%) - хорошие
o 0.45 (20%) - удовлетворительные
o 0.32 (объясняет 10% дисперсии) - слабые
Условия проведения:
o Нельзя
факторизовать
качественные данные,
полученные
по
шкале
наименований, например, цвет волос, глаз и т.д.;
o Все признаки должны быть количественными;
o Число наблюдений должно быть не менее чем в два раза больше числа
переменных (10 переменных – 20 испытуемых минимум);
o Факторный анализ осуществляется по коррелирующим переменным, т.е. до
факторного анализа надо провести корреляционный анализ и выбросить
факторы, которые не коррелируют ни с одной переменной
o Все переменные должны быть независимым, а их распределение должно
приближаться
к
нормальному
(провести
проверку на
нормальность
распределения).
o В исходной корреляционной матрице должно быть несколько корреляций по
модулю выше 0,3.
o Выборка должна быть достаточно большой (желательно 100).
Выбор количества факторов для вычисления нагрузок
Должны определяться математически.
Один из методов - анализ «следа» (гистограмма собственных
значений). Факторы в возрастающем порядке по номеру расположены по
абсциссе. Обычно на графике виден излом между крутым наклоном первых
факторов и постепенным убыванием остальных. Процедура определения
количества факторов заключается в поиске на графике точки, где линия
меняет крутизну и приобретает почти горизонтальное положение. На
примере выделяются четыре фактора.
Нельзя выкидывать переменные просто так, это нарушает целостность
анализа и мы можем потерять дополнительную информацию для
исследования.
Кластерный анализ в психологии
Ввел Тгуоп в 1939. Широкое распространение - после массового
внедрения компьютеров, с 80-х годов.
Кластерный анализ - многомерный метод статистической обработки
данных, применяемый для классификации объектов, т.е. разделения их на
группы или классы, таким образом, что объекты в каждой группе больше
похожи друг на друга, чем на объекты из других классов. Объекты
объединяются по схожести.
Задачи:
o Разработка типологии или классификации, диагностических методик.
o Исследование схем группирования объектов.
o Проверка гипотез или исследования для определения, действительно ли
типы (группы) присутствуют в имеющихся данных.
Группы, выделенные по результатам кластерного анализа, называют
кластерами.
Кластер - объединение нескольких однородных элементов, которое
может
рассматриваться
как
самостоятельная
единица,
обладающая
определенными свойствами. Мы говорим, что переменные схожи.
Графическое
представление
-
в
виде
дерева
иерархической
кластеризации. По оси X классифицируемые объекты (на одинаковом
расстоянии друг от друга); по оси Y - расстояния, на основании которых
происходит объединение объектов в кластеры.
На
первых
этапах
объединяются
наиболее
близкие
объекты,
находящиеся на одном уровне сходства. Затем поочередно присоединяются
остальные объекты, пока они не объединятся в один кластер.
Наиболее типичные методы:
o Метод одиночной связи
o Метод полной связи
o Метод средней связи
Регрессионный анализ
Ввел Ф. Гальтон, установивший факт определенного соотношения
между ростом родителей и их взрослых детей: он заметил, что у родителей
самого низкого роста дети оказывались несколько выше, а у родителей
самого высокого роста - ниже. Это он назвал регрессией.
Регрессионный анализ - статистический метод, позволяющий изучать
зависимость значения среднего некоей величины от вариации другой
величины или нескольких величин. Показывает, на сколько среднее какой-то
переменной меняется в зависимости от того, как меняется другая переменная
или группа переменных.
Назначение:
1. Для изучения взаимосвязи одной переменной (зависимой) и
нескольких других переменных (независимых, исходных).
Зависимая переменная (у) — это переменная, описывающая процесс,
который вы пытаетесь предсказать или понять
Независимые переменные (X) — это переменные, используемые для
моделирования или прогнозирования значений зависимых переменных.
2. Для предсказания результата по ряду предварительно измеренных
характеристик.
3. Позволяет определить, какие показатели (независимые переменные)
наиболее существенны, важны для предсказания, а какими можно пренебречь
Ограничения:
o Большое количество данных.
o Переменные должны быть представлены в метрической шкале.
o Переменные должны быть нормально распределены.
o Число варьирующих признаков в сравниваемых переменных должно быть
одинаковым.
Требования к исходным данным:
o Недопустимы переменные, коэффициент корреляции между которыми
равен 1
o Следует избегать включение в анализ переменных, корреляция между
которыми больше 0,8.
Результатом регрессионного анализа является уравнение регрессии.
Регрессия может быть:
o парной - поиск функциональной зависимости между зависимой и
независимой переменной
o множественной
-
метод
анализа
связи
между
независимыми переменными и зависимой переменной
несколькими
Дисперсионный анализ
— это статистический метод анализа результатов исследования,
зависящих от различных, одновременно действующих факторов, выбор
наиболее важных факторов и оценка их влияния.
Разработан Р. Фишером в 20-е годы ХX века.
Дисперсия - это степень разброса в серии результатов, дающая
определенное понятие об изменчивости этих результатов.
Чем выше дисперсия, тем больше результатов разбросано вокруг
среднего значения.
Если на объект влияет несколько независимых факторов и их влияние
складывается, общую дисперсию значений признака, характеризующую
объект (группу испытуемых), можно разложить на сумму дисперсий,
возникающих в результате воздействия каждого отдельного фактора, а также
обусловленных случайными влияниями (остаточная дисперсия). Сравнение
дисперсий, обусловленных влиянием различных факторов, со случайной
(остаточной) дисперсией позволяет оценить значимость вклада каждого из
факторов, т.е. оценить достоверность этих влияний
Исходный материал для анализа:
o Три и более выборки
o Выборки могут быть неравными по численности
o Выборки могут быть связными и несвязными
Ограничения:
o Дисперсионный анализ следует применять тогда, когда известно
(установлено), что распределение результативного признака является
нормальным.
o Объемы выборок равны или отличают незначительно.
o Объем выборки должен быть достаточно большим.
Типы дисперсионного анализа:
o Однофакторный (для связных и для несвязных выборок).
o Двухфакторный и многофакторный – одна - несколько независимых
переменных.
o С повторными измерениями – для зависимых выборок
o многомерный
Скачать