1. Цели освоения дисциплины

advertisement
1. Цели освоения дисциплины
Основной целью освоения дисциплины является овладение навыками обработки
экспериментальных и эмпирических данных. Основными задачами освоения дисциплины
«Математические методы в психологии» являются
развитие навыков работы с
многомерными психологическими данными, овладение математическим аппаратом,
необходимым для работы с многомерными данными, овладение компьютерными
технологиями обработки данных (пакет SPSS), овладение навыками интерпретации
данных и результатов их обработки.
2. Место дисциплины в структуре ООП
Курс читается с третьего семестра обучения и требует знаний уровня среднего
образования и некоторых тем курса математической статистики (измерение, корреляции).
Предшествует общему практикуму и курсу экспериментальной психологии.
3.
Компетенции
обучающегося,
формируемые
в
результате
освоения
дисциплины
Процесс
изучения
дисциплины
направлен
на
формирование
следующих
компетенций:
способность и готовность к:
применению теоретического и экспериментального исследования, основных
методов математического анализа и моделирования, стандартных статистических пакетов
для обработки данных, полученных при решении различных профессиональных задач
(ОК-5);
отбору и применению психодиагностических методик, адекватных целям, ситуации
и контингенту респондентов с последующей математико-статистической обработкой
данных и их интерпретаций (ПК-2);
обладать способностью и готовностью к пониманию сущности и значения
информации в развитии современного информационного общества, осознанию опасности
и
угрозы,
возникающих
в
этом
процессе,
соблюдению
основных
требований
информационной безопасности, в том числе защиты государственной тайны (ПК-10);
В результате освоения дисциплины обучающийся должен:
1
Знать: основные понятия математических методов в психологии, статистические
критерии проверки гипотез, методы математического моделирования в психологических
исследованиях
Уметь: использовать математические методы при обработке эмпирических
данных
Владеть: математическими методами обработки и интерпретации полученных
данных владеть компьютерными технологиями обработки многомерных данных (пакет
SPSS).
2
4. Структура и содержание дисциплины
Общая трудоемкость дисциплины составляет __4__ зачетных единиц__144___
часов
Вид учебной работы
Всего часов
Общая трудоемкость дисциплины
144
Аудиторные занятия (всего)
54/32/10
В том числе:
Лекции
10/6/2
Практические занятия (ПЗ)
40/22/8
Семинары (С)
Лабораторные работы (ЛР)
Самостоятельная работа (всего)
54/76/125
В том числе:
Курсовой проект (работа)
Расчетно-графические работы
Реферат
И (или) другие виды самостоятельной работы
48
Вид промежуточного контроля (зачет, экзамен)
36/36/9
экзамен
3
4. Содержание дисциплины «Математические методы в психологии».
4.1. Разделы дисциплин и виды занятий
1
2
3
4
5
6
Модуль 1
Введение.
Задачи,
приводящие к
обработке
многомерных
массивов
данных.
Факторный
анализ.
Модуль 2
Многомерное
шкалирование.
Регрессионный
анализ.
Модуль 3
Кластерный
анализ.
Многомерный
дисперсионный
анализ.
ИТОГО
1/0/1
Самост.
раб.
Лаборат.
Практич
Семинар
Виды учебной работы, включая
самостоятельную работу
студентов и трудоемкость (в
часах)
Лекции
Неделя семестра
№
п/п
Раздел
Дисциплины
Семестр
Примерный тематический план
Формы текущего
контроля
успеваемости (по
неделям семестра)
Форма
промежуточной
аттестации (по
семестрам)
2/4/4
Лабораторная работа
8/5/2
1/1/1
12/14/24
3/2/0
8/6/2
10/15/24
1/1/0
9/5/2
10/16/25
2/1/0
7/3/1
10/15/25
Лабораторная работа
Лабораторная работа
2/1/0
8/3/1
10/12/23
10/6/2
40/22/8
54/76/125

Экзамен 36/36/9
Количество часов в примерном тематическом плане корректируется в соответствии с действующими
учебными планами
4
4.2. Содержание разделов дисциплины:
Наименование
раздела.
Введение. Задачи,
приводящие к
обработке
многомерных
массивов данных.
Факторный
анализ.
Многомерное
шкалирование.
Регрессионный
анализ.
Кластерный
анализ.
Многомерный
дисперсионный
анализ.
Содержание
Обзор многомерных методов. Необходимость сочетания
геометрических и алгебраических представлений для повышения
эффективности работы с многомерными массивами данных.
Классификация многомерных методов по назначению, по
структуре и виду исходных данных.
Стандартизация выборки, заданной в шкале интервалов. Матрица
корреляций. Главные компоненты. Дисперсия, доли дисперсии
по осям и собственные значения. Снижение размерности.
Вращение осей. Матрица факторных нагрузок. Интерпретация
факторов. Вычисление факторных значений. Построение
графиков.
Постановка задачи. Виды шкал и соответствующие методы.
Метрическое многомерное шкалирование. Матрица скалярных
произведений, многомерное решение, разложение сумм
квадратов, снижение размерности. Неметрические методы.
Варианты определения расстояний. Матрицы сходств и различий.
Модель шкалирования индивидуальных различий. Модель
шкалирования
субъективных
предпочтений.
Примеры
применения.
Задачи линейной регрессии. Простая линейная регрессия. Доли
дисперсии,
коэффициент
детерминации.
Множественная
линейная регрессия. Нелинейная регрессия.
Задачи кластерного анализа. Иерархический кластерный анализ с
различными вариантами расчета расстояний. Построение
кластер-дерева.
Оценка шагов анализа. Выбор количества
кластеров.
Многомерный дисперсионный анализ и общий случай
дисперсионного анализа с повторными измерениями
5
5. Рекомендуемые образовательные технологии
Презентации Microsoft Power Point. Видеоматериалы.
В ходе освоения курса должна быть предусмотрена планомерная организация
последовательности различных видов
аудиторных занятий: лекций и практических
занятий. Обязательными требованиями являются:
использование имеющихся в распоряжении преподавателя наглядных материалов
(компьютерные презентации и пр.); чередование на практических занятиях опроса
студентов по теоретическому материалу с выполнением практических заданий;
постоянное стимулирование самостоятельной работы студентов.
На практических занятиях в форме интерактива по курсу «Математические методы
в психологии» некоторые авторы рекомендуют метод «обратной задачи». Суть метода
заключается в создании задач на применение конкретного статистического метода или
критерия.
На первом этапе образуются мини-группы (3-4 человека), которым в течение 10-15
минут
предлагается
придумать
задачу,
решение
которой
требует
применения
определенного статистического критерия. Задача должна содержать: информацию о
направленности исследования,
числовые данные,
указание единиц
измерения,
исследовательский вопрос.
На втором этапе каждая из мини-групп предлагает обсудить другим группам, с
помощью какого статистического критерия необходимо решать созданную задачу. При
обсуждении необходимо учитывать, что одна и та же задача может быть решена с
использованием разных статистических критериев. Мини-группе, разработавшей задачу,
надо уметь аргументировать, почему именно их метод является наиболее эффективным. В
ходе дискуссии может выясниться, что другие методы в большей степени подходят к
решению созданной задачи.
Ситуации неоднозначности можно избежать,
если ограничить выбор решения
заранее оговоренным списком статистических критериев.
Данный метод позволяет развивать у студентов навыки ведения научной
дискуссии, умение формулировать и отстаивать свою точку зрения, способствует
развитию критических и творческих компонентов мышления, формированию навыков
работы в группе, а также позволяет лучше усвоить достаточно сложный теоретический
материал и способствует систематизации полученных знаний.
6
6. Оценочные средства для текущего контроля успеваемости, промежуточной
аттестации по итогам освоения дисциплины и учебно-методическое обеспечение
самостоятельной работы студентов
Самостоятельная работа студентов при изучении курса «Математические методы в
психологии» предполагает работу с основной и дополнительной литературой и решение
задач. Результатами этой работы становятся выступления на семинарских занятиях,
участие в обсуждении тем курса, выполнение письменных работ, а именно, контрольных
работ.
Цель написания реферата – осмысленное систематическое изложение темы,
приобретение навыка «сжатия» информации, выделения в теме главного, а также освоение
приемов работы с научной и учебной литературой, приобретение практики правильного
оформления текстов научно-информационного характера.
Рекомендуемый
объем
реферата
–
8-10
страниц
(за
исключением
библиографического списка литературы).
В структуре реферата должны быть представлены: титульный лист, оглавление,
введение с указанием цели и задач работы, реферативный раздел с обязательной
рубрикацией, заключение и выводы, список литературы.
7
Примерные темы рефератов
1.
Одномерная прикладная статистика.
2.
Многомерная прикладная статистика.
3.
Многомерный анализ данных в психологии.
4.
Многомерное шкалирование в психологии.
5.
Использование факторного анализа в психологии.
6.
Использование кластерного анализа в психологии.
7.
Компьютерные методы обработки и представления данных.
8.
Статистические пакеты.
8
Перечень вопросов для подготовки к экзамену
1.
Основные разделы статистики. Общее представление о применении
статистических процедур в психологии.
2.
Понятие измерения. Типы шкал измерения.
3.
Типы данных и способы их статистической обработки
4.
Общая
характеристика
задач
и
основных
процедур
описательной
статистики.
Графические
5.
способы
представления
данных
психологического
исследования.
6.
Основные параметры распределения.
7.
Меры центральной тенденции.
8.
Меры вариативности.
9.
Понятие и основные свойства нормального распределения.
10.
Понятие выборочного метода.
11.
Типы выборки. Основные схемы отбора.
12.
Общая характеристика задач и основных процедур одномерной прикладной
статистики.
13.
Параметрические критерии различий.
14.
t - критерий Стьюдента и его модификации.
15.
Дисперсионный анализ.
16.
Непараметрические критерии различий.
17.
Критерий согласия Пирсона и способы его применения.
18.
Корреляционный анализ: основные задачи и процедуры.
19.
Линейный коэффициент корреляции Пирсона.
20.
Ранговый коэффициент корреляции Спирмена.
21.
Бисериальный точечный коэффициент корреляции.
22.
Бисериальный ранговый коэффициент корреляции.
9
23.
Коэффициент ассоциации Пирсона для дихотомических шкал.
24.
Общая
характеристика
компьютерных
методов
обработки
психологического исследования.
25.
Факторный анализ.
26.
Процедура проверки статистических гипотез.
27.
Статистические критерии различий.
28.
Первичная обработка данных
29.
Статистические таблицы.
30.
Место математических методов в структуре психологического
исследования.
10
данных
Задания для аудиторной контрольной работы по курсу «Математические
методы в психологии» (для студентов, обучающихся по заочной форме)
1.В ходе эксперимента были получены следующие результаты (в баллах):
№ п/п
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
Значение
5
4
3
6
3
4
7
4
5
6
7
2
8
5
9
3
5
6
5
7
Вычислите моду, медиану, среднее арифметическое, дисперсию и стандартное
отклонение.
2. В ходе проведенного исследования были получены следующие результаты ( в
баллах):
2
3
4
3
4
2
5
4
3
5
5
6
6
3
5
4
5
2
3
4
2
3
4
2
2
3
3
3
4
5
6
6
5
6
6
5
4
3
4
5
3
3
5
4
6
6
3
5
2
5
4
3
2
4
3
3
4
5
5
6
5
3
4
5
2
2
3
4
2
4
3
3
5
5
4
4
2
3
3
4
Постройте точечную диаграмму и гистограмму.
3. В исследовании измеряли уровень тревожности и самооценку (в баллах).
Данные сведены в таблицу:
номер п/п
1
2
3
4
5
6
7
8
9
1
0
тревожность
3
5
2
4
5
3
4
2
5
4
самооценка
3
4
3
4
2
5
4
4
3
5
Вычислите коэффициент корреляции.
4. При тестировании респондентов просили оценить выраженность маскулинных
качеств у себя и у идеального мужчины. Результаты (в баллах) представлены в таблице.
номер п/п
1
2
3
4
5
6
7
8
9
1
0
у себя
3
0
у идеального мужчины
2
8
2
8
3
3
4
4
2
8
4
2
4
0
4
0
3
2
4
1
3
3
3
7
2
5
4
0
2
3
3
Можно ли сделать вывод о связи самооценки с идеальными представлениями?
11
2
2
9
3
8
2
9
5. Среди опрошенных студентов 1 курса 45 человек представляют себе, где будут
работать после окончания ВУЗа, 64 человек не смогли ответить на этот вопрос. Среди
студентов 5 курса 34 человека не имеют представления, где будут работать после
окончания, а 46 человек уже определились в своем выборе. Можно ли говорить о связи
года обучения с определенностью профессионального выбора?
6. В исследовании измерялся уровень агрессивности у мальчиков и девочек по 10балльной шкале. Были получены следующие результаты:
мальчики
5
6
4
7
8
6
5
7
4
5
7
8
6
7
девочки
4
5
3
6
7
8
8
4
5
6
7
3
5
6
Какой вывод о различиях между мальчиками и девочками по изучаемому
параметру можно сделать?
7. Среди работников фирмы был проведен опрос о наиболее желательном графике
работы: 15 человек высказались за 8 часовой рабочий день и часовой обеденный перерыв;
20 человек за 7 часовой рабочий день без перерыва на обед; 26 человек за 8 часовой
рабочий день и перерывы по 10 минут каждый час; 22 человека - за свободный график.
Какой вариант графика работы можно считать наиболее приемлемым?
8. Исследовали влияние уровня тревожности на уровень запоминания.
Предварительно проводилась оценка уровня тревожности, на основании которой
испытуемые были разделены на две группы - с высоким уровнем тревожности и низким
уровнем тревожности. На основном этапе использовался тест механической памяти, при
этом фиксировалось количество правильно воспроизведенных слов. Были получены
следующие результаты.
уровень
количество воспроизведенных слов
тревожности
Низкий
7
5
9
8
5
7
6
8
9
Высокий
4
5
7
8
3
4
6
9
3
5
7
8
Какой вывод по результатам исследования можно сделать?
9. Исследовали влияние депрессивного состояния на самооценку способности
решения проблем (в баллах). Были получены следующие результаты.
уровень
самооценка способности к
12
депрессивности
решению проблем
Высокий
3
2
4
2
3
4
5
4
3
4
Низкий
5
4
3
4
4
3
3
4
4
5
Какой вывод по результатам исследования можно сделать?
10. Измеряли уровень самооценки у учащихся лицея и обычной школы. Были
получены следующие результаты (в баллах):
Учащиеся лицея: 5,8,4,6,8,7,2,5,4,6,3,7,5,4,2,6,4,8,2,5.
Учащиеся обычной школы: 5, 4, 6, 2, 3, 4, 5, 2, 3, 4, 5, 7, 5, 2, 4, 8, 2, 4, 3, 5, 2, 4, 6, 2.
Можно ли утверждать, что учащиеся лицея имеют более высокую самооценку?
11. Исследовали особенности атрибуции ответственности у подростков. Было
выявлено 4 категории и количество респондентов, их использующих:
приписывание ответственности субъекту - 56 человек;
приписывание ответственности объекту - 42 человека;
приписывание ответственности обстоятельствам - 68 человек;
приписывание ответственности случаю - 78 человек.
Можно ли утверждать, что наиболее популярная категория у подростков
«приписывание ответственности случаю»?
12. Исследовали уровень притязаний младших школьников. Были получены
следующие результаты:
№
1
2
3
4
5
6
7
8
исп.
9
0
б
5
4
2
4
5
1
2
3
1
1
1
4
2
2
1
3
1
1
4
5
1
1
3
4
5
2
алл
Опишите распределение (найти среднее, дисперсию, стандартное отклонение,
моду, медиану).
13. Измеряли беглость речи у учеников начальной школы. Были получены
следующие результаты:
№
1
2
3
4
5
6
7
8
исп.
9
0
сл
6
8
7
4
6
8
13
4
7
6
1
1
1
1
1
1
2
3
4
5
8
5
8
7
4
1
5
ов/мин.
0
0
5
5
0
5
5
2
8
0
6
0
5
0
0
Постройте гистограмму.
14. Исследовали влияние формы теста (ручной и компьютерной) на количество
неопределенных ответов испытуемых. Получили следующие результаты.
№ исп.
1
2
3
4
5
6
7
8
9
1
0
Ручная
1
0
компью
1
4
5
1
2
6
8
терная.
1
8
5
4
1
1
3
5
8
0
1
1
2
ответов?
15. Был проведен эксперимент. Исследовали влияние присутствия родителей на
устойчивость внимания у детей (в секундах). Измеряли устойчивость внимания без
родителей и в их присутствии. Результаты были сведены в таблицу.
1 2
без родителей.
0
1
с родителями
2
3
3
4
5
6
7
8
9
1
1
1
1
0
1
2
3
4
5
1 1
1
1
1
1
1
1
1
1
1
1
1
3 2
2
4
1
0
0
2
3
4
5
3
2
1 1
1
1
1
1
1
1
1
1
1
1
1
2 4
2
3
4
2
0
3
4
3
2
4
2
Какой вывод можно сделать?
14
6
5
Можно ли говорить о влиянии формы теста на количество неопределенных
номер п/п
1
5
9
5
7
1
1
1
1
1
1
1
Фонд тестовых заданий по курсу «Математические методы в психологии»
1.
Прикладная статистика не включает в себя решение
а) чисто математических задач
б) статистических задач
в) задач о параметрах выборочного распределения
г) все ответы верны
2.
Одномерная прикладная статистика решает задачи проверки гипотез
а) о равенстве математических ожиданий
б) о равенстве дисперсий
в) однородности двух выборок
г) все ответы верны
3.
Дисперсия, разброс, мода, медиана являются характеристиками:
а) генеральной совокупности
б) случайной величины
в) распределения
г) психологической переменной

К мерам центральной тенденции относятся:
а) дисперсия и стандартное отклонение
б) мода, медиана, среднее арифметическое
в) эксцесс и асимметрия
г) все ответы верны

По принципу «больше – меньше» классифицирует признак:
а) порядковая шкала
б) шкала отношений
в) шкала интервалов
г) номинативная шкала
15

Примером номинативной шкалы является
а) система школьных оценок от 1 до 5
б) стандартизованный тест измерения интеллекта (IQ)
в) дихотомическая шкала
г) все ответы верны

Вероятностная выборка - это
а) механическая выборка
б) серийная выборка
в) случайно-повторная и случайно-бесповторная выборка
г) все ответы верны

Процесс
упорядочения
и
систематизации
первичных
данных,
предполагающий их объединение в относительно однородные группы по некоторому
признаку называется:
а) шкалированием
б) выборкой
в) ранжированием
г) группировкой

Качество выборки, позволяющее распространить полученные на ней выводы
на всю генеральную совокупность - это
а) однородность
б) репрезентативность
в) целенаправленность
г) многоступенчатость

Нулевая гипотеза – это гипотеза
а) о наличии различий
б) о вариативности
в) об отсутствии различий
г) о нормальности распределения
16

Нулевая и альтернативная гипотезы могут быть
а) параметрическими и непараметрическими
б) статистическими и дихотомическими
в) номинативным и интервальными
г) направленными и ненаправленными

Параметрические критерии и методы
а) не включают в расчеты параметры распределения
б) включают в расчеты параметры распределения
в) выполняют нормализацию распределения
г) не выполняют нормализацию распределения

Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время
как она верна, называется
а) ошибкой 1 рода
б) ошибкой 2 рода
в) ошибкой 3 рода
г) ошибкой 4 рода

К непараметрическим критериям относится
а) критерий хи-квадрат
б) критерий Вилкоксона
в) Критерий Манна-Уитни
г) все ответы верны

Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время
как она неверна, называется
а) ошибкой 1 рода
б) ошибкой 2 рода
в) ошибкой 3 рода
г) ошибкой 4 рода
17

Для выявления различий в уровне исследуемого признака (2 выборки
испытуемых) можно использовать
а) коэффициент корреляции Пирсона
б) дисперсионный анализ
в) критерий Манна-Уитни
г) все ответы верны

Критерий Стьюдента можно использовать для решения задачи
а) оценки сдвига значений исследуемого признака
б) анализа изменения признака под влиянием контролируемых условий
в) выявление степени согласованности изменений
г) все ответы верны

В психологических исследованиях
низшим уровнем статистической
значимости является уровень
а) 0,1
б) 0,05
в) 0,01
г) 0, 001

Критерий хи-квадрат
а) является параметрическим
б) служит для решения задач о наличии сдвига
в) является многофункциональным
г) все ответы верны

Для решения задачи о согласованности изменений признаков, измеренных с
помощью интервальной шкалы, используется:
а) линейный коэффициент Пирсона
б) коэффициент Кендалла
в) коэффициент ассоциации
г) все ответы верны
18

Коэффициент ассоциации Пирсона используется для поиска связи между
признаками, измеренными с помощью
а) шкалы отношений
б) порядковой шкалы
в) интервальной шкалы
г) дихотомической шкалы

Для решения задачи о согласованности изменений признаков, измеренных с
помощью порядковой шкалы, используется:
а) линейный коэффициент Пирсона
б) коэффициент Кендалла
в) коэффициент ассоциации
г) все ответы верны

Рангово-бисериальный коэффициент используется для поиска связи между
признаками, измеренными с помощью
а) шкалы отношений и дихотомической шкалы
б) ранговой и дихотомической шкал
в) двух порядковых шкал
г) ранговой и интервальной шкал

Величина коэффициента корреляции, как правило, лежит в интервале
а) от 0 до 1
б) от 0 до - 1
в) от 0 и выше
г) от – 1 до 1

Оценку
уровня
значимости
любого
эмпирически
коэффициента корреляции можно определить
а) с помощью статистических таблиц значимости
б) с помощью критерия Стьюдента по соответствующей формуле
в) непосредственно по полученному значению
г) все ответы верны
19
рассчитанного

Отрицательное
значение
эмпирически
корреляции говорит
а) о незначимости коэффициента корреляции
б) о наличии обратной связи между признаками
в) о наличии прямой связи между признаками
г) о значимости коэффициента корреляции

Материалом для факторного анализа служат
а) первичные данные
б) корреляционные связи
в) средние значения
г) дисперсии

Факторному анализу нельзя подвергать
а) качественные данные
б) большие массивы данных
в) независимые переменные
г) все ответы верны

Методом вращения факторов является
а) варимакс
б) квартимакс
в) эквимакс
г) все ответы верны

Кластерный анализ используют
а) для определения структуры стимулов
б) для выявления связей между стимулами
в) для сжатия информации
г) все ответы верны
20
рассчитанного
коэффициента

С помощью программы Microsoft Excel нельзя
а) наглядно представить данные
б) провести статистический анализ
в) интерпретировать полученные результаты
г) все ответы верны

Статистический пакет для социальных наук имеет название
а) SAS
б) SPSS
в) SSPP
г) SASP
21
7. Учебно-методическое и информационное обеспечение дисциплины
Список основной учебной литературы:
1.
О.А.Шушерина. Математические методы в психологии: Сборник задач:
Учебно-методическое пособие для студентов направления «Психология» / Шушерина
О.А.; НОУ ВПО Университет Российской академии образования, красноярский филиал.
Красноярск, 2011. – 60 с.
2.
Ермолаев-Томин О.Ю. Математические методы в психологии: учебник для
бакалавров / О.Ю. Ермолаев-Томин. – 4-е изд., пер. и доп. – М.: Издательство Юрайт,
2012. – 511 с. (Гриф).
3.
Кутейников А.Н. Математические методы в психологии. Учебное пособие. –
СПб. Речь, 2008. – 172с.
Список дополнительной учебной литературы:
1.
Сидоренко Е.В. Методы математической обработки в психологии. СПб.:
Речь, 1996, 2010. – 350 с.
2.
Гусев А.Н. Измерение в психологии. Общий психологический практикум,
3.
Ермолаев О.Ю.Математическая статистика для психологов: МПСИ, 2002.
1998.
8. Материально-техническое обеспечение дисциплины
Компьютерные классы с необходимым количеством мест, мультимедийные
средства, компьютеры, специально разработанные слайды.
22
9. Глоссарий
Апостериори — после проведения исследования (противоположное априори).
Априори — до проведения исследования (противоположное апостериори).
Бимодальное распределение – распределение признака, имеющее две моды.
Бинарные (дихотомические) данные — данные, выражаемые только двумя
допустимыми альтернативными значениями признака (например, "мужчина –
женщина", "есть – нет", "здоров – болен", "курит – не курит").
Вариационный ряд – упорядоченный (по значениям признака) двойной ряд чисел –
значений признака и соответствующих им вероятностей (частот).
Вариация — см. Дисперсия.
Вероятность — число между 0 и 1, отражающее относительную частоту
появления события. Сумма альтернативных вероятностей равна 1.
Выборка — часть популяции. По результатам анализа выборки делают выводы о
всей популяции, что правомерно только в случае репрезентативности выборки по
отношению к популяции.
Генеральная совокупность — см. Популяция.
Гипотеза научная — утверждение, которое можно подтвердить или
опровергнуть на основании результатов исследования.
Гипотеза статистическая — представление научной гипотезы в форме,
приемлемой для проверки методами статистического анализа данных (см. нулевая и
альтернативная гипотезы).
Гистограмма
—
способ
графического
задания
распределения
в
виде
столбиковой диаграммы без пропуска "пустых" (с нулевыми частотами) интервалов.
Гистограмма
—
способ
графического
задания
распределения
в
виде
столбиковой диаграммы без пропуска "пустых" (с нулевыми частотами) интервалов
значений признака. На горизонтальной оси откладываются значения признака, на
23
вертикальной – вероятности (частоты) значений, попадающих в тот или иной интервал
квантования.
Двусторонний тест — проверка статистической значимости, не предполагающая
заранее известным направление смещения значения анализируемого параметра одной
группы по отношению к другой. Двусторонний тест носит более универсальный
характер, чем односторонний, и используется чаще.
Диаграмма рассеяния – совокупность точек
в пространстве двух признаков,
отображающих степень выраженности этих признаков у каждого объекта выборки.
Дискретные случайные величины — признаки, принимающие числовые
значения через некоторые интервалы (обычно равные 1) и выражаемые ограниченным
набором значений (обычно целыми числами). Альтернатива непрерывным данным.
Дисперсия
(вариация)
—
числовая
мера
разброса
значений
признака
относительного среднего арифметического.
Доверительный интервал (ДИ) — интервал значений признака, рассчитанный
для какого-либо параметра распределения (например, среднего значения признака) по
выборке и с определенной вероятностью (например, 95% для 95%) включающий
истинное значение этого параметра во всей популяции.
Достоверность — степень, с которой измерение отражает истинное значение
измеряемого признака. Достоверность исследования (внутренняя обоснованность
исследования) определяется тем, в какой мере полученные результаты справедливы в
отношении данной выборки.
Зависимый признак — признак, значение которого может быть рассчитано по
значениям других признаков.
Интервал квантования (шаг квантования) – число, определяющее величину
основания столбиков гистограммы.
Интерквартильный интервал (размах, отрезок) — интервал значений
признака, содержащий центральные 50% наблюдений выборки, т.е. интервал между
25-м и 75-м процентилями. Используется вместе с медианой (вместо среднего
значения и стандартного отклонения) для описания данных, имеющих распределение,
отличное от нормального.
24
Категориальные данные – см. Качественные данные
Качественные данные — номинальные и порядковые данные, которые
отражают
условные
коды
неизмеряемых
категорий
или
условную
степень
выраженности признака.
Корреляция – взаимосвязь между двумя переменными (порядковыми или
метрическими), характеризующая её направление, силу и уровень значимости.
Корреляционная плеяда – часть корреляционной матрицы, к которую входят
тесно связанные между собой признаки. Корреляционная плеяда может быть
представлена в виде графа с вершинами, соответствующими признакам, и ребрами между
ними, соответствующими коэффициентам корреляции.
Корреляционная матрица – квадратная таблица, столбцы и строки которой
соответствуют признакам, между которыми высчитаны коэффициенты корреляции, а в
ячейках находятся значения этих коэффициентов. Корреляционная матрица симметрична
относительно главной диагонали (с верхнего левого до нижнего правого угла), значения
всех элементов которой равны единицам.
Коэффициент корреляции – число, отражающее силу (тесноту) и направление
взаимосвязи между двумя метрическими или порядковыми переменными. Интервал
возможных значений коэффициента корреляции: от 1 до +1.
Коэффициент линейной корреляции Пирсона – число, отражающее силу
(тесноту) и направление взаимосвязи между двумя метрическими переменными. Интервал
возможных значений коэффициента линейной корреляции: от 1 до +1.
Коэффициент ранговой корреляции (Спирмана или Кендала) – число,
отражающее силу (тесноту) и направление взаимосвязи между двумя порядковыми
(ранговыми) перемен-ными. Интервал возможных значений коэффициента ранговой
корреляции: от 1 до +1.
Коэффициент сопряженности – числовая характеристика силы взаимосвязи двух
признаков,
измеренных
в
номинальной
коэффициента сопряженности: от 0 до +1.
25
шкале.
Интервал
возможных
значений
Кумулята – гистограмма с накопленными частотами; изображение распределения в
виде диаграммы, ординатами которой являются накопленные вероятности (частоты)
значений признака (от минимального до текущего).

a
x

a
x



a
x

b
1
1
2
2
m
m
Линейная функция – функция вида y
, графиком
которой является прямая линия.
Математическое моделирование – описание различных явлений, процессов (в том
числе и социально-психологических) посредством математического аппарата с выделением
основных факторов, влияющих на процесс, определением вклада каждого фактора,
выявлением их взаимосвязи и вероятностным предсказанием протекания процесса и его
результата.
Медиана – числовая мера положения распределения признака, значение признака,
разделяющее выборку на две равные части. Для определения медианы удобно упорядочить
значения признака от меньшего к большему по всей выборке.
Меры разброса (рассеяния) — статистики, описывающие вариабельность
значений признака (дисперсия, стандартное отклонение, размах, интерквартильный
интервал).
Метрическая шкала – совокупность чисел для обозначения величин признака,
интервал между которыми определен: равным интервалам в числовой шкале
соответствуют равные интервалы интенсивности измеряемого признака (например,
интервалу в один килограмм соответствует равное приращение веса на всем диапазоне
измерений этого признака). Метрические шкалы могут быть двух видов: шкала
интервалов и шкала обозначений.
Многомерная статистика — раздел статистики, анализирующий влияние двух (и
более) независимых признаков на один зависимый признак.
Мода – значение признака, наиболее часто встречающееся в исследуемой
выборке. Распределения бывают унимодальными (с одной модой), бимодальными (с двумя
модами) и полимодальными (с большим количеством мод).
Независимые (несвязанные) выборки — выборки, в которые объекты
исследования набирались независимо друг от друга. Альтернатива независимым выборкам
— зависимые (связанные, парные) выборки.
26
Нейронная сеть - вычислительная система, автоматически формирующая описание
характеристик случайных процессов (прогноз поведения потребителя, предсказание
ситуации на рынке, анализ товарных потоков и т.д.), имеющих сложные функции
распределения.
Нелинейная (криволинейная) функция - функция, график которой отклоняется от
прямой линии.
Непараметрический критерий – критерий проверки статистических гипотез, не
требующий допущения о метрическом уровне измерения и нормальности распределения
признака.
Непараметрические методы статистики — класс статистических методов,
которые используются для анализа порядковых данных, а также для метрических
данных, не образующих нормальное распределение.
Непрерывные случайные величины — признаки, принимающие числовые
значения на любом допустимом интервале значений. Альтернативой непрерывным
величинам служат дискретные величины.
Номинативная (номинальная, обозначений) шкала – совокупность символов
для обозначения категорий признака (например, символы "м" и "ж" для признака
"пол").
Нормальное (гауссово) распределение – распределение признака колоколообразной
формы,
унимодальное,
симметричное,
с
одинаковыми
значениями
среднего
арифметического, медианы и моды. Большинство психологических свойств имеют
распределения близкие к нормальному. Большинство параметрических тестов разработаны
для анализа распределений, подчиняющихся закону нормального распределения.
Нулевая гипотеза – статистическая гипотеза в форме утверждения об отсутствии
различий (нулевых различиях) между теми или иными характеристиками двух
распределений (например, между двумя средними значениями признака в двух выборках)
или о равенстве нулю одной характеристики распределения (например, коэффициента
корреляции Пирсона). Нулевая гипотеза –
гипотезе.
27
противоположность альтернативной
Односторонний тест — статистический тест, учитывающий априорные знания о
направлении (увеличении либо уменьшении) значения исследуемого параметра одной
группы по отношению к этому же параметру другой группы.
Описательная статистика — раздел статистики, задача которого – описание
распределений исследуемых признаков в виде числовых характеристик (например,
среднее арифметическое, медиана, дисперсия, стандартное отклонение).
Ордината – вертикальная ось графика, на которой чаще всего фиксируют
частоту встречаемости значений переменной.
Оценка
—
значение
параметра
распределения
на
выборке,
которое
предположительно отражает соответствующее свойство распределения признака в
популяции. Точечная оценка — одно число (например, среднее). Интервальная оценка
— интервал значений признака (например, доверительный интервал вокруг среднего).
Параметрический критерий – критерий проверки статистических гипотез,
требующий допущения о метрическом уровне измерения и нормальности распределения
признака.
Параметрические методы статистики — класс статистических методов,
используемых для анализа данных, которые образуют известное распределение (обычно
нормальное). Названы так потому, что опираются на анализ параметров (числовых
характеристик) нормального распределения.
Параметры рассеяния (разброса) — числовые характеристики распределения,
отражающие вариабельность значений признака на выборке (дисперсия, стандартное
(среднеквадратическое) отклонение, интерквартильный интервал и др.).
Переменная — см. Признак.
Популяция (генеральная совокупность) — группа субъектов, из которой
набрана выборка и на которую следует распространять результаты исследования.
Порядковые
признаки
—
признаки,
значения
которых
могут
быть
упорядочены (ранжированы), но интервал между этими значениями не может быть
выражен количественно. Отражают только степень выраженности какого-либо качества
изучаемых объектов.
28
Порядковая (ординальная) шкала – совокупность чисел для обозначения
величин признака, значения которых могут быть упорядочены (по возрастанию или по
убыванию), но интервал между которыми не определен: равным интервалам в числовой
шкале не сопоставлены равные интервалы интенсивности измеряемого признака
(например, интервалу в один балл в шкале школьных оценок не обязательно
соответствует
равное
количество
знаний
между
отличником,
четверочником,
троечником и двоечником).
Признак (переменная) — характеристика объекта исследования (наблюдения).
Различают качественные и количественные признаки
Проверка
(статистической)
гипотезы
—
математический
способ
тестирования статистической гипотезы на конкретных данных. Решение принимается
путем отклонения или неотклонения нулевой гипотезы об отсутствии различий.
Неотклонение нулевой гипотезы — это признание существующих различий случайными.
Принятие альтернативной гипотезы — это признание значимости различий (значимости
воздействия изучаемого фактора).
Размах значений признака – разность между наибольшим и наименьшим
значением признака в выборке.
Рандомизация — случайный выбор объектов исследования.
Распределение признака на выборке — описание, связывающее значения
признака на выборке с их частотами (вероятностями). Обычно представляется в виде
графика: по оси абсцисс — значения признака, по оси ординат — частоты (вероятности)
значений признака.
Регрессия
(независимых
–
уравнение,
признаков)
со
связывающее
значениями
значения
зависимого
независимого
признака,
или
признака
линия,
соответствующая этому уравнению. Различают простые и множественные, линейные и
нелинейные регрессии.
Регрессия
линейная
–
регрессия
в
виде
линейного
уравнения
или
соответствующей этому уравнению прямой линии.
Регрессия нелинейная – регрессия в виде нелинейного уравнения или
соответствующей этому уравнению линии.
29
Регрессия множественная – регрессия с двумя или более независимыми
переменными.
Регрессия простая – регрессия с одной независимой переменной.
Репрезентативность выборки – возможность распространить полученные на
выборке выводы на всю генеральную совокупность. Репрезентативность имеет две
стороны – по составу и по количеству.
Связанные
(зависимые)
выборки
—
выборки,
в
которые
участники
исследования набирались парами (или с использованием какого-либо иного принципа)
или состоящие из одних и тех же объектов исследования, обследованных в разные
моменты времени.
Сопряженность — термин, применяемый для обозначения взаимосвязи
качественных (номинальных) признаков.
Среднее значение — описательная статистика (параметр), являющаяся мерой
центральной тенденции для приближенно нормально распределенных данных. Если
распределение
не
соответствует
закону
нормального
распределения,
то
для
характеристики центральной тенденции следует использовать медиану.
Стандартное (среднеквадратическое) отклонение — описательная статистика
(параметр), являющаяся мерой рассеяния для приближенно нормально распределенных
данных,
числовая
характеристика
разброса
распределения
признака
равная
квадратному корню из дисперсии. Если распределение не соответствует закону
нормального распределения, то для характеристики рассеяния следует использовать
какой-либо интерпроцентильный интервал, например интерквартильный интервал.
Таблица
сопряженности
—
таблица
абсолютных
частот
(количества)
наблюдений, столбцы которой соответствуют значениям одного признака, а строки —
значениям другого признака (в случае двумерной таблицы сопряженности). Значения
абсолютных частот располагаются в ячейках на пересечении рядов и колонок. Как
правило, таблица сопряженности строится для номинальных переменных.
Уровень статистической значимости (критический, пороговый уровень
статистической значимости) — допускаемая исследователем величина α-ошибки, т.е.
максимально допускаемая исследователем вероятность ошибочного отклонения нулевой
30
гипотезы (об отсутствии различия между группами, об отсутствии взаимосвязи
признаков и т.д.). Обычно за величину уровня значимости принимаются значения 0,05;
0,01 или 0,001.
Центральной
тенденции
параметры
—
статистические
параметры
распределения, отражающие наиболее типичные (средние) значения признака на
выборке (среднее арифметическое, медиана, мода).
Шкала интервалов – совокупность чисел для обозначения величин признака,
интервал между которыми определен (равным интервалам в числовой шкале
соответствуют равные интервалы интенсивности измеряемого признака), но нулевая
точка является договорной отметкой, а не показателем отсутствия измеряемого
качества (например, шкала измерения температуры по Цельсию).
Шкала отношений – совокупность чисел для обозначения величин признака,
интервал между которыми определен (равным интервалам в числовой шкале
соответствуют равные интервалы интенсивности измеряемого признака), а нулевая
точка является показателем отсутствия измеряемого качества (например, шкала
измерения скорости).
Шкала рангов – частный случай порядковой шкалы, в которой значения признака
проранжированы (по возрастанию или по убыванию).
Шкала числовая – система обозначений (качественных или количественных)
для фиксации значений измеряемых величин. Шкалы бывают номинативные,
порядковые, метрические (интервальные и отношений).
31
Download