ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Институт Кибернетики Направление Кафедра Прикладная математика и информатика Прикладной математики Отчет по лабораторной работе №3 по дисциплине Прикладная математическая статистика «Корреляционный анализ экспертных оценок по критерию Пирсона и критерию Спирмена» Выполнил: студент гр. 8БМ21 Карпенко П.В. Проверил: проф., д.т.н. Берестнева О. Г. Томск 2013 Постановка задачи Изучить возможности статистического пакета StatGraphics в области корреляционного анализа. С помощью пакета провести корреляционный анализ экспертных оценок показателей студентов с использованием критерия Пирсона и критерия Спирмена. Теоретические положения Корреляционный анализ Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию. Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема п связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y. Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону. Коэффициент корреляции — параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле: rxy ( x x )( y y ) ( x x ) ( y y ) i i 2 i 2 . i Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет. Критерий Пирсона, или критерий χ² (Хи-квадрат) — наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки. Обозначим через X исследуемую случайную величину. Пусть требуется проверить гипотезу H0 о том, что эта случайная величина подчиняется закону распределения F(x). Для проверки гипотезы произведём выборку, состоящую из n независимых наблюдений над случайной величиной X. По выборке можно построить эмпирическое распределение F*(x) исследуемой случайной величины. Сравнение эмпирического распределения F*(x) и теоретического (или, точнее было бы сказать, гипотетического — то есть соответствующего гипотезе H0) распределения F(x) производится с помощью специального правила — критерия согласия. Одним из таких критериев и является критерий Пирсона. Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения. Ход работы Таблица 1 Результаты корреляционного анализа A B C D E B C D E F C D E F D E F E F F Критерий Пирсона Значение p 0,1518 0,0043 0,1684 0,0021 0,798 0,0924 0,611 0,1912 0,286 0,5813 0,1261 0,0134 0,917 0,0569 0,473 0,3166 0,503 0,2845 0,312 0,5377 0,705 0,1334 0,1204 0,017 0,552 0,2384 0,1999 0,0005 0,757 0,086 Критерий Спирмена Значение p 0,2277 0,0054 0,2578 0,023 0,6401 0,0048 0,5134 0,0061 0,1735 0,0088 0,2352 0,0122 0,8889 0,0077 0,3444 0,0113 0,8917 0,0075 0,2826 0,0189 0,8743 0,0087 0,804 0,0159 0,7429 0,0258 0,6995 0,0359 0,7885 0,018 А. Замкнутость – открытость в общении. Е. Подчинённость – доминантность при поведении в группе. C. Неуравновешенность – контроль эмоциональных реакций. F. Бедность эмоций. Контрольные вопросы 3. Для определения статистической значимости корреляционной связи переменных необходимо сравнить коэффициент корреляции с критическим значением для данного объема выборки. 7. Обратная связь двух переменных означает, что высоким показателям первой переменной соответствуют низкие показатели второй и наоборот, т.е. имеет место обратная зависимость. 9. Область изменения значений коэффициента корреляции – от -1 до +1. 19. Коэффициент корреляции Спирмена предназначен для оценки взаимосвязи между двумя признаками. Вывод В ходе данной работы были изучены возможности статистического пакета StatGraphics в области корреляционного анализа, с помощью пакета проведен корреляционный анализ экспертных оценок показателей студентов с использованием критерия Пирсона и критерия Спирмена. Оба критерия выявляют корреляцию значений по оценкам, представленным в таблице 1, выделенные желтым цветом. В остальных оценках ни один из критериев не выявил корреляции. Следовательно, по результатам экспертных оценок можно заключить, какие критерии оценок студентов взаимозависимы.