Практическая работа 10 Основы корреляционного анализа Задание 1. Ответьте на вопросы: 1.Какие зависимости называются стохастическими? 2. Что такое корреляционное поле? 3. Какие зависимости называются корреляционными? 1 Практические работы «Математические основы обработки информации» 4. Каким образом можно оценить силу (тесноту) линейной корреляционной зависимости между изучаемыми свойствами X и Y? Силу(тесноту) линейной корреляционной зависимости между изучаемыми свойствами Х и Y можно оценить с помощью: - коэффициента линейной корреляции Пирсона (в случае если обе шкалы являются количественными (метрическими); - коэффициента ранговой корреляции Спирмена или Кендалла (если хотя бы она из шкал является порядковой). ! Корреляционная связь не изучается при наличии величины, измеренной в номинальной шкале. Формулы для вычисления коэффициента линейной корреляции Пирсона Формулы для вычисления коэффициента линейной корреляции Спирмена 2 Практические работы «Математические основы обработки информации» 5. При каких значениях коэффициента корреляции связь между свойствами X и Y положительная (прямая), отрицательная (обратная). При каких значениях существует строгая зависимость (функциональная линейная)? 3 Практические работы «Математические основы обработки информации» 6. Каким образом можно оценить качественную характеристику силы (тесноты) линейной корреляционной зависимости между изучаемыми свойствами? Задача 1. (на коэффициент количественных (метрических) шкал) линейной корреляции Пирсона, для Оценить силу и направление линейной связи между временем пробегания (преодоления) дистанции в 50 м учащимися спортивного кружка (номер испытуемого – первая строчка) в утренние часы (время в сек – вторая строчка) и в вечерние в часы (время в сек – третья строчка). Решение. Составьте вспомогательную таблицу для расчетов по формуле парных сравнений. Таблица для работы (заполнить только первые три строчки и последнюю строчку расчетной таблицы): 4 Практические работы «Математические основы обработки информации» Значение времени в утренние часы (в сек) Значение времени в вечерние часы (в сек) (𝑥𝑖 − 𝑥̅ ) (𝑥𝑖 − 𝑦̅) (𝑥𝑖 − 𝑥̅ )2 (𝑦𝑖 − 𝑦̅)2 (𝑥𝑖 − 𝑥̅ )(𝑥𝑖 − 𝑦̅) Данные по №4-20 Последняя строка: 𝑥̅ = 𝑦̅ = 0 0 20 20 2 20 2 ∑(𝑥𝑖 − 𝑥̅ ) = ∑(𝑦𝑖 − 𝑦̅) = ∑(𝑥𝑖 − 𝑥̅ )(𝑥𝑖 − 𝑦̅) = 𝑖=1 𝑖=1 𝑖=1 Указание: воспользуйтесь формулой коэффициента линейной корреляции Пирсона для парных сравнений. Сделайте вывод: между представленными значениями существует линейная связь по силе – _______________, по направлению - ________________(чем меньше время на преодоление дистанции утром, тем _______________ время на преодоление дистанции вечером. Задача 2. (на коэффициент ранговой корреляции Спирмена) Исследуйте силу линейной связи между изучаемыми свойствами: X – балл за прохождение теоретического теста по определенной теме по дисциплине «Математика» (0-5), Y – время решения задачи по той же теме (в сек.) № 1 2 3 4 5 6 7 8 9 10 11 12 испытуемого Значения Х 4,7 4,5 4,4 3,8 3,7 4,6 4 4,2 4,1 3,6 3,5 4,8 Значения Y 122 105 100 145 130 90 162 172 120 150 170 112 Решение. 5 Практические работы «Математические основы обработки информации» Свойство Х измерено в порядковой шкале (баллы), поэтому для исследования силы связи между переменными используем коэффициент ранговой корреляции Спирмена. Для его расчета составим вспомогательную таблицу (дополним данную в условии таблицу строками: ранги, разности рангов, квадраты разностей рангов): № 1 2 3 4 5 6 7 8 9 10 11 12 испытуемого Значения Х 4,7 4,5 4,4 3,8 3,7 4,6 4 4,2 4,1 3,6 3,5 4,8 Значения Y 122 105 100 145 130 90 162 172 120 150 170 112 Ранг Х Ранг Y Указание: воспользуйтесь формулой для расчета коэффициента линейной корреляции Спирмена (учитываем, что связных рангов нет). Сделайте вывод: между изучаемыми величинами Х и У: - _______ _________(по силе связи); - _________________(по направлению), т. е. чем ниже балл по теоретическому тесту по теме, тем больше времени он тратит на решение задачи. Задача 3. (на коэффициент ранговой корреляции Кендалла) Исследуйте силу связи уровня IQ и времени решения серии логических заданий на выборке 14 учащихся одного класса. № учащегося Уровень IQ, баллы Время решения задач, сек 1 100 2 118 3 112 4 97 5 99 6 103 7 102 8 132 9 122 10 121 11 115 12 117 13 109 14 111 154 123 120 213 200 187 155 100 114 115 107 176 143 111 Составьте вспомогательную таблицу (проранжируйте свойство Х «Уровень IQ по возрастанию): Уровень IQ, баллы Время решения задач, сек Ранг времени решения Число следующих рангов, больших данного Число следующих рангов, меньших данного Воспользуйтесь формулой для вычисления коэффициента ранговой корреляции Кендалла. 6 Практические работы «Математические основы обработки информации» Сделайте вывод: Связь___________(по тесноте), ____________(по направлению), т.е. чем выше IQ, тем ________________решает логические задачи. Задание (отчёт) Отсканируйте решения задач и сдайте на поверку в раздел ЗАДАНИЯ. Решение рекомендуем выполнить в Excel. 7 Практические работы «Математические основы обработки информации»