Министерство образования и науки РФ «Национальный исследовательский Томский политехнический университет» Институт кибернетики Кафедра прикладной математики Отчет по лабораторной работе 4 «Критерий хи-квадрат» По дисциплине «Прикладная математическая статистика» Выполнила студентка гр. 8БМ10 Рожновская А.И. Проверил профессор кафедры ПМ Берестнева О.Г. Томск — 2013 Цель работы: Теоретические положения Проверку гипотез о нормальном законе распределения производят с помощью ряда критериев. Один из них, нашедший широкое применение в педагогических, психологических и медицинских исследованиях, – критерий согласия, или соответствия 2 (хи-квадрат). Величина критерия 2 определяется по формуле ( f f ) 2 k d 2 , i 1 i 1 f f k 2 (1) где f – эмпирические частоты, f – ожидаемые частоты, d – раз-ность между эмпирическими и вычисленными частотами. Величина критерия 2 всегда положительна. При полном совпадении эмпирических частот с вычисленными или ожидаемыми частотами 2 fi fi 0 и 2 = 0. 0,6 2 F( )? 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Рисунок 1. Функция χ2-распределения в зависимости от разных чисел 2 Распределение вероятных значений случайной величины 2 является непрерывным и асимметричным (рис. 1), оно зависит от числа степеней свободы k и приближается к нормальной кривой по мере увеличения числа испытаний n. Поэтому применение критерия 2 к оценке дискретных распределений сопряжено с некоторыми погрешностями, которые сказываются на его величине, особенно при малых выборках. Число степеней свободы устанавливают по вторичному числу классов с учетом ограничений свободы вариации, которая в разных случаях бывает различной. Так, при оценке эмпирических распределений, следующих нормальному закону, число степеней свободы равно v = n – 3 (с учетом трех ограничений свободы вариации: n, x и sx). На величине критерия 2 сказывается степень точности, с какой определены теоретически вычисленные или ожидаемые частоты. Поэтому при сопоставлении эмпирических частот с вычисленными частотами последние не следует округлять до целых чисел. Нулевая гипотеза сводится к предположению, что различия, наблюдаемые между эмпирическими и вычисленными или ожидаемыми частотами, носят исключительно случайный характер. Для проверки нулевой 2 гипотезы нужно фактически полученную величину эмп сравнить с ее 2 критическим значением кр2 . Если эмп кр2 , то нулевая гипотеза должна быть отвергнута на принятом уровне значимости с числом степеней свободы v. Критические точки кр2 приведены в статистических таблицах. Критерий 2 применяют и для оценки сходства между вариационными рядами, частоты которых распределяются в границах одних и тех же классов. В таких случаях критерий 2 определяют по формулам: k f12 N ; 4 i 1 f f 1 2 при n1 = n2 при n1 n2 2 N 2 k f12 n2 . n1n2 i 1 f1 f 2 N 2 (2) (3) В этих формулах f1 и f2 – частоты сравниваемых распределений; n1 – объем одного, а n2 – объем другого ряда распределения; N = n1 + n2. Число степеней свободы v определяют по числу классов N без единицы, т. е. v = N – 1. При этом частоты, меньшие 5, не объединяют, как это принято в отношении теоретически вычисленных частот. Ход работы Q1 OP 13,46 (χ2) 0.0092 (р) кр2 7,8147 (3 степени свободы) Рис. 1. Таблица частот для параметров "Отношение к работе" и "Консерватизм" Выводы В результате проведенных исследований в пакете StatGraphics были вычислены коэффициенты взаимной сопряженности для различных параметров. Уровень значимости меньше, чем 0,01 и значение χ2. Больше, чем 7,81. Таким образом, наблюдаемое значение Q1 связано со значением OP.