Параметрические критерии Статистические критерии z, t и F называются параметрическими. Параметрические критерии предназначены для проверки гипотез о параметрах генеральной совокупности (среднем, дисперсии, доле признака) или гипотез о типе распределения. В статистике разработано также направление, которое развивает непараметрические критерии. В этом случае вид и параметры распределения не рассматриваются. Такие критерии используют, в частности, для исследования генеральных совокупностей, которые не распределены нормально. © Иванов О.В., 2005 2 Преимущества непараметрических методов 1. Могут использоваться для проверки гипотез о параметрах генеральной совокупности, когда переменная не распределена нормально. 2. Могут использоваться для номинальных и порядковых данных. 3. Могут использоваться для проверки гипотез, которые не связаны с параметрами генеральной совокупности. 4. В большинстве случаев для непараметрических методов вычисления проще, чем для параметрических. Методы более понятны. © Иванов О.В., 2005 3 Недостатки непараметрических методов 1. Они менее точны, чем соответствующие параметрические критерии. 2. Они менее информативны. 3. Они менее эффективны. Например, для критерия знаков нужна выборка из 100 человек, в то время, как для получения аналогичных результатов при использовании z-критерия достаточно было бы выборки из 60 человек. © Иванов О.В., 2005 4 Сравнение эффективности Приложения Парные выборки Параметрический тест t-тест или z-тест Непараметрический тест Эффективность Критерий знаков Знако-ранговый критерий 0,63 0,95 Две независимые t-тест или z-тест выборки Критерий Вилкоксона 0,95 Несколько независимых выборок Дисперсионный анализ (F-тест) Критерий Уоллиса Краскела- 0,95 Корреляция Линейная корреляция Ранговая корреляция 0,91 Проверка случайности Нет параметрических Тест Руна тестов Нет базы сравнения Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально распределенной генеральной совокупности. © Иванов О.В., 2005 5 Пример 1. Кадровые предпочтения Руководство сети ресторанов быстрого обслуживания обратило внимание, что кадровая служба сети отдает большее предпочтение при подборе кадров на должность менеджера девушкам, нежели, чем юношам. Среди менеджеров оказалось 30 юношей и 70 девушек. Усомнившись в разумности сложившихся пропорций, руководство запросило объяснений. Кадровая служба объяснила сложившуюся пропорцию результатом случайности, а не итогом определенных предпочтений. Проверить на уровне значимости α=0,05, может ли такая пропорция оказаться результатом случайности. © Иванов О.В., 2005 7 Пример 2. Строительство башни Несколько детей попросили из предоставленных им кубиков собрать башню. Эксперимент повторили с этими же детьми через месяц, результаты времени (в секундах) представлены в таблице ниже. Ребенок A B C D E F G I K L M Исп. 1 30 19 19 23 29 44 42 20 12 39 14 81 17 31 52 Исп. 2 30 13 14 16 14 52 14 22 17 12 11 N O P R 30 14 17 15 На уровне значимости α=0,05 проверить предположение о том, что нет существенной разницы между результатами. © Иванов О.В., 2005 8 Пример 3. В день 40 леденцов Владелец продуктового магазина строит гипотезу о том, что медианное количество продаваемых им за день леденцов равно 40. Случайная выборка за 20 дней дает следующие данные по количеству леденцов, продаваемых каждый день. 18 30 39 36 43 29 34 40 40 32 39 34 16 37 45 39 22 36 28 52 При α = 0,05 проверить гипотезу владельца магазина. © Иванов О.В., 2005 9 Критерий знаков Гипотеза об однородности для парных выборок Критерий знаков Гипотеза о значении медианы Гипотеза о доли признака © Иванов О.В., 2005 Строительство башни В день 40 леденцов Кадровые предпочтения 10 На чем основан критерий Сравниваем наблюдения попарно и проставляем знаки. Последовательность знаков есть результаты n независимых испытаний с двумя возможными исходами: “плюс” или “минус”. Если распределения совпадают, то в каждом испытании вероятности равны ½: 1 P("+") = P("−") = 2 Количество плюсов и количество минусов есть случайные величины, которые распределены по биноминальному закону и теоретически должны быть равны. Малое количество плюсов € будет означать, что гипотеза неверна. (или минусов) © Иванов О.В., 2005 11 Условия для применения критерия 1. Данные должны быть получены случайным образом. 2. Нет никаких требований относительно закона распределения генеральных совокупностей, из которых эти данные получены. © Иванов О.В., 2005 12 Статистика 1. Объем выборки n≤25. Выбираем в качестве критерия: x = min (количество минусов, количество плюсов). Критические значения находятся по таблице. Если x окажется меньше или равен критическому значению из таблицы, то гипотеза отвергается. 2. Объем выборки n>25. Тогда в качестве критерия выберем: Критические значения находятся по таблице нормального закона. © Иванов О.В., 2005 13 Решение примера. Строительство башни Ребенок Исп. 1 Исп. 2 A 30 30 B 19 13 + C 19 14 + D 23 16 + E 29 14 + F 64 52 + G 42 14 + I 20 22 - K 12 17 - L 39 12 + M 14 11 + N 81 30 + O 17 14 + P 31 17 + R 52 15 + © Иванов О.В., 2005 Знак Гипотезы: H0: изменений не произошло H1: есть изменения 12 плюсов, 2 минуса, 1 совпадение. Совпадение отбрасываем. n=14 α=0,05 х = min(2,12) = 2 По таблице А-7 находим критическое значение 2. Вывод. Результаты улучшились. 14 Критические значения для критерия знаков n α=0,05 α=0,1 9 1 1 10 1 1 11 1 2 12 2 2 13 2 3 14 2 3 15 3 3 16 3 4 17 4 4 18 4 5 19 4 5 20 5 5 25 7 7 30 9 10 © Иванов О.В., 2005 Таблица А-7. Критическая область 0 2 14 15 Решение примера. Кадровые предпочтения Гипотезы: H0: доля юношей в генеральной совокупности равна 0,5 H1: доля юношей значимо отличается от 0,5 Выборка составила 100 человек: n=100. Статистика: x = min (30, 70) = 30. Поскольку n>25, вычислим значение критерия по формуле: Для α=0,05 находим z = -1,96 (Двусторонняя область) -3,9 © Иванов О.В., 2005 -1,96 0 16 Решение примера. Кадровые предпочтения Вывод. Поскольку значение статистики попало в критическую область, мы отвергаем основную гипотезу и считаем, что кадровые предпочтения имеются. Дополнительный вопрос. Имеется возможность ответить на вопрос – какое соотношение юношей и девушек не приведет к отклонению нулевой гипотезы? Элементарный подсчет приведет к тому, что граничной окажется ситуация с пропорцией, близкой к 40÷60 или 60÷40. В этих границах отклонение может рассматриваться как результат случайности. © Иванов О.В., 2005 17 Решение примера. В день 40 леденцов Гипотезы: H0: медиана равна 40 H1: медиана значимо отличается от 40 Совпадения отбрасываем. n=18, α=0,05, х = min (3,15) = 3 По таблице находим критическое значение 4. Вывод. У нас достаточно оснований, чтобы отказаться от заявления, о том, что медиана продаваемых в день леденцов равна 40. © Иванов О.В., 2005 18 30 39 36 43 29 34 40 40 32 39 34 16 37 45 39 22 36 28 52 - + - 0 - - - + 0 + 3 плюса, 15 минусов, 2 совпадения 18 Что проверяет критерий Знако-ранговый критерий проверяет гипотезу об однородности для парных выборок. Требуется проверить, совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Часто проверяют наличие эффекта обработки: совпадение распределений «до» и «после» обработки. Гипотезы формулируются следующим образом: H0: выборки имеют одинаковый закон распределения H1: законы распределения различаются © Иванов О.В., 2005 20 Условия применения критерия 1. Исследуются парные (зависимые) выборки, проверяется эффект обработки – эксперименты «до» и «после». 2. Данные должны быть получены случайным образом. 3. Генеральная совокупность разностей имеет симметричное распределение, в том смысле, что правая часть графика является зеркальным отражением левой. При этом не требуется, чтобы данные имели нормальное распределение. © Иванов О.В., 2005 21 Последовательность действий Шаг 1. Для каждой пары (x, y) смотрим разности d = x – y. Не считаем пары, в которых разность равна нулю. Шаг 2. Ранжируем полученные разности по абсолютной величине (игнорируя знаки). Шаг 3. Находим сумму отрицательных рангов и сумму положительных рангов. Если выборки однородны, то эти суммы не могут сильно отличаться. Обозначим T – наименьшую из полученных сумм, n – число пар, в которых разности не равны нулю. © Иванов О.В., 2005 22 Последовательность действий Шаг 4. Определим статистику: если n≤30, статистика есть T, если n>30, статистика есть: © Иванов О.В., 2005 23 Последовательность действий (2) Шаг 5. Определим критические значения: если n≤30, критические точки T находятся по таблице А-8, если n>30, критические z-точки находятся по таблице А-2. Шаг 6. Делаем вывод: если значение статистики попадает в критическую область, мы отклоняем нулевую гипотезу. © Иванов О.В., 2005 24 Решение примера. Строительство башни Ребенок Исп. 1 Исп. 2 Разности d A 30 30 0 B 19 13 6 6 6 C 19 14 5 4,5 4,5 D 23 16 7 7 7 E 29 14 15 10 10 F 64 52 12 8 8 G 42 14 28 12 12 I 20 22 -2 1 -1 K 12 17 -5 4,5 -4,5 L 39 12 27 11 11 M 14 11 3 2,5 2,5 N 81 30 51 14 14 O 17 14 3 2,5 2,5 P 31 17 14 9 9 R 52 15 37 13 13 © Иванов О.В., 2005 Ранги Ранги - Ранги + 25 Решение Шаг 1. Заполнен столбец разностей d = Исп.1 – Исп.2. Устранена первая пара, в которой разность равна нулю. Шаг 2. Следующий столбец заполняем рангами разностей по абсолютной величине. Шаг 3. Сумма отрицательных рангов = 5,5 Сумма положительных рангов = 99,5 Число пар, в которых разности не равны нулю, n =14 Шаг 4. Поскольку n≤30, статистика есть T=5,5 © Иванов О.В., 2005 26 Решение Шаг 5. Поскольку n≤30, критическое значение 21. Шаг 6. Значение статистики попало в критическую область. Отклоняем нулевую гипотезу. © Иванов О.В., 2005 27 Критические значения n α=0,05 α=0,1 9 8 3 10 11 5 11 14 7 12 17 10 13 21 13 14 26 16 15 30 20 16 36 24 17 41 28 18 47 33 19 54 38 20 60 43 25 101 77 30 152 120 © Иванов О.В., 2005 Таблица А-8. 0 26 Критическая область для α=0,05 28 Mann-Whitney Test for Two Independent Samples Что проверяет критерий Манна-Уитни Критерий Манна-Уитни проверяет гипотезу об однородности для двух независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Гипотезы формулируются следующим образом: H0: выборки взяты из одной генеральной совокупности H1: выборки взяты из разных генеральных совокупностей © Иванов О.В., 2005 30 Суть метода Идея метода состоит в сравнении элементов первой выборки с элементами второй попарно. Всего имеется mn пар сравнений. Для каждого элемента первой выборки подсчитывается число элементов второй, которые меньше его или равны. Значения суммируются для каждой выборки. За статистику принимается минимальная из полученных сумм. © Иванов О.В., 2005 31 Задача. Длина побегов Исследователь интересуется, имеется ли разница между всхожестью семян на двух соседних участках земли. Имеются следующие данные: Участок 1 Участок 2 2,3 1,3 3,5 2,4 4,6 4,5 2,1 3,2 3,4 2,5 6,3 4,2 1,5 3,5 2,7 4,6 6,5 2,8 4,1 7,1 © Иванов О.В., 2005 32 Вычисление U в таблице Участок 1 Участок 2 1,5 1 1,3 0 2,1 1 2,4 3 2,3 1 2,5 3 2,7 3 2,8 4 3,4 5 3,2 4 3,5 5,5 3,5 5,5 4,1 6 4,2 7 4,6 8,5 4,5 7 6,3 9 4,6 7,5 6,5 9 7,1 9 Σ=58 © Иванов О.В., 2005 Σ=41 Ведем подсчет случаев уч.1 > уч.2 при сравнениях по всем парам чисел. Заполняем столбец 2. Если пара совпадает, принимаем при подсчете за 0,5. Выбираем минимальное чисел 58 и 41. из 41 есть значение U критерия, полученное по выборкам. 33 От данных к анализу © Иванов О.В., 2005 34 Выбор переменных для анализа Указываем группы для анализа © Иванов О.В., 2005 35 Отчет об анализе Mann-Whitney Test 0 © Иванов О.В., 2005 41 99 36 Что проверяет критерий Вилкоксона Критерий Вилкоксона проверяет гипотезу об однородности для двух независимых выборок: совпадают ли законы распределения генеральных совокупностей, из которых взяты эти выборки. Гипотезы формулируются следующим образом: H0: выборки взяты из одной генеральной совокупности H1: выборки взяты из разных генеральных совокупностей © Иванов О.В., 2005 38 Последовательность действий Шаг 1. Перемешиваем две выборки и ранжируем их значения. Шаг 2. Найдем сумму рангов первой и сумму рангов второй выборки. Если выборки однородны, то суммы не должны сильно отличаться. На этом основано действие критерия Вилкоксона. Шаг 3. Определим критерий: если n≤10, статистика W есть сумма рангов первой выборки, если n>10, статистика есть: © Иванов О.В., 2005 39 Обозначения Объемы выборок Меньшая из полученных сумм рангов Среднее значение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения Стандартное отклонение R, при условии, что две генеральные совокупности имеют одинаковый закон распределения © Иванов О.В., 2005 40 Последовательность действий Шаг 4. Зададим уровень значимости α (как правило 0,1; 0.05; 0.01). Шаг 5. Определим критическую область: если n≤10, критические точки W находятся по специальной таблице, которую мы не приводим. если n>10, критические z-точки находятся по таблице А-2 (поскольку статистика основывается на нормальном распределении) Шаг 6. Сравним полученное по выборкам значение статистики с границей критической области и сделаем вывод. © Иванов О.В., 2005 41 Пример. Простота чтения J.K.Rowling Leo Tolstoy 85,3 69,4 84,3 64,2 79,5 71,4 82,5 71,6 80,2 68,5 84,6 51,9 79,2 72,2 70,9 74,4 78,6 52,8 86,2 58,4 74,0 65,4 83,7 73,6 Проверить гипотезу об однородности двух независимых выборок. Можно ли считать, что простота чтения одинакова для произведений двух исследуемых писателей? 71,4 © Иванов О.В., 2005 42 Решение примера J.K.Rowling Ранги Leo Tolstoy Ранги 85,3 24 69,4 7 84,3 22 64,2 4 79,5 18 71,4 9,5 82,5 20 71,6 11 80,2 19 68,5 6 84,6 23 51,9 1 79,2 17 72,2 12 70,9 8 74,4 15 78,6 16 52,8 2 86,2 25 58,4 3 74,0 14 65,4 5 83,7 21 73,6 13 71,4 9,5 Всего 13 Σ=236,5 Всего 12 Σ=88,5 © Иванов О.В., 2005 • Ранжировали две выборки, перемешав. • Нашли сумму рангов каждой выборки. • Сумма рангов первой выборки равна 236,5. 43 Вычисления Находим следующие величины: © Иванов О.В., 2005 44 Получение вывода Критическая область является двусторонней и при α=0,05 критические точки z=-1,96 и z=1,96. Полученное нами значение попадает в критическую область. Вывод. Выборки не однородны, генеральных совокупностей. © Иванов О.В., 2005 получены из разных 45 Решаем в SPSS © Иванов О.В., 2005 46 Вновь вспомним о растениях Mann-Whitney Test 0 -1,96 -0,646 © Иванов О.В., 2005 210 86 1,96 47 Сравнение эффективности Приложения Парные выборки Параметрический тест t-тест или z-тест Непараметрически й тест Эффективнос ть Критерий знаков Знако-ранговый критерий 0,63 0,95 Две независимые t-тест или z-тест выборки Критерий Вилкоксона 0,95 Несколько независимых выборок Дисперсионный анализ (F-тест) Критерий Уоллиса Краскела- 0,95 Корреляция Линейная корреляция Ранговая корреляция 0,91 Проверка случайности Нет параметрических Тест Руна тестов Нет базы сравнения Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для нормально распределенной генеральной совокупности. © Иванов О.В., 2005 48