Лекция 12 Непараметрические критерии. Проверка однородности

advertisement
Параметрические критерии
Статистические критерии z, t и F называются параметрическими.
Параметрические критерии предназначены для проверки
гипотез о параметрах генеральной совокупности (среднем,
дисперсии, доле признака) или гипотез о типе распределения.
В статистике разработано также направление, которое
развивает непараметрические критерии. В этом случае вид и
параметры распределения не рассматриваются. Такие критерии
используют, в частности, для исследования генеральных
совокупностей, которые не распределены нормально.
© Иванов О.В., 2005
2
Преимущества непараметрических методов
1.  Могут использоваться для проверки гипотез о параметрах
генеральной
совокупности,
когда
переменная
не
распределена нормально.
2.  Могут использоваться для номинальных и порядковых
данных.
3.  Могут использоваться для проверки гипотез, которые не
связаны с параметрами генеральной совокупности.
4.  В большинстве случаев для непараметрических методов
вычисления проще, чем для параметрических. Методы
более понятны.
© Иванов О.В., 2005
3
Недостатки непараметрических методов
1.  Они менее точны, чем соответствующие параметрические
критерии.
2.  Они менее информативны.
3.  Они менее эффективны. Например, для критерия знаков
нужна выборка из 100 человек, в то время, как для получения
аналогичных результатов при использовании z-критерия
достаточно было бы выборки из 60 человек.
© Иванов О.В., 2005
4
Сравнение эффективности
Приложения
Парные выборки
Параметрический
тест
t-тест или z-тест
Непараметрический
тест
Эффективность
Критерий знаков
Знако-ранговый
критерий
0,63
0,95
Две независимые t-тест или z-тест
выборки
Критерий Вилкоксона
0,95
Несколько
независимых
выборок
Дисперсионный
анализ (F-тест)
Критерий
Уоллиса
Краскела-
0,95
Корреляция
Линейная корреляция Ранговая корреляция
0,91
Проверка
случайности
Нет параметрических Тест Руна
тестов
Нет базы
сравнения
Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для
нормально распределенной генеральной совокупности.
© Иванов О.В., 2005
5
Пример 1. Кадровые предпочтения
Руководство сети ресторанов быстрого обслуживания обратило
внимание, что кадровая служба сети отдает большее
предпочтение при подборе кадров на должность менеджера
девушкам, нежели, чем юношам.
Среди менеджеров оказалось 30 юношей и 70 девушек.
Усомнившись
в
разумности
сложившихся
пропорций,
руководство
запросило
объяснений.
Кадровая
служба
объяснила сложившуюся пропорцию результатом случайности,
а не итогом определенных предпочтений.
Проверить на уровне значимости α=0,05, может ли такая
пропорция оказаться результатом случайности.
© Иванов О.В., 2005
7
Пример 2. Строительство башни
Несколько детей попросили из предоставленных им кубиков
собрать башню. Эксперимент повторили с этими же детьми
через месяц, результаты времени (в секундах) представлены в
таблице ниже.
Ребенок
A
B
C
D
E
F
G
I
K
L
M
Исп. 1
30 19 19 23 29
44
42 20 12 39 14 81 17 31 52
Исп. 2
30 13 14 16 14
52
14 22 17 12
11
N
O
P
R
30 14 17 15
На уровне значимости α=0,05 проверить предположение о
том, что нет существенной разницы между результатами.
© Иванов О.В., 2005
8
Пример 3. В день 40 леденцов
Владелец продуктового магазина строит гипотезу о том, что
медианное количество продаваемых им за день леденцов равно
40. Случайная выборка за 20 дней дает следующие данные по
количеству леденцов, продаваемых каждый день.
18
30
39
36
43
29
34
40
40
32
39
34
16
37
45
39
22
36
28
52
При α = 0,05 проверить гипотезу владельца магазина.
© Иванов О.В., 2005
9
Критерий знаков
Гипотеза
об однородности для
парных выборок
Критерий знаков
Гипотеза
о значении медианы
Гипотеза
о доли признака
© Иванов О.В., 2005
Строительство
башни
В день
40 леденцов
Кадровые
предпочтения
10
На чем основан критерий
Сравниваем наблюдения попарно и проставляем знаки.
Последовательность знаков есть результаты n независимых
испытаний с двумя возможными исходами: “плюс” или “минус”.
Если распределения совпадают, то в каждом испытании
вероятности равны ½:
1
P("+") = P("−") =
2
Количество плюсов и количество минусов есть случайные
величины, которые распределены по биноминальному закону и
теоретически должны быть равны. Малое количество плюсов
€ будет означать, что гипотеза неверна.
(или минусов)
© Иванов О.В., 2005
11
Условия для применения критерия
1. Данные должны быть получены случайным образом.
2. Нет никаких требований относительно закона распределения
генеральных совокупностей, из которых эти данные получены.
© Иванов О.В., 2005
12
Статистика
1. Объем выборки n≤25. Выбираем в качестве критерия: x =
min (количество минусов, количество плюсов).
Критические значения находятся по таблице. Если x окажется
меньше или равен критическому значению из таблицы, то
гипотеза отвергается.
2. Объем выборки n>25. Тогда в качестве критерия выберем:
Критические значения находятся по таблице нормального
закона.
© Иванов О.В., 2005
13
Решение примера. Строительство башни
Ребенок
Исп. 1
Исп. 2
A
30
30
B
19
13
+
C
19
14
+
D
23
16
+
E
29
14
+
F
64
52
+
G
42
14
+
I
20
22
-
K
12
17
-
L
39
12
+
M
14
11
+
N
81
30
+
O
17
14
+
P
31
17
+
R
52
15
+
© Иванов О.В., 2005
Знак
Гипотезы:
H0: изменений не произошло
H1: есть изменения
12 плюсов, 2 минуса, 1 совпадение.
Совпадение отбрасываем.
n=14 α=0,05 х = min(2,12) = 2
По таблице А-7 находим критическое
значение 2.
Вывод. Результаты улучшились.
14
Критические значения для критерия знаков
n
α=0,05
α=0,1
9
1
1
10
1
1
11
1
2
12
2
2
13
2
3
14
2
3
15
3
3
16
3
4
17
4
4
18
4
5
19
4
5
20
5
5
25
7
7
30
9
10
© Иванов О.В., 2005
Таблица А-7.
Критическая
область
0
2
14
15
Решение примера. Кадровые предпочтения
Гипотезы:
H0: доля юношей в генеральной совокупности равна 0,5
H1: доля юношей значимо отличается от 0,5
Выборка составила 100 человек: n=100. Статистика: x = min (30,
70) = 30. Поскольку n>25, вычислим значение критерия по
формуле:
Для α=0,05 находим z = -1,96 (Двусторонняя область)
-3,9
© Иванов О.В., 2005
-1,96
0
16
Решение примера. Кадровые предпочтения
Вывод. Поскольку значение статистики попало в критическую
область, мы отвергаем основную гипотезу и считаем, что
кадровые предпочтения имеются.
Дополнительный вопрос. Имеется возможность ответить на
вопрос – какое соотношение юношей и девушек не приведет к
отклонению нулевой гипотезы? Элементарный подсчет
приведет к тому, что граничной окажется ситуация с
пропорцией, близкой к 40÷60 или 60÷40. В этих границах
отклонение может рассматриваться как результат случайности.
© Иванов О.В., 2005
17
Решение примера. В день 40 леденцов
Гипотезы:
H0: медиана равна 40
H1: медиана значимо отличается от 40
Совпадения отбрасываем.
n=18, α=0,05, х = min (3,15) = 3
По таблице находим критическое
значение 4.
Вывод. У нас достаточно оснований,
чтобы отказаться от заявления, о том,
что медиана продаваемых в день
леденцов равна 40.
© Иванов О.В., 2005
18
30
39
36
43
29
34
40
40
32
39
34
16
37
45
39
22
36
28
52
-
+
-
0
-
-
-
+
0
+
3 плюса, 15 минусов,
2 совпадения
18
Что проверяет критерий
Знако-ранговый критерий проверяет гипотезу об однородности
для парных выборок. Требуется проверить, совпадают ли
законы распределения генеральных совокупностей, из которых
взяты эти выборки. Часто проверяют наличие эффекта
обработки: совпадение распределений «до» и «после»
обработки.
Гипотезы формулируются следующим образом:
H0: выборки имеют одинаковый закон распределения
H1: законы распределения различаются
© Иванов О.В., 2005
20
Условия применения критерия
1. Исследуются парные (зависимые) выборки, проверяется
эффект обработки – эксперименты «до» и «после».
2. Данные должны быть получены случайным образом.
3. Генеральная совокупность разностей имеет симметричное
распределение, в том смысле, что правая часть графика
является зеркальным отражением левой. При этом не
требуется, чтобы данные имели нормальное распределение.
© Иванов О.В., 2005
21
Последовательность действий
Шаг 1. Для каждой пары (x, y) смотрим разности d = x – y. Не
считаем пары, в которых разность равна нулю.
Шаг 2. Ранжируем полученные разности по абсолютной
величине (игнорируя знаки).
Шаг 3. Находим сумму отрицательных рангов и сумму
положительных рангов. Если выборки однородны, то эти
суммы не могут сильно отличаться. Обозначим T –
наименьшую из полученных сумм, n – число пар, в
которых разности не равны нулю.
© Иванов О.В., 2005
22
Последовательность действий
Шаг 4. Определим статистику:
если n≤30, статистика есть T,
если n>30, статистика есть:
© Иванов О.В., 2005
23
Последовательность действий (2)
Шаг 5. Определим критические значения:
если n≤30, критические точки T находятся по таблице А-8,
если n>30, критические z-точки находятся по таблице А-2.
Шаг 6.
Делаем вывод: если значение статистики попадает в
критическую область, мы отклоняем нулевую гипотезу.
© Иванов О.В., 2005
24
Решение примера. Строительство башни
Ребенок
Исп. 1
Исп. 2
Разности d
A
30
30
0
B
19
13
6
6
6
C
19
14
5
4,5
4,5
D
23
16
7
7
7
E
29
14
15
10
10
F
64
52
12
8
8
G
42
14
28
12
12
I
20
22
-2
1
-1
K
12
17
-5
4,5
-4,5
L
39
12
27
11
11
M
14
11
3
2,5
2,5
N
81
30
51
14
14
O
17
14
3
2,5
2,5
P
31
17
14
9
9
R
52
15
37
13
13
© Иванов О.В., 2005
Ранги
Ранги -
Ранги +
25
Решение
Шаг 1. Заполнен столбец разностей d = Исп.1 – Исп.2.
Устранена первая пара, в которой разность равна нулю.
Шаг 2. Следующий столбец заполняем рангами разностей по
абсолютной величине.
Шаг 3. Сумма отрицательных рангов = 5,5
Сумма положительных рангов = 99,5
Число пар, в которых разности не равны нулю, n =14
Шаг 4. Поскольку n≤30, статистика есть T=5,5
© Иванов О.В., 2005
26
Решение
Шаг 5. Поскольку n≤30, критическое значение 21.
Шаг 6. Значение статистики попало в критическую область.
Отклоняем нулевую гипотезу.
© Иванов О.В., 2005
27
Критические значения
n
α=0,05
α=0,1
9
8
3
10
11
5
11
14
7
12
17
10
13
21
13
14
26
16
15
30
20
16
36
24
17
41
28
18
47
33
19
54
38
20
60
43
25
101
77
30
152
120
© Иванов О.В., 2005
Таблица А-8.
0
26
Критическая
область
для α=0,05
28
Mann-Whitney Test
for Two Independent Samples
Что проверяет критерий Манна-Уитни
Критерий Манна-Уитни проверяет гипотезу об однородности для
двух
независимых
выборок:
совпадают
ли
законы
распределения генеральных совокупностей, из которых взяты
эти выборки.
Гипотезы формулируются следующим образом:
H0: выборки взяты из одной генеральной совокупности
H1: выборки взяты из разных генеральных совокупностей
© Иванов О.В., 2005
30
Суть метода
Идея метода состоит в сравнении элементов первой выборки с
элементами второй попарно. Всего имеется mn пар сравнений.
Для каждого элемента первой выборки подсчитывается число
элементов второй, которые меньше его или равны. Значения
суммируются для каждой выборки. За статистику принимается
минимальная из полученных сумм.
© Иванов О.В., 2005
31
Задача. Длина побегов
Исследователь интересуется, имеется ли разница между
всхожестью семян на двух соседних участках земли. Имеются
следующие данные:
Участок 1
Участок 2
2,3
1,3
3,5
2,4
4,6
4,5
2,1
3,2
3,4
2,5
6,3
4,2
1,5
3,5
2,7
4,6
6,5
2,8
4,1
7,1
© Иванов О.В., 2005
32
Вычисление U в таблице
Участок 1
Участок 2
1,5
1
1,3
0
2,1
1
2,4
3
2,3
1
2,5
3
2,7
3
2,8
4
3,4
5
3,2
4
3,5
5,5
3,5
5,5
4,1
6
4,2
7
4,6
8,5
4,5
7
6,3
9
4,6
7,5
6,5
9
7,1
9
Σ=58
© Иванов О.В., 2005
Σ=41
Ведем подсчет случаев уч.1 >
уч.2 при сравнениях по всем
парам
чисел.
Заполняем
столбец
2.
Если
пара
совпадает, принимаем при
подсчете за 0,5.
Выбираем минимальное
чисел 58 и 41.
из
41 есть значение U критерия,
полученное по выборкам.
33
От данных к анализу
© Иванов О.В., 2005
34
Выбор переменных для анализа
Указываем группы для анализа
© Иванов О.В., 2005
35
Отчет об анализе
Mann-Whitney Test
0
© Иванов О.В., 2005
41
99
36
Что проверяет критерий Вилкоксона
Критерий Вилкоксона проверяет гипотезу об однородности для
двух
независимых
выборок:
совпадают
ли
законы
распределения генеральных совокупностей, из которых взяты
эти выборки.
Гипотезы формулируются следующим образом:
H0: выборки взяты из одной генеральной совокупности
H1: выборки взяты из разных генеральных совокупностей
© Иванов О.В., 2005
38
Последовательность действий
Шаг 1. Перемешиваем две выборки и ранжируем их значения.
Шаг 2. Найдем сумму рангов первой и сумму рангов второй
выборки. Если выборки однородны, то суммы не должны
сильно отличаться. На этом основано действие
критерия Вилкоксона.
Шаг 3. Определим критерий: если n≤10, статистика W есть
сумма рангов первой выборки, если n>10, статистика
есть:
© Иванов О.В., 2005
39
Обозначения
Объемы выборок
Меньшая из полученных сумм
рангов
Среднее
значение
R,
при
условии, что две генеральные
совокупности имеют одинаковый
закон распределения
Стандартное отклонение R, при
условии, что две генеральные
совокупности имеют одинаковый
закон распределения
© Иванов О.В., 2005
40
Последовательность действий
Шаг 4. Зададим уровень значимости α (как правило 0,1; 0.05;
0.01).
Шаг 5. Определим критическую область:
если n≤10, критические точки W находятся по
специальной таблице, которую мы не приводим.
если n>10, критические z-точки находятся по таблице
А-2 (поскольку статистика основывается на нормальном
распределении)
Шаг 6. Сравним полученное по выборкам значение статистики
с границей критической области и сделаем вывод.
© Иванов О.В., 2005
41
Пример. Простота чтения
J.K.Rowling
Leo Tolstoy
85,3
69,4
84,3
64,2
79,5
71,4
82,5
71,6
80,2
68,5
84,6
51,9
79,2
72,2
70,9
74,4
78,6
52,8
86,2
58,4
74,0
65,4
83,7
73,6
Проверить гипотезу об однородности
двух независимых выборок.
Можно ли считать, что простота
чтения одинакова для произведений
двух исследуемых писателей?
71,4
© Иванов О.В., 2005
42
Решение примера
J.K.Rowling
Ранги
Leo Tolstoy
Ранги
85,3
24
69,4
7
84,3
22
64,2
4
79,5
18
71,4
9,5
82,5
20
71,6
11
80,2
19
68,5
6
84,6
23
51,9
1
79,2
17
72,2
12
70,9
8
74,4
15
78,6
16
52,8
2
86,2
25
58,4
3
74,0
14
65,4
5
83,7
21
73,6
13
71,4
9,5
Всего 13
Σ=236,5
Всего 12
Σ=88,5
© Иванов О.В., 2005
•  Ранжировали
две
выборки,
перемешав.
•  Нашли
сумму
рангов
каждой
выборки.
•  Сумма
рангов
первой выборки
равна 236,5.
43
Вычисления
Находим следующие величины:
© Иванов О.В., 2005
44
Получение вывода
Критическая область является двусторонней и при α=0,05
критические точки z=-1,96 и z=1,96. Полученное нами значение
попадает в критическую область.
Вывод. Выборки не однородны,
генеральных совокупностей.
© Иванов О.В., 2005
получены
из
разных
45
Решаем в SPSS
© Иванов О.В., 2005
46
Вновь вспомним о растениях
Mann-Whitney Test
0
-1,96 -0,646
© Иванов О.В., 2005
210
86
1,96
47
Сравнение эффективности
Приложения
Парные выборки
Параметрический
тест
t-тест или z-тест
Непараметрически
й тест
Эффективнос
ть
Критерий знаков
Знако-ранговый
критерий
0,63
0,95
Две независимые t-тест или z-тест
выборки
Критерий Вилкоксона
0,95
Несколько
независимых
выборок
Дисперсионный
анализ (F-тест)
Критерий
Уоллиса
Краскела-
0,95
Корреляция
Линейная корреляция Ранговая корреляция
0,91
Проверка
случайности
Нет параметрических Тест Руна
тестов
Нет базы
сравнения
Эффективность непараметрических тестов оценивалась в сравнении с параметрическими для
нормально распределенной генеральной совокупности.
© Иванов О.В., 2005
48
Download