Uploaded by dandandan

Расчетная работа 1 итог

advertisement
Ксения Алексеевна Кликунова, Арина Викторовна Холматова-Бочкарева, Анна Андреевна
Разинова
Методические указания
к расчетной работе
«Анализ количественных данных»
УДК
Методические указания к расчетной работе «Анализ количественных данных»: ФГБОУ
ВО «Санкт-Петербургский государственный педиатрический медицинский университет»
МЗ РФ, 2022- 44с.
Издание подготовлено в соответствии с программой по дисциплине
"Информационное обеспечение медицины" для студентов 1 курса специальности
«Педиатрия», «Лечебное дело», «Стоматология» и в соответствии с программой по
дисциплине "Математика" для студентов 1 курса специальности «Сестринское дело».
Данное методическое пособие служит кратким изложением материала по анализу
количественных данных и содержит рекомендации, требования и пример выполнения
расчетной работы.
Авторы:
Ксения Алексеевна Кликунова – кандидат физико-математических наук, доцент
кафедры Медицинской физики СПбГПМУ.
Арина Викторовна Холматова-Бочкарева – ассистент кафедры Медицинской физики
СПбГПМУ.
Анна Андреевна Разинова – старший преподаватель кафедры Медицинской физики
СПбГПМУ.
Рецензенты:
Марина Витальевна Гончарова – кандидат физико-математических наук, доцент
кафедры управления медико-биологическими системами Санкт-Петербургского
государственного университета,
Александра Александровна Тихомирова – кандидат экономических наук,
заведующий кафедрой медицинской информатики ФГБОУ ВО «Санкт-Петербургский
государственный педиатрический медицинский университет» Минздрава России.
Оглавление
Основные определения .................................................................................................................4
Описательные статистики.............................................................................................................4
Меры центральной тенденции .................................................................................................4
Меры размаха ............................................................................................................................5
Проверка статистических гипотез ...............................................................................................5
Алгоритм проверки статической гипотезы .................................................................................7
Алгоритм выбора статистического критерия .............................................................................8
Расчетная работа «Анализ количественных данных» ...............................................................9
Пример задания..............................................................................................................................9
Алгоритм выполнения работы ...................................................................................................10
1.
Вычисление описательных статистик.........................................................................10
2.
Графическое представление данных ...........................................................................14
2.1 График «ящик с усами» ...............................................................................................14
2.2 Столбиковая диаграмма с доверительным интервалом ...........................................15
2.3 Гистограмма ..................................................................................................................17
3.
Проверка гипотезы о принадлежности выборки к генеральной совокупности с
нормальным законом распределения ....................................................................................20
3.1 Критерий χ2 Пирсона ....................................................................................................20
3.2 Критерий Шапиро-Уилка ............................................................................................22
Сравнение независимых выборок ...............................................................................24
4.
4.1
T-критерий Стьюдента ..........................................................................................24
4.2 Критерий Фишера (F-критерий) .................................................................................25
4.3 Критерий Манна-Уитни...............................................................................................26
Сравнение зависимых выборок ...................................................................................29
5.
5.1
Пример задания......................................................................................................29
5.2
Парный критерий Стьюдента ...............................................................................30
5.2 Критерий T-Уилкоксона ..............................................................................................31
6.
Общий вывод .................................................................................................................33
7.
Требования к отчету .....................................................................................................33
Приложения .............................................................................................................................36
Критические значения t-критерия Стьюдента.................................................................36
Критические значения критерия Пирсона (χ2) ................................................................37
Критические значения F-критерия Фишера для двух выборок одинакового объема .38
Вспомогательные коэффициенты α для проверки нормальности распределения по Wкритерию Шапиро – Уилка ...............................................................................................39
Критические значения W-критерия Шапиро – Уилка ....................................................41
Таблица критических значений критерия U-Манна-Уитни ...........................................42
Критические значения критерия Уилкоксона .................................................................43
Полная схема выбора критерия ........................................................................................44
Методические указания к расчетной работе
«Анализ качественных данных»
Основные определения
 Генеральная совокупность (популяция) – это множество,
включающее все данные, явления, объекты или людей, которые
подвергаются изучению.
 Выборочная совокупность (выборка) – это часть элементов,
отобранных из генеральной совокупности.
 Выборка должна быть репрезентативной, т.е. выбранной случайным
образом и имеющей с генеральной совокупностью одинаковую
структуру.
 Независимые выборки – выборки, где вероятность отбора любого
испытуемого одной выборки не зависит от отбора любого испытуемого
другой.
 Зависимые выборки – выборки, где каждому испытуемому одной
выборки поставлен в соответствие по определенному критерию
испытуемый из другой выборки или тот же самый испытуемый при
повторном измерении.
Описательные статистики
Меры центральной тенденции
 Выборочное среднее – среднее арифметическое значение признака в
выборке.
n
X
x
i 1
n
i
, где n-объем выборки, xi– элементы выборки.
 Мода – наиболее часто встречающееся в выборке значение.
 Медиана делит упорядоченную выборку на 2 равные части. Если в
выборке четное количество элементов, то медиана – это среднее
арифметическое элементов, находящихся посередине упорядоченной
выборки.
 Нижний квартильQ1– это такое значение, что 25% значений
переменной попадают ниже этого значения.
 Квартиль Q2 - МЕДИАНА– это такое значение, что 50% значений
переменной попадают ниже этого значения.
 Верхний квартильQ3 – такое значение, ниже которого попадают 75%
значений переменной.
Меры размаха
 Интерквартильный размах – это разность между верхним квартилем
и нижним.
IQR  Q3  Q1
 Дисперсия – мера разброса случайной величины (мера отклонения от
среднего значения).
 x  X 
n
D
2
i 1
n
 x
n
или уточненная дисперсия D 
i
i 1
i
 X
n 1
2
, если n<30.
 Стандартное отклонение – тоже мера разброса случайной величины.
 D
 Доверительный интервал – это интервал значений, который включает
в себя оцениваемый генеральный параметр с указанной вероятностью
(рисунок 1).
Рисунок 1
x 

t , n , где σ – стандартное отклонение, n – объем выборки,
n
tα,n– коэффициент Стьюдента (приложение № 1).
Проверка статистических гипотез
Статистическая гипотеза – это любое предположение о числовых
показателях и функциях распределения.
H0 – нулевая (проверяемая) гипотеза
Пример: средние значения параметра в двух генеральных совокупностях
равны или отличаются незначимо.
H1 – альтернативная гипотеза
Пример: средние значения отличаются значимо.
Статистический критерий – это правило, по которому гипотеза H0
принимается или отвергается.
Условия применения параметрических критериев:
• данные количественные;
• выборочные данные извлечены из нормально распределенной
генеральной совокупности.
В остальных случаях применяем непараметрические критерии.
Работая с научной гипотезой, исследователь может сделать неверный
вывод, т.к. принятие гипотезы еще не означает, что она действительно верна,
а ее отклонение еще не означает, что она действительно ложна. Это можно
представить в виде таблицы:
Гипотеза H0
Пациент здоров
Верна
Пациент на самом деле здоров
Неверна
Пациент на самом деле болен
Принимается
Отвергается
Здорового принимаем за
здорового – всѐ хорошо
Больной пациент принимается
за здорового - Ошибка 2 рода
Здорового принимаем за
больного - Ошибка 1 рода
Больного принимаем за
больного и лечим – всѐ хорошо
 Ошибка первого рода – отвергнуть верную гипотезу.
 Ошибка второго рода – принять неверную гипотезу.
Ошибки первого и второго рода взаимосвязаны: уменьшение одной из них
приводит к увеличению другой. Одновременно уменьшить обе ошибки
можно только путем увеличения объема исследования.
 Уровень значимости α– это вероятность допустить ошибку первого
рода.
 Доверительная вероятность р=1-α
 Мощность критерия – вероятность не допустить ошибку второго
рода.
Параметрические критерии более мощные, поэтому рекомендуется по
возможности применять параметрические методы, и только тогда, когда не
соблюдаются обязательные условия их применения, использовать методы
непараметрической статистики.
Алгоритм проверки статической гипотезы
Выбор критерия
Расчет статистики критерия Q
Сравнение статистики критерия с критическими значениями
Q0,05 и Q0,01
Решения о принятии или нет гипотезы (рисунок 2)
Рисунок 2
Алгоритм выбора статистического критерия
Представленный ниже алгоритм (рисунок 3) справедлив для выбора
критерия в случае сравнения двух выборок количественных данных. От
нормальности распределения зависит не только выбор критерия, но испособ
представления данных. Если в выборках нормальное распределение, то
количественные данные описываем, используясредневыборочноезначение,
стандартное отклонение и 95% доверительный интервал. Если гипотеза о
нормальности распределения отвергается, то данные описываем медианой и
квартилями. Визуализация данных также зависит от типа распределения.
Рисунок 3
Независимые выборки
X   (95% ДИ )
Да
Зависимые выборки
Me, Q1 ; Q3 
Нет
Независимые выборки
Зависимые выборки
Расчетная работа «Анализ количественных данных»
Цели работы:
 ознакомиться с методами анализа количественных данных;
 научиться выбирать верные критерии для анализа данных;
 сравнить выборки и сделать вывод о значимости или не значимости
отличий.
Пример задания
В таблице имеются данные о концентрации гемоглобина в крови (г/л) у
пациентов, страдающих целиакией. В первой выборке представлены
пациенты, находящиеся в острой стадии заболевания, во второй - в стадии
ремиссии.
Значения концентрации гемоглобина в крови обозначены:
Х1–для пациентов в стадии ремиссии,
Х2–для пациентов в острой стадии заболевания
№
Выборка 1
Выборка 2
1
2
3
4
132
139
127
106
136
98
124
94
5
6
7
8
9
10
11
12
13
14
15
114
125
142
122
110
131
143
102
131
124
146
141
102
136
98
94
112
101
104
123
106
123
Алгоритм выполнения работы
1. Вычисление описательных статистик
Записываем исходные данные:
Выборка 1 значений Х1; объем 𝑛1 = 15, пациенты в ремиссии;
Выборка 2 значений Х2; объем 𝑛2 = 15, пациенты с обострением.
Для вычисления описательных статистик и дальнейшего анализа
удобнее всего данные записать в виде таблицы. Значения первой выборки в
таблицу 1, значения второй выборки – в таблицу 2.
Указания к заполнению таблицы 1:
 Во второй столбец просто переписываем значения из задания, без
сокращений, как указано в исходной таблице.
 В третьем столбце сортируем их от наименьшего к наибольшему.
 Четвертый столбец оставляем пустым (он заполняется после таблицы
4).
 Вычисляем средневыборочное значение (округляем до двух знаков
после запятой):
n1
X1 
X
i 1
i
n1

1894
 126,27 г/л.
15
 Столбец 5 заполняем разностями значений из третьего столбца и
средневыборочного значения.
 Столбец 6 – значения из пятого столбца, возведенные в квадрат.
 Вычисляем дисперсию выборки (округляем до четырех знаков после
запятой):
n1
D1 
 X 
2
i 1
i
n1  1

2596,9335
 185,4953 (г/л)2.
14
 Вычисляем стандартное отклонение (округляем до двух знаков после
запятой):
  D  185,4953  13,62 г/л.
Таблица 1
1
2
3
4
5
6
№
X1.i
Упорядоченные
Х1.i
Класс j
𝚫Х𝟏,𝒊 = 𝐗 𝟏,𝐢 − 𝑿𝟏
𝚫Х𝟏,𝐢 𝟐
1
132
102
1
-24,27
589,0329
2
139
106
1
-20,27
410,8729
3
127
110
1
-16,27
264,7129
4
106
114
2
-12,27
150,5529
5
114
122
3
-4,27
18,2329
6
125
124
3
-2,27
5,1529
7
142
125
3
-1,27
1,6129
8
122
127
3
0,73
0,5329
9
110
131
4
4,73
22,3729
10
131
131
4
4,73
22,3729
11
143
132
4
5,73
32,8329
12
102
139
5
12,73
162,0529
13
131
142
5
15,73
247,4329
14
124
143
5
16,73
279,8929
15
146
146
5
19,73
389,2729
Σ
1894
2596,9335
 Медианой является восьмой элемент в упорядоченной выборке:
Me  X 8  127 г/л.
 Нижний квартиль:
Q1  X 4  114 г/л.
 Верхний квартиль:
Q3  X12  139 г/л.
 Интерквартильный размах:
IQR  Q3  Q1  25 г/л.
 Вычисление границ доверительного интервала:
X 1 
1
n1
 t , n 
13,62
 2,15  7,57 г/л, где tα,n – критическое значение критерия
15
Стьюдента при уровне значимости 0,05 и n-1 степенями свободы
(Приложение 1).
Таким образом, нижняя граница 95% ДИ:
X1  X1  126,27  7,57  118,70 г/л.
верхняя граница 95% ДИ:
X1  X1  126,27  7,57  133,84 г/л.
Таблица 2 для второй выборки заполняется аналогично.
Таблица 2
1
2
3
4
5
6
№
X2.i
Упорядоченные
Х2.i
Класс j
𝚫Х𝟐,𝐢 = 𝐗 𝟐.𝐢 − 𝑿𝟐
𝚫Х𝟐,𝒊 𝟐
1
136
94
1
-18,8
353,44
2
98
94
1
-18,8
353,44
3
124
98
1
-14,8
219,04
4
94
98
1
-14,8
219,04
5
141
101
1
-11,8
139,24
6
102
102
1
-10,8
116,64
7
136
104
2
-8,8
77,44
8
98
106
2
-6,8
46,24
9
94
112
2
-0,8
0,64
10
112
123
4
10,2
104,04
11
101
123
4
10,2
104,04
12
104
124
4
11,2
125,44
13
123
136
5
23,2
538,24
14
106
136
5
23,2
538,24
15
123
141
5
28,2
795,24
Σ
1692
 Средневыборочное значение:
n2
X2 
X
i 1
n2
i
1692
 112,80 г/л.
15

 Дисперсия выборки:
n1
D1 
 X 
2
i 1
i
n1  1

3730,4
 266,4571 (г/л)2.
14
 Стандартное отклонение:
  D  266,4571  16,32 г/л.
3730,4
 Медиана:
Me  X 8  106 г/л.
 Нижний квартиль:
Q1  X 4  98 г/л.
 Верхний квартиль:
Q3  X12  124 г/л.
 Интерквартильный размах:
IQR  Q3  Q1  26 г/л.
 Границы доверительного интервала:
X 2 
2
n2
 t , n 
16,32
 2,15  9,07 г/л
15
нижняя граница 95% ДИ:
X 2  X 2  112,80  9,07  103,73 г/л.
верхняя граница 95% ДИ:
X 2  X 2  112,80  9,07  121,87 г/л.
Получившиеся ответы заносим в таблицу 3.
Таблица 3
Средневыборочное (𝑋)
Медиана (𝑀𝑒)
Нижний квартиль (𝑄1 )
Верхний квартиль (𝑄3 )
Интерквартильный размах (𝐼𝑄𝑅)
Дисперсия (𝐷)
Среднеквадратичное отклонение
(𝜎)
Верхняя граница 95% ДИ
Нижняя граница 95% ДИ
Ремиссия
126,27
127
114
139
25
185,4953
Обострение
112,80
106
98
124
26
266,4571
13,62
16,32
133,84
118,70
121,87
103,73
Делаем предварительные выводы, где указываем, как изменилось
среднее значение переменной и медиана. Средние значения записываем в
виде X   (95% ДИ ) , медианы в виде Me (Q1; Q3 ) .
Предварительный вывод: У пациентов с ремиссией целиакии среднее
значение гемоглобина выше, чем у пациентов в острой стадии:
126,27  13,62 (95% ДИ 118,70  133,84) против 112,80  16,32 (95% ДИ 113,73  121,87) .
Медианное значение гемоглобина также заметно отличаются: 127 г/л
(114;139) против 106 г/л (98;124).
2. Графическое представление данных
2.1 График «ящик с усами»
Диаграмма размаха («ящик с усами»)– это удобный способ визуального
представления групп числовых данных через квартили. Прямые линии,
исходящие из ящика, называются «усами» и используются для обозначения
степени разброса за пределами верхнего и нижнего квартилей. Если есть
выбросы (результаты, выделяющиеся из общей выборки), тоони
отображаются в виде отдельных точек, находящихся на одной линии с усами.
Диаграммы размаха могут располагаться как горизонтально, так и
вертикально. Как строить этот график, показано на рисунке 4.
Рисунок 4
Нарисуйте два «ящика с усами» в одной системе координат (рисунок
5), так сразу будет видно, отличаются ли выборки между собой. Ширина
ящиков выбирается произвольно, как вам симпатичнее.
Рисунок 5
2.2 Столбиковая диаграмма с доверительным интервалом
Еще одним способом показать графически и меру центральной
тенденции, и меру размаха, является столбиковая диаграмма с
доверительным
интервалом.
Высота
столбца
соответствует
средневыборочному значению (ширина на любителя), и от верхней грани
прямоугольника вверх и вниз отложена полуширина доверительного
интервала (рисунок 6). Нарисуйте два столбца в одной системе координат
(рисунок 7).
Рисунок 6
Рисунок 7
2.3 Гистограмма
Гистограмма – это наглядное представление функцииплотности
вероятностинекоторой случайной величины, построенное по выборке.
Иногда еѐ называют частотным распределением, так как гистограмма
показывает частоту появления измеренных значений параметров объекта.
Для построения гистограммы нам потребуются значения плотности
вероятности и интервалы наших значений полученных в задании выборок.
Для того, чтобы найти их нам понадобится прежде заполнить таблицу 4. Для
начала стоит перерисовать «каркас» таблицы 4, как указано в примере, но без
указания числовых значений, их вы будете заполнять согласно своим
значениям.
1. В разделе 2 таблицы 4 значения Xmax и Xmin — это последний и
первый элементы упорядоченной выборки табл. 1 и табл.2.
2.Размах R = Xmax - Xmin является простейшей мерой разброса данных в
выборке. Дисперсия D – более «строгая» мера разброса.
3. В разделе 3 устанавливается количество классовых интервалов
(классов), на которые будет разбит большой интервал R. Его следует считать,
как указано в формуле 𝑘 ≈ 1 + log 2 𝑛.
4. Ширина h классового интервала в k раз меньше, чем размах выборки.
Рекомендуем величину h вычислять с точностью до трех значащих цифр
𝑅
после запятой по формуле ℎ = 𝑘 .
5. В разделе 5 границы классовых интервалов – это указание координат
их начала и конца. Они устанавливаются k последовательными шагами h к
значению X. Вычисления начинаются от Xmin и через k шагов (в нашем
случае 4) заканчиваются на Xmax. Прибавлять к минимальному значению
стоит ширину классового интервала, которую вы вычислили ранее. Теперь,
зная границы классовых интервалов, необходимо заполнить столбцы 4
таблиц 1 и 2, указав в них для каждого элемента упорядоченной выборки
номер j классового интервала (класса), в который этот элемент попадает.
6. В разделе 6 частота nj – это количество элементов, попавших в
каждый класс. Проще говоря, это число единиц, двоек, троек, и т.д. в столбце
4 таблицы 1 или 2. В проверочной строке убедитесь, что нет потерявшихся
или лишних элементов.
7. В разделе 7 значения частоты nj предыдущего раздела переведены в
относительные частоты. Для этого числа, полученные в разделе 6, делятся на
n = 15. В проверочной строке убедитесь, что целое (единица) равно сумме ее
дробных долей.
8. В разделе 8 осуществляется переход от значений относительной
частоты (раздел 7) к значениям плотности вероятности как фундаментальной
характеристики случайной величины. И снова арифметика очень простая:
достаточно поделить значения относительной частоты предыдущего раздела
на ширину h классового интервала.
Теперь вы можете перейти к построению гистограмм. Гистограмма
строится следующим образом. Сначала множество значений, которое может
принимать элемент выборки (размах R – смотри таблицу 4), разбивается на
несколько одинаковых интервалов (в нашем случае их 5). Эти интервалы
откладываются на горизонтальной оси, затем над каждым рисуется
прямоугольник. Высота каждого прямоугольника пропорциональна числу
элементов выборки, попадающих в соответствующий интервал. Мы за
высоту берем плотность вероятности для данного интервала (пункт 8 в
таблице 4). Перед заполнением пункта 6 необходимо вернуться к таблицам 1
и 2 и заполнить столбец 4, расставив номер классового интервала для
каждого элемента выборки.
Таблица 4
1
2
3
4
Параметр
Объем выборки
𝑋𝑚𝑎𝑥
𝑋𝑚𝑖𝑛
Размах 𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Количество классовых интервалов
𝑘 ≈ 1 + log 2 𝑛
Ширина классового интервала
𝑘2 = 5
44
= 8,8
5
ℎ2 =
47
= 9,4
45
1
2
3
4
5
Проверка: (Σ) = 15
Номер класса
1
2
3
4
5
Проверка: (Σ) = 1
Номер класса
Плотность вероятности 𝑓𝑗 =
Номер класса
8
𝑘1 = 5
Границы классового интервала
[102; 102+8,8=110,8)
[94; 103,4)
[110,8; 110,8+8,8=119,6)
[103,4; 112,8)
[119,6; 128,4)
[112,8; 122,2)
[128,4; 137,2)
[122,2; 131,6)
[137,2; 146]
[131,6; 141]
Частота nj попаданий в класс
3
6
1
3
4
0
3
3
4
3
(Σ) = 15
(Σ) = 15
Относительная частота 𝜈 =nj/n
0,2
0,4
0,07
0,2
0,27
0
0,2
0,2
0,27
0,2
(Σ) = 1
(Σ) = 1
1
2
3
4
5
5
7
Выборка 2
𝑛2 = 15
141
94
47
ℎ1 =
𝑅
ℎ=𝑘
Номер класса
6
Выборка 1
𝑛1 = 15
146
102
44
𝜈𝑗
ℎ
1
2
3
4
5
Проверка: (Σ)·h = 1
0,023
0,008
0,031
0,023
0,031
0,116·8,8 ≈ 1
0,043
0,021
0
0,021
0,021
0,106·9,4 ≈ 1
Гистограммы строим одну под другой, масштаб осей одинаковый. Для
оценки симметричности гистограммы отмечаем на ней средневыборочное
значение и медиану (рисунки 8 и 9).
Рисунок 8
Рисунок 9
Вывод по гистограммам:
Первая
гистограммаболее
симметрична,
чем
вторая.
Предположительно в первой выборке нормальный закон распределения
выполняется, а во второй нет.
3. Проверка гипотезы о принадлежности выборки к генеральной
совокупности с нормальным законом распределения
3.1 Критерий χ2 Пирсона
Проверка данных на нормальность очень часто является первым этапом
их анализа, т.к. большое количество статистических методов исходит из
предположения нормальности распределения изучаемых данных. Критерий
хи-квадрат Пирсона обычно не очень хорошо работает в данном случае, т.к.
велика вероятность ошибки второго рода для достаточно широкого класса
альтернативных распределений. Поэтому в настоящее время его не
рекомендуют использовать для этих целей. Однако, в ходе его вычисления
можно рассчитать плотности вероятности для каждого классового интервала,
что позволяет на гистограмме нарисовать график нормального распределения
с нашими параметрами.
Задание: проверить гипотезу о нормальности распределения в первой
выборке и нарисовать график нормального распределения на гистограмме.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
𝐻0 : < 𝑓 𝑋1 = 𝑓 𝑋1 >,
где 𝑓 𝑋1 – распределение случайной величины 𝑋1 в гистограмме 1 (рисунок
8); 𝑓 𝑋1 – распределение случайной величины 𝑋1 в соответствии с
нормальным законом распределения, с параметрами: 𝑀 𝑋 = 𝑋1 ; 𝜎 = 𝜎1
Формула нормального закона распределения:
𝐹 𝑋1 =
1
𝜎1 2𝜋
∙𝑒
(𝑋 −𝑋 )2
− 1 21
2𝜎 1
Альтернативная гипотеза:< 𝑓 𝑋1 ≠ 𝑓 𝑋1 >.
2. Вычисляем контрольное значение критерия, заполняя таблицу 5.
Таблица 5
1
2
3
4
j – номер класса
𝑋𝑗 – средняя точка
класса
𝑋1 = 126,27 г/л
𝑋𝑗 − 𝑋1
𝜎1 = 13,62 г/л
1
(102+110,8)/2
=106,4
2
3
4
5
115,2
124
132,8
141,6
-19,87
-11,07
-2,27
6,53
15,33
-1,46
-0,81
-0,17
0,48
1,13
𝑡𝑗 =
𝑋𝑗 − 𝑋1
𝜎1
𝑡𝑗 2 /2
1,0658
0,32805
0,01445
0,1152
0,63845
0,34445
0,72033
0,98565
0,89119
0,52811
0,01
0,021
0,029
0,026
0,015
8
∙𝑒 2
𝜎1 2𝜋
𝑓𝑗 (из п.8 таблицы 4)
0,023
0,008
0,031
0,023
0,031
9
𝑓1 − 𝑓𝑗
-0,013
0,013
-0,002
0,003
-0,016
0,000169
0,000169
0,000004
0,000009
0,000256
0,969
2,789
0,017
0,052
1,090
5
6
𝑒
1
7
𝜎1 2𝜋
𝑓1 =
−𝑡 𝑗 2
2
= 0,029
1
−𝑡 𝑗 2
2
(𝑓1 − 𝑓𝑗 )
10
2
11
12
𝜒𝑗 2 =
(𝑓1 − 𝑓𝑗 )
∙ 𝑛1 ∙ ℎ1
𝑓1
2
𝜒𝑗 2 = 𝜒конт
2
𝜒конт
=
𝜒𝑗 2 ≈ 4,92
3.
В приложении 2 ищем критические значения критерия хиквадрат для уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия. Количество классовых интервалов в гистограмме k = 5.
Нормальный закон распределения – двухпараметрический. Следовательно,
число степеней свободы: L = k– 2–1 = 2.
Рисунок 10
Вывод: χ2контр<χ20,05=> нулевая гипотеза принимается на уровне значимости
α=0,05. Таким образом, с доверительной вероятностью 95% можно говорить
о том, что в первой выборке выполняется нормальный закон распределения.
4.
На рисунке 8 отмечаем плотности вероятности для нормального
распределения (пункт 7 в таблице 5) и рисуем куполообразную кривую
(рисунок 11).
Рисунок 11
3.2 Критерий Шапиро-Уилка
Критерий Шапиро-Уилка является специальным критерием нормальности
и используется для проверки гипотезы о нормальном распределении. Этот
критерий надѐжен при 8 ≤ n ≤ 50, для больших выборок существует
модификация критерия.
Проверяем критерием Шапиро-Уилка вторую выборку.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
𝐻0 : < 𝑓 𝑋2 = 𝑓 𝑋2 >
Здесь 𝑓 𝑋2 – эмпирическое распределение случайной величины 𝑋2 .
𝑓 𝑋2 – теоретическое распределение случайной величины 𝑋2 в соответствии
снормальным законом распределения. Параметры М(Т) и 𝜎не известны.
Альтернативная гипотеза:< 𝑓 𝑋2 ≠ 𝑓 𝑋2 >.
2. Вычисляем контрольное значение критерия, заполняя таблицу 6:
· во второй столбец переписываем упорядоченные значения второй
выборки;
· в третий столбец вносим значения разностей последнего элемента и
первого, предпоследнего и второго и т.д. В итоге остается только семь
значений, медиана выборки с нечетным числом элементов не
учитывается;
· из приложения 4 выписываем значения вспомогательных
коэффициентов для нашего объема выборки;
· столбец 5 – это произведение третьего и четвертого столбцов.
Таблица 6
1
№
2
Упорядоченные Х2
3
ΔХ
4
𝜶𝒏,𝒌
5
ΔХ·𝜶𝒏,𝒌
1
94
47
0,5150
24,205
2
94
42
0,3306
13,8852
3
98
38
0,2495
9,481
4
98
23
0,1878
4,3194
5
101
22
0,1353
2,9766
6
102
21
0,0880
1,848
7
104
8
0,0434
0,3472
8
106
𝑏=
9
112
10
123
11
123
12
124
13
136
14
136
15
141
𝚫Х · 𝜶𝒏,𝒌
57,0624
Контрольное значение критерия Шапиро-Уилка:
𝑊конт =
𝑏2
(57,0624)2
=
= 0,873
(𝑛 − 1)𝐷2 14 ∙ 266,4571
3. В приложении 5 ищем критические значения критерия Шапиро-Уилка
для уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия. Обратите внимание, что в данном случае ось
перевернута в другую сторону, но принцип тот же (рисунок 12).
Рисунок 12
Вывод:W0,01<Wконтр<W0,05 => нулевая гипотеза отвергается на уровне
значимости 0,05 =>c доверительной вероятностью 95% во второй выборке не
выполняется нормальный закон распределения.
4. Сравнение независимых выборок
Независимые выборки – выборки, где вероятность отбора любого
испытуемого одной выборки не зависит от отбора любого испытуемого
другой. Например, группа больных и группа здоровых, группа мужчин и
группа женщин, группа школьников и группа студентов и т.д.
ВАЖНОЕ ЗАМЕЧАНИЕ № 1:В независимости от типа распределения
выполняем все критерии, т.к. у нас учебная задача. Нормальность или
ненормальность будем учитывать при написании общего вывода.
ВАЖНОЕ ЗАМЕЧАНИЕ № 2: Определите тип выборок в вашем задании.
Если выборки независимые, то продолжаете выполнять п.4 и пропускаете
п.5. Если же выборки зависимые, то этот пункт необходимо пропустить и
перейти сразу к п.5.
4.1 T-критерий Стьюдента
T-критерий Стьюдента применяется для сравнения средних значений
двухнезависимыхмежду собойвыборок.
Условия применения критерия:
• Нормальное распределение данных;
• Равенство дисперсий (в случае неоднородности дисперсий существует
модификация Уэлча для t-критерия).
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
Н0: < М(X1) = М(X2) > или «математические ожидания случайных величин
равны, то есть средние значения в популяции совпадают».
Альтернативная гипотеза:
Н1: < М(X1) ≠ М(X2) >.
2. Вычисляем контрольное значение критерия:
𝑡конт =
𝑋1 − 𝑋2
(𝑛1 − 1)𝐷1 + (𝑛2 − 1)𝐷2
∙
𝑛1 𝑛2 (𝑛1 + 𝑛2 − 2)
𝑛1 + 𝑛2
В нашем примере выборки одинакового размера, поэтому формула
упрощается:
𝑋1 − 𝑋2
𝑡конт =
∙ 𝑛
𝐷1 + 𝐷2
где 𝑋1 , 𝑋2 , D1, D2 – наши средневыборочные и дисперсии (таблица 3),
𝑛 = 𝑛1 = 𝑛2 = 15.
Подставляем значения:
126,27 − 112,8
13,47
𝑡конт =
∙ 15 =
∙ 3,87 = 2,45
21,26
185,4953 + 266,4571
3. В приложении 1 ищем критические значения t-критерия Стьюдента для
уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия. Число степеней свободы: 𝐿 = 𝑛1 + 𝑛2 − 2 = 28.
Рисунок 13
Вывод:t0,05<tконтр<t0,01 => нулевая гипотеза отвергается на уровне значимости
0,05 =>c доверительной вероятностью 95% средневыборочные значения
отличаются значимо.
4.2 Критерий Фишера (F-критерий)
С помощью F-критерия Фишера можно проверить гипотезу об
однородности дисперсий. Условие однородности дисперсий является одним
из условий применимости t-критерия Стьюдента.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
Н0: < М(D1) = М(D2)> или «математические ожидания дисперсий случайных
величин равны, то есть дисперсии случайных величин в популяции
одинаковые».
Альтернативная гипотеза:
Н1: < М(D1) ≠ М(D2) >.
2. Вычисляем контрольное значение критерия:
𝐹конт =
𝐷𝑚𝑎𝑥
266,4571
=
≈ 1,44
𝐷𝑚𝑖𝑛
185,4953
Здесь Dmax– наибольшая из выборочных дисперсий D1 и D2, а Dmin–
наименьшая из них (таблица 3).
3. В приложении 3 ищем критические значения F-критерия для уровней
значимости 0,05 и 0,01 и сравниваем с ними полученное значение
критерия. Число степеней свободы: 𝐿 = 𝑛 − 1 = 14.
Рисунок 14
Вывод:Fконтр<F0,05 => нулевая гипотеза принимается на уровне значимости
0,05 =>c доверительной вероятностью 95% выборочные дисперсии
однородны.
4.3 Критерий Манна-Уитни
Критерий Манна-Уитни– это непараметрический аналогt-критерия
Стьюдента для независимых выборок.Преимущество его состоит в том, что
нет обязательности предположения нормальности распределения и
одинаковых дисперсий.Недостатком является меньшая, чем у критерия
Стьюдента, мощность.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
Н0: распределение признака в первой выборке соответствует распределению
признака во второй выборке.
Альтернативная гипотеза:
Н1: распределение признака в первой выборке не соответствует
распределению признака во второй выборке.
2. Вычисляем контрольное значение критерия, заполняя таблицу 7:
· В столбец 2 переписываем упорядоченные значения первой выборки, в
столбец 3 – упорядоченные значения второй выборки.
· В столбцах 4 и 5 составляем единый ряд из обеих выборок.
· В столбцах 6 и 7 расставляем ранг для элементов общей выборки. Ранг
равен порядковому номеру элемента в общей выборке (при наличии
повторяющихся элементов в выборке ранг равен среднему
арифметическому порядковых номеров).
Таблица 7
Концентрация гемоглобина
Общая выборка
Ранги
1
2
3
4
5
6
7
№
ремиссия
обострение
ремиссия
обострение
ремиссия
1
102
94
94
2
106
94
94
3
110
98
98
4
114
98
98
5
122
101
101
6
124
102
102
обострение
(1+2)/2=
1,5
(1+2)/2=
1,5
(3+4)/2=
3,5
(3+4)/2=
3,5
5
(6+7)/2=
6,5
7
125
104
8
127
106
104
9
131
112
106
10
131
123
106
11
12
13
14
132
139
142
143
123
124
136
136
110
15
146
141
(6+7)/2=
6,5
102
8
(9+10)/2=
9,5
(9+10)/2=
9,5
11
12
112
13
14
114
122
(15+16)/=
15,5
(15+16)/=
15,5
17,5
123
16
123
17
18
124
124
17,5
19
20
21
22
23
24
25
26
27
28
29
30
19
20
21,5
21,5
23
125
127
131
131
132
24,5
24,5
136
136
26
139
27
141
142
143
146
Сумма
28
29
30
𝑅1 = 289,5
𝑅2 = 175,5
· Считаем отдельно сумму рангов, пришедшихся на долю элементов
первой выборкиR1, и отдельно— на долю элементов второй выборкиR2.
· Вычисляем:
𝑛1 ∙ 𝑛1 + 1
15 ∙ 16
𝑈1 = 𝑛1 ∙ 𝑛2 +
− 𝑅1 = 15 ∙ 15 +
− 289,5 = 55,5
2
2
𝑛2 ∙ 𝑛2 + 1
15 ∙ 16
𝑈2 = 𝑛1 ∙ 𝑛2 +
− 𝑅2 = 15 ∙ 15 +
− 175,5 = 169,5
2
2
· Делаем проверку: 𝑈1 + 𝑈2 = 𝑛1 ∙ 𝑛2 ; 55,5 + 169,5 = 15 ∙ 15;
225 = 225
· Выбираем контрольное значение критерия, как минимум из U1 и U2:
𝑈конт = min 𝑈1 ; 𝑈2 = 55,5.
3. В приложении 6 ищем критические значения критерия Манна-Уитни
для уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия.
Рисунок 15
Вывод:U0,05<Uконтр<U0,01 => нулевая гипотеза отвергается на уровне
значимости 0,05 =>c доверительной вероятностью 95%распределения наших
выборок разные, то есть выборки отличаются.
5. Сравнение зависимых выборок
Зависимые выборки – выборки, где каждому испытуемому одной
выборки поставлен в соответствие по определенному критерию испытуемый
из другой выборки или тот же самый испытуемый при повторном
измерении.Например, выборку пациентов изучают до и после лечения, или
на одной и той же группе сравнивают два варианта диагностики.
5.1 Пример задания
В таблице имеются данные о концентрации витамина D в крови (нг/мл)
у пациентов, страдающих целиакией. В первой выборке представлены
результаты анализов пациентов до назначения лечения, во второй – через 2
месяца терапии.
Значения концентрации витамина D в крови обозначены: Х1 –для
пациентов до назначения терапии, Х2–для пациентов через 2 месяца
непрерывной терапии.
№
Выборка 1
Выборка 2
1
2
3
4
33,1
47,6
46,8
21,5
38,4
55,2
49,3
33,7
5
48,6
51,1
6
7
8
9
10
11
12
13
14
47,3
17,3
34,6
40,8
36,4
52,7
39,9
51,3
35,9
47,3
28,9
41,6
44,7
39,8
52,7
52,7
50,0
41,5
15
44,8
49,3
Замечание: первые три пункта делаются одинаково вне зависимости от типа
выборки.
Таблица описательных статистик для данного примера –таблица 8.
Таблица 8
Средневыборочное (𝑋)
Медиана (𝑀𝑒)
Нижний квартиль (𝑄1 )
Верхний квартиль (𝑄3 )
Интерквартильный размах (𝐼𝑄𝑅)
Дисперсия (𝐷)
Среднеквадратичное отклонение
(𝜎)
Верхняя граница 95% ДИ
Нижняя граница 95% ДИ
До лечения
39,91
40,80
34,60
47,60
13,00
107,7050
Через 2 месяца
45,08
47,30
39,80
51,10
11,30
57,7430
10,38
7,60
45,65
34,16
49,29
40,87
5.2 Парный критерий Стьюдента
Парный t-критерий Стьюдента используется для сравнения двух
зависимых (парных) выборок. Для применения парного t-критерия
необходимо, чтобы исходные данные имели нормальное распределение.
Задача сводится к сравнению одной выборочной средней с гипотетическим
значением генеральной средней. Для этого вводится новая переменная
𝑍𝑖 = 𝑋𝑖 − 𝑌𝑖 и среднее арифметическое этой переменной сравнивается с
нулем. Чем больше отличие от нуля, тем сильнее отличаются исходные
выборки.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
Н0: < М(Z) = М(0) >.
Альтернативная гипотеза:
Н1: < М(Z) ≠ М(0) >.
2. Вычисляем контрольное значение критерия, заполняя таблицу 9.
Средневыборочное: 𝑍 = 𝑋1 − 𝑋2 = 39,91 − 45,08 = 5,17нг/мл.
Таблица 9
№
До лечения
Через 2
месяца
𝒁𝒊 = 𝑿𝟏 − 𝑿𝟐
𝒁𝒊 𝟐
1
33,1
38,4
-5,3
28,09
2
47,6
55,2
-7,6
57,76
3
46,8
49,3
-2,5
6,25
4
21,5
33,7
-12,2
148,84
5
48,6
51,1
-2,5
6,25
6
47,3
47,3
0
0
7
17,3
28,9
-11,6
134,56
8
34,6
41,6
-7
49
9
40,8
44,7
-3,9
15,21
10
36,4
39,8
-3,4
11,56
11
52,7
52,7
0
0
12
39,9
52,7
-12,8
163,84
13
51,3
50
1,3
1,69
14
35,9
41,5
-5,6
31,36
15
44,8
49,3
-4,5
20,25
-77,6
674,66
Σ
2
(ΣZi)
𝑡конт =
𝑍∙ 𝑛
( 𝒁𝒊 )2
𝒁𝒊 𝟐 −
𝑛
𝑛−1
=
5,17 ∙ 15
6021 ,76
15
6021,76
≈ 4,536
674,66−
14
3. В приложении 1 ищем критические значения t-критерия Стьюдента для
уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия.Число степеней свободы: 𝐿 = 𝑛 − 1 = 14.
Рисунок 16
Вывод:tконтр>t0,01 => нулевая гипотеза отвергается на уровне значимости 0,01
=>c доверительной вероятностью 99% среднее значение случайной величины
Z отличается от нуля, то есть средневыборочные значения в наших выборках
отличаются значимо.
5.2 Критерий T-Уилкоксона
Т-критерий Уилкоксона – это непараметрический аналог парного
критерия Стьюдента.
Алгоритм проверки:
1. Формулируем нулевую и альтернативную гипотезы:
Нулевая гипотеза:
Н0: медиана разницы случайных величин в популяции равна нулю.
Альтернативная гипотеза:
Н1: медиана разницы в популяции не равна нулю.
2. Считаем разности концентраций.
Таблица 10
До лечения,
X
Ч/з 2
месяца, Y
Разница
(Δ=Y-X)
33,1
47,6
46,8
21,5
48,6
47,3
17,3
34,6
40,8
36,4
52,7
39,9
51,3
35,9
44,8
38,4
55,2
49,3
33,7
51,1
47,3
28,9
41,6
44,7
39,8
52,7
52,7
50
41,5
49,3
5,3
7,6
2,5
12,2
2,5
0
11,6
7
3,9
3,4
0
12,8
-1,3
5,6
4,5
3. Упорядочиваем эти разности, не учитывая знак и не считая нулевые
разности. Вычисляем ранг.
Таблица 11
Номер
1
2
3
4
5
6
7
8
9
10
11
Упорядоченные
Δ
Ранг
0
0
-1,3
2,5
2,5
3,4
3,9
4,5
5,3
5,6
7
7,6
11,6
1
(2+3)/2=2,5
(2+3)/2=2,5
4
5
6
7
8
9
10
11
12
13
12,2
12,8
12
13
4. Складываем ранги положительных (T+) и отрицательных (T-) разностей
и ищем контрольное значение.
+
Т = 2,5+2,5+4+5+6+7+8+9+10+11+12+13=90
T- = 1
Tконт= min{Т+ ; Т- }= T- = 1
Поскольку мы не учитывали нулевые разности, то новый n’ = 13.
5. В приложении 7 ищем критические значения t-критерия Уилкоксона
для уровней значимости 0,05 и 0,01 и сравниваем с ними полученное
значение критерия.
Рисунок 17
Вывод:tконтр<t0,01 => нулевая гипотеза отвергается на уровне значимости 0,01
=>c доверительной вероятностью 99% медиана разности случайных величин
отличается от нуля, то есть медианы наших выборок отличаются
статистически значимо.
6. Общий вывод
Вывод пишется по требованиям описания результатов и методов для
научных медицинских работ. В нашей учебной задаче мы считали все
критерии вне зависимости от нормальности распределения. При написании
вывода мы должны это учитывать, ориентируемся на алгоритм на рисунке 3.
Чтобы написать вывод нужно ответить на следующие вопросы:
1. С помощью чего проводили статистическую обработку?
• Программные пакеты SPSS, Statistica, Excel и пр.
• Калькулятор
2. Зависимые или не зависимые выборки
3. В каком виде представляли количественные данные?
• средневыборочное значение и 95% доверительный интервал
• медиана и квартили в формате Ме (Q1;Q3)
4. Какой критерий применялся для проверки гипотезы о нормальности
распределения?
5. Проверялась ли гипотеза об однородности дисперсий? Если да, то
каким критерием?
6. Какой критерий применялся с целью обнаружения различий между
выборками?
7. При каком уровне значимости результаты считали статистически
значимыми? Стандартно берется уровень значимости 0,05.
8. Какие результаты и выводы получились?
Пример вывода в случае нормального распределения независимых выборок:
Статистическая обработка проводилась с помощью калькулятора.
Количественные данные представляли в виде средневыборочного значения и
95% доверительного интервала. Для проверки гипотезы о нормальности
распределения применялся критерий Шапиро-Уилка и критерий χ2 Пирсона.
Однородность дисперсий проверялась критерием Фишера1. С целью
обнаружения различий между выборками использовался t-критерий
Стьюдента2. Результаты считались статистически значимыми при уровне
значимости 0,05.
Анализ данных гемоглобина двух групп пациентов с целиакией (в
стадии ремиссии, n1=15, и в стадии обострения, n2=15) показал, что
средниезначениягемоглобинав
этих
группах
статистически
значимо*различаются (р<0,05).Среднее значение гемоглобина в стадии
ремиссии 126,27г/л (95% ДИ 118,70-138,84), в стадии обострения 112,80 г/л
(95% ДИ 103,73-121,87).
Пример вывода в случае отличия распределения от нормального для
зависимых выборок:
Статистическая обработка проводилась с помощью калькулятора.
Количественные данные представляли в виде медианы и квартилей в
формате Ме (Q1;Q3). Для проверки гипотезы о нормальности распределения
применялся критерий Шапиро-Уилка и критерий χ2 Пирсона. С целью
обнаружения различий между выборками использовался Т-критерий
Уилкоксона3. Результаты считались статистически значимыми при уровне
значимости 0,05.
Анализ концентрациивитамина D у пациентов с целиакией показал,
что медианное значение показателястатистически значимо*повысилось с
40,08 нг/мл (34,60-47,60) до 47,30 нг/мл (39,80-51,10), р<0,01.
*Если получилось не значимые отличия, то пишем, что статистически
значимых изменений в значениях не произошло, р>0,05. И указываем
средневыборочные с 95% ДИ или Ме с квартилями.
1
Проверяется только для независимых выборок
Или парный критерий Стьюдента в случае зависимых выборок
3
Или критерий Манна-Уитни в случае независимых выборок
2
Важное замечание:несмотря на то, что в литературе общепринято
обозначать уровень значимости α, а доверительную вероятность – р=1-α, в
медицинских статьях принято писать вероятность ошибки первого рода, как
р. Если говорить точнее, то указывается «p-value» - вероятность получить
разницу между группами такую же, или еще более выраженную, при том, что
нулевая гипотеза все-таки верная. Компьютерные программы позволяют
рассчитать точное значение p-value, и если оно меньше, чем общепринятый
уровень значимости 0,05, то считаем, что результаты статистически значимы.
7. Требования к отчѐту
Отчет по данной работе должен обязательно содержать:
 название работы и еѐ цель;
 формулировку задания;
 если анализируемые выборки оказались независимыми, то необходимо
вычислить все коэффициенты и критерии из пунктов 1-4 (в том числе
должны быть заполнены все таблицы и нарисованы все графики и
числовые прямые);
 если анализируемые выборки оказались зависимыми, то необходимо
вычислить все коэффициенты и критерии из пунктов 1-3 и 5 (в том
числе должны быть заполнены все таблицы и нарисованы все графики
и числовые прямые);
 все промежуточные выводы;
 общий вывод.
Приложения
Приложение 1
Критические значения t-критерия Стьюдента
Число
степеней
свободы
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
Уровень значимости
0,10
0,05
0,01
6,31
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,73
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,67
1,66
12,71
4,30
3,18
2,78
2,57
2,45
2,37
2,31
2,26
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04
2,02
2,00
1,98
63,66
9,93
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,66
2,62
1,64
1,96
2,58
Приложение2
Критические значения критерия Пирсона (χ2)
Число
степеней
свободы
1
2
3
4
5
6
7
8
9
10
20
30
40
50
Уровень значимости
0,10
0,05
0,01
2,71
4,61
6,25
7,78
9,24
3,84
5,99
7,81
9,49
11,1
6,63
9,21
11,3
13,3
15,1
10,6
12,0
13,4
14,7
16,0
28,4
40,3
51,8
63,2
12,6
14,1
15,5
16,9
18,3
31,4
43,8
55,8
67,5
16,8
18,5
20,1
21,7
23,2
37,6
50,0
63,7
76,2
Приложение 3
Критические значения F-критерия Фишера для двух выборок
одинакового объема
Число
степеней
свободы
2
3
4
5
6
7
8
9
10
12
14
16
18
20
22
24
26
28
30
40
50
100
Уровень значимости
0,05
0,01
19,00
9,28
6,39
5,05
4,27
3,79
3,44
3,18
2,97
2,69
2,46
2,33
2,22
2,12
2,05
1,98
1,93
1,88
1,84
1,69
1,60
1,39
99,01
29,46
15,98
10,97
8,47
7,00
6,03
5,35
4,85
4,16
3,70
3,37
3,13
2,94
2,79
2,66
2,55
2,46
2,39
2,11
1,94
1,59
Приложение 4
Вспомогательные коэффициенты α для проверки нормальности
распределения по W- критерию Шапиро – Уилка
(n – объемвыборки, k – номер сравниваемой пары)
n
3
4
5
6
7
8
9
10
k
1
2
3
4
5
0,7071
0,6872
0,1677
0,6646
0,2413
0,6431
0,2806
0,0875
0,6233
0,3031
0,1401
0,6052
0,3164
0,1743
0,0561
0,5888
0,3244
0,1976
0,0947
0,5739
0,3291
0,2141
0,1224
0,0399
15
16
17
18
0,5150
0,3306
0,2495
0,1878
0,1353
0,0880
0,0433
0,5056
0,3290
0,2521
0,1939
0,1447
0,1005
0,0593
0,0196
0,4968
0,3273
0,2540
0,1988
0,1524
0,1109
0,0725
0,0359
0,4886
0,3253
0,2553
0,2027
0,1587
0,1197
0,0837
0,0496
0,0163
n
11
k
1
2
3
4
5
6
7
8
9
0,5601
0,3315
0,2260
0,1429
0,0695
12
0,5475
0,3325
0,2347
0,1585
0,0922
0,0303
13
0,5359
0,3325
0,2412
0,1707
0,1099
0,0539
14
0,5251
0,3318
0,2460
0,1802
0,1240
0,0727
0,0240
Приложение 4 (продолжение)
n
19
k
1
2
3
4
5
6
7
8
9
10
11
12
13
20
21
22
23
0,4542
0,3126
0,2563
0,2139
0,1787
0,1480
0,1201
0,0941
0,0696
0,0459
0,0228
0,4808
0,3232
0,2561
0,2059
0,1641
0,1271
0,0932
0,0612
0,0303
0,4734
0,3211
0,2565
0,2085
0,1686
0,1334
0,1013
0,0711
0,0422
0,0140
0,4643
0,3185
0,2578
0,2119
0,1736
0,1399
0,1092
0,0804
0,0530
0,0263
0,4590
0,3156
0,2571
0,2131
0,1764
0,1443
0,1150
0,0878
0,0618
0,0368
0,0122
27
28
29
30
0,4366
0,3018
0,2522
0,2152
0,1848
0,1584
0,1246
0,1128
0,0923
0,0728
0,0540
0,0358
0,0178
0,4328
0,2992
0,2510
0,2151
0,1857
0,1601
0,1372
0,1162
0,0965
0,0778
0,0598
0,0424
0,0253
0,0084
0,4291
0,2968
0,2499
0,2150
0,1864
0,1616
0,1395
0,1192
0,1002
0,0822
0,0650
0,0483
0,0320
0,0159
0,4254
0,2944
0,2487
0,2148
0,1870
0,1630
0,1415
0,1219
0,1036
0,0862
0,0697
0,0537
0,0381
0,0227
0,0076
24
25
26
0,4493
0,3098
0,2554
0,2145
0,1807
0,1512
0,1245
0,0997
0,0764
0,0539
0,0321
0,0107
0,4450
0,3069
0,2543
0,2148
0,1822
0,1539
0,1283
0,1046
0,0823
0,0610
0,0403
0,0200
0,4407
0,3043
0,2533
0,2151
0,1836
0,1563
0,1316
0,1089
0,0876
0,0672
0,0476
0,0284
0,0094
32
33
34
n
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
31
0,4220
0,2931
0,2475
0,2145
0,1874
0,1641
0,1433
0,1243
0,1066
0,0899
0,0739
0,0585
0,0435
0,0289
0,0144
0,4188
0,2898
0,2463
0,2141
0,1878
0,1651
0,1449
0,1265
0,1093
0,0931
0,0777
0,0629
0,0485
0,0344
0,0206
0,0068
0,4156
0,2876
0,2451
0,2137
0,1880
0,1660
0,1463
0,1284
0,1118
0,0961
0,0812
0,0669
0,0530
0,0395
0,0262
0,0131
0,4127
0,2854
0,2439
0,2132
0,1882
0,1667
0,1475
0,1301
0,1140
0,0988
0,0844
0,0706
0,0572
0,0441
0,0314
0,0187
0,0062
Приложение 5
Критические значения W-критерия Шапиро – Уилка
n
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
α
0,05
0,767
0,748
0,762
0,803
0,818
0,829
0,842
0,850
0,859
0,866
0,874
0,881
0,887
0,892
0,897
0,901
0,01
0,753
0,687
0,686
0,730
0,749
0,764
0,781
0,781
0,805
0,814
0,825
0,835
0,884
0,851
0,858
0,863
n
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
α
0,05
0,905
0,908
0,911
0,914
0,916
0,918
0,920
0,923
0,924
0,926
0,927
0,929
0,930
0,931
0,933
0,934
0,01
0,868
0,873
0,878
0,881
0,884
0,888
0,891
0,894
0,896
0,898
0,900
0,902
0,904
0,906
0,908
0,910
n
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
α
0,05
0,935
0,936
0,938
0,939
0,940
0,941
0,942
0,943
0,944
0,945
0,945
0,946
0,947
0,947
0,947
0,01
0,912
0,914
0,916
0,917
0,919
0,920
0,922
0,923
0,924
0,926
0,927
0,928
0,929
0,929
0,930
Приложение 6
Таблица критических значений критерия U-Манна-Уитни
Таблица критических значений для уровня значимости 0,05.
N1
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
7
1
3
5
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
8
2
4
6
8
10
13
15
17
19
22
24
26
29
31
34
36
38
41
9
2
4
7
10
12
15
17
20
23
26
28
31
34
37
39
42
45
48
10
3
5
8
11
14
17
20
23
26
29
33
36
39
42
45
48
52
55
11
3
6
9
13
16
19
23
26
30
33
37
40
44
47
51
55
58
62
12
4
7
11
14
18
22
26
29
33
37
41
45
49
53
57
61
65
69
N2
13
4
8
12
16
20
24
28
33
37
41
45
50
54
59
63
67
72
76
14
5
9
13
17
22
26
30
36
40
45
50
55
59
64
67
74
78
83
15
5
10
14
19
24
29
34
39
44
49
54
59
64
70
75
80
85
90
16
6
11
15
21
26
31
37
42
48
53
59
64
70
75
81
86
92
98
17
6
11
17
22
28
34
39
45
51
57
63
67
75
81
87
93
99
105
18
7
12
18
24
30
36
42
48
55
61
67
74
80
86
93
99
106
112
Таблица критических значений для уровня значимости 0,01.
N1
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
7
8
0
1
3
4
6
7
9
10
12
13
15
16
18
19
21
22
24
1
2
4
6
7
9
11
13
15
17
18
20
22
24
26
28
30
9
0
1
3
5
7
9
11
13
16
18
20
22
24
27
29
31
33
36
10
0
2
4
6
9
11
13
16
18
21
24
26
29
31
34
37
39
42
11
0
2
4
6
9
11
13
16
18
21
24
26
29
31
34
37
39
42
N2
12 13
1
1
3
3
6
7
9
10
12 13
15 17
18 20
21 24
24 27
27 31
31 34
34 38
37 42
41 45
44 49
47 53
51 56
54 60
14
1
4
7
11
15
18
22
26
30
34
38
42
46
50
54
58
63
67
15
2
5
8
12
16
20
24
29
33
37
42
46
51
55
60
64
69
73
16
2
5
9
13
18
22
27
31
36
41
45
50
55
60
65
70
74
79
17
2
6
10
15
19
24
29
34
39
44
49
54
60
65
70
75
81
86
18
2
6
11
16
21
26
31
37
42
47
53
58
64
70
75
81
87
92
Приложение 7
Критические значения критерия Уилкоксона
Уровень значимости
n
Уровень значимости
n
0,05
0,01
0,05
0,01
5
0
—
29
140
110
6
2
—
30
151
120
7
3
0
31
163
130
8
5
1
32
175
140
9
8
3
33
187
151
10
10
5
34
200
162
11
13
7
35
213
173
12
17
9
36
227
185
13
21
12
37
241
198
14
25
15
38
256
211
15
30
19
39
271
224
16
35
23
40
286
238
17
41
27
41
302
252
18
47
32
42
319
266
19
53
37
43
336
281
20
60
43
44
353
296
21
67
49
45
371
312
22
75
55
46
389
328
23
83
62
47
407
345
24
91
69
48
426
362
25
100
76
49
446
379
26
110
84
50
466
397
27
119
92
28
130
101
Приложение 8
Полная схема выбора критерия
Download