Проверка гипотез (тесты)

реклама
Лекция 4.34. Проверка гипотез (тесты). t-критерий. F-критерий. Критерий Уилкоксона. χ2- критерий. Случай дополнительных параметров.
Критерий согласия Колмогорова-Смирнова.
Проверка гипотез (тесты)
На основании материала выборки следует проверить гипотезу H0. Гипотеза H0 может
быть, например, гипотезой о равенстве определенных параметров распределения, о
равенстве законов распределения, о некоррелированности двух случайных величин и прочее.
Для проверки такой гипотезы необходима контрольная величина Т , которой является
соответствующим образом выбранная и приспособленная к задаче функция выборки. По
заданному уровню надежности α (чаще всего выбираются α=0,05 или 0,02 или 0,01)
определяется область В, так называемая критическая область, удовлетворяющая условию
Р (Т∈ВН0 верна)≤α
(6.113)
Практически В можно найти, если известно распределение (или по меньшей мере
асимптотическое распределение) контрольной величины Т. Если t∈В, т.е. если
осуществляется событие, имеющее очень малую вероятность α, то от гипотезы Н0
отказываются. Если t не лежит в В, то можно только заключить, что данные наблюдения не
противоречат принятой гипотезе.
Чем меньше α, тем меньше вероятность того, что гипотеза Н0 отвергается, хотя она
верна, или, как еще говорят, что совершается ошибка первого рода.
Ошибочное решение, когда гипотеза Н0 не отвергается, хотя она неправильна, называют
ошибкой второго рода. Если α задано, то критическую область В можно выбрать, согласно
(6.113.), бесконечно многими способами. Ее выбирают так, чтобы вероятность допустить
ошибку второго рода была по возможности наименьшей. Критические области тестов,
рассматриваемых в дальнейшем, выбираются с этой точки зрения.
t-критерий
t-критерий
служит для сравнения двух средних значений из нормально
распределенных генеральных совокупностей, если дисперсии σх и σy хотя и неизвестны,
однако можно с уверенностью предположить, что они равны. Таким образом, проверяемая
гипотеза Н0 утверждает MX=MY. Пусть ( x1 ,…, x n1 ), (Y1,… Yn2 ) – независимые случайные
выборки из обеих генеральных совокупностей; они могут иметь совершенно разные объемы.
В качестве контрольной используют величину
n1 n2 (n1 + n2 − 2)
X −Y
T=
(6.114)
2
2
n1 + n2
(n1 − 1) S X + (n2 − 1) S Y
При сделанных предпосылках (нормальная распределенность X и Y и равенство
дисперсий) и при предложении, что Н0 правильна, Т удовлетворяет t-распределению
Стьюдента с k=n1+n2-2 степенями свободы. Поэтому критическая область критерия может
быть установлена следующим образом. Для уровня значимости α определяется tα,k, где
k=n1+n2-2.
Если вычисления (согласно (6.114) реализации t удовлетворяет неравенству t > tα ,k , то
гипотезу Н0 отвергают.
По отношению к предпосылке “нормальной распределенности” t-критерий не очень
чувствителен. Его можно применять, если статистические распределения обеих выборок не
имеют нескольких вершин и не слишком асимметричны. Предпосылка σx=σy во многих
случаях может быть обоснована на содержательном уровне; гипотезу σx=σy можно
проверить и по F-критерию.
161
Лекция 4.34. Проверка гипотез (тесты). t-критерий. F-критерий. Критерий Уилкоксона. χ2- критерий. Случай дополнительных параметров.
Критерий согласия Колмогорова-Смирнова.
F-критерий
Гипотезы о дисперсии имеют в технике большое значение, так как σ2 есть мера таких
числовых характеристик, как точность машин, ошибки измерительных приборов, точность
технологических процессов и т.п.
F-критерий служит для проверки гипотезы σx=σy при условии, что X и Y распределены
нормально. Из каждой генеральной совокупности производятся выборки объема n1 и n2. В
качестве контрольной величины используют отношение эмпирических дисперсий:
F = S x2 / S y2 или F = S y2 / S x2 (смотря по обстоятельствам большую дисперсию выбирают в
качестве числителя). Величина F удовлетворяет F-распределению с (m1,m2) степенями
свободы (m1,2=n1,2-1). Критическая область выбирается следующим образом. Для уровня
значимости α выбирают при p=α/2 и соответствующих степенях свободы m1, m2 значение
F p : m1 ,m2 . Если f, вычисленное из выборки, больше, чем это критическое значение, то гипотеза
должна быть отклонена с вероятностью ошибки α (таблица построена так, что возможны
только α=0,10 и α=0,02, что достаточно для практических целей).
Пример: Двумя измерительными приборами X и Y произведены соответственно 10 и 20
измерений. Получились следующие эмпирические дисперсии:
s 2 12,2
s x2 = 12,2 µ m, s y2 = 8,0 µ m. f = x2 =
= 1,525 . Для уровня доверительности α=0,01
8,0
sy
берем F0 , 05; 9 ;19 = 2,42 . Так как вычисленное значение f меньше, чем критическое значение, то
различие между s x2 и s y2 незначительно, т.е. гипотеза, что оба измерительных прибора
одинаково точны, не противоречит данным наблюдений.
Критерий Уилкоксона
Служит для проверки гипотезы о том, относятся ли две выборки к одной и той же
генеральной совокупности; другими словами, гипотеза Н0: FX ( x) ≡ FY ( y ) проверяется
посредством одной выборки (x1,…., x n1 ) из X и одной выборки (y1…, y n2 ) из Y. Значения
x1,…., x n1 и
y1…, y n2 обеих выборок упорядочиваются вместе по их величине. Пусть в
качестве примера для n1=4 и n2=5 получилась следующая последовательность:
y5x3x4y1y2x2y4y3x1. Если рассмотреть пару значений (xi,yj), то в случае yj<xi говорят, что оба
значения образуют инверсию. В нашем примере x3 и x4 образуют по одной инверсии с y5, x2
образуют три инверсии с (y2,y1,y5), а x1 образует пять инверсий (со всеми yj). В качестве
контрольной величины принимается полное число u инверсий. Если гипотеза верна, то u не
nn
должно слишком сильно отклоняться от своего математического ожидания M u = 1 2 . От
2
nn
гипотезы отказываются, если u − 1 2 больше, чем определенное критическое значение uα.
2
Критическое значение uα берут для заданного уровня значимости. Для больших n1 и n2, для
n n (n + n 2 + 1)
которых uα нельзя взять из таблицы, справедливо uα = zα 1 2 1
, причем zα
12
определяется, согласно 2Ф0 ( zα ) = 1 − α .
χ2- критерий
С помощью рассмотренных до сих пор критериев можно было проверить, являются ли
некоторые различия, появляющиеся в материале наблюдений двух выборок, существенными
162
Лекция 4.34. Проверка гипотез (тесты). t-критерий. F-критерий. Критерий Уилкоксона. χ2- критерий. Случай дополнительных параметров.
Критерий согласия Колмогорова-Смирнова.
(значимыми) или случайными. Рассмотрим теперь критерии, которые проверяют гипотезы,
удовлетворяет ли рассматриваемая случайная величина X заданному закону распределения
F0(x). Они называются критериями согласия. Критерий согласия χ2 служит для проверки
гипотезы H0, что FX(x)=F0(x), где FX(x) функция распределения X , а F0(x) – заданное
(гипотетическое) распределение.
Сначала рассматривается случай, что F0(x) полностью определено, т.е. не содержит
неизвестных параметров. Область значений случайной величины X делится на конечное
число непересекающихся множеств (так называемых классов) ∆1,…,∆k. При непрерывном X
множества ∆i являются интервалами, при дискретном X – группами возможных значений X.
Пусть pi есть “теоретическая вероятность” того, что X попадает в ∆i , т.е. вероятность того,
что X∈∆i, если гипотеза H0 верна. Если ∆ i = [ai , bi ) , то для pi справедливо
pi = F0 (bi ) − F0 (ai ) .
(6.115)
Теперь из X производится выборка (x1,…,xn) объема n. Пусть Mi – число значений выборки в
∆i. Тогда
k
∑ pi = 1,
i =1
k
∑M
i =1
i
= n . Разбиение на классы довольно произвольно. Необходимо
однако, чтобы для граничных классов выполнялось npi≥1, для остальных npi≥5. Если это не
выполняется, классы нужно укрупнить. Если разбиение на классы взято согласно этим
требованиям, то контрольная величина
k
k
M i2
( M i − npi ) 2
2
χ =∑
=∑
−n,
(6.116)
npi
i =1
i =1 np i
в предположении, что гипотеза H0 верна, имеет асимптотическое χ2-распределение с m=k-1
степенями свободы. Так как χ2 есть мера отклонения истинного распределения от
гипотетического, то гипотеза отвергается, если значение вычисленное по конкретной
выборке, согласно (6.116), превышает определенное критическое значение. Это критическое
значение χα2 для заданного уровня значимости α и m=k-1 степеней свободы находят из
таблиц. Если χ 2 ≥ χ α2 , то гипотеза отвергается. Для n>30 значение χα2 находят уже не из
1
табл., а вычисляют по формуле χ α2 = ( 2m − 1 + z 2α ) 2 , где z 2α вычисляется, согласно
2
2Ф0 ( z 2α ) = 1 − 2α .
Случай дополнительных параметров
Чаще всего гипотетическое распределение F0(x) установлено неоднозначно, и гипотеза
говорит лишь о том, что F0(x) относится к определенному множеству функций
распределения F(x;V1,…,Vr), которое зависит от r параметров. Например, гипотеза могла бы
гласить: X имеет нормальное распределение (здесь есть два параметра a и σ) или X имеет
распределение по закону Пуассона (здесь имеется один параметр λ). В этом случае
поступают следующим образом: по выборке получают наиболее правдоподобные оценки
параметров Vˆ1 ,...,Vˆr и принимают F0 ( x) = F ( x;Vˆ1 ,..., Vˆr ) . Теперь по (6.115) вычисляются pi , а
по (6.116) - χ2 . Если производится оценка r параметров, то остается только m=k-r-1
степеней свободы. В остальном критерий остается прежним.
Критерий согласия Колмогорова-Смирнова
Этот критерий использует непосредственно эмпирическую функцию распределения X .
В основе лежит функция выборки Dn = sup Fn ( x) − F0 ( x) , причем Fn ( x) - эмпирическая
−∞ < x <∞
функция распределения, а
F0(x) – гипотетическое распределение. Имеет место
163
Лекция 4.34. Проверка гипотез (тесты). t-критерий. F-критерий. Критерий Уилкоксона. χ2- критерий. Случай дополнительных параметров.
Критерий согласия Колмогорова-Смирнова.
lim P ( Dn <
λ
) = Q (λ ) ,
Q (λ ) =
∞
∑ (−1)
k
e −2k
2 2
λ
n Dn
. Контрольная величина
n
k = −∞
асимптотически имеет функцию распределения Q(λ). Теперь для уровня значимости берут
такое значение λ0, при котором выполняется Q(λ0)=1-α. Если n Dn ≥ λ0 , то гипотезу H0 о
том, что X распределена по закону F0(x), отбрасывают. Критерий Колмогорова - Смирнова в
общем неприменим, если в F0(x) входят оценки параметров, которые были произведены по
той же самой выборке, по которой была вычислена Fm ( x) .
n→∞
где
164
Скачать