Лекция 5. Проверка статистических гипотез

advertisement
Математическая обработка результатов измерения
Математические основы измерения
Лекция 5
Проверка статистических
гипотез
Лектор: ст. преподаватель каф. ИИТ
Вавилова Галина Васильевна
Содержание
Статистические гипотезы
2. Ошибки первого и второго рода
3. Гипотезы о значениях числовых характеристик
1.
1.
2.
Сравнение средних
Сравнение дисперсий
2
Статистические гипотезы
Статистическая гипотеза
• любое предположение о виде неизвестного закона
распределения или о параметрах известных распределений
Параметрические гипотезы
H 0 : m  m0 ;
• Гипотезы о значениях параметров распределений или о
сравнительной величине параметров двух распределений H1 : m  m0
Непараметрические гипотезы
• Гипотезы о виде распределения
3
Где какая гипотеза: параметрическая
и непараметрическая?
Примеры статистических гипотез
генеральная совокупность
подчиняется нормальному закону
распределения
математические ожидания двух
нормальных совокупностей равны
между собой
m1  m2
4
Проверить статистическую гипотезу
• проверить, согласуются ли выборочные данные с
выдвинутой гипотезой
Нулевая (основная
или проверяемая)
гипотеза
Конкурирующая
(альтернативная)
гипотеза
• выдвинутая гипотеза, которая обозначается H0
• гипотеза H1 , которая противоречит нулевой гипотезе
H 0 : m  m0 ; H1 : m  m0 или m  m0 .
5
Пример.
Нулевая и конкурирующая гипотезы
Пример 1. Пусть основная гипотеза H 0 состоит в том, что математическое
ожидание m равно m0 . Тогда альтернативная гипотеза H1 может состоять в
предположении, что математическое ожидание m не равно (больше или меньше)
значению m0 :
H 0 : m  m0 ; H1 : m  m0 или m  m0 .
6
Ошибки первого и второго рода
Ошибка первого рода
• состоит в том, что будет отвергнута верная гипотеза.
Ошибка второго рода
• состоит в том, что будет принята ложная гипотеза.
Уровень значимости α
• Вероятность совершения ошибки первого рода
β ошибка второго рода
• Вероятность не отклонить ложную гипотезу
7
Критическая область и область принятия
гипотезы
Статистический критерий
• случайная величина (статистика), которую используется
для проверки нулевой гипотезы
Критическая область
• множество возможных значений статистического
критерия, при которых нулевая гипотеза отвергается.
Область принятия гипотезы
• множество возможных значений статистического
критерия, при которых нулевая гипотеза принимается.
Критические точки (квантили)
• точки, которые разграничивают критическую область и
область принятия гипотезы.
8
9
Порядок проверки статистической
гипотезы
задается уровень значимости α, выбирается статистический
критерий К и вычисляется значение Ккр;
по выборке вычисляется Кнабл;
если Кнабл попадает в критическую область, нулевая гипотеза
отвергается;
при попадании Кнабл в область принятия гипотезы нулевая гипотеза
принимается
10
Гипотезы о значениях числовых
характеристик
Гипотезы о равенстве среднего
определенным числам m и  .
0
значения
m
и
дисперсии
σ2
2
0
m0 - номинальное
значение
измеряемого
параметра
Точность прибора
определяется
значением
прибор дает
систематическую
ошибку.
, качество
прибора не
отвечает
стандартным
требованиям
11
Сравнение средних
Сравнение средних — это проверка гипотезы о равенстве средних
значений совокупностей, из которых получены выборки.
12
Сравнение средних
13
Сравнение дисперсий
Дисперсия характеризует
 точность приборов,
 технологических процессов,
 риск, связанный с отклонением доходности от заданного уровня, и т. д.
14
Пример
По результатам n=9 замеров установлено, что
выборочное среднее время
(в секундах)
изготовления детали. Предполагая, что время
изготовления – нормально распределенная
случайная величина с дисперсией σ2=9,
рассмотреть гипотезу
против
конкурирующей гипотезы
.
Доверительная вероятность P = 95%.
15
Решение
На уровне P = 0,95 находим по таблицам
нормального распределения (Функция Лапласа) Ukp
= 1,96 . По формуле
Так как
, то гипотеза
принимается.
Выборка принадлежит генеральной совокупности
со средним значением
16
Пример
По утверждению руководства фирмы, средний размер
дебиторского учета равен 187,5 тыс. руб. Ревизор
составляет случайную выборку из 10 счетов и
обнаруживает, что средняя арифметическая выборка
равна 175 тыс. руб. при среднем квадратичном
отклонении 35 тыс. руб. Может ли оказаться в
действительности правильным объявленный размер
дебиторского счета? Доверительная вероятность P=0.95.
17
Решение
Здесь m = 187.5 тыс. руб.,
тыс. руб., n=10 , S=35,
P=0.95. Так как дисперсия неизвестна, то для проверки
гипотезы
воспользуемся распределением Стьюдента.
Тогда
Число степеней свободных
По таблице распределения Стьюдента при P=0.95 находим
.
. Так как
, то гипотеза H0 о среднем размере
дебиторского счета принимается на уровне доверия
P=0.95.
18
Пример
По независимым данным объемами n1=31 и
n2=25 вычислены выборочные дисперсии
S12  25, 0 и S22  16, 0
Необходимо проверить гипотезу о равенстве
дисперсий исходных совокупностей на
уровне значимости α = 0.01 .
19
Решение
Так как объемы выборок сравнительно невелики,
применим односторонний критерий Фишера.
Вычислим статистику
число степеней свободы
k1  n1  1  31  1  30 , k2  n2  1  25  1  24
По таблице распределения Фишера находим
критическое значение
. Так как
,
то гипотеза о равенстве дисперсий
20
принимается.
Спасибо за внимание!
21
Download