Математическая обработка результатов измерения Математические основы измерения Лекция 5 Проверка статистических гипотез Лектор: ст. преподаватель каф. ИИТ Вавилова Галина Васильевна Содержание Статистические гипотезы 2. Ошибки первого и второго рода 3. Гипотезы о значениях числовых характеристик 1. 1. 2. Сравнение средних Сравнение дисперсий 2 Статистические гипотезы Статистическая гипотеза • любое предположение о виде неизвестного закона распределения или о параметрах известных распределений Параметрические гипотезы H 0 : m m0 ; • Гипотезы о значениях параметров распределений или о сравнительной величине параметров двух распределений H1 : m m0 Непараметрические гипотезы • Гипотезы о виде распределения 3 Где какая гипотеза: параметрическая и непараметрическая? Примеры статистических гипотез генеральная совокупность подчиняется нормальному закону распределения математические ожидания двух нормальных совокупностей равны между собой m1 m2 4 Проверить статистическую гипотезу • проверить, согласуются ли выборочные данные с выдвинутой гипотезой Нулевая (основная или проверяемая) гипотеза Конкурирующая (альтернативная) гипотеза • выдвинутая гипотеза, которая обозначается H0 • гипотеза H1 , которая противоречит нулевой гипотезе H 0 : m m0 ; H1 : m m0 или m m0 . 5 Пример. Нулевая и конкурирующая гипотезы Пример 1. Пусть основная гипотеза H 0 состоит в том, что математическое ожидание m равно m0 . Тогда альтернативная гипотеза H1 может состоять в предположении, что математическое ожидание m не равно (больше или меньше) значению m0 : H 0 : m m0 ; H1 : m m0 или m m0 . 6 Ошибки первого и второго рода Ошибка первого рода • состоит в том, что будет отвергнута верная гипотеза. Ошибка второго рода • состоит в том, что будет принята ложная гипотеза. Уровень значимости α • Вероятность совершения ошибки первого рода β ошибка второго рода • Вероятность не отклонить ложную гипотезу 7 Критическая область и область принятия гипотезы Статистический критерий • случайная величина (статистика), которую используется для проверки нулевой гипотезы Критическая область • множество возможных значений статистического критерия, при которых нулевая гипотеза отвергается. Область принятия гипотезы • множество возможных значений статистического критерия, при которых нулевая гипотеза принимается. Критические точки (квантили) • точки, которые разграничивают критическую область и область принятия гипотезы. 8 9 Порядок проверки статистической гипотезы задается уровень значимости α, выбирается статистический критерий К и вычисляется значение Ккр; по выборке вычисляется Кнабл; если Кнабл попадает в критическую область, нулевая гипотеза отвергается; при попадании Кнабл в область принятия гипотезы нулевая гипотеза принимается 10 Гипотезы о значениях числовых характеристик Гипотезы о равенстве среднего определенным числам m и . 0 значения m и дисперсии σ2 2 0 m0 - номинальное значение измеряемого параметра Точность прибора определяется значением прибор дает систематическую ошибку. , качество прибора не отвечает стандартным требованиям 11 Сравнение средних Сравнение средних — это проверка гипотезы о равенстве средних значений совокупностей, из которых получены выборки. 12 Сравнение средних 13 Сравнение дисперсий Дисперсия характеризует точность приборов, технологических процессов, риск, связанный с отклонением доходности от заданного уровня, и т. д. 14 Пример По результатам n=9 замеров установлено, что выборочное среднее время (в секундах) изготовления детали. Предполагая, что время изготовления – нормально распределенная случайная величина с дисперсией σ2=9, рассмотреть гипотезу против конкурирующей гипотезы . Доверительная вероятность P = 95%. 15 Решение На уровне P = 0,95 находим по таблицам нормального распределения (Функция Лапласа) Ukp = 1,96 . По формуле Так как , то гипотеза принимается. Выборка принадлежит генеральной совокупности со средним значением 16 Пример По утверждению руководства фирмы, средний размер дебиторского учета равен 187,5 тыс. руб. Ревизор составляет случайную выборку из 10 счетов и обнаруживает, что средняя арифметическая выборка равна 175 тыс. руб. при среднем квадратичном отклонении 35 тыс. руб. Может ли оказаться в действительности правильным объявленный размер дебиторского счета? Доверительная вероятность P=0.95. 17 Решение Здесь m = 187.5 тыс. руб., тыс. руб., n=10 , S=35, P=0.95. Так как дисперсия неизвестна, то для проверки гипотезы воспользуемся распределением Стьюдента. Тогда Число степеней свободных По таблице распределения Стьюдента при P=0.95 находим . . Так как , то гипотеза H0 о среднем размере дебиторского счета принимается на уровне доверия P=0.95. 18 Пример По независимым данным объемами n1=31 и n2=25 вычислены выборочные дисперсии S12 25, 0 и S22 16, 0 Необходимо проверить гипотезу о равенстве дисперсий исходных совокупностей на уровне значимости α = 0.01 . 19 Решение Так как объемы выборок сравнительно невелики, применим односторонний критерий Фишера. Вычислим статистику число степеней свободы k1 n1 1 31 1 30 , k2 n2 1 25 1 24 По таблице распределения Фишера находим критическое значение . Так как , то гипотеза о равенстве дисперсий 20 принимается. Спасибо за внимание! 21