Пример задачи на тему: "Проверка гипотез" Бензовозы А и Б возят бензин с нефтебазы на АЗС. Имеются данные по расходу бензина на собственные нужды, тыс. л/неделя. Необходимо объяснить менеджеру причины различий, а также дать рекомендации по покупке нового бензовоза. А Б 1.23 0.8 0.95 1.12 0.98 0.89 0.87 1.18 1.09 1.04 1 1.22 1.1 1.28 0.98 1.08 0.99 0.98 0.96 1.18 0.78 1.18 0.79 1.39 0.73 1.25 0.88 Пример задачи на тему: "Проверка гипотез" Возможные вопросы: 1. Почему выборки разного размера? Данные по бензовозам собирались независимо друг от друга. Возможно, что они собирались даже в разные моменты времени. 2. Почему расход каждую неделю различен? Причин этому много. Можно предположить, что в течении каждой поездки ситуация на дороге была различной. Было разное количество машин на дороге, т.е. разные режимы разгона и торможения, разная продолжительность пробок, разное время, затраченное на светофоры. 3. Выборкой из какого распределения скорее всего является расход бензина бензовозами? Вероятнее всего расход будет иметь нормальное распределение, поскольку много случайных причин влияет на него. И нельзя выделить какую-то одну, оказывающую наибольшее влияние на величину расхода. ЦПТ в данном случае применима. Теорема позволяет придти к выводу о нормальном распределении. 4. Можно ли сравнить эти выборки напрямую? Можно найти выборочные характеристики, такие как математическое ожидание, стандартное отклонение, коэффициент вариации. Их можно сравнить для данных выборок, и узнать какая больше, а какая меньше. Двухвыборочный F-тест для дисперсии Переменная 1 Переменная 2 Среднее 0.952142857 1.122307692 0.01851044 0.026585897 Наблюдения 14 13 df 13 12 F 0.696250319 Дисперсия P(F<=f) одностороннее F критическое одностороннее 0.26294302 0.384074615 Двухвыборочный t-тест с одинаковыми дисперсиями Переменная 1 Переменная 2 Среднее Дисперсия Наблюдения Объединенная дисперсия Гипотетическая разность средних df t-статистика 0.952142857 1.122307692 0.01851044 0.026585897 14 13 0.022386659 0 25 -2.952765677 P(T<=t) одностороннее 0.003380918 t критическое одностороннее 1.708140745 P(T<=t) двухстороннее 0.006761836 t критическое двухстороннее 2.059538536 5. С помощью какого теста проведено сравнение дисперсий данных выборок? С помощью теста Фишера. Он применим, поскольку выборочное распределение близко к нормальному (см. вопрос 3). 6. Какую гипотезу проверяют с помощью теста Фишера? Гипотезу о равенстве дисперсий расходов бензина двумя бензовозами. 7. Что вы узнали, проведя тест на равенство дисперсий? Гипотеза о равенстве дисперсий на уровне значимости 0.05 принимается. Можно сделать вывод о том, что бензовозы ездят в более менее одинаковых условиях, водители имеют похожий стиль вождения, и поэтому разброс обусловлен различной ситуацией на дороге в каждый конкретный рейс. 8. На каком уровне значимости гипотеза о равенстве дисперсий будет отвергнута? При уровне, выше значимости Fрасч, т.е., например при уровне значимости 27%. Однако это очень высокий уровень, поскольку он означает вероятность отвергнуть верную гипотезу (27% верных гипотез будет отвергнуто). Это говорит о том, что гипотеза о равенстве дисперсий может быть принята с большой уверенностью. 9. Разве значения дисперсий: 0.0185 и 0.0266 – одинаковые? А ведь мы приняли гипотезу о равенстве дисперсий. Выборочные значения дисперсий разные. Именно поэтому приходится обращаться к критерию Фишера, чтобы ответить на вопрос: могут ли при одинаковой дисперсии расхода бензина бензовозами получаться столь разные выборочные значения этих дисперсий. 10. Почему график теста Фишера расположен в I четверти? В тесте Фишера рассматривается отношение дисперсий двух выборок. Дисперсия любой выборки неотрицательное число. 11. Где расположен максимум на графике плотности распределения Фишера? Максимум расположен около 1. Поскольку именно в том случае, когда дисперсии равны, их отношение равно 1. Точнее мода распределения Фишера равна m 2 n , m 2 , где m, n – количество степеней свободы числителя и знаменателя m n 2 соответственно, т.е. для больших выборок почти 1. 12. От чего зависит критическое значение статистики Фишера? Во-первых, от того какая дисперсия окажется в числителе, а какая в знаменателе дроби. В таблицах распределения Фишера представлены значения большие единицы, т.е. односторонние (правосторонние) значения. Во-вторых, от уровня значимости больше . Чем , тем большее количество гипотез может быть отвергнуто, тем ближе к 1 критическое значение. В-третьих, от числа степеней свободы числителя и знаменателя. Чем больше объемы выборок, тем точнее выборочное значение дисперсий отражает дисперсию генеральной совокупности данных. Чем меньшее различие в дисперсиях выборок способен различить критерий, тем ближе к 1 оказывается его критическое значение. 12а. Возможно ли получение статистики Фишера меньшее единицы? Расчетное значение может оказаться менее единицы, если в числителе дроби будет меньшая дисперсия, а в знаменателе большая. Компьютер в таком случае, дает критическое значение, также меньшее единицы. Вручную можно а) перевернуть дробь и сравнить расчетное значение с табличным; б) обратиться к программе Excel и определить критическое значение, воспользовавшись функцией FРАСПОБР(0.95;13;12), которая дает процентную точку распределения Фишера (поэтому первый параметр равен 1-α); в) использовать функцию Excel FРАСП(0.696;13;12), где 0.696 – расчетное значение статистики Фишера, чтобы определить значимость этого значения: это будет 1FРАСП(0.696;13;12). 13. Почему использовался "Двухвыборочный t-тест с одинаковыми дисперсиями"? Была принята гипотеза о равенстве дисперсий расходов бензина. Поскольку мы собираемся сравнивать математические ожидания заданных выборок, то применяется двухвыборочный тест Стьюдента. 14. Какая гипотеза проверяется с помощью теста Стьюдента? Какова альтернативная гипотеза? Гипотеза о равенстве математических ожиданий двух заданных выборок. Или, другими словами, гипотеза о том, что расход бензина двумя бензовозами одинаков. Эта гипотеза называется ненаправленной, и может быть проверена с помощью одностороннего теста Стьюдента. Альтернативная гипотеза будет о неравенстве двух мат.ожиданий. 15. Какой вывод можно сделать по тесту Стьюдента? На уровне значимости 0.05 гипотеза отвергается. Т.е. математические ожидание заданных выборок не равны. А значит расход бензина двумя бензовозами неодинаков. Поскольку выборочное мат. ожидание бензовоза Б превышает значение для бензовоза А, можно сказать, что расход бензина выше у бензовоза Б. 16. На каком уровне значимости можно было бы принять гипотезу о равенстве мат. ожиданий расхода? На уровне 0.003, т.е. 3 тысячных или 0.3%. Это очень низкий уровень значимости, поэтому можно достаточно уверенно говорить о различии средних расходов бензина. 17. Какую гипотезу можно было бы проверить с помощью двустороннего теста Стьюдента? Как звучит альтернативная к ней? Можно было бы проверить гипотезу о том, что мат. ожидания равны, т.е. что расход бензина одинаков, против альтернативы, что расход бензовоза А больше, чем у Б. Или наоборот, что у Б больше, чем у А. Выборочные значения мат. ожиданий могли бы помочь правильно сформулировать альтернативную гипотезу. Однако в этом случае также следовало бы отвергнуть нулевую гипотезу о равенстве мат. ожиданий расхода бензина. 18. Как можно сравнивать отрицательное значение tрасч с положительным значением tкрит? Если идет речь о ненаправленной альтернативе, то необходимо модуль расчетного значения статистики Стьюдента сравнить с критическим значением. Если говорить о направленной альтернативной гипотезе, то стоит вспомнить о симметрии плотности распределения Стьюдента. Соответственно критическое значение слева от оси Оу будет равно -tкрит. 19. Какие причины могли привести к существенному различию в расходе бензина на собственные нужды у бензовозов? Таких причин можно предположить несколько. Какая или какие из них верны можно выяснить у менеджера фирмы. К таким причинам следует отнести следующие: бензовозы разных фирм/с разным объемом двигателя; график движения бензовозов различен – время суток может влиять на среднее количество пробок на дорогах и их продолжительность; бензовозы могут иметь различный объем цистерны и соответственно разный вес в груженом виде. Можно также предположить, что стиль вождения (т.е. средняя скорость и частота разгонов/торможений) приводит к столько различному расходу топлива. 20. Какой вывод можно сделать после выполнения этой работы? Какой бензовоз стоит выбрать для покупки менеджеру? Во-первых, мы пришли к выводу, что бензовоз Б расходует в среднем больше бензина на собственные нужды. Это различие составляет в среднем 170 л/неделю, т.е. более 15% расхода бензина. Нам недостаточно знать только это значение, поскольку (вопрос 19) причины различий столь неопределенны. Например, в случае разного объема цистерны, имеет смысл рассмотреть расход бензина на 1 тонну перевозимого продукта. В случае различия моделей бензовозов стоит рассмотреть их стоимость, обслуживания, срок эксплуатации. 21. В каких единицах измеряется уровень значимости ? стоимость технического В долях единицы или в процентах, поскольку - это вероятность отвергнуть верную гипотезу. 22. Можно ли утверждать, что расход бензина у одного бензовоза больше, чем у другого на 680 л/месяц? Средний расход, полученный по выборке, не дает достаточных оснований делать такой вывод. Можно рассмотреть доверительные интервалы для среднего расхода бензина. Поскольку (вопрос 3) распределение еженедельного расхода близко к нормальному, дисперсия и мат. ожидание неизвестны и оцениваются по выборке, границы доверительного интервала рассчитываем по формуле x t 2;n 1 S ;x t n 2;n 1 S . n С доверительной вероятностью 95% для бензовоза А средний расход лежит в интервале 0.952 2.160 0.136 0.136 , т.е. 0.874;1.031 . ;0.952 2.160 14 14 С доверительной вероятностью 95% для бензовоза Б средний расход лежит в интервале 1.122 2.179 0.163 0.163 , т.е. 1.024;1.221 . ;1.122 2.179 13 13 Таким образом с вероятностью 95% величина разности в расходах бензина у бензовоза Б и А лежит в интервале 0.007;0.347 . А значит, мы не можем утверждать, что за месяц разница в расходе будет 680 л.