Для генеральной совокупности из всех покупателей женщины

advertisement
статистика. Тема 8.
Мужские бритвенные принадлежности
Выборка 1200 покупок
728 чел. (61%) - женщины
Для генеральной совокупности из
всех покупателей женщины составят
от 58% до 64%
Среднеквадратическое отклонение
выборочного распределения
среднего =
Среднеквадратическое отклонение исходного распределения
Размер выбоки
Исходное
Выборочное распределение
распределение
среднего
Нормальная
Нормальная
Среднее
x
x
Среднеквадратическое
s
Форма
отклонение
s
Размер выборки
Исходное
Выборочное распределение
распределение
среднего
НЕ Нормальная
Нормальная
Среднее
x
x
Среднеквадратическое
s
Форма
отклонение
s
Размер выборки
В организации насчитывается несколько тысяч сотрудников. Имеются записи,
которые показывают, что среднее число дней, которые работник проболел в
течение года равно 14, среднеквадратическое отклонение – 6. Если были взяты
случайные выборки по 100 работников, и было подсчитано среднее значение и
среднеквадратическое отклонение для каждой из выборок, какое распределение
мы получим? Каковы будут его параметры?
6
100  0.6
Мы ничего не знаем о генеральной совокупности, но у нас есть выборка из 100
сотрудников. Среднее значение выборки – 11.5, среднеквадратическое отклонение
выборочного распределения среднего - 0.6. Каково среднее значение генеральной
совокупности?
10.3-12.7 дней (±2 ср. квадр. отклонений выборки).
Общая процедура оценивания среднего значения генеральной
совокупности выглядит так:
1. Взять случайную выборку размером, по крайней мере, 30. Обозначим размер
выборки за n. Минимум 30 нужен потому, чтобы мы могли использовать
теорему о центральном пределе и использовать среднеквадратическое
отклонение выборки как среднеквадратическое отклонение генеральной
совокупности. Можно ограничиться и меньшей выборкой в том случае, если
генеральная совокупность представляет собой нормальное распределение и
если среднеквадратическое отклонение генеральной совокупности известно.
2. Подсчитать среднее значение выборки (x) и среднеквадратическое
отклонение выборки (s).
3. Cреднеквадратическое отклонение выборочного распределения среднего
рассчитывается по формуле s n
4. Точечная оценка генеральной совокупности равна x
5. Тогда 95%-ный доверительный предел для среднего значения в генеральной
совокупности будет равен x  2 s n
ПРИМЕР: Была взята случайная выборка из 49 ламп, которые проработали в
среднем 1100 часов перед тем, как выйти из строя. Среднеквадратическое
отклонение было 70 часов. Оцените среднее время жизни лампы такой марки
в целом.
1. Выборка случайная. Размер ее достаточен (больше 30). Следовательно, мы
можем применить теореме о центральном пределе и можем использовать
среднеквадратическое отклонение выборки как среднеквадратическое
отклонение генеральной совокупности.
2. Среднее значение выборки 1100, среднеквадратическое отклонение 70
3. Среднеквадратическое отклонение выборочного распределения среднего
70
49  10
4. Точечная оценка среднего в генеральной совокупности равна 1100 часов
5. 95%-ный доверительный предел в таком случае равен 1100  2  10  1080  1120
также можно подсчитать доверительный
предел любого другого уровня, скажем
68%-ный, он будем равен 1100 110  1090 1110
ПРИМЕР: Маслодельная компания производит брикеты масла
массой 500 грамм.
У кого-то из компании возникло подозрение, что машина,
которая штампует брикеты, слегка перевешивает их, в итоге в
пачке оказывается слегка больше масла, чем 500 грамм.
Была отобрана случайная выборка в 100 брикетов, и они все
были взвешены.
Средний вес брикета в выборке составил 500.4 грамма.
Среднеквадратическое отклонение в выборке составило 1.5
грамма.
Действительно ли машина делает брикеты средним весом 500
грамм или таки имеет место перевес?
ШАГ 1. Формулирование гипотезы.
средний вес пачки масла 500 грамм
ШАГ 2. Получение набора доказательств
Доказательством нашей гипотезы будет служить выборка из 100
пачек масла, со средним весом 500.4 грамма и
среднеквадратическим отклонением 1.5 грамма
ШАГ 3. Установление уровня значимости
Уровень значимости установим = 5%.
Если вероятность события, что случайно взятая выборка
будет весить в среднем 500.4г будет больше 5% - то не
необычное событие, и мы верим, что оно произошло по
чистой случайности.
Если вероятность события, что случайно взятая выборка
будет весить в среднем 500.4г будет меньше 5% - то это
событие необычное, и мы не верим, что оно произошло
случайно.
ШАГ 4. Вычисление вероятности того, что выборка подтвердит гипотезу
Среднеквадратическое отклонение
выборочного распределения среднего
1.5
(500.4  500) 0.15  2.67
0.5-0.4962=0.0038 или 0.38%.
100  0.15
ШАГ 5. Сравнение вероятности с уровнем значимости
Вероятность того, что из генеральной совокупности брикетов масла
массой 500 грамм мы получим какую-то выборку со средней массой 500.4
грамма составила 0.38%.
Это число значительно ниже установленного нами барьера (уровня
значимости) в 5%.
Следовательно, крайне невероятно то, что мы можем получить выборку
со средней массой 500.4 грамма из генеральной совокупности со средним
значением в 500 грамм.
Следовательно, гипотеза отвергается.
Это значит, что машина производит слегка перевешенные брикеты
Как вариант при решении о принятии или неприятии гипотезы можно основываться
на сравнении среднего значения выборки с критическим значением.
Если, как и в прошлом примере, мы установим уровень значимости 5%,
критическое значение можно будет рассчитать следующим образом:
500 + (1.645 * 0.15) = 500.247 грамм
500.247 < 500.4 – гипотеза отвергается
Задача
Больные выздоравливали за 12 дней.
Новый метод лечения. Выборка 30 человек. Больные выздоравливают за
10.5 дней.
Среднеквадратическое отклонение выборки = 5.5
Помогло ли новое лечение? (уровень значимости примем 5%)
5.5 / корень из 30 = 1 (выборочное распр. средн.)
12 дней - 10.5 дней = 1.5 дня
1.5 / 1 = 1.5 (сколько сред. квадр. откл. в разнице между 12 и 10.5)
1.5 => 43% => Вероятность получения выборки 10.5дн. составила 7%
7% > 5% - выборка в 10.5 дней получилась чисто случайно. Новое
лечение не помогает.
10,355 Крит. Знач. < 10.5
Download