CH-8

advertisement
Глава 8. Статические оценки параметров распределения.
8.1. Точечные оценки.
8.1.1. Пусть дано распределение изучаемого признака Х генеральной
совокупности (ГС), содержащей неизвестный параметр  . Например это параметр  в
распределении Пуассона. Так как исследование всех элементов ГС не представляется
возможным, то о параметре  судят по выборке, состоящей из значений x1 , x2 ,..., xn .
Эти значения можно рассматривать как значения n независимых случайных величин
X 1 , X 2 ,..., X n , имеющих тот же закон распределения, что и изучаемый признак Х.
Статистической оценкой  n* неизвестного параметра  называют функцию
результатов наблюдений над случайной величиной Х:
 n* =  n*  X 1 , X 2 ,..., X n  .
(8.1.1)
Так как X 1 , X 2 ,..., X n - случайные величины, то и оценка  n* является
случайной величиной, зависящей от закона распределения Х и числа n.
Точечной оценкой параметра  называют статистическую оценку, которая
определяется одним числом  n* = f  x1 , x2 ,..., xn  по результатам n наблюдений
x1 , x2 ,..., xn признака Х.
Отметим основные требования к точечным оценкам.
1. Оценка  n* должна быть несмещенной, т.е. ее математическое ожидание
равно оцениваемому параметру  при любом объеме n выборки;
 
M  n*   .
(8.1.2)
В противном случае оценка называется смещенной.
2. Оценка  n* должна быть состоятельной, т.е. сходиться по вероятности к
параметру  :


limn P  n*     1 .
(8.1.3)
Если оценка состоятельна, то практически достоверно, что при достаточно
большом n  n*   .
3. Несмещенная оценка  n* должна быть эффективной, т.е. иметь наименьшую
дисперсию среди всех несмещенных оценок параметра  .
Так как для несмещенной оценки  n* ее дисперсия  *2 определяется в виде

n

2
*
n
 M  n*
2
 ,

(8.1.4)
то эффективность является определяющим качеством оценки.
8.1.2. Оценка генеральной доли.
Пусть в ГС объема N M элементов обладают признаком Х.
1
В качестве точечной оценки генеральной доли p 
M
берется выборочная доля
N
m
, где n – объем выборки, m – количество элементов выборки, обладающие
n
признаком Х.
m
Для повторной выборки выборочная доля  
является несмещенной и
n
M
состоятельной оценкой генеральной доли p 
, причем ее дисперсия
N

2



pq
n ,
(8.1.5)
где q  1  p , стремится к нулю при увеличении объема выборки.
m
также является
n
несмещенной и состоятельной оценкой генеральной доли, причем, если объем ГС
Для
бесповторной
выборки
выборочная

доля
значительно больше объема выборки, то и дисперсия 
2

выборочной доли
практически совпадает с (8.1.5).
Пример 8.1.1. В таблице приведены результаты измерения роста случайной
отобранных 100 студентов (юношей).
Рост
Число
студентов
160-165
165-170
170-175
175-180
180-185
185-190
190-195
3
21
27
23
14
10
2
Найти несмещенную и состоятельную оценку доли студентов с ростом не менее
175 см.
Решение. Оценкой доли p  X  175 является выборочная доля   X  175 .
  X  175  
23  14  10  2
 0, 49 .
100
8.1.3. Оценка генеральной средней.
Выборочная
средняя
X B повторной
выборки
является
несмещенной
и
состоятельной оценкой генеральной средней X Г , причем ее дисперсия
2

XB

2
n
,
(8.1.6)
где  2 - генеральная дисперсия признака Х, n – объем выборки, стремится к 0 при
n  0.
Для
бесповторной
выборки
выборочная
средняя
XB
также
является
несмещенной и состоятельной оценкой генеральной средней.
2
Отметим, что если N  n , то бесповторная выборка практически не отличается
от повторной.
Пример 8.1.2. Найти несмещенную и состоятельную оценку среднего роста
студентов по данным выборки 8.1.1.
Решение. По данным вариационного ряда найдем xB .
162,5  3  167,5  21  172,5  27  177,5  23  182,5  14  187,5  10  192,5  2
=
100
 175, 6 .
xB 
8.1.4. Оценка генеральной дисперсии.
Выборочная дисперсия DB повторной и бесповторной выборок является
смещенной и состоятельной оценкой генеральной дисперсии  2 , так как
n 1 2
M  DB  
 ,
(8.1.7)
n
где n – объем выборки.
Несмещенной оценкой генеральной дисперсии служит генеральная выборочная
дисперсия S 2 , вычисляемая по формуле
n
S2 
 DB .
(8.1.8)
n 1
Пример 8.1.3. Найти несмещенную и состоятельную оценку генеральной
дисперсии случайной величины Х – рост студента, по данным выборки примера 8.1.1.
Решение. Вычислим смещенную оценку DB  X  по формуле
 
DB  X   DB U   U 2  U ,
2
(8.1.9)
где U i  xi  c - условные варианты. В качестве с возьмем высокочастотную варианту
172,5, составим распределение условных вариант
Ui
ni
-10
3
-5
21
0
27
5
23
10
14
15
10
20
2
и вычислим U и U 2 .
U i ni  3,1
U
100
U i2 ni  58,5
U2 
100
И DB  X   58,5   3,1  48,89 .
2
Исправленная выборочная дисперсия
n
100
S2 
 DB 
 48,89  49,38 .
n 1
99
Заметим, что при достаточно больших n  30 различие между DB и S 2
практически незаметно.
3
8.2. Интервальные оценки.
Для малых объемов выборки точечная оценка может значительно отличаться от
исследуемого параметра. В этом случае используется интервальная оценка.
Интервальной оценкой параметра  называется числовой интервал 1 ,  2  ,
который с заданной вероятностью  накрывает неизвестное значение  . Такой
интервал называют доверительным, а вероятность  - доверительной вероятностью
или надежностью оценки. Зачастую доверительный интервал выбирают симметричным
относительно исследуемого параметра  , т.е.    ;    .
4
Download