lect_03_01

advertisement
Обработка результатов
наблюдений
Лямин Андрей Владимирович
Определения
Множество возможных значений случайной
величины X называется генеральной
совокупностью или пространством
выборки.
Множество измеренных значений (x1, x2,…xn)
случайной величины называется выборкой,
где n – объем выборки.
Любая функция зависящая от наблюдений
называется статистикой.
Вариационный ряд
Вариационным рядом называется
последовательность элементов выборки,
расположенных в неубывающем порядке.
Минимальный xmin и максимальный xmax
элементы выборки называются крайними.
Разность R= xmax- xmin называется
размахом.
Пример 1:
• {0, -2, 3, 2, 3, -1, -4, 0, 1, 2, -2}
• {-4, -2, -2, -1, 0, 0, 1, 2, 2, 3, 3}
• xmin=-4, xmax=3, R=7
Точечные оценки
Точечной оценкой числовой характеристики 
генеральной совокупности называется
ˆ ( x , x ,..., x ) приближенно
n  
статистика ˆ
n
1
2
n
равная .
Оценка называется состоятельной, если для
n   | )  0
любого >0 lim P (| ˆ
n 
Оценка называется несмещенной, если
M[ˆ
]  
Оценки средних значений,
дисперсии, корреляции
n
n
2
ˆ
 ( xi   )
 xi
2
i 1
ˆ
ˆ

,   i 1
n
n 1
n j
,
( xi  ˆ )( xi  j  ˆ )

ˆ
kj ˆ
ˆ j  2 , k j  i 1
,
n j
ˆ
где j  1,..., n  1.
Пример 2:
Последовательность случайных чисел:
{0.42, 0.52, 0.33, 0.43, 0.23,
0.58, 0.76, 0.53, 0.64, 0.21}
Оценка математического ожидания: 0.48.
Оценка дисперсии: 0.07.
Математическое ожидание
оценки дисперсии


(1

i
/
n
)


i 

2
2
i 1

ˆ ]   1  2
M[
n 1




n 1
Принцип максимального
правдоподобия
L()  P ( x1 ) P ( x2 )...P ( xn )
L()  f  ( x1 ) f  ( x2 )... f  ( xn )
L
 L
 0,
0
2


2
Пример 3:
L()   (1  )
k
nk
ln L()  k ln   (n  k ) ln(1  )
 ln L k n  k
k
 
0

 1 
n
Интервальные оценки
Доверительным интервалом числовой
характеристики  генеральной совокупности с
доверительной вероятностью  называется
интервал (1, 2) со случайными границами 1=
=1(x1, x2,…xn), 2= 2(x1, x2,…xn), который
накрывает  с вероятностью : P(1<< 2)=,
где =1- – уровень значимости.
Построение интервальной
оценки для среднего значения
ˆ  )/ 
ˆ , ( x ) 
Y  n (
1
x
e

2
2 /2

( x ) : (0)  1/2; ( x )  1  ( x ).
ˆ 

P ( x  n
 x )  2( x )  1 
ˆ

ˆx
ˆx


ˆ
ˆ
P (

)  2( x )  1
n
n
d
Построение интервальной
оценки для среднего значения
ˆ
P (
ˆx

ˆ

ˆx

)  2( x )  1
n
n
2( x )  1  1    ( x )  1   /2
1
x  u1 /2 , где u1 /2   (1   /2)
ˆ
P (
ˆ u1 /2

n
ˆ

ˆ u1 /2

n
)1
Пример 4:
ˆ  0.132, 
ˆ  1.05,   0.05
n  100, 
ˆ u1  /2
ˆ u1  /2


ˆ
ˆ
P (

) 1
n
n
u1  /2  u0.975  1.96
1.05  1.96
P (|0.132   |
)  0.95
10
P (0.07    0.34)  0.95
Пример 5:
u1 / 2
  1,   0.05,
 0.1
n
u1 / 2  u0.975  1.96 
n  u1 / 2 / 0.1  19.6 
n  385
Распределение Стьюдента
Нормальное
распределение
N(,2)
Распределение
Стьюдента tn-1,1-/2
Статистические гипотезы
Статистической гипотезой называется
предположение о виде и свойствах
генерального и выборочного распределений.
Критерием значимости называется правило
проверки статистической гипотезы.
Статистикой критерия значимости Z
называется функция наблюдений, по
значениям которой судят о справедливости
гипотезы.
Статистические гипотезы
Критической областью критерия называется
подмножество Vk множества V значений
статистки Z, вероятность попадания в которое
при условии истинности гипотезы равна
уровню значимости 0, т.е. P(ZVk)=.
Множество V\Vk называется областью
допустимых значений статистики критерия.
Схема проверки гипотез
1. Выдвигается проверяемая гипотеза H0 и ей
альтернативная H1.
2. Выбирается уровень значимости  (0.1, 0.05,
0.01, 0.001).
3. Выбирается статистика Z, строится
критическая область Vk и область допустимых
значений V\Vk.
4. Вычисляется выборочное значение статистики.
5. Если ZVk, гипотеза H0 отвергается, иначе –
принимается.
Мощность критерия
• Мощностью критерия называется
вероятность отклонения гипотезы H0,
когда она ложна.
• Ошибка первого рода – отклонение
гипотезы H0, когда она верна.
• Ошибка второго рода – принятие
гипотезы H0, когда она ложна.
Проверка гипотез с помощью
доверительных интервалов
Гипотеза H0: = 0 принимается, если
построенный доверительный интервал
покрывает 0, и отвергается в противном
случае.
ˆ  0

Z n
ˆ

| Z | u1 /2  H 0 принимается
| Z | u1 /2  H 0 отвергается
Пример 6:
ˆ  0.132, 
ˆ  1.05,   0.05
n  100, 
H 0 : 0  0.5
u1  /2  u0.975  1.96
ˆ  0

0.132  0.5
Z n
 10
 3.5
ˆ

1.05
| Z | 3.5  1.96
Метод гистограмм
1) [b0 , b1 ),[b1 , b2 ),...,[bk 1 , bk )
2) h( x)  hi / n, bi 1  x  bi , i  1, 2,..., k
3) P(bi 1  x  bi ) 
bi

f ( x)dx  (bi  bi 1 ) f ( y )
bi 1
4) h( y )  hi / n  (bi  bi 1 ) f ( y )
Пример 7:
F(x)
0.5
0
0.25
0.5
0.75
1
1.25
x
{0.42, 0.52, 0.33, 0.43, 0.23, 0.58, 0.76, 0.53, 0.64, 0.21}
h( y )={0.2, 0.3, 0.4, 0.1}, (bi  bi 1 ) f ( y)  0.25
Метод 2
1) [b0 , b1 ),[b1 , b2 ),...,[bk 1 , bk )
2) h( x)  hi , bi 1  x  bi , i  1, 2,..., k

  f ( x)dx
bi1
3) pi  
  P( x j )
bi1  x j bi
bi
Метод 2
(hi  npi )
4) Z  
npi
i 1
k
2
| Z | 
 H 0 принимается
5) 
2
| Z |  k 1,1  H 0 отвергается
2
k 1,1
Пример 8:
{0.42, 0.52, 0.33, 0.43, 0.23,
0.58, 0.76, 0.53, 0.64, 0.21}
h={2, 3, 4, 1}, p ={0.25, 0.25, 0.25, 0.25}
Z =2, 
2
3,0.9
 6.3, | Z | 
2
3,0.9
Download