Загрузил sleepy cat

2 lb

реклама
Задание 2.1.
Точечные оценки математического ожидания. Точечные оценки дисперсии.
Необходимо найти состоятельные несмещенные оценки математического
ожидания М[] и дисперсии D[] случайной величины  по приведенным в
задании выборочным значениям x1 , x2 ,..., xn .
ORIGIN 1
 3 921 
 2 918 


1 933 

D1 
 4 945 
 2 957 


 1 901 
1
i  1 18
 2 944 
 1 921 


4 911 

D2 
 3 969 
 1 950 


 3 978 
D  stack ( D1D2)
2
1
2
910
2
1
911
3
2
912
4
3
913
5
1
914
D 6
1
915
7
1
950
8
2
943
9
3
949
10
2
990
11
1
957
12
1
968
Далее необходимо определить объем выборки:
12
n 
 Di1
i1
n  27
Следует найти точечную оценку математического ожидания М[],
состоятельную
смещенную
оценку
дисперсии
среднеквадратичное отклонение Dx:
Mx  
1

n
Dx 
12
 Di1 Di2
i1
12
Mx  939.66667
D  D  Mx 


n  1   i 1 i 2
1

i1
2
Dx  577.23077
Dx1
и
несмещенное
Dx1 
12
D  D  Mx 


n   i 1 i 2
1

2
Dx1  555.85185
i1
Математическим ожиданием случайной величины называют сумму
произведений всех возможных значений этой случайной величины на
соответсвующие им вероятности в объеме выборки. По-другому, это среднее
значение случайной величины.
Дисперсия случайной величины – это математическое ожидание квадрата
ее отклонений от среднего значения. Иными словами, это величина,
характеризующая степень отклонения значений случайной величины от ее
среднего значения.
Несмещенная оценка случайного события – это оценка, мат.ожидание
которой равно оцениваемому параметру, дисперсия с увеличением объема
выборки стремится к нулю. Соответственно, смещенная оценка- это такая
оценка, мат. ожидание которой не равно параметру.
Вывод: данная выборка характеризуется такими значениями: оценка
математического ожидания Mx = 939.66667, несмещенное среднеквадратичное
отклонение Dx = 577.23077 и смещенное среднеквадратичное отклонение Dx1 =
555.85185. Из приведенных вычислений видно, что смещенная оценка даёт
заниженное значение оценки дисперсии.
2
Задание 2.2.
Точечная оценка вероятности события.
В данном задании необходимо смоделировать несколько выборок
значений случайной величины, имеющей распределение Бернулли с заданным
значением параметра р = 0,6.
Биноминальное распределение – это распределение случайных величин,
количества «успехов»
в последовательности из независимых случайных
экспериментов, таких, что вероятность «успеха» в каждом из них постоянна.
Распределение Бернулли моделирует случайный эксперимент, когда заранее
известна вероятность успеха или неудачи.
Вычисление для каждого значения п точечных оценки p вероятности р.
Функция rbinom(n, size, prob) генерирует количество случайных значений из
заданной выборки
с заданной вероятностью, т.е. формирует вектор из k
случайных чисел, каждое из которых равно числу успехов в серии из n
независимых испытаний с вероятностью успеха p в каждом.
k  1 15000
p  0.6
rbinom ( 1 10k 0.3)
P 
k
10k
1
, где 𝑃𝑘 – вероятность равномерного биноминального распределения.
График зависимости величины р от объема выборки выглядит так:
Pk
0.6
0.4
0.3 
0.3   0.2
0
0
4
5
510
110
10 k
3
1.510
5
С
увеличением
объема
выборки
разброс
вероятности
равномерного
биноминального распределения значений случайной величины стремится к
нулю.
Далее вычисляется значение отклонения, равное 2.5% от оптимального
значения:
 
0.6
100
 2.5
  0.015
С учетом отклонения график выглядит так:
0.32
Pk
0.31
0.6
0.3  0.3
0.3   0.29
0.28
3
8.510
910
3
3
9.510
4
110
10 k
Вывод: для того, чтобы отклонение идеального значения p = 0.6 не
превышало 5% (то есть, входило в интервал [0.285; 0.315]), необходимо брать
значение выборки равное, как минимум, 9240.
4
Задание 2.3.
Точечная оценка параметров равномерного распределения.
Необходимо смоделировать несколько выборок разного объема значений
случайной величины, имеющей равномерное распределение на отрезке [0; θ]
при значении θ = 3. (θ- верхняя граница интервала при распределении в условиях
данной задачи)
Непрерывное равномерное распределение — распределение случайной
величины,
принимающей
некоторому промежутку конечной
значения,
длины,
принадлежащие
характеризующееся
тем,
что
вероятности появления каждого значения выборки на этом промежутке почти
всюду постоянна.
Для этого нужно для каждого значения п вычислить точечные оценки T1k
и T3k и их отклонение p1 и p3 (функция runif(m, a, b) возвращает вектор m
случайных чисел, имеющих равномерное распределение, в котором b и a
являются граничными точками интервала):
k  1 20
T1 
k
T1
20
10k

runif (10k 03)
 3.061
T3 
k
T3
2
ORIGIN 1
20
10k  1
10k
max( runif ( 10k 0 3) )
 2.998
График зависимости величин T1k и T3k от объема выборки:
5
4
4
3
T1k
T3k
3
2
0.8 1
0
50
0
100
150
200
10k
200
Вывод: как видно из приведенных выше вычислений, значение θ = 3 при объеме
выборки 20 T120 = 3.061, а T320 = 2.998, следовательно, вторая оценка более
точная.
T3 
T1 
k
k
1.95972
2.10139
1.89134
mean( T1)  1.9869
3
2.11618
mean( T3)  2.00488
2.01885
var ( T3)  1.22223  10
2.01051
var ( T1)  8.56156  10
2.00358
1.91996
1.95834
2.16644
2.03305
2.08445
2.002
1.95345
2.01989
2.10682
1.91692
1.92085
2.00767
1.98123
2.00006
1.94959
2.01042
1.90429
2.01088
1.89234
1.98066
1.84792
2.00226
1.87908
...
...
6
3
Вывод: вследствие того, что дисперсия оценки θ3 меньше θ1, имеем то,
что θ3 является более точной оценкой.
7
Скачать