Задачи по математической статистике

advertisement
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Задачи по математической статистике
Задача 1. По данным распределения возрастного состава участников революционного
движения в России 70-х годов 19-го века была построена следующая таблица
Возраст
17-23
Процент
27
на
1000
участников
23-29
45,2
29-35
22,5
35-41
2,8
41-47
1,4
47-53
1,1
По имеющимся данным:
а) построить гистограмму относительных частот;
б) оценить плотность распределения случайной величины с помощью гистограммы;
в) проверить гипотезу о законе распределения с уровнем значимости 0,01.
Решение. Построим гистограмму относительных частот, для чего дополнительно
n
ni
вычислим плотность относительных частот pi = i =
. Получаем:
nh 100 ⋅ 6
начало
17
23
29
35
41
47
конец
23
29
35
41
47
53
частота
27
45,2
22,5
2,8
1,4
1,1
100
pi
0,045
0,07533
0,0375
0,00467
0,00233
0,00183
1
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Гистограмма относительных частот
0,08
0,0753
0,07
0,06
0,05
0,0450
0,0375
0,04
0,03
0,02
0,01
0,0047
0,0023
0,0018
44
50
0
20
26
32
38
По виду гистограммы можно предположить, что исследуемая величина имеет нормальный
закон распределения.
Найдем точечные оценки параметров распределения. Для этого перейдем к простому
вариационному ряду, выбирая в качестве вариант середины интервалов, составим
расчетную таблицу:
xi
ni
x i ni
( xi − x ) 2 ni
20
26
32
38
44
50
Сумма
27
45,2
22,5
2,8
1,4
1,1
100
540
1175,2
720
106,4
61,6
55
2658,2
1169,71
15,3103
660,481
365,038
424,741
603,243
3238,53
Выборочное среднее:
1
1
x = ∑ xi ni =
2658, 2 = 26, 582 .
n
100
Выборочная исправленная дисперсия:
1
1
S2 =
( x − xi ) 2 ni = 3238, 53 ≈ 32, 712 .
∑
n −1
99
Выборочное исправленное среднее квадратическое отклонение: S = 32, 712 ≈ 5, 719 .
Таким образом, предполагаем, что исследуемая величина имеет нормальный закон
распределения с параметрами a = 26,582 и σ = 5, 719 .
С помощью критерия согласия Пирсона проверим, согласуется ли гипотеза с опытными
данными на уровне значимости α = 0, 01 .
2
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Пронормируем случайную величину X , то есть перейдем к величине Z =
x−x
, вычислим
S
xi − x
x −x
, zi +1 = i +1
.
S
S
Вычислим теоретические (выравнивающие частоты) ni ' = nPi , где n = 100 ,
концы интервалов по формулам zi =
Pi = Φ ( z i +1 ) − Φ ( z i ) - вероятность попадания в интервал ( zi , zi +1 ) , Φ(z ) - функция Лапласа.
Для нахождения значений составим расчетную таблицу:
xi
xi +1
ni
zi
zi +1
Φ ( zi )
Φ( zi +1 )
Pi
ni '
17
23
29
35
41
47
Сумма
23
29
35
41
47
53
27
45,2
22,5
2,8
1,4
1,1
100
-1,675
-0,626
0,423
1,472
2,521
3,570
-0,626
0,423
1,472
2,521
3,570
4,619
-0,500
-0,234
0,164
0,429
0,494
0,500
-0,234
0,164
0,429
0,494
0,500
0,500
0,266
0,398
0,266
0,065
0,006
0,000
26,557
39,820
26,570
6,468
0,567
0,018
100,000
Последние три интервала объединим как малочисленные:
ni
ni '
(ni − ni ')2
ni '
27
45,2
22,5
5,3
26,557
39,820
26,570
7,054
0,007
0,727
0,623
0,436
Сумма
1,794
Сравним эмпирические и теоретические частоты, используя критерий Пирсона:
(n − ni ')2
χ2 = ∑ i
= 1, 794 .
ni '
По таблице критических точек распределения χ по уровню значимости α = 0, 01 и числу
2
степеней свободы k = 4 - 3 = 1, находим χ кр. = 6,6. Так как χ набл. = 1,794 < χ
то можно принять гипотезу о нормальном распределении данной величины.
2
2
2
кр.
= 6,6,
Задача 2. Среди 500 молодых семей, живущих с родителями, было зарегистрировано 38
разводов в течение первых трех лет совместной жизни. Построить приближенный
доверительный интервал для вероятности развода в таких семьях с уровнем доверия 0,9.
Решение. Доверительный интервал для вероятности развода p найдем по формуле
3
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
w(1 − w)
w(1 − w)
38
< p < w + tкр
, где w =
= 0, 076
n
n
500
tкр = Φ −1 (0,9 / 2) = Φ −1 (0, 45) = 1, 645 . Подставляем:
w − tкр
0, 076 − 1, 645
0, 076 (1 − 0, 076 )
500
< p < 0, 076 + 1, 645
0, 076 (1 − 0, 076 )
500
-
выборочная
доля,
,
0, 0565 < p < 0, 0955 .
Ответ: от 5,65% до 9,55%.
Задача 3. Известно, что случайная величина Х имеет нормальное распределение с
неизвестным математическим ожиданием а и известной дисперсией σ2=144. По выборке
объема n=90 вычислено выборочное среднее хв=120. Определить доверительный интервал
для неизвестного параметра а, отвечающий заданной надежности γ=0,9.
Решение. Найдем доверительный интервал для математического по формуле:
xB − t
σ
< a < xB + t
σ
,
n
n
где n = 90 , xB = 120 , σ = 144 = 12 , t определяется по доверительной вероятности из
таблицы распределения Лапласа t (0, 9) = Φ −1 (0, 9 / 2) = Φ −1 (0, 45) = 1, 645 . Получаем:
12
12
120 − 1, 645
< a < 120 + 1, 645
90
90
117, 919 < a < 122, 081 .
Ответ: от 117,919 до 122,081.
Задача 4. При обработке исторических материалов профессиональной переписи 1914 года
были получены следующие данные: из 329 рабочих фабрики Тамбовской губернии на
полевые работы уходило 146 человек, а из 494 рабочих фабрики Ярославской губернии
уходило 263 человек. Проверить гипотезу о равенстве вероятности ухода рабочих на
полевые работы для двух губерний при уровне значимости 0,1.
Решение. Нулевая гипотеза: H 0 : p1 = p2 . В качестве конкурирующей гипотезы выберем
H1 : p1 ≠ p2 .
Вычислим наблюдаемое значение критерия по формуле:
m1 m2
−
n1 n2
U набл =
,
m1 + m2  m1 + m2  1 1 
1 −
 + 
n1 + n2 
n1 + n2  n1 n2 
Где
4
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
n1 = 329, n2 = 494,
m1 = 146, m2 = 263.
Получаем:
U набл =
146 263
−
329 494
≈ −2, 75
146 + 263  146 + 263  1
1 
+
1 −


329 + 494  329 + 494  329 494 
1 − α 1 − 0,1
=
= 0, 45 , откуда
2
2
uкр = 1, 645 . Так как | U набл |= 2, 75 > 1, 645 = uкр , нулевую гипотезу следует отвергнуть.
Вычисляем критическое значение из равенства Φ ( uкр ) =
Вероятности ухода рабочих на фабриках разных губерний отличаются значимо.
Задача 5. При уровне значимости α=0,1 проверить гипотезу о равенстве дисперсии двух
нормально распределенных случайных величин X и Y на основе выборочных данных,
приведенных в следующих таблицах:
X
xi
ni
yi
mi
Y
35
1
36
3
37
3
37
5
39
5
38
2
40
4
44
1
41
4
42
4
Решение. Вычислим по данным выборок исправленные выборочные дисперсии S x2 , S y2 .
xi
ni
x i ni
( xi − x) 2 ni
35
37
39
40
41
Сумма
1
3
5
4
4
17
35
111
195
160
164
665
16,955
13,453
0,069
3,114
14,173
47,765
1
1
xi ni = 665 ≈ 39,118 .
∑
n
17
Исправленная (несмещенная) выборочная дисперсия
Выборочная средняя x =
Sx2 =
1
1
( xi − x)2 ni = 47,765 = 2,985
∑
n −1
16
yi
mi
y i mi
( y i − y ) 2 mi
36
37
38
44
42
Сумма
3
5
2
1
4
15
108
185
76
44
168
581
22,413
15,022
1,076
27,738
42,684
108,933
5
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
1
1
yi mi = 581 ≈ 38, 733 .
∑
m
15
Исправленная (несмещенная) выборочная дисперсия
Выборочная средняя y =
S y2 =
1
1
( yi − y)2 mi = 108,933 = 7,781
∑
m −1
14
Вычислим наблюдаемое значение критерия Fнабл =
S y2
S
2
x
=
7, 781
≈ 2, 606
2,985
Найдем критическую точку при уровне значимости α / 2 = 0,05 и числам степеней
свободы k1 = m − 1 = 14 , k2 = n − 1 = 16 , Fкр = 2,373 .
Так как Fнабл = 2, 606 > 2,373 = Fкр , следует отвергнуть нулевую гипотезу.
Дисперсии различаются значимо.
Задача 6. Результаты наблюдений переменных X и Y приведены в таблице. Найти
выборочный коэффициент линейной корреляции и уравнение прямой регрессии Y по X.
X
Y
20
40
60
80
100
10
4
4
12
14
16
18
2
6
5
5
10
1
2
3
8
3
10
6
4
20
22
4
7
4
2
5
5
Решение. Построим ряды распределений для X и Y , вычислим их характеристики
(выборочное среднее и выборочное среднее квадратическое отклонение).
xi
ni
10
12
14
16
18
20
22
Сумма
Среднее
11
7
18
20
17
11
16
100
xi ⋅ ni ( xi − x) 2 ⋅ ni
110
84
252
320
306
220
352
1644
16,44
456,2096
137,9952
107,1648
3,872
41,3712
139,4096
494,6176
1380,64
13,8064
1
1
xi ni =
1644 = 16, 44
∑
n
100
1
1
Выборочная дисперсия D x = ∑ ( xi − x) 2 ni =
1380, 64 = 13,8064
n
100
Выборочная средняя x =
6
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Выборочное квадратическое отклонение σ x = Dx = 3, 716
yi
ni
yi ⋅ ni
( yi − y ) 2 ⋅ ni
20
40
60
80
100
Сумма
Среднее
17
17
28
20
18
100
340
680
1680
1600
1800
6100
61
28577,000
7497,000
28,000
7220,000
27378,000
70700,000
707,000
1
1
yi ni =
6100 = 61, 0
∑
n
100
1
1
Выборочная дисперсия D y = ∑ ( yi − y ) 2 ni =
70700 = 707, 0
n
100
Выборочная средняя y =
Выборочное квадратическое отклонение σ y = Dy = 26,589
Коэффициент линейной корреляции вычислим по формуле r =
Найдем сумму
Y\X
20
40
60
80
100
10
0
4
4
0
3
∑n
∑n
x yi − nx y
xy i
nσ xσ y
.
x yi = 100840 . Расчеты в таблице
xy i
12
2
0
2
3
0
14
6
0
8
0
4
16
5
5
10
0
0
18
0
1
0
10
6
20
0
0
4
2
5
22
4
7
0
5
0
nxy xi nxy xi yi
276
292
416
366
294
5520
11680
24960
29280
29400
100840
Тогда коэффициент корреляции:
100800 − 100 ⋅16, 44 ⋅ 61
r=
≈ 0, 056 .
100 ⋅ 3, 716 ⋅ 26, 589
Связь очень слабая, прямая по направлению.
Напишем уравнение регрессии Y на X . Оно имеет вид yx − y = r
все величины:
yx − 61 = 0, 056
26,589
( x − 16, 44) ,
3, 716
yx = 0, 402 x + 54,379 .
7
σy
( x − x) . Подставляем
σx
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Задача 7. При уровне значимости α=0,05 методом дисперсионного анализа проверить
нулевую гипотезу о влиянии фактора на качество объекта на основании пяти измерений
для трех уровней фактора. Данные измерений приводятся в таблице:
Номер измерения
1
2
3
4
5
Ф1
34
36
26
25
30
Ф2
38
30
34
36
38
Ф3
28
24
22
20
23
Решение. Составим дисперсионную таблицу:
Φ1
Φ2
Φ3
i
yi1
yi21
yi 2
yi22
yi 3
yi23
1
2
3
4
5
34
36
26
25
30
1156
1296
676
625
900
38
30
34
36
38
1444
900
1156
1296
1444
28
24
22
20
23
784
576
484
400
529
T j = ∑ yij
Sj = ∑ y
151
176
2
ij
T
2
j
4653
22801
117
6240
30976
444
2773
13689
Сумма
13666
67466
Найдем общую и факторную суммы квадратов отклонений, учитывая, что число уровней
фактора p = 3 , число испытаний на каждом уровне q = 5 .
Получаем:
Sобщ
2
1  p 
1
2
= ∑Sj −
 ∑ T j  = 13666 − 444 = 523, 6
pq
15
j =1
 j =1 
p
2
1 p
1  p  1
1
2
Sфакт = ∑ T j2 −
 ∑ T j  = 67466 − 444 = 350,8
q j =1
pq  j =1  5
15
Найдем остаточную сумму квадратов отклонений
Sост = S общ − S факт = 523, 6 − 350,8 = 172,8
Найдем дисперсии
S
350,8
2
sфакт
= факт =
= 175, 4
p −1
2
Sост
172,8
2
sост
=
=
= 14, 4
p (q − 1)
3⋅ 4
Сравним факторную и остаточную дисперсию с помощью критерия Фишера-Снедекора.
Найдем наблюдаемое значение критерия
8
Контрольная работа выполнена на сайте www.MatBuro.ru
©МатБюро. Решение задач по математике, статистике, теории вероятностей
Fнабл =
2
sфакт
2
ост
s
=
175, 4
= 12,18 .
14, 4
По числу степеней свободы k1 = 2 , k2 = 12 и по уровню значимости α = 0, 05 находим
критическую точку Fкрит = 3,88 . Так как Fнабл > Fкрит , следует отвергнуть гипотезу,
влияние фактора значимо.
9
Download