Задание п 1. составить вариационный ряд; 2. составить статистический ряд;

advertisement
Задание
Для данной случайной выборки объемом п = 100:
1. составить вариационный ряд;
2. составить статистический ряд;
3. построить гистограмму частот;
4. вычислить статистическое среднее и статистическую дисперсию;
5. составить статистическую функцию распределения F(x);
6. построить группированную выборку и с ее помощью:
а) вычислить статистическое среднее и статистическую дисперсию;
б) составить статистическую функцию распределения F (x) и построить
ее график;
7. найти доверительный интервал для математического ожидания и
дисперсии;
8. с помощью критерия Пирсона 𝑥 2 проверить гипотезу о нормальном
законе распределения данной выборки;
9. составить уравнение линии регрессии (кривой, «сглаживающей»
гистограмму частот) и построить ее график.
Дана случайная выборка n=100
-1,752
-0,206
-0,266
-0,578
0,035
-0,291
0,092
0,901
0,439
0,106
-0,093
-1.222
-1,433
-0,852
0,199
-0.450
0,065
0,327
0,489
-1,990
0,512
0,183
0,248
0,675
0,710
-0,702
-0.811
-0,401
-1,210
0,340
0,284
-1.019
0,344
0,131
-0,594
-0,509
1,453
0,441
-1,202
-1,527
-1.776
0,759
0,824
0,894
0,362
-0.044
0,287
1,385
-0,780
-0,570
0,263
-0,669
-0,329
-0,195
-1,309
0,986
0,392
0,085
-0,927
1,531
-0,441
-о,зз7
0,130
-1,582
-1,008
-0.866
0,369
-0,244
0,075
0,763
-1.215
1,694
-0,882
1,600
0,788
-0,475
-0,985
0,472
2,904
-0,679
1,2
-1,063
0,039
0,149
-0,824
-0,498
0,033
1,42
1,210
-0,372
-0,743
0,597
-1,033
-0,838
0,049
0,779
-1.601
1,807
0,278
1,320
Таблица 1
Решение:
Из данной выборки определяем максимальную варианту x max и
минимальную варианту xmin
x max =2,904, xmin =-1,99
Расположив варианты в порядке возрастания, начиная с xmin получим
вариаионный ряд:
-1,99
-0,852
-0,329
0,183
0,71
-1,776
-0,838
-0,291
0,199
0,759
-1,752
-0,824
-0,266
0,248
0,763
-1,601
-0,811
-0,244
0,263
0,779
-1,582
-0,78
-0,206
0,278
0,788
-1,527
-0,743
-0,195
0,284
0,824
-1,433
-0,702
-0,093
0,287
0,894
-1,309
-0,679
-0,044
0,327
0,901
-1,222
-0,669
0,033
0,34
0,986
-1,215
-0,594
0,035
0,344
1,2
-1,21
-0,578
0,039
0,362
1,21
-1,202
-0,57
0,049
0,369
1,32
-1,063
-0,509
0,065
0,392
1,385
-1,033
-0,498
0,075
0,439
1,42
-1,019
-0,475
0,085
0,441
1,453
-1,008
-0,45
0,092
0,472
1,531
-0,985
-0,441
0,106
0,489
1,6
-0,927
-0,401
0,130
0,512
1,694
-0,882
-0,372
0,131
0,597
1,807
-0,866
-0,337
0,149
0,675
2,904
Таблица 2
Для построения статистического ряда разобьем вариационный ряд на
конечное число интервалов (зарядов). Длину интервала определим по
формуле Стэрджеса:
∆=( x max - xmin )/(1+3,32lgn)
где п - объем данной случайной выборки, ∆ - длина интервала;
∆ = (2,904 +1,99)/(7,64) = 0,640
Примем ∆ = 0,7. От xmin отступим влево на 0,01. Величину 0,01 выбрали
так, чтобы округлить значение левого конца интервала. Откладываем вправо
интервалы длиной ∆ = 0,7 до тех пор, пока не покроется вся выборка, и
считаем число вариант, попавших на каждый интервал. В вариационном ряду
удобно отделить варианты одного разряда от вариант другого разряда
чертой. По результатам разбиения составим таблицу 1.
Интервалы I, (
ai , a i 1 )
(-2;-1,31)
(-1,31;-0,588)
(-0,588;0,116)
(0,116;0,79)
(0,79;1,46)
(1,46;1,81)
(1,81;2,91)
Число вариант
Частоты mi / n
mi
8
23
27
27
10
4
1
Таблица 3
0,08
0,23
0,27
0,27
0,1
0,04
0,01
Эта таблица называется статистическим рядом. В таблице 3 тi — это
число вариант, попавших в i-й интервал; ai,ai+x — соответственно начало и
конец i -го интервала.
3. Для построения графического изображения статистического ряда
(гистограммы) отложим на оси Ох интервалы из таблицы 1, и на каждом i -м
интервале построим прямоугольник с высотой уi: уi =mi/∆n, тогда
y1 = 0,114; у2=0,328; у3 = 0,385; у4 = 0,385; у5 = 0,142; у6= 0,057;
у7 = 0,014;
На рисунке 1 представлено графическое изображение статистического
ряда (гистограмма). Для удобства обозначения гистограммы ее основание
должно быть в 1,5 - 2 раза больше высоты.
0.45
0.385
0.4
0.385
0.328
0.35
0.3
0.25
0.2
0.15
0.142
0.114
0.1
0.057
0.05
0.014
0
Рис.1
_ 2
_
4. Найдем статистическое среднее x и статистичекую дисперсию S :
100
_
1
x    xi  0.01 xi  -0,06993
n
i 1
2
2
_
100
 1 n
S2  
(
x

x
)

0
.
0101
 i
 ( xi  0.6993)  1.24
n

1

i 1
i 1
 n  2
S 
 S — исправленная статистическая дисперсия;
 n 1 
_2
S2 
_
1 n
(
x

x
 i ) — выборочная дисперсия.
n i 1
5. Составим статистическую функцию распределения. Ее значения,
составленные по данной случаной выборке, занесены в таблицу 4.
x1
-1,99
-1,77
-1,75
-1,60
-1,58
-1,52
-1,43
-1,30
-1,22
-1,215
-1,21
-1,202
-1,063
-1,033
-1,019
-1,008
-0,985
-0,927
-0,882
-0,866
F(x1)
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
x1
-0,852
-0,838
-0,824
-0,811
-0,78
-0,743
-0,702
-0,679
-0,669
-0,594
-0,578
-0,57
-0,509
-0,498
-0,475
-0,45
-0,441
-0,401
-0,372
-0,337
F(x1)
0,2
0,21
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,3
0,31
0,32
0,33
0,34
0,35
0,36
0,37
0,38
0,39
x1
-0,329
-0,291
-0,266
-0,244
-0,206
-0,195
-0,093
-0,044
0,033
0,035
0,039
0,049
0,065
0,075
0,085
0,092
0,106
0,130
0,131
0,149
F(x1)
0,4
0,41
0,42
0,43
0,44
0,45
0,46
0,47
0,48
0,49
0,5
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
Таблица 4
x1
0,183
0,199
0,248
0,263
0,278
0,284
0,287
0,327
0,34
0,344
0,362
0,369
0,392
0,439
0,441
0,472
0,489
0,512
0,597
0,675
F(x1)
0,6
0,61
0,62
0,63
0,64
0,65
0,66
0,67
0,68
0,69
0,7
0,71
0,72
0,73
0,74
0,75
0,76
0,77
0,78
0,79
x1
0,71
0,759
0,763
0,779
0,788
0,824
0,894
0,901
0,986
1,2
1,21
1,32
1,385
1,42
1,453
1,531
1,6
1,694
1,807
2,904
F(x1)
0,8
0,81
0,82
0,83
0,84
0,85
0,86
0,87
0,88
0,89
0,9
0,91
0,92
0,93
0,94
0,95
0,96
0,97
0,98
0,99
6. Группированная выборка.
Так как объем данной случайной выборки велик (n = 100), то удобнее
пользоваться группированной выборкой, для построения которой в
статистическом ряде (табл. 1) заменим каждый интервал его представителем.
В качестве представителя i-го интервала возьмем его середину xi* (табл.5).
Число вариант mi
8
23
27
27
10
4
1
Таблица 5
xi *
-1,62
-0,825
-0,119
0,508
1,28
1,658
2,904
Частоты mi / n
0,08
0,23
0,27
0,27
0,1
0,04
0,01
_*
1) Вычислим статистическое среднее x и статистическую дисперсию
_ 2*
 по группированной выборке:
_*
7
1
x    xi*  mi  0.01   xi*  mi  0,09
n
i 1
_ 2*
S
* 2
* 2
n
_
_
1 n
   ( xi*  x )  mi  0.01 ( xi*  x ) =0,079
 n  i 1
i 1
Здесь к- число интервалов, на которые разбита выборка. С учетом поправок
_ 2*
_ 2*
Шеппарда   S 
_
2
 0,0448, статистическое среднее x =-0,09,
12
*
_ 2*
статистическая дисперсия  =0,0448 .
2) Составим статистическую функцию распределения F*(x):
 0,
0,035

 0,185

 0,43
F * ( x)  0,705
0,895

 0,97
 1


при
x  1,62;
при
 1,62  x  0,825;
при  0,825  x  0,119;
при
 0,119  x  0,508;
при
0,508  x  1,28;
при
1,28  x  1,658;
при
1,658  x  2,904;
при
x  2,904;
Построим график статистической функции распределения F * ( x) ,
составленной по сгруппированной выборке
F * ( x)
0,97
1
1,658
2,904
0,895
0,705
0,43
0,185
0,035
0
-1,62
-0,825
-0,119
0,508
1,28
X
7. Найдем доверительный интервал для математического ожидания .
Воспользуемся формулой
z S
z S

 X  
 ,
;X  
n
n


где z  - статистика, распределенная асимптотически по нормальному
закону. При n  100 можно считать, что   S . Значение статистики z 
определяем из условия
P(| zi | z  2( z )   .
Пользуясь таблицей значений функции Лапласа для доверительной
вероятности   0,95 находим
( z ) 

2
 0,475  z  1,96 .
Значения X  0,06993 и S  1,24  1,1135529 вычислены ранее по
случайной выборке.
Подставляя указанные значения в формулу, получаем искомый
доверительный интервал для математического ожидания
1,96  1,1135529
1,96  1,1135529 

;0,06993 
  0,06993 

100
100


 0,1484;0,148070 .
Найдем доверительный интервал для дисперсии . Воспользуемся
формулой




2
2
S
 S
,
;

2
2
1

z
1

z




n
n

Ранее было найдено z  1,96 , S 2  1,24 .
Подставляя указанные значения в формулу, получаем искомый
доверительный интервал для дисперсии


1,24
1,24

  0,970;1,7155 .
;
 1  1,96  0,02 1  1,96  0,02 
8. Предположим, что данная случайная выборка распределена по
нормальному закону с параметрами a  0 и   1 . Проверим гипотезу о
нормальном законе распределения данной случайной выборки при помощи
критерия Пирсона:
8
 
2
i 1
m
i
 npi 
.
npi
2
Для расчета попадания случайной величины X в интервал x i , x i 1 
используем функцию Лапласа в соответствии со свойствами нормального
распределения:
x X
x X
   l

p i  P ( x i  X  x i 1 )   l 1

  .





  2  0,06993 
  1,31  0,06993 
p1  P(1,31  X  2)  
  

1
,
033
1
,
033




  1,86   1,20  0,4973  0,4998  0,0025
  2,1  0,06993 
  2,95  0,06993 
p 2  P(2,95  X  2,1)  
  
   1,97    2,79  
1,033
1,033




 0,4756  0,4973  0,0217
  1,25  0,06993 
  2,1  0,06993 
p3  P(2,1  X  1,25)  
  
   1,14    1,97  
1,033
1,033




 0,3729  0,4756  0,1027
  0,4  0,06993 
  1,25  0,06993 
p 4  P(1,25  X  0,4)  
  
   0,32    1,14  
1,033
1,033




 0,1255  0,3729  0,2474
 0,45  0,06993 
  0,4  0,06993 
p5  P(0,4  X  0,45)  
  
  0,5   0,32  
1,033
1,033




 0,1915  0,1255  0,317
 1,3  0,06993 
 0,45  0,06993 
p 6  P(0,45  X  1,3)  
  
  1,33  0,5 
1,033
1,033




 0,4082  0,1915  0,2167
 2,15  0,06993 
 1,3  0,06993 
p 7  P(1,3  X  2,15)  
  
  2,15   1,33 
1,033
1,033




 0,484  0,4082  0,0758
 3  0,06993 
 2,15  0,06993 
p8  P(2,15  X  3)  
  
   (2,97 )  2,15  
1,033
 1,033 


 0,4984  0,484  0,0144
Составим расчетную таблицу
Интервалы
ai , ai 1 
Частоты Вероятности
pi
mi
Теоретически
е частоты np i
(-3.8;-2,95)
(-2,95;-2,1)
(-2,1;-1,25)
(-1,25;-0,4)
(-0,4;0,45)
(0,45;1,3)
(1,3;2,15)
(2,15;3)
1
0
12
26
32
18
10
1
0,25
2,17
10,27
24,74
31,7
21,67
7,58
1,44
0,0025
0,0217
0,1027
0,2474
0,317
0,2167
0,0758
0,0144
m
i
 npi 
2
n
i
 npi 
npi
2
2,42
9,02
2,0164
2,9929
1,5876
0,09
13,4689
3,9204
сумма
0,83
0,29
0,06
0,003
0,62
0,43
2,233
Таким образом, получаем опытное значение критерия  оп2  2,233
Найдем пороговое значение критерия Пирсона  п2 . Для этого вычислим
число степеней свободы q  r  s  1  6  2  1  3 .
По найденному числу степеней свободы и заданному уровню
значимости   0,05 находим пороговое значение критерия Пирсона  п2  7,8
.Так как  оп2  2,233   п2  7,8 , то гипотеза о нормальном законе
распределения данной случайной выборки принимается.
9. Составим уравнение линии регрессии, т.е. уравнение кривой,
«сглаживающей» гистограмму частот. Это уравнение будем искать в виде
y  Ae

( xa )2
b2
.
Прологарифмируем последнее выражение по основанию e :
( xa )


ln y  ln  A  e b

2
Обозначим
2

( x  a) 2
x 2 2a
a2
  ln y  ln A 
 ln y  ln A  2  2 x  2
2

b
b
b
b

z  ln y , a0  ln A 
2a
1
a2
, a1  2 , a2   2 .
2
b
b
b
В этих обозначениях уравнение регрессии примет вид
z  a2 x 2  a1 x  a0 . Так как объем выборки велик , то для нахождения
коэффициентов a 0 , a1 и a 2 воспользуемся группированной выборкой,
m
дополнив ее значениями yi  i и z i  ln yi
n
mi
n z i  ln yi
0,01
-4,61
0,01
-4,61
0,13
-2,04
0,31
-1,17
0,38
-0,97
0,21
-1,56
0,12
-2,12
0,01
-4,61
a1 и a 2 уравнения находим, решая следующую
yi 
*
i
mi
x
-3,375
1
-2,525
1
-1,675
11
-0,825
26
0,025
32
0,875
18
1,725
10
2,575
1
Коэффициенты a 0 ,
систему линейных алгебраических уравнений
a 8 x *4 a 8 x *3 a 8 x *2  8 x *2 z ;

i
1 i
0 i
i
i
 2
i 1
i 1
i 1
i 1
 8
8
8
8

*3
*2
*
*
a2  xi a1  xi a0  xi  xi zi ;
i 1
i 1
i 1
 i 1
8
8
8
a x *2 a x * a  n  z .

i
1 i
0
i
 2 
i 1
i 1
i 1
Составим расчетную таблицу
xi*
-3,375
-2,525
-1,675
-0,825
0,025
0,875
1,725
z
xi* z
-4,61 15,55875
-4,61 11,64025
-2,04
3,417
-1,17 0,96525
-0,97 -0,02425
-1,56
-1,365
-2,12
-3,657
xi*2
xi*2 z
xi*3
xi*4
11,39063
6,375625
2,805625
0,680625
0,000625
0,765625
2,975625
-52,51078125
-29,39163125
-5,723475
-0,79633125
-0,00060625
-1,194375
-6,308325
-38,44335938
-16,09845313
-4,699421875
-0,561515625
1,5625E-05
0,669921875
5,132953125
129,7463379
40,64859414
7,871531641
0,463250391
0,0000004
0,586181641
8,854344141
2,575
-3,2
сумма
-4,61 -11,8708
-21,69 14,66425
6,630625
31,625
-30,56718125
-126,4927063
17,07385938
-36,926
43,96518789
232,1354281
Таким образом, получено, что
8
x
i 1
*
i
 3,2 ,
8
x
i 1
8
*2
i
 xi*2 z  126,4927063 ,
i 1
 31,625 ,
8
x
i 1
8
*3
i
 36,926 ,
 xi* z  14,66425 ,
i 1
8
x
i 1
*4
i
 232,1354281 ,
8
 z  21,69 .
i 1
В результате получаем систему уравнений
232,1354281 a2  36,926 a1  31,625a0  126,4927063

 36,926 a2  31,625a1  3,2a0  14,66425
31,625a  3,2a  8a  21,69
2
1
0

Решая систему методом Гаусса, имеем
232,14
-36,926
31,625
-36,926
31,625
-3,2
31,625
-126,49
-3,2 14,66425
8
-21,69
232,14
-36,926
31,625
0 25,75126227 1,830519
0 1,830519299 3,691649
-126,49
-5,45624
-4,45796
232,14
-36,926
31,625
0 25,75126227 1,830519
0
0 3,561527
-126,49
-5,45624
-4,0701
232,14
-36,926
31,625
0 25,75126227 1,830519
0
0
1
-126,49
-5,45624
-1,1428
232,14
-36,926
0 25,75126227
0
0
0
0
1
-90,349
-3,36432
-1,1428
232,14
0
0
0
1
0
0
0
1
-95,1733
-0,13065
-1,1428
1
0
0
-0,40998
0
0
1
0
0
1
-0,13065
-1,1428
Т.е. a0  1,1428 , a1  0,13065 и a2  0,40998 .
В результате находим уравнение параболической регрессии
z  0,40998 x 2  0,13065 x  1,1428 .
Чтобы вернуться к исходному уравнению регрессии, вычислим
коэффициенты A , a и b , решив систему уравнений
 1
 b 2  0,40998 ,
b 2  2,44,


 2a
 a  0,159393 ,
 2  0,13065 ,
b
 A  0,322.
2


a
ln
A



1
,
1428

b2

Таким образом, получаем уравнение регрессии
y  0,322  e

( x  0 ,159393) 2
2, 4
.
Изобразим график полученной функции
Download