Òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà

advertisement
Òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà
Äîêòîð ôèç.-ìàò. íàóê ïðîôåññîð
Ìèõàèë Ïàâëîâè÷ Õàðëàìîâ
¾Ñòðàíèöà¿ ñ ìåòîäè÷åñêèìè ìàòåðèàëàìè
http://inter.vags.ru/hmp
×àñòü II. Íà÷àëà ìàòåìàòè÷åñêîé ñòàòèñòèêè
Âîëãîãðàäñêèé ôèëèàë ÐÀÍÕèÃÑ (ÔÃÎÓ ÂÏÎ ÂÀÃÑ)
Íàïðàâëåíèÿ
Ýêîíîìèêà, ñîöèîëîãèÿ (áàêàëàâðèàò)
Ëåêöèÿ 1
Òåìà
Îñíîâíûå ïîíÿòèÿ ìàòåìàòè÷åñêîé ñòàòèñòèêè
Ñîäåðæàíèå òåìû
Çàäà÷à ìàòåìàòè÷åñêîé ñòàòèñòèêè
Íàó÷íûå ïðåäïîñûëêè ìàòåìàòè÷åñêîé ñòàòèñòèêè
Îñíîâíûå ïîíÿòèÿ ìàòåìàòè÷åñêîé ñòàòèñòèêè
Îñíîâíûå õàðàêòåðèñòèêè âûáîðîê
Îñíîâíûå êàòåãîðèè
I
I
I
âûáîðêà, âàðèàöèîííûé ðÿä, ìåäèàíà, ìîäà
âàðèàíòû, ñòàòèñòè÷åñêèé ðÿä, ÷àñòîòû, ÷àñòîñòè, ïîëèãîí
âûáîðî÷íîå ñðåäíåå, ñðåäíåå êâàäðàòè÷åñêîå îòêëîíåíèå,
âûáîðî÷íàÿ äèñïåðñèÿ, íåñìåùåííàÿ îöåíêà.
Ðàçëè÷íûå çíà÷åíèÿ òåðìèíà ¾ñòàòèñòèêà¿
Ñòàòèñòèêà ñåìåéñòâî äèñöèïëèí, èçó÷àþùèõ îáúåì íàêîïëåííûõ
äàííûõ â îïðåäåëåííîé îòðàñëè è ïðèåìû èõ îáðàáîòêè (ñîöèàëüíàÿ
ñòàòèñòèêà, ôèíàíñîâàÿ ñòàòèñòèêà, ýêîíîìè÷åñêàÿ ñòàòèñòèêà,
ñòàòèñòèêà îòðàñëåé íàðîäíîãî õîçÿéñòâà, ñòàòèñòèêà ïðåñòóïëåíèé
è ò.ï.).
Ñòàòèñòèêà ïðîöåññ ñáîðà îò÷åòíîé èíôîðìàöèè îá îïðåäåëåííîì
íàáîðå ïîêàçàòåëåé ïî îïðåäåëåííîìó âîïðîñó.
Ñòàòèñòèêà, èëè ñòàòèñòè÷åñêàÿ èíôîðìàöèÿ ÷èñëîâàÿ è
ñòðóêòóðèðîâàííàÿ èíôîðìàöèÿ î íåêîòîðûõ îáúåêòàõ èëè ïðîöåññàõ.
Ñòðóêòóðèðîâàííîñòü ïðåäïîëàãàåò, ÷òî ÷åòêî îïðåäåëåí íàáîð
÷èñëîâûõ ïðèçíàêîâ, çíà÷åíèÿ êîòîðîãî ñîáðàíû ïî ìíîæåñòâó
îäíîðîäíûõ îáúåêòîâ èëè ïðîöåññîâ.
Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà íàóêà îá îáîñíîâàííûõ ñïîñîáàõ
îáðàáîòêè ñòàòèñòè÷åñêîé èíôîðìàöèè. Îáåñïå÷èâàåò îòðàñëåâûå
ñìåæíûå äèñöèïëèíû íàó÷íûì òåîðåòè÷åñêèì ôóíäàìåíòîì.
Ïðåäïîñûëêè ÌÑ ¾ïðåäåëüíûå òåîðåìû¿
Íåòî÷íûå, ãèïîòåòè÷åñêèå óòâåðæäåíèÿ:
Ïåðâàÿ èäåÿ ïðè áîëüøîì êîëè÷åñòâå ýêñïåðèìåíòîâ ñðåäíÿÿ âåëè÷èíà
èçìåðåííîãî ïðèçíàêà ñòðåìèòñÿ ê åãî ìàòåìàòè÷åñêîìó îæèäàíèþ.
Âòîðàÿ èäåÿ ïðè áîëüøîì êîëè÷åñòâå ýêñïåðèìåíòîâ ëþáîé èçìåðåííûé
ïðèçíàê ¾â ñðåäíåì¿ ïîä÷èíÿåòñÿ íîðìàëüíîìó çàêîíó (Ãàóññà).
Ïëîòíîñòü ðàñïðåäåëåíèÿ íîðìàëüíî ðàñïðåäåëåííîé
ñëó÷àéíîé âåëè÷èíû çàêîí Ãàóññà N (µ, σ) ñ ìàòåìàòè÷åñêèì îæèäàíèåì
µ è äèñïåðñèåé σ 2 èìååò âèä
Íàïîìèíàíèå.
f (x) =
(x−µ)2
1
√ e− 2σ2 .
σ 2π
Îïðåäåëåíèå. Ñòàíäàðòíîé íîðìàëüíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàåòñÿ
ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî çàêîíó N (0, 1), òî åñòü ñ
ïëîòíîñòüþ ðàñïðåäåëåíèÿ è õàðàêòåðèñòèêàìè
x2
1
f (x) = √ e− 2 ,
2π
M (X) = 0,
D(X) = 1,
σ(X) = 1.
Ïåðâûå ïðåäïîñûëêè òåîðåìû Áåðíóëëè è ×åáûøåâà
Òåîðåìà Áåðíóëëè. Â ñõåìå Áåðíóëëè ñ âåðîÿòíîñòüþ óñïåõà
p îòíîñèòåëüíàÿ ÷àñòîòà óñïåõà â n èñïûòàíèÿõ ñòðåìèòñÿ ¾ïî
âåðîÿòíîñòè¿ ê p ïðè íåîãðàíè÷åííîì óâåëè÷åíèè ÷èñëà èñïûòàíèé,
òî åñòü äëÿ ëþáîãî ñêîëü óãîäíî ìàëîãî ïîëîæèòåëüíîãî ÷èñëà ε è
êîëè÷åñòâà óñïåõîâ k
lim P {|
n→∞
k
− p| 6 ε} = 1.
n
Òåîðåìà ×åáûøåâà. Ïóñòü X1 , X2 , . . . , Xn , . . . îäèíàêîâî
ðàñïðåäåëåííûå íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû ñ ìàòåìàòè÷åñêèì
îæèäàíèåì a. Ïóñòü Yn îáîçíà÷àåò ñðåäíåå àðèôìåòè÷åñêîå ïåðâûõ
n âåëè÷èí
X1 + . . . + Xn
Yn =
.
n
Òîãäà äëÿ ëþáîãî ñêîëü óãîäíî ìàëîãî ïîëîæèòåëüíîãî ÷èñëà ε
lim P {|Yn − a| > ε} = 0.
n→∞
Ýòî îäíà èç ôîðìóëèðîâîê
Çàêîíà Áîëüøèõ ×èñåë.
Äàëüíåéøèå ïðåäïîñûëêè ¾ïðåäåëüíûå òåîðåìû¿
Òåîðåìà
ÌóàâðàËàïëàñà. Ðàññìîòðèì ñõåìó Áåðíóëëè ñ
ôèêñèðîâàííîé âåðîÿòíîñòüþ óñïåõà p. Ïóñòü X áèíîìèàëüíàÿ
ñëó÷àéíàÿ âåëè÷èíà êîëè÷åñòâî óñïåõîâ â n èñïûòàíèÿõ, à ÷åðåç
q = 1−p îáîçíà÷åíà âåðîÿòíîñòü íåóäà÷è. Åñëè êîëè÷åñòâî èñïûòàíèé
n ñòðåìèòñÿ ê ∞, òî ñëó÷àéíàÿ âåëè÷èíà
X − np
Z= √
npq
ñòðåìèòñÿ ê ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó N (0, 1).
Öåíòðàëüíàÿ ïðåäåëüíàÿ òåîðåìà (Ëÿïóíîâ è ïîñëåäîâàòåëè).
Ïóñòü X1 , . . . , Xn , . . . ïðîèçâîëüíûå ñëó÷àéíûå âåëè÷èíû, îäèíàêîâî
ðàñïðåäåëåííûå è M (Xi ) = a, σ(Xi ) = σ . Òîãäà çàêîí ðàñïðåäåëåíèÿ
¾ñðåäíåé è íîðìàëèçîâàííîé¿ âåëè÷èíû
Yn =
X1 +...+Xn
n
√
σ/ n
−a
.
ñòðåìèòñÿ ê íîðìàëüíîìó çàêîíó N (0, 1) ïðè n → ∞.
Ïðèìåð
Çàäà÷à äëÿ ñòðàõîâîé êîìïàíèè
 îïðåäåëåííîì ðåãèîíå ñðåäíÿÿ ïðîäîëæèòåëüíîñòü æèçíè
ñîñòàâëÿåò 60 ëåò, ñðåäíåêâàäðàòè÷íîå îòêëîíåíèå 15 ëåò. Êàêîâà
âåðîÿòíîñòü òîãî, ÷òî ñðåäíÿÿ ïðîäîëæèòåëüíîñòü æèçíè 100
ñëó÷àéíî âûáðàííûõ æèòåëåé áóäåò îò 60 äî 63 ëåò?
Íàáðîñîê ðåøåíèÿ
X ÑÂ, âûðàæàþùàÿ ïðîäîëæèòåëüíîñòü æèçíè. Òîãäà ïî èñõîäíûì
äàííûì: a = M (X) = 60, σ = σ(X) = 15. Âûáðàëè n = 100 ÷åëîâåê
è âû÷èñëèëè ñðåäíåå
Z=
1
(X1 + X2 + ... + X100 ).
100
Ïî ÖÏÒ ýòó âåëè÷èíó ìîæíî ñ÷èòàòü íîðìàëüíî ðàñïðåäåëåííîé
ñ ìàòåìàòè÷åñêèì
√ îæèäàíèåì a = 60 è ñðåäíåêâàäðàòè÷åñêèì
îòêëîíåíèåì σ/ n = 1.5. Âåðîÿòíîñòü òîãî, ÷òî 60 6 Z 6 63 òåïåðü
ìîæíî íàéòè ïî ïðàâèëó òðåõ ñèãì.
Íà÷àëà ìàòåìàòè÷åñêîé ñòàòèñòèêè
Ïðåäïîëîæåíèå. Âûáðàí è èçìåðÿåòñÿ â ïîñëåäîâàòåëüíîñòè
ýêñïåðèìåíòîâ íåêîòîðûé ÷èñëîâîé ïðèçíàê (ñëó÷àéíàÿ âåëè÷èíà) X .
Ãåíåðàëüíàÿ ñîâîêóïíîñòü âñå âîçìîæíûå çíà÷åíèÿ
ïðèçíàêà â ðåçóëüòàòå âñåõ âîçìîæíûõ ìûñëèìûõ ýêñïåðèìåíòîâ.
Îïðåäåëåíèå.
Êàê ïðàâèëî, ãåíåðàëüíàÿ ñîâîêóïíîñòü íàì íåäîñòóïíà, à åñëè è
ìîæåò áûòü óêàçàíà, òî òîëüêî òåîðåòè÷åñêè.
Âûáîðêà ïîëíàÿ ïîñëåäîâàòåëüíîñòü çíà÷åíèé
ïðèçíàêà, ïîëó÷åííàÿ â ðåçóëüòàòå âñåõ ýêñïåðèìåíòîâ. Îáúåì
âûáîðêè êîëè÷åñòâî ïîëó÷åííûõ çíà÷åíèé ïðèçíàêà (â òîì ÷èñëå
è ïîâòîðÿþùèõñÿ) â ðåçóëüòàòå âñåõ ýêñïåðèìåíòîâ (ôàêòè÷åñêè êîëè÷åñòâî ýêñïåðèìåíòîâ).
Îïðåäåëåíèå.
Âàæíîå ïîíÿòèå ðåïðåçåíòàòèâíîñòü âûáîðêè
Âûáîðêà
íàçûâàåòñÿ
ðåïðåçåíòàòèâíîé
(ïðåäñòàâèòåëüíîé), åñëè îíà ñîñòàâëåíà òàê, ÷òî ÿâëÿåòñÿ
äîñòàòî÷íîé äëÿ íàäåæíûõ âûâîäîâ î âñåé ãåíåðàëüíîé
ñîâîêóïíîñòè.
Îïðåäåëåíèå.
Ïî÷òè íåâîçìîæíî äîêàçàòü ðåïðåçåíòàòèâíîñòü âûáîðêè,
îäíàêî, ÷àñòî ìîæíî îáîñíîâàòü îáðàòíîå òî åñòü
óêàçàòü íåêîòîðûå ñâîéñòâà, ïðè íåâûïîëíåíèè êîòîðûõ
âûáîðêà çàâåäîìî íå áóäåò ðåïðåçåíòàòèâíîé (íàïðèìåð,
ïðè ñîöèîëîãè÷åñêîì îïðîñå ïåðåä âûáîðàìè íåëüçÿ
îãðàíè÷èâàòüñÿ òîëüêî ïåíñèîíåðàìè èëè òîëüêî ëþäüìè,
èìåþùèìè ìîáèëüíûå òåëåôîíû).
Âàðèàöèîííûé ðÿä
Âàðèàöèîííûì ðÿäîì
íàçûâàþòñÿ çíà÷åíèÿ
ïðèçíàêà âûáîðêè, ðàñïîëîæåííûå â ïîðÿäêå âîçðàñòàíèÿ:
Îïðåäåëåíèå.
x1 6 x2 6 . . . 6 xn .
Îïðåäåëåíèå. Ìåäèàíîé Me âàðèàöèîííîãî ðÿäà íàçûâàåòñÿ
çíà÷åíèå, ðàñïîëîæåííîå â åãî ñåðåäèíå (åñëè n íå÷åòíîå, òî
â òî÷íîñòè â ñåðåäèíå, åñëè n ÷åòíîå, òî ëèáî äâà ñîñåäíèõ â
ñåðåäèíå, ëèáî èõ ïîëóñóììà).
Ìîäîé
Mo âàðèàöèîííîãî ðÿäà íàçûâàåòñÿ
çíà÷åíèå, êîòîðîå âñòðå÷àåòñÿ â íåì ÷àùå âñåãî. Åñëè òàêèõ
çíà÷åíèé íåñêîëüêî, òî ðÿä íàçûâàåòñÿ ïîëèìîäàëüíûì.
Îïðåäåëåíèå.
Âàðèàöèîííûì ðàçìàõîì R âàðèàöèîííîãî
ðÿäà íàçûâàåòñÿ ðàçíîñòü ìåæäó íàèáîëüøèì è íàèìåíüøèì
çíà÷åíèÿìè ïðèçíàêà â ðÿäå.
Îïðåäåëåíèå.
Ñòàòèñòè÷åñêèé ðÿä
Ïóñòü äàíà âûáîðêà. Ðàññìîòðèì òîëüêî ðàçëè÷íûå çíà÷åíèÿ
ïðèçíàêà â âûáîðêå è îáîçíà÷èì èõ â ïîðÿäêå âîçðàñòàíèÿ
÷åðåç x1 , . . . , xk . Îíè íàçûâàþòñÿ âàðèàíòàìè. Âàðèàíòà ìîæåò
âñòðå÷àòüñÿ íåñêîëüêî ðàç. Êîëè÷åñòâî ïîÿâëåíèé çíà÷åíèÿ xi
â âàðèàöèîííîì ðÿäå íàçûâàåòñÿ ÷àñòîòîé ýòîãî çíà÷åíèÿ è
îáîçíà÷àåòñÿ ni . Ñóììà âñåõ ÷àñòîò ðàâíà îáúåìó âûáîðêè:
n1 + . . . + nk = n.
Ñòàòèñòè÷åñêèì ðÿäîì íàçûâàåòñÿ ðàíæèðîâàííûé
(òî åñòü óïîðÿäî÷åííûé ïî âîçðàñòàíèþ) íàáîð ðàçëè÷íûõ çíà÷åíèé
ïðèçíàêà â âûáîðêå (âàðèàíò), âìåñòå ñ èõ âåñàìè (÷àñòîòàìè).
Îïðåäåëåíèå.
Òàêèì îáðàçîì, ñòàòèñòè÷åñêèé ðÿä ýòî òàáëèöà, àíàëîãè÷íàÿ ðÿäó
ðàñïðåäåëåíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû:
xi
ni
x1
n1
...
...
xk
nk
×àñòîñòè
Îïðåäåëåíèå. Îòíîøåíèå ÷àñòîò çíà÷åíèé ñòàòèñòè÷åñêîãî ðÿäà
ê îáúåìó âûáîðêè íàçûâàþòñÿ ÷àñòîñòÿìè èëè îòíîñèòåëüíûìè
÷àñòîòàìè è îáîçíà÷àþòñÿ ÷åðåç wi :
wi =
ni
,
n
i = 1, 2, . . . , k.
Ñòàòèñòè÷åñêèé ðÿä óäîáíî ïðåäñòàâëÿòü è â âèäå òàáëèöû ÷àñòîñòåé:
xi
wi
x1
w1
...
...
xk
wk
Óïðàæíåíèÿ. 1) ×åìó ðàâíà ñóììà ÷àñòîñòåé? 2) Êàê ïî
ñòàòèñòè÷åñêîìó ðÿäó ñðàçó óêàçàòü ìîäó âàðèàöèîííîãî ðÿäà?
Ïîëèãîí ÷àñòîò èëè ÷àñòîñòåé
Îïðåäåëåíèå. Ïîëèãîíîì ÷àñòîò ñòàòèñòè÷åñêîãî ðÿäà íàçûâàåòñÿ
ëîìàíàÿ, ñîñòàâëåííàÿ ïî òî÷êàì (xi , ni ), òî åñòü ïî îñè
àáñöèññ îòêëàäûâàþòñÿ çíà÷åíèÿ ïðèçíàêà x1 , . . . , xk , à ïî îñè
îðäèíàò èõ ÷àñòîòû n1 , . . . , nk . Åñëè âìåñòî ÷àñòîò ïî îñè
îðäèíàò îòêëàäûâàþòñÿ ÷àñòîñòè, òî ëîìàíàÿ íàçûâàåòñÿ ïîëèãîíîì
÷àñòîñòåé.
Ïðèìåð. Ïîëèãîí ÷àñòîñòåé. Ñòàòèñòè÷åñêèé ðÿä çàäàí òàáëèöåé:
xi
wi
−1
0.2
0
0.1
2
0.4
3
0.1
5
0.2
Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
Îïðåäåëåíèå. Ïóñòü äàíà âûáîðêà îáúåìà n. Äëÿ ëþáîãî ÷èñëà
x âû÷èñëèì k(x) êîëè÷åñòâî ýëåìåíòîâ â âûáîðêå ñî çíà÷åíèåì
ìåíüøèì, ÷åì x. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ îïðåäåëÿåòñÿ
ïî ôîðìóëå:
F (x) =
k(x)
.
n
Âàæíî! Ãðàôèê ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ èìååò
ñòóïåí÷àòûé âèä.
Óïðàæíåíèå.
Ïîñòðîèòü
ãðàôèê
ýìïèðè÷åñêîé
ðàñïðåäåëåíèÿ ïî ñòàòèñòè÷åñêîìó ðÿäó:
xi
ni
−1
20
0
10
2
40
3
10
5
20
ôóíêöèè
Âûáîðî÷íûå õàðàêòåðèñòèêè
Îïðåäåëåíèå. Ïóñòü äàíà âûáîðêà îáúåìà n. Åñëè x1 6 . . . 6 xn âàðèàöèîííûé ðÿä, òî âåëè÷èíà
n
x=
1X
xi
n i=1
ñðåäíåé àðèôìåòè÷åñêîé
âûáîðî÷íûì ñðåäíèì.
íàçûâàåòñÿ
(âàðèàöèîííîãî ðÿäà) èëè
Óïðàæíåíèå. Íàéòè âûáîðî÷íîå ñðåäíåå, åñëè çàäàí ñòàòèñòè÷åñêèé
ðÿä:
xi
ni
Ñëåäñòâèå.
−1
20
0
10
2
40
3
10
5
20
Äëÿ ñòàòèñòè÷åñêîãî ðÿäà (x1 , n1 ), . . . , (xk , nk )
âûáîðî÷íîå ñðåäíåå âû÷èñëÿåòñÿ ïî ôîðìóëå
Pk
k
X
i=1 ni xi
x = Pk
=
wi xi .
i=1 ni
i=1
Âûáîðî÷íûå õàðàêòåðèñòèêè (ïðîäîëæåíèå)
Îïðåäåëåíèå.
Âûáîðî÷íàÿ äèñïåðñèÿ
îïðåäåëÿåòñÿ ïî ôîðìóëå
2
s =
Pk
i=1
k
ñòàòèñòè÷åñêîãî
X
ni (xi − x)2
=
wi (xi − x)2 =
n
i=1
k
X
ðÿäà
!
wi x2i
− x2 .
i=1
Ñðåäíåå êâàäðàòè÷åñêîå îòêëîíåíèå ñòàòèñòè÷åñêîãî
ðÿäà îïðåäåëÿåòñÿ êàê êîðåíü êâàäðàòíûé èç âûáîðî÷íîé äèñïåðñèè:
√
s = s2 .
Îïðåäåëåíèå.
Íåñìåùåííàÿ îöåíêà âûáîðî÷íîé
ñòàòèñòè÷åñêîãî ðÿäà îïðåäåëÿåòñÿ ïî ôîðìóëå
Îïðåäåëåíèå.
s2H =
n 2
s =
n−1
Pk
i=1
ni (xi − x)2
.
n−1
äèñïåðñèè
Êîíòðîëüíûå âîïðîñû
1. Ðàçëè÷íûå ïîíèìàíèÿ òåðìèíà ¾ñòàòèñòèêà¿
2. Òåîðåìû Áåðíóëëè è ×åáûøåâà
3. Òåîðåìà ÌóàâðàËàïëàñà è ÖÏÒ (Ëÿïóíîâà)
4. Ïîíÿòèÿ
ãåíåðàëüíîé
âàðèàöèîííûé ðÿä
ñîâîêóïíîñòè
è
âûáîðêè,
5. Ìåäèàíà, ìîäà, âàðèàöèîííûé ðàçìàõ
6. Âàðèàíòû, ñòàòèñòè÷åñêèé ðÿä, ÷àñòîòû, ÷àñòîñòè, ïîëèãîí
7. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ, ïðèìåð ãðàôèêà
8. Âûáîðî÷íîå ñðåäíåå. Ôîðìóëû äëÿ âàðèàöèîííîãî è
ñòàòèñòè÷åñêîãî ðÿäîâ
9. Ñðåäíåå
êâàäðàòè÷åñêîå
îòêëîíåíèå,
äèñïåðñèÿ, íåñìåùåííàÿ îöåíêà
âûáîðî÷íàÿ
Ëåêöèÿ 2
Òåìà
Ñâîéñòâà âûáîðî÷íûõ õàðàêòåðèñòèê. Èíòåðâàëüíûå ðÿäû
Ñîäåðæàíèå òåìû
Ñâîéñòâà ñðåäíåé àðèôìåòè÷åñêîé
Ñâîéñòâà âûáîðî÷íîé äèñïåðñèè
Èíòåðâàëüíûé ðÿä è åãî õàðàêòåðèñòèêè
Îñíîâíûå êàòåãîðèè
I
I
I
I
I
I
I
ðàçáèåíèå âûáîðêè íà ãðóïïû;
ñðåäíåãðóïïîâàÿ äèñïåðñèÿ;
ìåæãðóïïîâàÿ äèñïåðñèÿ;
ôîðìóëà Ñòåðäæåñà;
èíòåðâàëüíûé ðÿä;
ñðåäíÿÿ àðèôìåòè÷åñêàÿ, äèñïåðñèÿ, íåñìåùåííàÿ äèñïåðñèÿ
èíòåðâàëüíîãî ðÿäà;
ãèñòîãðàììà èíòåðâàëüíîãî ðÿäà.
Ñâîéñòâà ñðåäíåé àðèôìåòè÷åñêîé
1.
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ ïîñòîÿííîé ðàâíà ñàìîé ïîñòîÿííîé.
Ò.å. åñëè â âûáîðêå âñå ÷èñëà îêàçàëèñü îäèíàêîâû, òî è ñðåäíÿÿ èìååò òî
æå çíà÷åíèå.
Åñëè âñå ýëåìåíòû âûáîðêè (èëè, ÷òî òî æå ñàìîå, âñå âàðèàíòû)
óìíîæèòü íà îäíî è òî æå ÷èñëî, òî è ñðåäíÿÿ àðèôìåòè÷åñêàÿ óìíîæèòñÿ
íà òî æå ÷èñëî.
2.
Ïîÿñíåíèå óäîáíî çàïèñûâàòü äëÿ ñòàòèñòè÷åñêîãî ðÿäà, ò.å. äëÿ
âàðèàíò(îâ) è ÷àñòîò:
k
X
(c xi )ni
i=1
n
k
X
xi ni
=c
i=1
n
=⇒
c x = c x.
Åñëè êî âñåì ýëåìåíòàì âûáîðêè (ê âàðèàíòàì) ïðèáàâèòü îäíî è òî æå
÷èñëî, òî è ê ñðåäíåé àðèôìåòè÷åñêîé ïðèáàâèòñÿ ýòî æå ÷èñëî:
3.
x + c = x + c.
Ïðèìå÷àíèå. ×èñëî c ìîæåò áûòü è îòðèöàòåëüíûì, ïîýòîìó ìîæíî
ïðèáàâèòü èëè îòíÿòü!
Ñâîéñòâà ñðåäíåé àðèôìåòè÷åñêîé - II
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ îòêëîíåíèÿ âûáîðî÷íûõ çíà÷åíèé (âàðèàíò) îò
ñðåäíåé ðàâíà íóëþ.
4.
Ïîÿñíåíèå:
x − x = x − x = x − x = 0.
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ àëãåáðàè÷åñêîé ñóììû âûáîðîê ðàâíà
àëãåáðàè÷åñêîé ñóììå ñðåäíèõ àðèôìåòè÷åñêèõ:
5.
x ± y = x ± y.
Ãðóïïîâîå ñâîéñòâî: åñëè âñÿ âûáîðêà {xi } ðàçáèòà íà A ãðóïï gα (α =
1, . . . , A) ñ êîëè÷åñòâàìè ýëåìåíòîâ mα è ñðåäíèå ïî ãðóïïàì ðàâíû g α , òî
6.
x=
A
1X
g mα .
n α=1 α
Âíèìàíèå! Ñðåäíÿÿ â öåëîì ÍÅ ÐÀÂÍÀ ñðåäíåìó îò ñðåäíèõ ïî ãðóïïàì!
A
X
gα .
Òî åñòü x 6= A1
α=1
Ñâîéñòâà âûáîðî÷íîé äèñïåðñèè
1.
Äèñïåðñèÿ ïîñòîÿííîé ðàâíà íóëþ.
Åñëè âñå ýëåìåíòû âûáîðêè (èëè, ÷òî òî æå ñàìîå, âñå âàðèàíòû)
óìíîæèòü íà îäíî è òî æå ÷èñëî, òî äèñïåðñèÿ óìíîæèòñÿ íà êâàäðàò ýòîãî
÷èñëà:
s2 (c x) = c2 s2 (x).
2.
Åñëè êî âñåì ýëåìåíòàì âûáîðêè (ê âàðèàíòàì) ïðèáàâèòü îäíî è òî æå
÷èñëî (åñëè îíî îòðèöàòåëüíîå, çíà÷èò, îòíÿòü), òî äèñïåðñèÿ íå èçìåíèòñÿ.
3.
s2 (x + c) = s2 (x).
4. Âûáîðî÷íàÿ äèñïåðñèÿ ðàâíà ðàçíîñòè ìåæäó ñðåäíåé àðèôìåòè÷åñêîé
îò êâàäðàòà çíà÷åíèé âûáîðêè è êâàäðàòîì ñðåäíåé àðèôìåòè÷åñêîé:
s2 (x) = x2 − x2 .
Ãðóïïîâîå ñâîéñòâî âûáîðî÷íîé äèñïåðñèè
Ïóñòü âñÿ âûáîðêà x = {xi } ðàçáèòà íà A ãðóïï gα = {xαj }
(α = 1, . . . , A) ñ êîëè÷åñòâàìè ýëåìåíòîâ mα . Íàéäåì ñðåäíèå
àðèôìåòè÷åñêèå ïî ãðóïïàì g α è âûáîðî÷íûå äèñïåðñèè â ãðóïïàõ
gα =
mα
1 X
xαj ,
mα j=1
s2 (gα ) =
mα
1 X
(xαj − g α )2 .
mα j=1
Ðàññìîòðèì ñòàòèñòè÷åñêèé ðÿä
xi
ni
s2 (g1 )
m1
...
...
s2 (gA )
mk
Îïðåäåëåíèå. Ñðåäíåãðóïïîâîé äèñïåðñèåé íàçûâàåòñÿ ñðåäíÿÿ
àðèôìåòè÷åñêàÿ ýòîãî ðÿäà
s2 (gα ) =
A
1X 2
s (gα )mα .
n α=1
Ãðóïïîâîå ñâîéñòâî âûáîðî÷íîé äèñïåðñèè - II
Ðàññìîòðèì ñòàòèñòè÷åñêèé ðÿä
xi
ni
g1
m1
...
...
gA
mk
Îïðåäåëåíèå. Ìåæãðóïïîâîé äèñïåðñèåé íàçûâàåòñÿ äèñïåðñèÿ
ýòîãî ðÿäà
A
1X
δ =
(g − x)2 mα .
n α=1 α
2
5. Òåîðåìà. Åñëè âûáîðêà ðàçáèòà íà ãðóïïû, òî âûáîðî÷íàÿ
äèñïåðñèÿ ðàâíà ñóììå ñðåäíåãðóïïîâîé äèñïåðñèè è ìåæãðóïïîâîé
äèñïåðñèè:
s2 (x) = s2 (gα ) + δ 2 .
Ìîæíî óïðîùåííî ñêàçàòü, ÷òî îáùàÿ âûáîðî÷íàÿ äèñïåðñèÿ ýòî
ñðåäíåå äèñïåðñèé ïî ãðóïïàì ïëþñ äèñïåðñèÿ ñðåäíèõ ïî ãðóïïàì.
Çàäà÷à
Èñïîëüçîâàòü MS EXCEL è âñòðîåííûå ôóíêöèè.
1. Ñãåíåðèðîâàòü âûáîðêó îáúåìîì 100 èç ðàâíîìåðíî
ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû íà îòðåçêå [0,20], ñîñòîÿùóþ èç
öåëûõ ÷èñåë (äîïóñòèì, ÷òî òîëüêî òàêàÿ òî÷íîñòü èçìåðåíèÿ íàì
äîñòóïíà). Ïðèñâîèòü âûáîðêå èìÿ (íàïðèìåð, myrow).
2. Âû÷èñëèòü ñðåäíþþ àðèôìåòè÷åñêóþ è âûáîðî÷íóþ äèñïåðñèþ
âûáîðêè myrow.
3. Ðàçáèòü âûáîðêó íà ÷åòûðå ãðóïïû èç 10, 30, 40 è 20 ýëåìåíòîâ
ñîîòâåòñòâåííî. Ïðèñâîèòü èìåíà ýòèì ãðóïïàì (íàïðèìåð, myrow1 myrow4).
4. Âû÷èñëèòü ñðåäíèå àðèôìåòè÷åñêèå è âûáîðî÷íûå äèñïåðñèè
ãðóïï myrow1 myrow4.
5. Âû÷èñëèòü ìåæãðóïïîâóþ äèñïåðñèþ è ñðåäíåãðóïïîâóþ
äèñïåðñèþ. Ïðîâåðèòü âûïîëíåíèå ãðóïïîâîãî ñâîéñòâà âûáîðî÷íîé
äèñïåðñèè.
Èíòåðâàëû. Ôîðìóëà Ñòåðäæåñà
Åñëè âûáîðêà ñäåëàíà äëÿ èçó÷åíèÿ ïðèçíàêà, êîòîðûé ìîæåò ïðèíèìàòü
ëþáûå çíà÷åíèÿ â íåêîòîðîì ïðîìåæóòêå (òî åñòü èññëåäóåìàÿ ñëó÷àéíàÿ
âåëè÷èíà íåïðåðûâíà), èëè âûáîðêà ñîäåðæèò î÷åíü ìíîãî ðàçëè÷íûõ
çíà÷åíèé, òî èìååò ñìûñë ýòè çíà÷åíèÿ íåêîòîðûì îáðàçîì ñãðóïïèðîâàòü
è èçó÷àòü çàêîíû ðàñïðåäåëåíèÿ îòíîñèòåëüíî ïîëó÷åííûõ ãðóïï.
Äëÿ ýòîãî, âåñü ïðîìåæóòîê çíà÷åíèé îò xmin äî xmax ðàçáèâàþò íà
èíòåðâàëû è ïîäñ÷èòûâàþò êîëè÷åñòâî çíà÷åíèé âûáîðêè, ïîïàâøåé â
êàæäûé èíòåðâàë. Â ïðîãðàììå MS EXCEL ýòè èíòåðâàëû íàçûâàþòñÿ
¾êàðìàíàìè¿.
Êàê âûáðàòü êîëè÷åñòâî è âåëè÷èíó èíòåðâàëîâ? Èç ñîîáðàæåíèé óäîáñòâà
âåëè÷èíó èíòåðâàëîâ, êàê ïðàâèëî, âûáèðàþò îäèíàêîâîé, à èõ êîëè÷åñòâî
k íå äîëæíî áûòü î÷åíü áîëüøèì (èíà÷å íå ïîëó÷èòñÿ âûèãðûøà â
ïðîñòîòå âû÷èñëåíèé), íî è íå äîëæíî áûòü ìàëûì (èíà÷å ìîãóò ïîòåðÿòüñÿ
îñîáåííîñòè èçìåíåíèé ïðèçíàêà).
Ñòåðäæåñà. Ïóñòü n îáúåì âûáîðêè. Ðåêîìåíäóåìîå ÷èñëî k
èíòåðâàëîâ ãðóïïèðîâêè îïðåäåëÿåòñÿ ôîðìóëîé
Ôîðìóëà
k ≈ 1 + log2 n ≈ 1 + 3, 322 lg n.
Íà ïðàêòèêå ïîñòóïàåì òàê:
1) Âû÷èñëÿåì ÷èñëî Ñòåðäæåñà 1 + 3, 322 lg n è áåðåì â êà÷åñòâå
äëèíû èíòåðâàëà ÷èñëî, ñ ðàçóìíîé ñòåïåíüþ òî÷íîñòè áëèæàéøåå
ê âåëè÷èíå
xmax − xmin
R
=
1 + 3, 322 lg n
1 + 3, 322 lg n
(íàïðèìåð, áëèæàéøåå öåëîå äëÿ ïðîñòîòû ðàñ÷åòîâ). Âûáðàííîå
÷èñëî (äëèíà èíòåðâàëà) íàçûâàåòñÿ øàãîì èíòåðâàëüíîãî ðÿäà è
îáîçíà÷àåòñÿ h.
2)  êà÷åñòâå íà÷àëà ïåðâîãî èíòåðâàëà áåðåì òî÷êó xmin − h/2 (òî
åñòü íàèìåíüøåå çíà÷åíèå âûáîðêè ïðèõîäèòñÿ íà ñåðåäèíó ïåðâîãî
èíòåðâàëà). Íàõîäèì âñå èíòåðâàëû è ïîäñ÷èòûâàåì êîëè÷åñòâî òî÷åê
ni , â íèõ ïîïàäàþùèõ.
3) Íóìåðóåì ïîëó÷åííûå êîíöû èíòåðâàëîâ x0 < x1 < . . . < xk è
ðàññìàòðèâàåì ¾ñòàòèñòè÷åñêèé¿ ðÿä
xi
ni
[x0 , x1 ]
n1
...
...
[xk−1 , xk ]
nk
Èíòåðâàëüíûé ðÿä
4) Ïîñêîëüêó ñ èíòåðâàëàìè àðèôìåòè÷åñêèå äåéñòâèÿ íåâîçìîæíû,
òî çàìåíÿåì èíòåðâàëû íà èõ ñåðåäèíû x∗i = (xi−1 + xi )/2, ïîëó÷àåì
ñòàòèñòè÷åñêèé ðÿä
xi
ni
Ïîñòðîåííûé
òàêèì
èíòåðâàëüíûì ðÿäîì.
x∗1
n1
îáðàçîì
...
...
x∗k
nk
ñòàòèñòè÷åñêèé
ðÿä
íàçûâàåòñÿ
Äëÿ íåãî îïðåäåëÿþòñÿ õàðàêòåðèñòèêè ïî îáû÷íûì ïðàâèëàì äëÿ
ñòàòèñòè÷åñêèõ ðÿäîâ.
Õàðàêòåðèñòèêè èíòåðâàëüíîãî ðÿäà
Îïðåäåëåíèå.
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ èíòåðâàëüíîãî ðÿäà
k
1X ∗
x=
xi ni .
n
i=1
Âûáîðî÷íàÿ äèñïåðñèÿ s2 è âûáîðî÷íîå
ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå s èíòåðâàëüíîãî ðÿäà
Îïðåäåëåíèå.
k
1X ∗
(xi − x)2 ni ,
s =
n
2
√
s=
s2 .
i=1
Íåñìåùåííàÿ
îöåíêà
èíòåðâàëüíîãî ðÿäà
n 2
s2H =
s .
n−1
Îïðåäåëåíèå.
äèñïåðñèè
s2H
Ãèñòîãðàììà èíòåðâàëüíîãî ðÿäà
Äëÿ èíòåðâàëüíûõ ðÿäîâ ïðèìåíÿþò ãðàôè÷åñêîå èçîáðàæåíèå â âèäå
ãèñòîãðàììû.
Ïðàâèëî ïîñòðîåíèÿ. Äëÿ ïîñòðîåíèÿ ãèñòîãðàììû èíòåðâàëüíîãî
ðÿäà ïî îñè Ox îòêëàäûâàþò èíòåðâàëû
[x0 , x1 ], . . . [xk−1 , xk ],
à ïî îñè Oy îòêëàäûâàþò âûñîòû ïðÿìîóãîëüíèêîâ òàêèì îáðàçîì,
÷òîáû èõ ïëîùàäè ðàâíÿëèñü ÷àñòîòàì ni äëÿ ãèñòîãðàììû ÷àñòîò
èëè ÷àñòîñòÿì ni /n äëÿ ãèñòîãðàììû ÷àñòîñòåé.
Åñëè øàã èíòåðâàëüíîãî ðÿäà ïîñòîÿííûé è ðàâåí h, òî âûñîòà
ïðÿìîóãîëüíèêîâ âû÷èñëÿåòñÿ êàê nhi äëÿ ÷àñòîò è nnhi äëÿ ÷àñòîñòåé.
Åñëè øàãè ðàçíûå è ðàâíû h1 = x1 − x0 , . . . , hk = xk − xk−1 , òî
âûñîòû ïðÿìîóãîëüíèêîâ âû÷èñëÿþòñÿ êàê nhii äëÿ ÷àñòîò è nnhi i äëÿ
÷àñòîñòåé.
Êîíòðîëüíûå âîïðîñû
1. Øåñòü ñâîéñòâ ñðåäíåé àðèôìåòè÷åñêîé
2. ×åòûðå ñâîéñòâà âûáîðî÷íîé äèñïåðñèè
3. Îïðåäåëåíèå ñðåäíåãðóïïîâîé äèñïåðñèè
4. Îïðåäåëåíèå ìåæãðóïïîâîé äèñïåðñèè
5. Ãðóïïîâîå ñâîéñòâî âûáîðî÷íîé äèñïåðñèè (òåîðåìà)
6. Ôîðìóëà Ñòåðäæåñà
7. ×åòûðå øàãà ïîñòðîåíèÿ èíòåðâàëüíîãî ðÿäà
8. Ñðåäíÿÿ àðèôìåòè÷åñêàÿ, äèñïåðñèÿ,
äèñïåðñèÿ èíòåðâàëüíîãî ðÿäà
íåñìåùåííàÿ
9. Ãèñòîãðàììà èíòåðâàëüíîãî ðÿäà ïðàâèëî ïîñòðîåíèÿ
Ëåêöèÿ 3
Òåìà
Ñðàâíåíèå ñëó÷àéíûõ âåëè÷èí èëè ïðèçíàêîâ.
Ñîäåðæàíèå òåìû
Àíàëîãèÿ äèñêðåòíûõ ÑÂ è âûáîðîê
Âèäû çàâèñèìîñòåé äâóõ ñëó÷àéíûõ âåëè÷èí (âûáîðîê)
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü. Ëèíèè ðåãðåññèè. Êîâàðèàöèÿ
Êîððåëÿöèîííàÿ çàâèñèìîñòü. Êîâàðèàöèÿ. Ëèíèè ðåãðåññèè.
Êîýôôèöèåíò êîððåëÿöèè
Îñíîâíûå êàòåãîðèè
I ôóíêöèîíàëüíàÿ, ñòàòèñòè÷åñêàÿ è êîððåëÿöèîííàÿ çàâèñèìîñòè;
I ëèíèè ðåãðåññèè äëÿ ôóíêöèîíàëüíîé çàâèñèìîñòè;
I ìåòîä íàèìåíüøèõ êâàäðàòîâ;
I êîâàðèàöèÿ äëÿ ôóíêöèîíàëüíîé çàâèñèìîñòè;
I ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ, êîððåëÿöèîííàÿ òàáëèöà è ïîëå
êîððåëÿöèè;
I êîâàðèàöèÿ äëÿ êîððåëÿöèîííîé çàâèñèìîñòè;
I ëèíèè ðåãðåññèè äëÿ êîððåëÿöèîííîé çàâèñèìîñòè;
I êîýôôèöèåíò êîððåëÿöèè.
Àíàëîãèÿ ÄÑÂ è âûáîðêè
Äèñêðåòíàÿ
Âûáîðêà
ñëó÷àéíàÿ
îïèñûâàåòñÿ
âåëè÷èíà
ÄÑÂ X
Çíà÷åíèÿ Ñ x1 , . . . , xk
Ðÿä ðàñïðåäåëåíèÿ
X
x1 . . .
xk
P
p1 . . .
pk
Âåðîÿòíîñòè
k
P
pi = 1
i=1
Ìàòåìàòè÷åñêîå îæèäàíèå
k
P
M (X) =
p i xi
i=1
Äèñïåðñèÿ
k
P
D(X) =
pi (xi − M (X))2
i=1
îïèñûâàåòñÿ
.
ðÿäîì
ðàñïðåäåëåíèÿ
ñòàòèñòè÷åñêèì ðÿäîì
Âûáîðêà xi
Âàðèàíòû x1 , . . . , xk
Ñòàòèñòè÷åñêèé ðÿä
xi
x1
...
xk
wi
w1 . . .
wk
×àñòîñòè
k
P
wi =
i=1
k
P
i=1
ni
n
=1
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ
k
P
x=
wi xi
i=1
Âûáîðî÷íàÿ äèñïåðñèÿ
k
P
s2x =
wi (xi − x)2
i=1
.
Âèäû çàâèñèìîñòåé äâóõ ñëó÷àéíûõ âåëè÷èí (âûáîðîê)
Äàëåå âñþäó ïðåäïîëàãàåì, ÷òî çàäàíû äâå äèñêðåòíûå ñëó÷àéíûå
âåëè÷èíû X, Y , ëèáî äâå âûáîðêè {xi }, {yi }.  ñèëó ýòîãî, âñ¼, ÷òî íàïèñàíî
ïðî ñëó÷àéíûå âåëè÷èíû, ðàñïðîñòðàíÿåòñÿ íà âûáîðêè çàìåíîé pi íà
wi = nni , è íàîáîðîò.
Ìåæäó ñëó÷àéíûìè âåëè÷èíàìè èëè âûáîðêàìè ìîæíî èçó÷àòü ñëåäóþùèå
âèäû çàâèñèìîñòåé:
I Ôóíêöèîíàëüíàÿ çàâèñèìîñòü (ÔÇ).
I Ñòàòèñòè÷åñêàÿ çàâèñèìîñòü (ÑÇ).
I Êîððåëÿöèîííàÿ çàâèñèìîñòü (ÊÇ).
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî êàæäîìó çíà÷åíèþ
ñëó÷àéíîé âåëè÷èíû X ñîîòâåòñòâóåò ñòðîãî îïðåäåëåííîå åäèíñòâåííîå
çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Y , òî åñòü èõ çíà÷åíèÿ ñâÿçàíû ôóíêöèåé
y = f (x).
Íà ïðàêòèêå âñ¼ æå îíà ïðîÿâëÿåòñÿ íå òàê îäíîçíà÷íî, à èìåþòñÿ
íåêîòîðûå ìàëûå ñëó÷àéíûå îòêëîíåíèÿ ε(x), òàê ÷òî
y = f (x) + ε(x).
Ýòè îòêëîíåíèÿ õàðàêòåðèçóþò òó ñëó÷àéíóþ ñîñòàâëÿþùóþ, êîòîðàÿ íàì
íå âàæíà. Îíè íàçûâàþòñÿ ¾ñëó÷àéíûì øóìîì¿. Íàïðèìåð, åæåäíåâíûå
êîëåáàíèÿ êóðñà âàëþòû íà ôîíå ñåçîííûõ:
Òàêèå øóìû
èãíîðèðóþòñÿ.
Äâîéíîé ðÿä ðàñïðåäåëåíèÿ
Åñëè ïðåäïîëàãàåòñÿ ôóíêöèîíàëüíàÿ çàâèñèìîñòü, òî çíà÷åíèÿ yi
äîëæíû ñòðîãî ñîîòâåòñòâîâàòü çíà÷åíèÿì xi , òî åñòü ïàðà (xi , yi )
âñòðå÷àåòñÿ òîëüêî â òàêîì ñî÷åòàíèè è ñ îïðåäåëåííîé âåðîÿòíîñòüþ.
Âîçíèêàåò äâîéíîé ðÿä ðàñïðåäåëåíèÿ
X
Y
P
x1
y1
p1
...
...
...
xk
yk
pk
Íà
ïëîñêîñòè
Oxy
ñòðîèì
ëîìàíóþ
ïî
òî÷êàì
M1 (x1 , y1 ), . . . , Mk (xk , yk ). Ïðè ýòîì ìû íå âèäèì èíôîðìàöèè
î âåðîÿòíîñòÿõ pi , ò.å. êàæäàÿ òî÷êà Mi åùå èìååò ¾âåñ¿ âåðîÿòíîñòü pi , è âíîñèò òåì áîëüøèé âêëàä â çàêîí ðàñïðåäåëåíèÿ,
÷åì áîëüøå ýòà âåðîÿòíîñòü. Ìîæíî èçîáðàçèòü ýòîò ôàêò ðàçìåðîì
òî÷êè (â EXCEL åñòü äëÿ ýòîãî ïóçûðüêîâûå äèàãðàììû).
Ëèíèÿ ðåãðåññèè
Îïðåäåëåíèå. Ïðÿìàÿ âèäà
y = b0 + b1 x,
ãäå b0 , b1 íåêîòîðûå ÷èñëà, êîòîðàÿ ¾íàèëó÷øèì îáðàçîì¿
ïðèáëèæàåò ïîñòðîåííóþ ëîìàíóþ, íàçûâàåòñÿ ëèíèåé ðåãðåññèè Y
íà X .
Êðèòåðèåì êà÷åñòâà ïðèáëèæåíèÿ ÿâëÿåòñÿ ñóììà êâàäðàòîâ
îòêëîíåíèÿ òî÷åê ïðÿìîé îò òî÷åê ëîìàíîé, âçÿòûõ ñ ìíîæèòåëåì
pi , òî åñòü âåëè÷èíà ìàòåìàòè÷åñêîãî îæèäàíèÿ ñëó÷àéíîé âåëè÷èíû
[(b0 + b1 X) − Y ]2 :
S=
k
X
(b0 + b1 xi − yi )2 pi .
i=1
 ìåòîäå íàèìåíüøèõ êâàäðàòîâ íàèëó÷øèì ïðèáëèæåíèåì
ñ÷èòàåòñÿ òî, äëÿ êîòîðîãî êîýôôèöèåíòû b0 , b1 âûáðàíû òàê, ÷òî
âåëè÷èíà S ïðèíèìàåò íàèìåíüøåå çíà÷åíèå.
Êîâàðèàöèÿ
Çàïèñûâàÿ íåîáõîäèìîå óñëîâèå ýêñòðåìóìà ôóíêöèè äâóõ ïåðåìåííûõ
S(b0 , b1 ) â âèäå
∂S
∂S
= 0,
= 0,
∂b0
∂b1
è ðåøàÿ ïîëó÷åííóþ ñèñòåìó äâóõ ëèíåéíûõ óðàâíåíèé îòíîñèòåëüíî b0 , b1 ,
ïîëó÷èì
b1 =
cov(X, Y )
,
D(X)
b0 = M (Y ) − M (X)
cov(X, Y )
.
D(X)
Çäåñü ïîÿâèëîñü íîâîå ïîíÿòèå cov(X, Y ) êîâàðèàöèÿ äâóõ ñëó÷àéíûõ
âåëè÷èí.
Êîâàðèàöèåé äâóõ ñëó÷àéíûõ âåëè÷èí X, Y íàçûâàåòñÿ
÷èñëî, âû÷èñëÿåìîå ïî ôîðìóëå
Îïðåäåëåíèå.
cov(X, Y ) = M ([X − M (X)][Y − M (Y )]) = M (XY ) − M (X)M (Y ).
Äëÿ äâîéíîãî ðÿäà ðàñïðåäåëåíèÿ ïîëó÷èì, ÷òî
!
!
!
k
k
k
X
X
X
cov(X, Y ) =
xi yi pi −
xi pi
yi pi .
i=1
i=1
i=1
Óðàâíåíèÿ ðåãðåññèè
Äëÿ âûáîðîê ïðèíÿòî áîëåå ïðîñòîå îáîçíà÷åíèå âûáîðî÷íàÿ êîâàðèàöèÿ
îáîçíà÷àåòñÿ ÷åðåç µ (èëè ÷åðåç µxy ) è âû÷èñëÿåòñÿ â ñëó÷àå äâîéíîãî
ñòàòèñòè÷åñêîãî ðÿäà èìååì
!
!
!
k
k
k
k
X
X
X
X
µ=
xi yi wi −
xi wi
yi wi =
(xi − x)(yi − y)wi .
i=1
i=1
i=1
i=1
Òîãäà èç ôîðìóë äëÿ êîýôôèöèåíòîâ b0 , b1 , â êîòîðûõ åùå ñëåäóåò çàìåíèòü
ìàòåìàòè÷åñêèå îæèäàíèÿ íà ñðåäíèå àðèôìåòè÷åñêèå, à äèñïåðñèè íà
âûáîðî÷íûå äèñïåðñèè, ïîëó÷èì óðàâíåíèå ðåãðåññèè Y íà X
y−y =
µ
(x − x).
s2x
Åñëè âñå ïîâòîðèòü, ïîìåíÿâ ìåñòàìè X, Y , òî ïîëó÷èì óðàâíåíèå
ðåãðåññèè X íà Y
µ
x − x = 2 (y − y).
sy
Òåîðåìà î ëèíèÿõ ðåãðåññèè
Òåîðåìà. Ïðè íàëè÷èè äâóõ âûáîðîê, ó êîòîðûõ ïðåäïîëàãàåòñÿ
ôóíêöèîíàëüíàÿ çàâèñèìîñòü,
ëèíèåé ðåãðåññèè Y íà X ÿâëÿåòñÿ
ïðÿìàÿ, ïðîõîäÿùàÿ ÷åðåç òî÷êó ¾ñðåäíèõ¿
C = (x, y)
ñ óãëîâûì êîýôôèöèåíòîì
µ
.
s2x
Ëèíèåé ðåãðåññèè X íà Y ÿâëÿåòñÿ ïðÿìàÿ, ïðîõîäÿùàÿ ÷åðåç òî÷êó
¾ñðåäíèõ¿
C = (x, y)
µ
ñ óãëîâûì êîýôôèöèåíòîì 2 .
sy
Ñòàòèñòè÷åñêàÿ çàâèñèìîñòü
 îáùåì ñëó÷àå, åñëè íåò íèêàêèõ ñâåäåíèé î ãëîáàëüíîé ñâÿçè
ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, ìîæíî ïîñ÷èòàòü óñëîâíóþ ôóíêöèþ
ðàñïðåäåëåíèÿ âåëè÷èíû Y â ïðåäïîëîæåíèè, ÷òî âåëè÷èíà X ïðèíÿëà
êîíêðåòíîå çíà÷åíèå x ∈ R. Îíà âûðàæàåò óñëîâíóþ âåðîÿòíîñòü
P {Y < y|X = x},
îáîçíà÷àåòñÿ ÷åðåç F (y; x) èëè Fx (y):
F (y; x) = Fx (y) = P {Y < y|X = x} =
P {Y < y è X = x}
.
P {X = x}
Ýòè îáîçíà÷åíèÿ ïîä÷åðêèâàþò, ÷òî çäåñü x õîòü è ëþáîå, íî
ôèêñèðîâàííîå ÷èñëî, òî åñòü ïàðàìåòð, à y íåçàâèñèìàÿ ïåðåìåííàÿ
(àðãóìåíò).
Èòàê, ñòàòèñòè÷åñêàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî ôóíêöèÿ
ðàñïðåäåëåíèÿ îäíîé ñëó÷àéíîé âåëè÷èíû çàâèñèò îò êîíêðåòíîãî
çíà÷åíèÿ äðóãîé. Ïðåäïîëàãàòü ýòî ìîæíî âñåãäà, íî âû÷èñëèòü ýòè
ôóíêöèè è îöåíèòü íàäåæíîñòü òàêîãî âû÷èñëåíèÿ ïðîáëåìàòè÷íî.
Ïîýòîìó òàêîé ñëó÷àé ÿâëÿåòñÿ ñëèøêîì îáùèì.
Êîððåëÿöèîííàÿ çàâèñèìîñòü
çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå
îäíîé ñëó÷àéíîé âåëè÷èíû çàâèñèò îò êîíêðåòíîãî çíà÷åíèÿ äðóãîé. Èíà÷å
ãîâîðÿ, âû÷èñëÿåòñÿ èëè îöåíèâàåòñÿ ïî âûáîðêå óñëîâíîå ìàòåìàòè÷åñêîå
îæèäàíèå M (Y |X = x), òî åñòü ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû
ñ ôóíêöèåé ðàñïðåäåëåíèÿ Fx (y) = P {Y < y|X = x}. Äëÿ ïðîñòîòû îíî
îáîçíà÷àåòñÿ ÷åðåç Mx (Y ).
Êîððåëÿöèîííàÿ
Íå ïóòàòü! Çäåñü x ÷èñëî (x ∈ R), ëþáîå, íî ôèêñèðîâàííîå, ïîýòîìó
ïèøåì x ìàëåíüêîå, à Y ñëó÷àéíàÿ âåëè÷èíà (ò.å. ÷èñëîâàÿ ôóíêöèÿ íà
ïðîñòðàíñòâå ýëåìåíòàðíûõ ñîáûòèé), ïîýòîìó ïèøåì Y áîëüøîå. Ðåçóëüòàò
Mx (Y ) (ìàòåìàòè÷åñêîå îæèäàíèå) ýòî ÷èñëî, íî çàâèñÿùåå îò ÷èñëîâîãî
ïàðàìåòðà x. Íî ¾÷èñëî, çàâèñÿùåå îò ÷èñëà¿ ýòî ñàìàÿ îáû÷íàÿ ÷èñëîâàÿ
ôóíêöèÿ îò ÷èñëîâîãî àðãóìåíòà!
Èòàê, êîððåëÿöèîííàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî èìååò ìåñòî
ôóíêöèîíàëüíàÿ çàâèñèìîñòü ìàòåìàòè÷åñêîãî îæèäàíèÿ Y îò çíà÷åíèÿ
x ñëó÷àéíîé âåëè÷èíû X . Êàê ïðàâèëî, ïðè ýòîì ìîæíî âû÷èñëèòü è
ôóíêöèîíàëüíóþ çàâèñèìîñòü ìàòåìàòè÷åñêîãî îæèäàíèÿ X îò çíà÷åíèÿ y
ñëó÷àéíîé âåëè÷èíû Y . Ïîëó÷àåì òàêèå ôóíêöèè
Mx (Y ) = ϕ(x),
Èõ ãðàôèêè íàçûâàþòñÿ
êðèâûìè
My (X) = ψ(y).
ðåãðåññèè ñîîòâåòñòâåííî Y íà X è X íà Y .
Ðåãðåññèîííûé àíàëèç. Ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ
äàåò ìåòîäû ïîñòðîåíèÿ ëèíèé ðåãðåññèè, ò.å. ïðÿìûõ,
ïðèáëèæàþùèõ êðèâûå ðåãðåññèè.
Ðåãðåññèîííûé àíàëèç
íàèëó÷øèì îáðàçîì
Ïóñòü äàíû äâå äèñêðåòíûå ñëó÷àéíûå âåëè÷èíû ñî çíà÷åíèÿìè
X:
Y :
x1 , . . . , x k ;
y1 , . . . , ym .
Ñîâìåñòíûé (èëè
ðàñïðåäåëåíèÿ X è Y ýòî òàáëèöà
Îïðåäåëåíèå.
x1
..
.
xi
..
.
xk
ïàðíûé,
èëè
y1
...
yj
...
ym
p11
...
p1j
...
p1m
pi1
...
pij
...
pim
pk1
...
pkj
...
pkm
äâóìåðíûé)
ãäå â êëåòêàõ ñòîÿò âåðîÿòíîñòè âñåâîçìîæíûõ ïàð çíà÷åíèé
pij = P {X = xi , Y = yj }.
çàêîí
Ìàòåìàòè÷åñêèå îæèäàíèÿ äëÿ ñîâìåñòíîãî çàêîíà
ðàñïðåäåëåíèÿ
Ïóñòü äàí ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ. Ñóììû âåðîÿòíîñòåé ïî
ñòðîêàì äàþò âåðîÿòíîñòè âñåõ çíà÷åíèé X , à ñóììû âåðîÿòíîñòåé ïî
ñòîëáöàì äàþò âåðîÿòíîñòè âñåõ çíà÷åíèé Y :
P {X = xi } =
m
X
pij ,
P {Y = yj } =
j=1
k
X
pij .
i=1
Ïîýòîìó ïîëó÷àåì äâà ðÿäà ðàñïðåäåëåíèÿ
X
P
x1
m
P
p1j
...
...
j=1
xk
m
P
pkj
j=1
Y
P
y1
k
P
pi1
...
...
i=1
ym
k
P
pim
i=1
Îòñþäà ñëåäóåò ïðàâèëî âû÷èñëåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé
M (X) =
k X
m
X
i=1 j=1
xi pij ,
M (Y ) =
m X
k
X
j=1 i=1
yj pij .
Êîâàðèàöèÿ ñîâìåñòíîãî çàêîíà ðàñïðåäåëåíèÿ
Ïóñòü äàí ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ. Âû÷èñëèì ìàòåìàòè÷åñêèå
îæèäàíèÿ M (X), M (Y ). Òîãäà êîâàðèàöèÿ äâóõ ñëó÷àéíûõ âåëè÷èí X, Y
(ñì. îïðåäåëåíèå âûøå) âû÷èñëÿåòñÿ ïî ôîðìóëàì
cov(X, Y ) =
k X
m
X
[xi − M (X)][yj − M (Y )]pij .
i=1 j=1
Êîâàðèàöèþ äâóõ ñëó÷àéíûõ âåëè÷èí ïî ñîâìåñòíîìó çàêîíó
ðàñïðåäåëåíèÿ ìîæíî òàêæå âû÷èñëèòü ïî ôîðìóëå
Òåîðåìà.
cov(X, Y )
=
=
M (XY ) − M (X)M
! (Y ) =
!
k
m
k P
m
P P
P
xi yj pij −
xi pij
i=1 j=1
i=1 j=1
m P
k
P
j=1 i=1
!
yj pij
.
Êîððåëÿöèîííàÿ òàáëèöà äëÿ âûáîðîê
Ïóñòü äàíà âûáîðêà, ñäåëàííàÿ îäíîâðåìåííî ïî äâóì ïðèçíàêàì, â
ðåçóëüòàòå êîòîðîé êàæäûé èç ïðèçíàêîâ èìååò âàðèàíòû
X = {xi } :
Y = {yj } :
Îïðåäåëåíèå.
x1 , . . . , x k ;
y1 , . . . , ym .
Êîððåëÿöèîííàÿ òàáëèöà ïàðíîé âûáîðêè ýòî òàáëèöà
x1
..
.
xi
..
.
xk
y1
...
yj
...
ym
n11
...
n1j
...
n1m
ni1
...
nij
...
nim
nk1
...
nkj
...
nkm
ãäå â êëåòêàõ ñòîÿò êîëè÷åñòâà nij , â êîòîðûõ âñòðåòèëàñü êàæäàÿ èç
âîçìîæíûõ ïàð çíà÷åíèé (xi , yj ).
ßñíî, ÷òî ñóììà öåëûõ ÷èñåë ïî âñåì êëåòêàì äàåò îáúåì âûáîðêè:
n=
k X
m
X
i=1 j=1
nij .
Ïîëå êîððåëÿöèè
Ïóñòü äàíà êîððåëÿöèîííàÿ òàáëèöà äëÿ ïàðíîé âûáîðêè. Â íàèáîëåå
ðàñïðîñòðàíåííîì ñëó÷àå â íåé äîâîëüíî ìíîãî íóëåé (òî åñòü íå âñå ïàðû
èç k × m ðåàëüíî âñòðå÷àþòñÿ â âûáîðêå).
Íàíåñåì íà ïëîñêîñòü Oxy òå èç òî÷åê Mij (xi , yj ), äëÿ êîòîðûõ nij 6= 0.
Ïîëó÷åííûé ðèñóíîê íàçûâàåòñÿ ïîëåì êîððåëÿöèè. Çàäà÷à ðåãðåññèîííîãî
àíàëèçà ïîñòðîèòü ïðÿìóþ
y = b0 + b1 x,
êîòîðàÿ íàèëó÷øèì
êîððåëÿöèè.
îáðàçîì
ïðèáëèæàåò
(àïïðîêñèìèðóåò)
ïîëå
Ëèíèÿ ðåãðåññèè
Êàê èñêàòü ýòó ïðÿìóþ? Âíà÷àëå íàéäåì òàê íàçûâàåìûå ãðóïïîâûå ñðåäíèå
ïðèçíàêà Y , òî åñòü ñðåäíèå àðèôìåòè÷åñêèå ïðèçíàêà Y â ïðåäïîëîæåíèè,
÷òî çíà÷åíèå ïðèçíàêà X â âûáîðêå ôèêñèðîâàíî è âçÿòî ðàâíûì íåêîòîðîìó
xi . Òîãäà îò êîððåëÿöèîííîé òàáëèöû îñòàíåòñÿ îäíà ñòðîêà, êîòîðàÿ è äàåò
ñòàòèñòè÷åñêèé ðÿä äëÿ ïðèçíàêà Y â ïðåäïîëîæåíèè, ÷òî X = xi :
yj
N |X = xi
...
...
y1
ni1
ym
nim
Ñîîòâåòñòâóþùåå ãðóïïîâîå ñðåäíåå (âçÿòîå ëèøü ïî òåì ýëåìåíòàì âûáîðêè,
â êîòîðûõ èìååòñÿ ôèêñèðîâàííîå xi ) îáîçíà÷àåòñÿ y i è âû÷èñëÿåòñÿ ïî
ýòîìó ñòàòèñòè÷åñêîìó ðÿäó êàê îáû÷íî
m
P
yi =
nij yj
j=1
m
P
nij
j=1
(çäåñü â çíàìåíàòåëå ñòîèò ni =
äàííîé ãðóïïå, òî åñòü
m
P
nij êîëè÷åñòâî ýëåìåíòîâ âûáîðêè â
j=1
îáúåì
i-îé ãðóïïû ñóììà êëåòî÷åê ïî ñòðîêå).
Íà ïðåäûäóùåì ñëàéäå íà ðèñóíêå ñèíåé ëîìàíîé ñîåäèíåíû òî÷êè äëÿ âñåõ
xi ñ îðäèíàòàìè ãðóïïîâûìè ñðåäíèìè y i .
Ëèíèÿ ðåãðåññèè - II
Òåïåðü ìû ïîëó÷èëè äâîéíîé ñòàòèñòè÷åñêèé ðÿä (ÄÑÐ), â êîòîðîì óæå
ïðèçíàê Y çàìåíåí íà ãðóïïîâûå ñðåäíèå:
xi
yi
ni
(ÄÑÐ):
...
...
...
x1
y1
n1
xk
yk
nk
Îòñþäà, âî-ïåðâûõ, ñðàçó íàõîäÿòñÿ îáùèå ñðåäíèå àðèôìåòè÷åñêèå
ïðèçíàêîâ X è Y :
x=
y=
1
n
1
n
k
P
i=1
k
P
i=1
ni xi =
ni y i =
1
n
1
n
k P
n
P
i=1 j=1
k P
n
P
nij xi ,
nij yj
i=1 j=1
è ïî îáùèì ôîðìóëàì ñîîòâåòñòâóþùèå âûáîðî÷íûå äèñïåðñèè s2x , s2y .
Ëèíèÿ ðåãðåññèè - III
Âî-âòîðûõ, ëèíèþ ðåãðåññèè Y íà X äëÿ êîððåëÿöèîííîé òàáëèöû
(äëÿ ïîëÿ êîððåëÿöèè) íàõîäèì, êàê ëèíèþ ðåãðåññèè äëÿ
ïîëó÷åííîãî äâîéíîãî ñòàòèñòè÷åñêîãî ðÿäà (äëÿ ôóíêöèîíàëüíîé
çàâèñèìîñòè xi 7→ y i ):
y−y =
µ
(x − x).
s2x
Ìåíÿÿ ìåñòàìè x, y íàéäåì è ëèíèþ ðåãðåññèè X íà Y :
x−x=
µ
(y − y).
s2y
Çäåñü âûáîðî÷íàÿ êîâàðèàöèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå
µ =
=
xy − x y =
!
k P
m
P
1
xi yj nij −
n
i=1 j=1
1
n2
k P
m
P
i=1 j=1
!
xi nij
m P
k
P
j=1 i=1
!
yj nij
.
Êîýôôèöèåíò êîððåëÿöèè
Âûáîðî÷íàÿ êîâàðèàöèÿ
èìååò îäèí ñóùåñòâåííûé íåäîñòàòîê îíà
çàâèñèò îò åäèíèö èçìåðåíèÿ, à èìåííî, åñëè îäèí èç ïðèçíàêîâ
óìíîæèòü íà íåêîòîðîå ÷èñëî, òî è êîâàðèàöèÿ óìíîæèòñÿ íà
ýòî ÷èñëî, õîòÿ ñîâåðøåííî ïîíÿòíî, ÷òî õàðàêòåð ñâÿçè ìåæäó
ïðèçíàêàìè îò ýòîãî íå çàâèñèò. Ïîýòîìó íóæíî ââåñòè ïîêàçàòåëü,
êîòîðûé èçìåðÿë áû çàâèñèìîñòü, íàõîäÿñü â íåêîòîðîì çàäàííîì
äèàïàçîíå.
Çàìåòèì, ÷òî åñëè îäèí èç ïðèçíàêîâ óìíîæèòü íà íåêîòîðîå ÷èñëî,
òî âûáîðî÷íàÿ äèñïåðñèÿ óìíîæèòñÿ íà êâàäðàò ýòîãî ÷èñëà, çàòî
âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå óìíîæèòñÿ òîæå ëèøü
íà ñàìî ÷èñëî. Ïîýòîìó ââîäÿò ñëåäóþùèé ïðèçíàê.
Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè äâóõ ïðèçíàêîâ X è Y
îïðåäåëÿåòñÿ òàê:
rxy =
ãäå
à sx , syq âûáîðî÷íûå
p
ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ sx = s2x , sy = s2y .
µ
âûáîðî÷íàÿ
µ
,
sx sy
êîâàðèàöèÿ,
Ñâîéñòâà êîýôôèöèåíòà êîððåëÿöèè
Òåîðåìà. Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè âñåãäà èçìåíÿåòñÿ
â ïðåäåëàõ
−1 6 rxy 6 1.
Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè õàðàêòåðèçóåò òåñíîòó
ñâÿçè ìåæäó ïðèçíàêàìè. Îöåíêîé òàêîé òåñíîòû çàäà÷à
êîððåëÿöèîííîãî àíàëèçà.
Åñëè rxy = 0, òî ëèíåéíóþ ñâÿçü ìåæäó ïðèçíàêàìè óñòàíîâèòü
íåâîçìîæíî, ëèíèè ðåãðåññèè èäóò ïîä ïðÿìûì óãëîì äðóã ê äðóãó,
ïðè÷åì îäíà ãîðèçîíòàëüíî, äðóãàÿ âåðòèêàëüíî. Ïîëå êîððåëÿöèè
ïî÷òè ðàâíîìåðíî çàïîëíÿåò ïðÿìîóãîëüíèê.
Åñëè çíà÷åíèå rxy áëèçêî ê ±1, òî ñ÷èòàåòñÿ, ÷òî ìåæäó ïðèçíàêàìè
èìååòñÿ ïî÷òè ëèíåéíàÿ ñâÿçü, à çíàê êîýôôèöèåíòà êîððåëÿöèè
ãîâîðèò î òîì, êàê âåäåò ñåáÿ îäèí ïðèçíàê ïðè èçìåíåíèè äðóãîãî.
Ïðè rxy > 0 îíè âîçðàñòàþò èëè óáûâàþò îäíîâðåìåííî, à ïðè rxy < 0
ïðè âîçðàñòàíèè îäíîãî èç íèõ âòîðîé óáûâàåò, è íàîáîðîò.
Êîíòðîëüíûå âîïðîñû
1. Àíàëîãèÿ ÄÑÂ è âûáîðîê (ñîñòàâèòü ñðàâíèòåëüíóþ
òàáëèöó).
2. Âèäû çàâèñèìîñòåé ìåæäó ÑÂ (âûáîðêàìè).
3. Äâîéíîé ñòàòèñòè÷åñêèé ðÿä è ëèíèÿ ðåãðåññèè äëÿ
ôóíêöèîíàëüíîé çàâèñèìîñòè.
4. Êðèòåðèé êà÷åñòâà â ìåòîäå íàèìåíüøèõ êâàäðàòîâ.
5. Êîâàðèàöèÿ äâóõ ñëó÷àéíûõ
ôóíêöèîíàëüíîé çàâèñèìîñòè.
âåëè÷èí.
Ôîðìóëà
äëÿ
6. Ðåãðåññèîííûé àíàëèç. Ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ.
Âû÷èñëåíèå ìàòåìàòè÷åñêèõ îæèäàíèé.
7. Êîððåëÿöèîííàÿ òàáëèöà è ïîëå êîððåëÿöèè.
8. Êîâàðèàöèÿ äëÿ êîððåëÿöèîííîé çàâèñèìîñòè.
9. Ëèíèè ðåãðåññèè äëÿ êîððåëÿöèîííîé çàâèñèìîñòè.
10. Êîýôôèöèåíò êîððåëÿöèè, åãî ñâîéñòâà è ñìûñë.
Ëåêöèÿ 4
Òåìà
Ââåäåíèå â òåîðèþ îöåíîê.
Ñîäåðæàíèå òåìû
Ïðåäìåò, öåëü è ìåòîä çàäà÷è îöåíèâàíèÿ
Òî÷å÷íûå âûáîðî÷íûå îöåíêè, ñâîéñòâà îöåíîê
Òåîðåìû îá îöåíêàõ
Èíòåðâàëüíûå îöåíêè è èíòåãðàë Ëàïëàñà
Îñíîâíûå êàòåãîðèè
I Ïîíÿòèå âûáîðî÷íîé îöåíêè (ñòàòèñòèêè).
I Êðèòåðèè
êà÷åñòâà
ýôôåêòèâíîñòü.
îöåíîê:
íåñìåùåííîñòü,
ñîñòîÿòåëüíîñòü,
I Èíòåðâàëüíîå îöåíèâàíèå. Äîâåðèòåëüíûé èíòåðâàë è íàäåæíîñòü
îöåíêè (äîâåðèòåëüíàÿ âåðîÿòíîñòü).
I Èíòåãðàë Ëàïëàñà.
Ïîñòàíîâêà çàäà÷è
Èçó÷àåòñÿ ñëó÷àéíàÿ âåëè÷èíà X ñ çàêîíîì ðàñïðåäåëåíèÿ,
çàâèñÿùèì îò íåèçâåñòíîãî ïàðàìåòðà θ.
Íàïðèìåð, äàíà ðàâíîìåðíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà íà
íåèçâåcòíîì îòðåçêå [a, b]. Òðåáóåòñÿ îöåíèòü ìàòåìàòè÷åñêîå îæèäàíèå
θ = M (X) = (a + b)/2.
Öåëü îïðåäåëèòü ïî âîçìîæíîñòè òî÷íåå çíà÷åíèå ïàðàìåòðà θ
èëè óêàçàòü ñ îïðåäåëåííîé âåðîÿòíîñòüþ èíòåðâàë, â êîòîðîì ýòîò
ïàðàìåòð ëåæèò.
Íàïðèìåð, òðåáóåòñÿ íàéòè òàêîé ïðîìåæóòîê (θ1 , θ2 ), ÷òî ñ âåðîÿòíîñòüþ
0,95 âåëè÷èíà θ ëåæèò â ïðåäåëàõ θ1 < θ < θ2 .
Ìåòîä âûáîðî÷íûé. Îí ñîñòîèò â òîì, ÷òî äåëàåòñÿ âûáîðêà
çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ïî êîòîðîé âû÷èñëÿåòñÿ ïðèáëèæåííîå
çíà÷åíèå θ̃.
Âûáîðî÷íàÿ îöåíêà ñòàòèñòèêà
Ïðèáëèæåííîå çíà÷åíèå θ̃n , ïîëó÷åííîå ïî âûáîðêå x1 , . . . , xn îáúåìà
n, íàçûâàåòñÿ âûáîðî÷íîé èëè ñòàòèñòè÷åñêîé îöåíêîé âåëè÷èíû
θ. Ïîñêîëüêó äîëæåí áûòü ïðåäëîæåí ìåòîä åå âû÷èñëåíèÿ, òî
ôàêòè÷åñêè ìû ïîëó÷àåì ôîðìóëó äëÿ íåêîòîðîé ôóíêöèè
θ̃n (X1 , . . . , Xn )
îò n ýêçåìïëÿðîâ ñëó÷àéíîé âåëè÷èíû X , âçÿòûõ â êà÷åñòâå
íåçàâèñèìûõ, âû÷èñëÿåìûõ ýêñïåðèìåíòàëüíî ïîêàçàòåëåé.  èòîãå,
ëþáàÿ îöåíêà ñàìà ñòàíîâèòñÿ ñëó÷àéíîé âåëè÷èíîé (ëþáàÿ ôóíêöèÿ
îò îäíîé ñëó÷àéíîé âåëè÷èíû èëè íåñêîëüêèõ ñëó÷àéíûõ âåëè÷èí
ñàìà ÿâëÿåòñÿ ñëó÷àéíîé âåëè÷èíîé).
Îïðåäåëåíèå. Ôîðìóëà äëÿ âûáîðî÷íîé îöåíêè θ̃n (X1 , . . . , Xn )
íàçûâàåòñÿ
ñòàòèñòèêîé.
 ñâÿçè ñ ýòèì, òåðìèíû ¾âûáîðî÷íàÿ îöåíêà¿, ¾ñòàòèñòè÷åñêàÿ
îöåíêà¿, ¾îöåíêà¿ è ¾ñòàòèñòèêà¿ ñ÷èòàåì ñèíîíèìàìè.
Ñâîéñòâà âûáîðî÷íûõ îöåíîê. Íåñìåùåííîñòü
Êà÷åñòâî îöåíêè õàðàêòåðèçóåòñÿ íàëè÷èåì èëè îòñóòñòâèåì
íåêîòîðûõ âàæíûõ ñâîéñòâ íåñìåùåííîñòè, ñîñòîÿòåëüíîñòè è
ýôôåêòèâíîñòè.
Äàëåå äëÿ êðàòêîñòè ïèøåì θ̃ èëè θ̃n , ïîäðàçóìåâàÿ θ̃n (X1 , . . . , Xn ).
Îïðåäåëåíèå. Îöåíêà θ̃ ïàðàìåòðà θ íàçûâàåòñÿ
M (θ̃) = θ.
íåñìåùåííîé, åñëè
Òðåáîâàíèå íåñìåùåííîñòè îçíà÷àåò îòñóòñòâèå íåêîòîðîé ñèñòåìíîé,
ïîñòîÿííî ïðèñóòñòâóþùåé îøèáêè, êîòîðàÿ áû çàâûøàëà îöåíêó (M θ̃ > θ)
èëè çàíèæàëà åå (M θ̃ < θ). Òðåáîâàíèå íåñìåùåííîñòè îñîáî âàæíî ïðè
ìàëîì êîëè÷åñòâå íàáëþäåíèé.
Îïðåäåëåíèå. Åñëè M (θ̃n ) → θ ïðè n → ∞, òî îöåíêà íàçûâàåòñÿ
àñèìïòîòè÷åñêè íåñìåùåííîé.
Ñâîéñòâà âûáîðî÷íûõ îöåíîê. Ñîñòîÿòåëüíîñòü
ñîñòîÿòåëüíîé,
åñëè äëÿ ëþáîãî ñêîëü óãîäíî ìàëîãî ïîëîæèòåëüíîãî ÷èñëà ε èìååì
Îïðåäåëåíèå. Îöåíêà θ̃n ïàðàìåòðà θ íàçûâàåòñÿ
lim P {|θ̃n − θ| < ε} = 1.
n→∞
Òðåáîâàíèå ñîñòîÿòåëüíîñòè îçíà÷àåò, ÷òî ïðè óâåëè÷åíèè îáúåìà âûáîðêè
ìû âñå áëèæå ïðèáëèæàåìñÿ ê èñòèííîìó çíà÷åíèþ ïàðàìåòðà. Òàêîå
ñòðåìëåíèå íàçûâàåòñÿ ñõîäèìîñòüþ ïî âåðîÿòíîñòè âåðîÿòíîñòü áîëüøèõ
îòëè÷èé ìåæäó θ̃n è θ ñòðåìèòñÿ ê íóëþ.
Òåîðåìà. Åñëè îöåíêà θ̃n ÿâëÿåòñÿ íåñìåùåííîé è åå äèñïåðñèÿ
ñòðåìèòñÿ ê íóëþ
lim D(θ̃n ) = 0,
n→∞
òî îöåíêà ÿâëÿåòñÿ è ñîñòîÿòåëüíîé.
Ñâîéñòâà âûáîðî÷íûõ îöåíîê. Ýôôåêòèâíîñòü
Îïðåäåëåíèå. Îöåíêà θ̃n ïàðàìåòðà θ íàçûâàåòñÿ ýôôåêòèâíîé, åñëè
åå äèñïåðñèÿ D(θ̃n ) ÿâëÿåòñÿ íàèìåíüøåé èç âñåõ âîçìîæíûõ îöåíîê
ïàðàìåòðà θ ïî âûáîðêàì îáúåìà n.
Òðåáîâàíèå ýôôåêòèâíîñòè îçíà÷àåò íàèìåíüøèé ðàçáðîñ âîêðóã ñâîåãî
ñðåäíåãî. Ýòî òðåáîâàíèå âàæíî äëÿ íåñìåùåííûõ îöåíîê, êîãäà èõ ñðåäíåå
(òî åñòü ìàòåìàòè÷åñêîå îæèäàíèå) ñîâïàäàåò ñ èñòèííûì çíà÷åíèåì
ïàðàìåòðà. Òîãäà è íàèìåíüøèé ðàçáðîñ îêàçûâàåòñÿ ïî îòíîøåíèþ ê
èñòèííîìó çíà÷åíèþ ïàðàìåòðà.
Ðàññìîòðèì íåêîòîðîå ñîáûòèå A è â êà÷åñòâå ïàðàìåòðà θ
âîçüìåì âåðîÿòíîñòü ýòîãî ñîáûòèÿ: θ = P (A). Ïðîâåäåì n ýêñïåðèìåíòîâ,
è ïóñòü ñîáûòèå A ïðîèçîøëî m ðàç. Òîãäà â êà÷åñòâå îöåíêè âåðîÿòíîñòè
åñòåñòâåííî âçÿòü ôàêòè÷åñêóþ ÷àñòîòó ïîÿâëåíèÿ ñîáûòèÿ A:
Ïðèìåð.
θ̃n =
m
.
n
Òîãäà òàêàÿ îöåíêà áóäåò íåñìåùåííîé, ñîñòîÿòåëüíîé è ýôôåêòèâíîé.
Ýòî ñëåäóåò èç òîãî, ÷òî çäåñü ìîæíî âñå ìîäåëèðîâàòü ñõåìîé Áåðíóëëè
(ñì. ñëåä. ñëàéä).
Ïðèìåð ñõåìà Áåðíóëëè
 ðåçóëüòàòå ýêñïåðèìåíòà ïðîâåðÿåòñÿ ïðîèçîøëî èëè íåò íåêîòîðîå
ñîáûòèå A. Òî åñòü ðåçóëüòàò ýêñïåðèìåíòà ýòî óñïåõ (ñîáûòèå
ïðîèçîøëî) èëè íåóäà÷à (ñîáûòèå íå ïðîèçîøëî). Êàê îáû÷íî îáîçíà÷àåì
âåðîÿòíîñòü óñïåõà p = P (A) è âåðîÿòíîñòü íåóäà÷è q = P (A) = 1 − p. Â
îäíîì ýêñïåðèìåíòà ïîëó÷àåì ñëó÷àéíóþ âåëè÷èíó X (êîëè÷åñòâî óñïåõîâ
â îäíîì èñïûòàíèè) ñ ðÿäîì ðàñïðåäåëåíèÿ
X
P
0
q
1
=⇒ M (X) = p,
p
D(X) = pq,
σ(X) =
√
pq.
 êà÷åñòâå îöåíêè âåðîÿòíîñòè p ïðèíèìàåòñÿ ñðåäíåå àðèôìåòè÷åñêîå
êîëè÷åñòâà óñïåõîâ â n èñïûòàíèÿõ:
θ̃n =
1
(X1 + . . . + Xn ).
n
Òîãäà
M (θ̃n ) =
1
(nM (X)) = p,
n
D(θ̃n ) =
1
pq
(nD(X)) =
→ 0 ïðè n → ∞.
n2
n
Çíà÷èò, òàêàÿ îöåíêà íåñìåùåííàÿ è ñîñòîÿòåëüíàÿ. Ìîæíî äîêàçàòü, ÷òî
îíà ýôôåêòèâíàÿ.
Îáùèå òåîðåìû
Òåîðåìà 1.
Ïóñòü X1 , . . . , Xn âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè X è
M (Xi ) = M (X) = µ,
D(Xi ) = D(X) = σ 2 .
Òîãäà âûáîðî÷íàÿ ñðåäíÿÿ àðèôìåòè÷åñêàÿ
x=
1
(X1 + . . . + Xn )
n
ÿâëÿåòñÿ íåñìåùåííîé è ñîñòîÿòåëüíîé îöåíêîé ìàòåìàòè÷åñêîãî îæèäàíèÿ
M (X).
Òåîðåìà 2.
Ïóñòü X1 , . . . , Xn âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè X è
M (Xi ) = M (X) = µ,
Òîãäà âåëè÷èíà s2H =
n
s2 ,
n−1
D(Xi ) = D(X) = σ 2 .
ãäå s2 =
1
n
n
P
(Xi − x)2 âûáîðî÷íàÿ
i=1
äèñïåðñèÿ, ÿâëÿåòñÿ íåñìåùåííîé è ñîñòîÿòåëüíîé îöåíêîé äèñïåðñèè
D(X).
Èìåííî ïîýòîìó âåëè÷èíó s2H è íàçûâàþò
äèñïåðñèè.
Ïðèìå÷àíèå.
îöåíêîé
íåñìåùåííîé
Èíòåðâàëüíîå îöåíèâàíèå ïàðàìåòðîâ
Îöåíêè, î êîòîðûõ ãîâîðèëîñü âûøå, íàçûâàþòñÿ òî÷å÷íûìè, òàê êàê îíè
äàþò êîíêðåòíîå ÷èñëî îäíó òî÷êó íà âåùåñòâåííîé îñè. Èõ íåäîñòàòîê â
òîì, ÷òî îíè íè÷åãî íå ãîâîðÿò î òî÷íîñòè òàêîãî îöåíèâàíèÿ ïðè çàäàííîì
n. Áîëåå òîãî, ïðè ìàëûõ âûáîðêàõ ðàñõîæäåíèÿ ìåæäó îöåíêîé è èñòèííûì
çíà÷åíèåì ìîæåò áûòü î÷åíü âåëèêî. Ïîýòîìó âîçíèêàåò çàäà÷à óêàçàòü
èíòåðâàë (θ1 , θ2 ), â êîòîðûé ñ çàäàííîé âåðîÿòíîñòüþ ïîïàäàåò èñòèííîå
çíà÷åíèå ïàðàìåòðà θ.
Îöåíêà íåèçâåñòíîãî ïàðàìåòðà íàçûâàåòñÿ èíòåðâàëüíîé,
åñëè îíà îïðåäåëÿåòñÿ äâóìÿ ÷èñëàìè íà÷àëîì è êîíöîì èíòåðâàëà, â
êîòîðûé äîëæåí ïîïàäàòü èñêîìûé ïàðàìåòð.
Îïðåäåëåíèå.
Åñëè óêàçàí èíòåðâàë (θ1 , θ2 ), â êîòîðûé ñ çàäàííîé
âåðîÿòíîñòüþ γ ïîïàäàåò èñòèííîå çíà÷åíèå ïàðàìåòðà θ, òî òàêîé èíòåðâàë
íàçûâàåòñÿ äîâåðèòåëüíûì èíòåðâàëîì, à âåðîÿòíîñòü γ íàçûâàåòñÿ
íàäåæíîñòüþ îöåíêè èëè äîâåðèòåëüíîé âåðîÿòíîñòüþ.
Îïðåäåëåíèå.
Ïðèìåð èñïîëüçîâàíèå èíòåãðàëà Ëàïëàñà
Ïóñòü äàíî íîðìàëüíîå ðàñïðåäåëåíèå N (µ, σ) ñ èçâåñòíîé äèñïåðñèåé σ 2 ,
íî íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ. Âîçüìåì â êà÷åñòâå îöåíêè
äëÿ µ âûáîðî÷íîå ñðåäíåå (ñðåäíþþ àðèôìåòè÷åñêóþ âûáîðêè)
x=
1
(X1 + . . . + Xn ).
n
Ýòà âåëè÷èíà òàêæå èìååò íîðìàëüíîå ðàñïðåäåëåíèå, åå ìàòåìàòè÷åñêîå
îæèäàíèå ñîâïàäàåò ñ èñêîìûì ïàðàìåòðîì M (x) = µ (îöåíêà
íåñìåùåííàÿ), à åå äèñïåðñèÿ ðàâíà, êàê ëåãêî ïîäñ÷èòàòü ïî ñâîéñòâàì
äèñïåðñèè
σ2
D(x) =
(îöåíêà ñîñòîÿòåëüíàÿ).
n
Òîãäà âåëè÷èíà
x−µ
Y = σ
√
n
èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå N (0, 1).
Ïðèìåð èñïîëüçîâàíèå èíòåãðàëà Ëàïëàñà - II
Èùåì äîâåðèòåëüíûé èíòåðâàë â âèäå (x − a, x + a). Òîãäà
|µ − x| < a
⇔
σ
|Y | < a √ ,
n
à âåðîÿòíîñòü ïîñëåäíåãî ñîáûòèÿ ðàâíà ïî ôîðìóëå ÍüþòîíàËåéáíèöà
a √σ
n
σ
σ
F (a √ ) − F (−a √ ) = 2
n
n
Z
f (t)dt,
0
ãäå
t2
1
f (t) = √ e− 2
2π
åñòü ïëîòíîñòü ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Èíòåãðàë
Zx
Φ(x) =
f (t)dt
0
íàçûâàåòñÿ èíòåãðàëîì Ëàïëàñà (ôóíêöèåé Ëàïëàñà). Äëÿ åãî âû÷èñëåíèÿ
èìåþòñÿ óäîáíûå òàáëèöû.
Èòàê, â íàøåì ïðèìåðå âåðîÿòíîñòü ïîïàäàíèÿ â äîâåðèòåëüíûé èíòåðâàë
(x − a, x + a) ðàâíà 2Φ(a √σn ).
Êîíòðîëüíûå âîïðîñû
1. Ïðåäìåò, öåëü è ìåòîä çàäà÷è îöåíèâàíèÿ.
2. Ïîíÿòèå âûáîðî÷íîé îöåíêè (ñòàòèñòèêè).
3. Íåñìåùåííàÿ îöåíêà.
4. Ñîñòîÿòåëüíàÿ îöåíêà. Òåîðåìà î ñîñòîÿòåëüíîñòè îöåíêè.
5. Ýôôåêòèâíîñòü îöåíêè.
6. Íåñìåùåííîñòü è ñîñòîÿòåëüíîñòü îöåíêè âåðîÿòíîñòè
óñïåõà â ñõåìå Áåðíóëëè.
7. Äâå òåîðåìû îá îöåíêàõ ìàòåìàòè÷åñêîãî îæèäàíèÿ è
äèñïåðñèè.
8. Èíòåðâàëüíîå îöåíèâàíèå. Äîâåðèòåëüíûé èíòåðâàë è
íàäåæíîñòü îöåíêè (äîâåðèòåëüíàÿ âåðîÿòíîñòü).
9. Èíòåãðàë Ëàïëàñà. Âû÷èñëåíèå äîâåðèòåëüíîé âåðîÿòíîñòè
äëÿ îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ íîðìàëüíîãî
ðàñïðåäåëåíèÿ.
Download