Ëåêöèÿ 10 Òåìà Ñîäåðæàíèå òåìû

advertisement
Ëåêöèÿ 10
Òåìà
Ñðàâíåíèå ñëó÷àéíûõ âåëè÷èí èëè ïðèçíàêîâ.
Ñîäåðæàíèå òåìû
Àíàëîãèÿ äèñêðåòíûõ ÑÂ è âûáîðîê
Âèäû çàâèñèìîñòåé äâóõ ñëó÷àéíûõ âåëè÷èí (âûáîðîê)
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü. Ëèíèè ðåãðåññèè. Êîâàðèàöèÿ
Êîððåëÿöèîííàÿ çàâèñèìîñòü. Êîâàðèàöèÿ. Ëèíèè ðåãðåññèè.
Êîýôôèöèåíò êîððåëÿöèè
Îñíîâíûå êàòåãîðèè
I ôóíêöèîíàëüíàÿ, ñòàòèñòè÷åñêàÿ è êîððåëÿöèîííàÿ çàâèñèìîñòè;
I ëèíèè ðåãðåññèè äëÿ ôóíêöèîíàëüíîé çàâèñèìîñòè;
I ìåòîä íàèìåíüøèõ êâàäðàòîâ;
I êîâàðèàöèÿ äëÿ ôóíêöèîíàëüíîé çàâèñèìîñòè;
I ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ, êîððåëÿöèîííàÿ òàáëèöà è ïîëå
êîððåëÿöèè;
I êîâàðèàöèÿ äëÿ êîððåëÿöèîííîé çàâèñèìîñòè;
I ëèíèè ðåãðåññèè äëÿ êîððåëÿöèîííîé çàâèñèìîñòè;
I êîýôôèöèåíò êîððåëÿöèè.
Àíàëîãèÿ ÄÑÂ è âûáîðêè
Äèñêðåòíàÿ
Âûáîðêà
ñëó÷àéíàÿ
îïèñûâàåòñÿ
âåëè÷èíà
ÄÑÂ X
Çíà÷åíèÿ Ñ x1 , . . . , xk
Ðÿä ðàñïðåäåëåíèÿ
X
x1 . . .
xk
P
p1 . . .
pk
Âåðîÿòíîñòè
k
P
pi = 1
i=1
Ìàòåìàòè÷åñêîå îæèäàíèå
k
P
M (X) =
p i xi
i=1
Äèñïåðñèÿ
k
P
D(X) =
pi (xi − M (X))2
i=1
îïèñûâàåòñÿ
ñòàòèñòè÷åñêèì ðÿäîì.
ðÿäîì ðàñïðåäåëåíèÿ.
Âûáîðêà xi
Âàðèàíòû x1 , . . . , xk
Ñòàòèñòè÷åñêèé ðÿä
xi
x1
...
xk
wi
w1 . . .
wk
×àñòîñòè
k
P
wi =
i=1
k
P
i=1
ni
n
=1
Ñðåäíÿÿ àðèôìåòè÷åñêàÿ
k
P
x=
wi xi
i=1
Âûáîðî÷íàÿ äèñïåðñèÿ
k
P
s2x =
wi (xi − x)2
i=1
Âèäû çàâèñèìîñòåé äâóõ ñëó÷àéíûõ âåëè÷èí (âûáîðîê)
Äàëåå âñþäó ïðåäïîëàãàåì, ÷òî çàäàíû äâå äèñêðåòíûå ñëó÷àéíûå
âåëè÷èíû X, Y , ëèáî äâå âûáîðêè {xi }, {yi }.  ñèëó ýòîãî, âñ¼, ÷òî íàïèñàíî
ïðî ñëó÷àéíûå âåëè÷èíû, ðàñïðîñòðàíÿåòñÿ íà âûáîðêè çàìåíîé pi íà
wi = nni , è íàîáîðîò.
Ìåæäó ñëó÷àéíûìè âåëè÷èíàìè èëè âûáîðêàìè ìîæíî èçó÷àòü ñëåäóþùèå
âèäû çàâèñèìîñòåé:
I Ôóíêöèîíàëüíàÿ çàâèñèìîñòü (ÔÇ).
I Ñòàòèñòè÷åñêàÿ çàâèñèìîñòü (ÑÇ).
I Êîððåëÿöèîííàÿ çàâèñèìîñòü (ÊÇ).
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü
Ôóíêöèîíàëüíàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî êàæäîìó çíà÷åíèþ
ñëó÷àéíîé âåëè÷èíû X ñîîòâåòñòâóåò ñòðîãî îïðåäåëåííîå åäèíñòâåííîå
çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Y , òî åñòü èõ çíà÷åíèÿ ñâÿçàíû ôóíêöèåé
y = f (x).
Íà ïðàêòèêå âñ¼ æå îíà ïðîÿâëÿåòñÿ íå òàê îäíîçíà÷íî, à èìåþòñÿ
íåêîòîðûå ìàëûå ñëó÷àéíûå îòêëîíåíèÿ ε(x), òàê ÷òî
y = f (x) + ε(x).
Ýòè îòêëîíåíèÿ õàðàêòåðèçóþò òó ñëó÷àéíóþ ñîñòàâëÿþùóþ, êîòîðàÿ íàì
íå âàæíà. Îíè íàçûâàþòñÿ ¾ñëó÷àéíûì øóìîì¿. Íàïðèìåð, åæåäíåâíûå
êîëåáàíèÿ êóðñà âàëþòû íà ôîíå ñåçîííûõ:
Òàêèå øóìû
èãíîðèðóþòñÿ.
Äâîéíîé ðÿä ðàñïðåäåëåíèÿ
Åñëè ïðåäïîëàãàåòñÿ ôóíêöèîíàëüíàÿ çàâèñèìîñòü, òî çíà÷åíèÿ yi
äîëæíû ñòðîãî ñîîòâåòñòâîâàòü çíà÷åíèÿì xi , òî åñòü ïàðà (xi , yi )
âñòðå÷àåòñÿ òîëüêî â òàêîì ñî÷åòàíèè è ñ îïðåäåëåííîé âåðîÿòíîñòüþ.
Âîçíèêàåò äâîéíîé ðÿä ðàñïðåäåëåíèÿ
X
Y
P
x1
y1
p1
...
...
...
xk
yk
pk
Íà
ïëîñêîñòè
Oxy
ñòðîèì
ëîìàíóþ
ïî
òî÷êàì
M1 (x1 , y1 ), . . . , Mk (xk , yk ). Ïðè ýòîì ìû íå âèäèì èíôîðìàöèè
î âåðîÿòíîñòÿõ pi , ò.å. êàæäàÿ òî÷êà Mi åùå èìååò ¾âåñ¿ âåðîÿòíîñòü pi , è âíîñèò òåì áîëüøèé âêëàä â çàêîí ðàñïðåäåëåíèÿ,
÷åì áîëüøå ýòà âåðîÿòíîñòü. Ìîæíî èçîáðàçèòü ýòîò ôàêò ðàçìåðîì
òî÷êè (â EXCEL åñòü äëÿ ýòîãî ïóçûðüêîâûå äèàãðàììû).
Ëèíèÿ ðåãðåññèè
Îïðåäåëåíèå.
Ïðÿìàÿ âèäà
y = b0 + b1 x,
ãäå b0 , b1 íåêîòîðûå ÷èñëà, êîòîðàÿ ¾íàèëó÷øèì îáðàçîì¿
ïðèáëèæàåò ïîñòðîåííóþ ëîìàíóþ, íàçûâàåòñÿ ëèíèåé ðåãðåññèè Y
íà X .
Êðèòåðèåì êà÷åñòâà ïðèáëèæåíèÿ ÿâëÿåòñÿ ñóììà êâàäðàòîâ
îòêëîíåíèÿ òî÷åê ïðÿìîé îò òî÷åê ëîìàíîé, âçÿòûõ ñ ìíîæèòåëåì
pi , òî åñòü âåëè÷èíà ìàòåìàòè÷åñêîãî îæèäàíèÿ ñëó÷àéíîé âåëè÷èíû
[(b0 + b1 X) − Y ]2 :
S=
k
X
(b0 + b1 xi − yi )2 pi .
i=1
 ìåòîäå íàèìåíüøèõ êâàäðàòîâ íàèëó÷øèì ïðèáëèæåíèåì
ñ÷èòàåòñÿ òî, äëÿ êîòîðîãî êîýôôèöèåíòû b0 , b1 âûáðàíû òàê, ÷òî
âåëè÷èíà S ïðèíèìàåò íàèìåíüøåå çíà÷åíèå.
Êîâàðèàöèÿ
Çàïèñûâàÿ íåîáõîäèìîå óñëîâèå ýêñòðåìóìà ôóíêöèè äâóõ ïåðåìåííûõ
S(b0 , b1 ) â âèäå
∂S
∂S
= 0,
= 0,
∂b0
∂b1
è ðåøàÿ ïîëó÷åííóþ ñèñòåìó äâóõ ëèíåéíûõ óðàâíåíèé îòíîñèòåëüíî b0 , b1 ,
ïîëó÷èì
b1 =
cov(X, Y )
,
D(X)
b0 = M (Y ) − M (X)
cov(X, Y )
.
D(X)
Çäåñü ïîÿâèëîñü íîâîå ïîíÿòèå cov(X, Y ) êîâàðèàöèÿ äâóõ ñëó÷àéíûõ
âåëè÷èí.
Êîâàðèàöèåé äâóõ ñëó÷àéíûõ âåëè÷èí X, Y íàçûâàåòñÿ
÷èñëî, âû÷èñëÿåìîå ïî ôîðìóëå
Îïðåäåëåíèå.
cov(X, Y ) = M ([X − M (X)][Y − M (Y )]) = M (XY ) − M (X)M (Y ).
Äëÿ äâîéíîãî ðÿäà ðàñïðåäåëåíèÿ ïîëó÷èì, ÷òî
!
!
!
k
k
k
X
X
X
cov(X, Y ) =
xi yi pi −
xi pi
yi pi .
i=1
i=1
i=1
Óðàâíåíèÿ ðåãðåññèè
Äëÿ âûáîðîê ïðèíÿòî áîëåå ïðîñòîå îáîçíà÷åíèå âûáîðî÷íàÿ êîâàðèàöèÿ
îáîçíà÷àåòñÿ ÷åðåç µ (èëè ÷åðåç µxy ) è âû÷èñëÿåòñÿ â ñëó÷àå äâîéíîãî
ñòàòèñòè÷åñêîãî ðÿäà èìååì
!
!
!
k
k
k
k
X
X
X
X
µ=
xi yi wi −
xi wi
yi wi =
(xi − x)(yi − y)wi .
i=1
i=1
i=1
i=1
Òîãäà èç ôîðìóë äëÿ êîýôôèöèåíòîâ b0 , b1 , â êîòîðûõ åùå ñëåäóåò çàìåíèòü
ìàòåìàòè÷åñêèå îæèäàíèÿ íà ñðåäíèå àðèôìåòè÷åñêèå, à äèñïåðñèè íà
âûáîðî÷íûå äèñïåðñèè, ïîëó÷èì óðàâíåíèå ðåãðåññèè Y íà X
y−y =
µ
(x − x).
s2x
Åñëè âñå ïîâòîðèòü, ïîìåíÿâ ìåñòàìè X, Y , òî ïîëó÷èì óðàâíåíèå
ðåãðåññèè X íà Y
µ
x − x = 2 (y − y).
sy
Òåîðåìà î ëèíèÿõ ðåãðåññèè
. Ïðè íàëè÷èè äâóõ âûáîðîê, ó êîòîðûõ ïðåäïîëàãàåòñÿ
ëèíèåé ðåãðåññèè Y íà X ÿâëÿåòñÿ
ïðÿìàÿ, ïðîõîäÿùàÿ ÷åðåç òî÷êó ¾ñðåäíèõ¿
Òåîðåìà
ôóíêöèîíàëüíàÿ çàâèñèìîñòü,
C = (x, y)
ñ óãëîâûì êîýôôèöèåíòîì
µ
.
s2x
Ëèíèåé ðåãðåññèè X íà Y ÿâëÿåòñÿ ïðÿìàÿ, ïðîõîäÿùàÿ ÷åðåç òî÷êó
¾ñðåäíèõ¿
C = (x, y)
µ
ñ óãëîâûì êîýôôèöèåíòîì 2 .
sy
Ñòàòèñòè÷åñêàÿ çàâèñèìîñòü
 îáùåì ñëó÷àå, åñëè íåò íèêàêèõ ñâåäåíèé î ãëîáàëüíîé ñâÿçè
ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, ìîæíî ïîñ÷èòàòü óñëîâíóþ ôóíêöèþ
ðàñïðåäåëåíèÿ âåëè÷èíû Y â ïðåäïîëîæåíèè, ÷òî âåëè÷èíà X ïðèíÿëà
êîíêðåòíîå çíà÷åíèå x ∈ R. Îíà âûðàæàåò óñëîâíóþ âåðîÿòíîñòü
P {Y < y|X = x},
îáîçíà÷àåòñÿ ÷åðåç F (y; x) èëè Fx (y):
F (y; x) = Fx (y) = P {Y < y|X = x} =
P {Y < y è X = x}
.
P {X = x}
Ýòè îáîçíà÷åíèÿ ïîä÷åðêèâàþò, ÷òî çäåñü x õîòü è ëþáîå, íî
ôèêñèðîâàííîå ÷èñëî, òî åñòü ïàðàìåòð, à y íåçàâèñèìàÿ ïåðåìåííàÿ
(àðãóìåíò).
Èòàê, ñòàòèñòè÷åñêàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî ôóíêöèÿ
ðàñïðåäåëåíèÿ îäíîé ñëó÷àéíîé âåëè÷èíû çàâèñèò îò êîíêðåòíîãî
çíà÷åíèÿ äðóãîé. Ïðåäïîëàãàòü ýòî ìîæíî âñåãäà, íî âû÷èñëèòü ýòè
ôóíêöèè è îöåíèòü íàäåæíîñòü òàêîãî âû÷èñëåíèÿ ïðîáëåìàòè÷íî.
Ïîýòîìó òàêîé ñëó÷àé ÿâëÿåòñÿ ñëèøêîì îáùèì.
Êîððåëÿöèîííàÿ çàâèñèìîñòü
Êîððåëÿöèîííàÿ çàâèñèìîñòü
ïðåäïîëàãàåò, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå
îäíîé ñëó÷àéíîé âåëè÷èíû çàâèñèò îò êîíêðåòíîãî çíà÷åíèÿ äðóãîé. Èíà÷å
ãîâîðÿ, âû÷èñëÿåòñÿ èëè îöåíèâàåòñÿ ïî âûáîðêå óñëîâíîå ìàòåìàòè÷åñêîå
îæèäàíèå M (Y |X = x), òî åñòü ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû
ñ ôóíêöèåé ðàñïðåäåëåíèÿ Fx (y) = P {Y < y|X = x}. Äëÿ ïðîñòîòû îíî
îáîçíà÷àåòñÿ ÷åðåç Mx (Y ).
Íå ïóòàòü! Çäåñü x ÷èñëî (x ∈ R), ëþáîå, íî ôèêñèðîâàííîå, ïîýòîìó
ïèøåì x ìàëåíüêîå, à Y ñëó÷àéíàÿ âåëè÷èíà (ò.å. ÷èñëîâàÿ ôóíêöèÿ íà
ïðîñòðàíñòâå ýëåìåíòàðíûõ ñîáûòèé), ïîýòîìó ïèøåì Y áîëüøîå. Ðåçóëüòàò
Mx (Y ) (ìàòåìàòè÷åñêîå îæèäàíèå) ýòî ÷èñëî, íî çàâèñÿùåå îò ÷èñëîâîãî
ïàðàìåòðà x. Íî ¾÷èñëî, çàâèñÿùåå îò ÷èñëà¿ ýòî ñàìàÿ îáû÷íàÿ ÷èñëîâàÿ
ôóíêöèÿ îò ÷èñëîâîãî àðãóìåíòà!
Èòàê, êîððåëÿöèîííàÿ çàâèñèìîñòü ïðåäïîëàãàåò, ÷òî èìååò ìåñòî
ôóíêöèîíàëüíàÿ çàâèñèìîñòü ìàòåìàòè÷åñêîãî îæèäàíèÿ Y îò çíà÷åíèÿ
x ñëó÷àéíîé âåëè÷èíû X . Êàê ïðàâèëî, ïðè ýòîì ìîæíî âû÷èñëèòü è
ôóíêöèîíàëüíóþ çàâèñèìîñòü ìàòåìàòè÷åñêîãî îæèäàíèÿ X îò çíà÷åíèÿ y
ñëó÷àéíîé âåëè÷èíû Y . Ïîëó÷àåì òàêèå ôóíêöèè
Mx (Y ) = ϕ(x),
Èõ ãðàôèêè íàçûâàþòñÿ
My (X) = ψ(y).
êðèâûìè ðåãðåññèè ñîîòâåòñòâåííî Y íà X è X íà Y .
Ðåãðåññèîííûé àíàëèç. Ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ
Ðåãðåññèîííûé àíàëèç äàåò ìåòîäû ïîñòðîåíèÿ ëèíèé ðåãðåññèè, ò.å. ïðÿìûõ,
íàèëó÷øèì îáðàçîì ïðèáëèæàþùèõ êðèâûå ðåãðåññèè.
Ïóñòü äàíû äâå äèñêðåòíûå ñëó÷àéíûå âåëè÷èíû ñî çíà÷åíèÿìè
X:
Y :
x1 , . . . , x k ;
y1 , . . . , ym .
Ñîâìåñòíûé (èëè
ðàñïðåäåëåíèÿ X è Y ýòî òàáëèöà
Îïðåäåëåíèå.
x1
..
.
xi
..
.
xk
ïàðíûé,
èëè
y1
...
yj
...
ym
p11
...
p1j
...
p1m
pi1
...
pij
...
pim
pk1
...
pkj
...
pkm
äâóìåðíûé)
ãäå â êëåòêàõ ñòîÿò âåðîÿòíîñòè âñåâîçìîæíûõ ïàð çíà÷åíèé
pij = P {X = xi , Y = yj }.
çàêîí
Ìàòåìàòè÷åñêèå îæèäàíèÿ äëÿ ñîâìåñòíîãî çàêîíà
ðàñïðåäåëåíèÿ
Ïóñòü äàí ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ. Ñóììû âåðîÿòíîñòåé ïî
ñòðîêàì äàþò âåðîÿòíîñòè âñåõ çíà÷åíèé X , à ñóììû âåðîÿòíîñòåé ïî
ñòîëáöàì äàþò âåðîÿòíîñòè âñåõ çíà÷åíèé Y :
P {X = xi } =
m
X
pij ,
P {Y = yj } =
j=1
k
X
pij .
i=1
Ïîýòîìó ïîëó÷àåì äâà ðÿäà ðàñïðåäåëåíèÿ
X
P
x1
m
P
p1j
...
...
j=1
xk
m
P
pkj
j=1
Y
P
y1
k
P
pi1
...
...
i=1
ym
k
P
pim
i=1
Îòñþäà ñëåäóåò ïðàâèëî âû÷èñëåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé
M (X) =
k X
m
X
i=1 j=1
xi pij ,
M (Y ) =
m X
k
X
j=1 i=1
yj pij .
Êîâàðèàöèÿ ñîâìåñòíîãî çàêîíà ðàñïðåäåëåíèÿ
Ïóñòü äàí ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ. Âû÷èñëèì ìàòåìàòè÷åñêèå
îæèäàíèÿ M (X), M (Y ). Òîãäà êîâàðèàöèÿ äâóõ ñëó÷àéíûõ âåëè÷èí X, Y
(ñì. îïðåäåëåíèå âûøå) âû÷èñëÿåòñÿ ïî ôîðìóëàì
cov(X, Y ) =
k X
m
X
[xi − M (X)][yj − M (Y )]pij .
i=1 j=1
Êîâàðèàöèþ äâóõ ñëó÷àéíûõ âåëè÷èí ïî ñîâìåñòíîìó çàêîíó
ðàñïðåäåëåíèÿ ìîæíî òàêæå âû÷èñëèòü ïî ôîðìóëå
Òåîðåìà.
cov(X, Y )
=
=
M (XY ) − M (X)M
! (Y ) =
!
k
m
k P
m
P P
P
xi yj pij −
xi pij
i=1 j=1
i=1 j=1
m P
k
P
j=1 i=1
!
yj pij
.
Êîððåëÿöèîííàÿ òàáëèöà äëÿ âûáîðîê
Ïóñòü äàíà âûáîðêà, ñäåëàííàÿ îäíîâðåìåííî ïî äâóì ïðèçíàêàì, â
ðåçóëüòàòå êîòîðîé êàæäûé èç ïðèçíàêîâ èìååò âàðèàíòû
X = {xi } :
Y = {yj } :
Îïðåäåëåíèå.
x1 , . . . , x k ;
y1 , . . . , ym .
Êîððåëÿöèîííàÿ òàáëèöà ïàðíîé âûáîðêè ýòî òàáëèöà
x1
..
.
xi
..
.
xk
y1
...
yj
...
ym
n11
...
n1j
...
n1m
ni1
...
nij
...
nim
nk1
...
nkj
...
nkm
ãäå â êëåòêàõ ñòîÿò êîëè÷åñòâà nij , â êîòîðûõ âñòðåòèëàñü êàæäàÿ èç
âîçìîæíûõ ïàð çíà÷åíèé (xi , yj ).
ßñíî, ÷òî ñóììà öåëûõ ÷èñåë ïî âñåì êëåòêàì äàåò îáúåì âûáîðêè:
n=
k X
m
X
i=1 j=1
nij .
Ïîëå êîððåëÿöèè
Ïóñòü äàíà êîððåëÿöèîííàÿ òàáëèöà äëÿ ïàðíîé âûáîðêè. Â íàèáîëåå
ðàñïðîñòðàíåííîì ñëó÷àå â íåé äîâîëüíî ìíîãî íóëåé (òî åñòü íå âñå ïàðû
èç k × m ðåàëüíî âñòðå÷àþòñÿ â âûáîðêå).
Íàíåñåì íà ïëîñêîñòü Oxy òå èç òî÷åê Mij (xi , yj ), äëÿ êîòîðûõ nij 6= 0.
Ïîëó÷åííûé ðèñóíîê íàçûâàåòñÿ ïîëåì êîððåëÿöèè. Çàäà÷à ðåãðåññèîííîãî
àíàëèçà ïîñòðîèòü ïðÿìóþ
y = b0 + b1 x,
êîòîðàÿ íàèëó÷øèì
êîððåëÿöèè.
îáðàçîì
ïðèáëèæàåò
(àïïðîêñèìèðóåò)
ïîëå
Ëèíèÿ ðåãðåññèè
Êàê èñêàòü ýòó ïðÿìóþ? Âíà÷àëå íàéäåì òàê íàçûâàåìûå ãðóïïîâûå ñðåäíèå
ïðèçíàêà Y , òî åñòü ñðåäíèå àðèôìåòè÷åñêèå ïðèçíàêà Y â ïðåäïîëîæåíèè,
÷òî çíà÷åíèå ïðèçíàêà X â âûáîðêå ôèêñèðîâàíî è âçÿòî ðàâíûì íåêîòîðîìó
xi . Òîãäà îò êîððåëÿöèîííîé òàáëèöû îñòàíåòñÿ îäíà ñòðîêà, êîòîðàÿ è äàåò
ñòàòèñòè÷åñêèé ðÿä äëÿ ïðèçíàêà Y â ïðåäïîëîæåíèè, ÷òî X = xi :
yj
N |X = xi
...
...
y1
ni1
ym
nim
Ñîîòâåòñòâóþùåå ãðóïïîâîå ñðåäíåå (âçÿòîå ëèøü ïî òåì ýëåìåíòàì âûáîðêè,
â êîòîðûõ èìååòñÿ ôèêñèðîâàííîå xi ) îáîçíà÷àåòñÿ y i è âû÷èñëÿåòñÿ ïî
ýòîìó ñòàòèñòè÷åñêîìó ðÿäó êàê îáû÷íî
m
P
yi =
nij yj
j=1
m
P
nij
j=1
(çäåñü â çíàìåíàòåëå ñòîèò ni =
äàííîé ãðóïïå, òî åñòü
m
P
nij êîëè÷åñòâî ýëåìåíòîâ âûáîðêè â
j=1
îáúåì i-îé ãðóïïû ñóììà êëåòî÷åê ïî ñòðîêå).
Íà ïðåäûäóùåì ñëàéäå íà ðèñóíêå ñèíåé ëîìàíîé ñîåäèíåíû òî÷êè äëÿ âñåõ
xi ñ îðäèíàòàìè ãðóïïîâûìè ñðåäíèìè y i .
Ëèíèÿ ðåãðåññèè - II
Òåïåðü ìû ïîëó÷èëè äâîéíîé ñòàòèñòè÷åñêèé ðÿä (ÄÑÐ), â êîòîðîì óæå
ïðèçíàê Y çàìåíåí íà ãðóïïîâûå ñðåäíèå:
xi
yi
ni
(ÄÑÐ):
...
...
...
x1
y1
n1
xk
yk
nk
Îòñþäà, âî-ïåðâûõ, ñðàçó íàõîäÿòñÿ îáùèå ñðåäíèå àðèôìåòè÷åñêèå
ïðèçíàêîâ X è Y :
x=
y=
1
n
1
n
k
P
i=1
k
P
i=1
ni xi =
ni y i =
1
n
1
n
k P
n
P
i=1 j=1
k P
n
P
nij xi ,
nij yj
i=1 j=1
è ïî îáùèì ôîðìóëàì ñîîòâåòñòâóþùèå âûáîðî÷íûå äèñïåðñèè s2x , s2y .
Ëèíèÿ ðåãðåññèè - III
Âî-âòîðûõ, ëèíèþ ðåãðåññèè Y íà X äëÿ êîððåëÿöèîííîé òàáëèöû
(äëÿ ïîëÿ êîððåëÿöèè) íàõîäèì, êàê ëèíèþ ðåãðåññèè äëÿ
ïîëó÷åííîãî äâîéíîãî ñòàòèñòè÷åñêîãî ðÿäà (äëÿ ôóíêöèîíàëüíîé
çàâèñèìîñòè xi 7→ y i ):
y−y =
µ
(x − x).
s2x
Ìåíÿÿ ìåñòàìè x, y íàéäåì è ëèíèþ ðåãðåññèè X íà Y :
x−x=
Çäåñü
âûáîðî÷íàÿ êîâàðèàöèÿ
µ =
=
xy − x y =
!
k P
m
P
1
xi yj nij −
n
i=1 j=1
µ
(y − y).
s2y
âû÷èñëÿåòñÿ ïî ôîðìóëå
1
n2
k P
m
P
i=1 j=1
!
xi nij
m P
k
P
j=1 i=1
!
yj nij
.
Êîýôôèöèåíò êîððåëÿöèè
Âûáîðî÷íàÿ êîâàðèàöèÿ
èìååò îäèí ñóùåñòâåííûé íåäîñòàòîê îíà
çàâèñèò îò åäèíèö èçìåðåíèÿ, à èìåííî, åñëè îäèí èç ïðèçíàêîâ
óìíîæèòü íà íåêîòîðîå ÷èñëî, òî è êîâàðèàöèÿ óìíîæèòñÿ íà
ýòî ÷èñëî, õîòÿ ñîâåðøåííî ïîíÿòíî, ÷òî õàðàêòåð ñâÿçè ìåæäó
ïðèçíàêàìè îò ýòîãî íå çàâèñèò. Ïîýòîìó íóæíî ââåñòè ïîêàçàòåëü,
êîòîðûé èçìåðÿë áû çàâèñèìîñòü, íàõîäÿñü â íåêîòîðîì çàäàííîì
äèàïàçîíå.
Çàìåòèì, ÷òî åñëè îäèí èç ïðèçíàêîâ óìíîæèòü íà íåêîòîðîå ÷èñëî,
òî âûáîðî÷íàÿ äèñïåðñèÿ óìíîæèòñÿ íà êâàäðàò ýòîãî ÷èñëà, çàòî
âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå óìíîæèòñÿ òîæå ëèøü
íà ñàìî ÷èñëî. Ïîýòîìó ââîäÿò ñëåäóþùèé ïðèçíàê.
Âûáîðî÷íûé
êîýôôèöèåíò
îïðåäåëÿåòñÿ òàê:
êîððåëÿöèè äâóõ ïðèçíàêîâ X è Y
rxy =
ãäå
à sx , syq âûáîðî÷íûå
p
ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ sx = s2x , sy = s2y .
µ
âûáîðî÷íàÿ
µ
,
sx sy
êîâàðèàöèÿ,
Ñâîéñòâà êîýôôèöèåíòà êîððåëÿöèè
Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè âñåãäà èçìåíÿåòñÿ
â ïðåäåëàõ
−1 6 rxy 6 1.
Òåîðåìà.
Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè õàðàêòåðèçóåò òåñíîòó
ñâÿçè ìåæäó ïðèçíàêàìè. Îöåíêîé òàêîé òåñíîòû çàäà÷à
êîððåëÿöèîííîãî àíàëèçà.
Åñëè rxy = 0, òî ëèíåéíóþ ñâÿçü ìåæäó ïðèçíàêàìè óñòàíîâèòü
íåâîçìîæíî, ëèíèè ðåãðåññèè èäóò ïîä ïðÿìûì óãëîì äðóã ê äðóãó,
ïðè÷åì îäíà ãîðèçîíòàëüíî, äðóãàÿ âåðòèêàëüíî. Ïîëå êîððåëÿöèè
ïî÷òè ðàâíîìåðíî çàïîëíÿåò ïðÿìîóãîëüíèê.
Åñëè çíà÷åíèå rxy áëèçêî ê ±1, òî ñ÷èòàåòñÿ, ÷òî ìåæäó ïðèçíàêàìè
èìååòñÿ ïî÷òè ëèíåéíàÿ ñâÿçü, à çíàê êîýôôèöèåíòà êîððåëÿöèè
ãîâîðèò î òîì, êàê âåäåò ñåáÿ îäèí ïðèçíàê ïðè èçìåíåíèè äðóãîãî.
Ïðè rxy > 0 îíè âîçðàñòàþò èëè óáûâàþò îäíîâðåìåííî, à ïðè rxy < 0
ïðè âîçðàñòàíèè îäíîãî èç íèõ âòîðîé óáûâàåò, è íàîáîðîò.
Êîíòðîëüíûå âîïðîñû
1. Àíàëîãèÿ
ÄÑÂ
è
âûáîðîê
(ñîñòàâèòü
ñðàâíèòåëüíóþ
òàáëèöó).
2. Âèäû çàâèñèìîñòåé ìåæäó ÑÂ (âûáîðêàìè).
3. Äâîéíîé
ñòàòèñòè÷åñêèé
ðÿä
è
ëèíèÿ
ðåãðåññèè
äëÿ
ôóíêöèîíàëüíîé çàâèñèìîñòè.
4. Êðèòåðèé êà÷åñòâà â ìåòîäå íàèìåíüøèõ êâàäðàòîâ.
5. Êîâàðèàöèÿ
äâóõ
ñëó÷àéíûõ
âåëè÷èí.
Ôîðìóëà
äëÿ
ôóíêöèîíàëüíîé çàâèñèìîñòè.
6. Ðåãðåññèîííûé àíàëèç. Ñîâìåñòíûé çàêîí ðàñïðåäåëåíèÿ.
Âû÷èñëåíèå ìàòåìàòè÷åñêèõ îæèäàíèé.
7. Êîððåëÿöèîííàÿ òàáëèöà è ïîëå êîððåëÿöèè.
8. Êîâàðèàöèÿ äëÿ êîððåëÿöèîííîé çàâèñèìîñòè.
9. Ëèíèè ðåãðåññèè äëÿ êîððåëÿöèîííîé çàâèñèìîñòè.
10. Êîýôôèöèåíò êîððåëÿöèè, åãî ñâîéñòâà è ñìûñë.
Download