статью - Прикладная эконометрика

реклама
Ý. Á. Åðøîâ
Âûáîð ðåãðåññèè, ìàêñèìèçèðóþùèé íåñìåùåííóþ îöåíêó
êîýôôèöèåíòà äåòåðìèíàöèè
Ïîëó÷åíà ôîðìà íåñìåùåííîé îöåíêè êîýôôèöèåíòà äåòåðìèíàöèè äëÿ ëèíåéíîãî
óðàâíåíèÿ ðåãðåññèè, âû÷èñëÿåìàÿ ïî âûáîðî÷íûì äàííûì èç ìíîãîìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ýòó îöåíêó ïðåäëàãàåòñÿ ïðèìåíÿòü êàê àëüòåðíàòèâíûé êðèòåðèé âûáîðà ôàêòîðîâ â ðåãðåññèè.
1. Введение
áùåèçâåñòåí âàðèàíò èñõîäíûõ ïðåäïîëîæåíèé ìåòîäà íàèìåíüøèõ êâàäðàòîâ
(ÌÍÊ), ïðè êîòîðîì èñïîëüçóåìûå çíà÷åíèÿ îáúÿñíÿåìîé ïåðåìåííîé y è ôàêòîðîâ
x1 ,... , xm â ðåãðåññèè ïîðîæäàþòñÿ âûáîðêîé èç ìíîãîìåðíîãî íåâûðîæäåííîãî
íîðìàëüíîãî ðàñïðåäåëåíèÿ. Âìåñòî åãî íåèçâåñòíûõ ïàðàìåòðîâ èñïîëüçóþòñÿ èõ îöåíêè,
âû÷èñëÿåìûå ïî âûáîðî÷íûì äàííûì.
Íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà y, ïîëó÷àåìàÿ ïðè ôèêñèðîâàííûõ çíà÷åíèÿõ ôàêòîðîâ x1 ,... , xm , ïðåäñòàâèìà â âèäå
Î
m
y = a 0 + å x j a j + e,
(1)
j =1
ãäå êîýôôèöèåíòû a 0 ,... , am — èçâåñòíûå ôóíêöèè îò ïàðàìåòðîâ çàêîíà ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû ( y , x1 ,... , xm ) è e — íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ íóëåâîå ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèþ s 2e , íå çàâèñÿùóþ îò çíà÷åíèé ôàêòîðîâ
x1 ,... , xm .
Õàðàêòåðèñòèêà Â 2 º Â 2 ( y ; x1 ,... , xm ), íàçûâàåìàÿ êîýôôèöèåíòîì äåòåðìèíàöèè, îïðåäåëÿåòñÿ ôîðìóëîé
 2 º 1- s 2e s 2 ( y ),
ãäå s 2 ( y ) — äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû y. Ïîêàçàòåëü  2 çàâèñèò îò ôàêòîðîâ x1 ,... , xm ,
íî íå îò èõ çíà÷åíèé, ò.å. õàðàêòåðèçóåò ñâÿçü ìåæäó y è ôàêòîðàìè.
Ïî äàííûì âûáîðêè, ñîñòîÿùåé èç íàáëþäåíèé ( ~
y k ;~
x k 1 ,... , ~
x km ), k = 1,... , n, c ïîìîùüþ
$
ÌÍÊ íàõîäÿòñÿ îöåíêè a j , j = 0 , 1, ... , m, êîýôôèöèåíòîâ â (1), ÌÍÊ-îñòàòêè e$ k , îöåíêè
1
1
y ) = å (~
y k -~
y )2 è s2 (~
y;~
x1 , ... , ~
xm ) = å e$ k2 äèñïåðñèé s 2 ( y ) è s 2e , à çàòåì âûáîðî÷íîå
s2 (~
n k
n k
2 ~ ~
2 ~ ~
~
~
çíà÷åíèå R ( y ; x ,... , x ) = 1-s ( y ; x ,... , x ) s 2 ( ~
y ) êîýôôèöèåíòà äåòåðìèíàöèè. Ïðè çà1
m
1
m
äàííîì íàáîðå { x1 , ... , x M } ïîòåíöèàëüíûõ ôàêòîðîâ âûáîð íàáîðà { x i (1) , ... , x i (m ) } àðãóìåíòîâ
n
îáû÷íî ñâîäÿò ê ìèíèìèçàöèè íåñìåùåííîé îöåíêè
s2 (~
y;~
x1 , ... , ~
xm ) äèñïåðñèè s 2e èëè
n-p
ê ìàêñèìèçàöèè ñòàòèñòèêè
R Теория и методология
71
n -1
2
,
R 2 ( ~y ; ~
x 1, ..., ~
x m ) º R 2 º R adj
º 1- [ 1- R 2 ( ~y ; ~
x 1, ..., ~
x m )]
n- p
(2)
ãäå p = (m + 1) — ÷èñëî îöåíèâàåìûõ êîýôôèöèåíòîâ â (1). Ñòàòèñòèêó R 2 íàçûâàþò âûáîðî÷íûì êîýôôèöèåíòîì äåòåðìèíàöèè, ñêîððåêòèðîâàííûì íà ÷èñëî ñòåïåíåé ñâîáîäû.
Ïðèâåäåííûå îïðåäåëåíèÿ âêëþ÷àþòñÿ â ó÷åáíèêè ïî ìíîãîìåðíîìó ñòàòèñòè÷åñêîìó àíàëèçó è ýêîíîìåòðèêå. Ìåíåå èçâåñòíî, ÷òî ìàòåìàòè÷åñêèå îæèäàíèÿ ER 2 è ER 2
ñòàòèñòèê R 2 è R 2 íå ðàâíû  2 . Ýòî âàæíî, ïîñêîëüêó âûáîð ôàêòîðîâ íå äîëæåí áûòü îðèåíòèðîâàí òîëüêî íà îáåñïå÷åíèå íàèáîëüøåé áëèçîñòè âûðaâíåííûõ çíà÷åíèé
m
y$k = a$ 0 + å xk j a$ j , k = 1, ... , n, ïåðåìåííîé y ê âûáîðî÷íûì çíà÷åíèÿì y k , òàê êàê óðàâj =1
m
íåíèå y$ = a$ 0 + å x j a$ j èñïîëüçóåòñÿ è ïðè äðóãèõ çíà÷åíèÿõ ôàêòîðîâ.  ñâÿçè ñ ýòèì ââîВыбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
j =1
äÿòñÿ ðàçëè÷íûå êðèòåðèè âûáîðà ôàêòîðîâ, èñïîëüçóþùèå ïðåäïîëîæåíèÿ î ãåíåðàëüíîé
ñîâîêóïíîñòè ïåðåìåííûõ y , x1 , ... , x M , íàïðèìåð î íîðìàëüíîñòè ñîîòâåòñòâóþùåãî ðàñïðåäåëåíèÿ. Ïðè òàêîì ïðåäïîëîæåíèè ïîêàçàòåëü Â 2 åñòåñòâåííî ðàññìàòðèâàòü êàê õàðàêòåðèñòèêó îöåíèâàåìîé ðåãðåññèè è, âûáèðàÿ ôàêòîðû, ìàêñèìèçèðîâàòü åå íåñìåùåííóþ îöåíêó.
2. Несмещенная оценка коэффициента детерминации Â 2 ,
ее аппроксимации и заменители
Óèøàðò [Wishart (1931)] ïîêàçàë, ÷òî ER 2 è Â 2 ñâÿçàíû ñîîòíîøåíèåì [Êåíäàëë, Ñòüþàðò
(1973), ñ. 454]
ER 2 = 1-
n- p
( 1- Â 2 ) F( 1; 1; 0,5( n + 1); Â 2 ).
n -1
(3)
Çäåñü F (a ; b ; g ; z ) — ñïåöèàëüíàÿ ãèïåðãåîìåòðè÷åñêàÿ ôóíêöèÿ, îïðåäåëÿåìàÿ â âèäå
ðÿäà [Ãðàäøòåéí, Ðûæèê (1962), ñ. 1053]
a ( a + 1)( a + 2 ) b( b + 1)( b + 2 ) z
abz a ( a + 1) b( b + 1) z
+ ... ,
+
+
1×2 ×3 × g ( g + 1)( g + 2 )
1× g
1×2 × g ( g + 1)
2
F( a ; b ; g ; z ) = 1+
3
(4)
ñõîäÿùåãîñÿ àáñîëþòíî è ðàâíîìåðíî âíóòðè åäèíè÷íîãî êðóãà äëÿ êîìïëåêñíîé ïåðåìåííîé z, åñëè g ¹ 0 , -1, -2, ... . Äëÿ äàëüíåéøåãî âàæíî, ÷òî ôóíêöèÿ F (a ; b ; g ; z ) äåéñòâèòåëüíîé ïåðåìåííîé z ïðè z ³ 0 è ïîëîæèòåëüíûõ a , b , g ÿâëÿåòñÿ âîçðàñòàþùåé, à òàêæå òî, ÷òî
ôîðìóëà (3) íå ïîçâîëÿåò íàõîäèòü ER 2 ïî äàííûì âûáîðêè, òàê êàê ñâÿçûâàåò íåèçâåñòíûå
äåòåðìèíèðîâàííûå âåëè÷èíû  2 è ER 2 .
Âàæíåéøèé ðåçóëüòàò áûë ïîëó÷åí Îëêèíûì è Ïðýòòîì [Olkin, Pratt (1958)], íàøåäøèìè
~
~
îïðåäåëåííóþ ïðè n > p ³ 3 ñòàòèñòèêó R 2 ( ~
y;~
x1, ... , ~
x m ) º R 2 [Êåíäàëë, Ñòüþàðò (1973),
ñ. 456]:
n -3
~2
R = 1( 1- R 2 ) F( 1; 1; 0,5( n - p ) + 1; 1- R 2 ),
n- p
(5)
ïðåäñòàâëÿþùóþ ñîáîé íåñìåùåííóþ îöåíêó äëÿ Â 2 ( y ; x1 , ... , xm ).
72
Теория и методология R
p -3
2( n - 3 )
~2
R = R2 ( 1- R 2 ) ( 1- R 2 ) 2 - O ( n-2 ).
n- p
( n - p )( n - p + 2 )
»
Òàêèì îáðàçîì, â ðàññìîòðåíèå ââîäèòñÿ ñòàòèñòèêà R 2 :
»
R2= R2 -
p -3
2( n - 3 )
( 1- R 2 ) ( 1- R 2 ) 2 ,
n- p
( n - p )( n - p + 2 )
(6)
êîòîðóþ â [Àéâàçÿí è äð. (1985), ñ. 284] ïðåäëàãàåòñÿ
ïðèìåíÿòü êàê êðèòåðèé êà÷åñòâà ðåã»
ðåññèè. Èç îïðåäåëåíèé ñòàòèñòèê R 2 è R 2 ñëåäóåò, ÷òî ïðè áëèçêèõ ê íóëþ çíà÷åíèÿõ R 2 îíè
ïðèíèìàþò îòðèöàòåëüíûå çíà÷åíèÿ. Ýòî æå ñâîéñòâî îòìå÷àåòñÿ â [Êåíäàëë, Ñòüþàðò
~
(1973), ñ. 456–457] è äëÿ R 2 .
»
~
Ñðàâíèì çíà÷åíèÿ ðàññìàòðèâàåìûõ ñòàòèñòèê R 2 , R 2 , R 2 è R 2 , íå âû÷èñëÿÿ èõ, íî ó÷èòûâàÿ, ÷òî 0 < R 2 < 1, n > p ³ 3 è F º F (1; 1; 0 , 5(n - p ) + 1; 1- R 2 ) > 1. Èç (2), (5) è (6) ïîëó÷àåì
»
»
p -1
~
R2 -R 2 =
(1- R 2 ) > 0, R 2 - R 2 > 0 , R 2 - R 2 > 0, ò. å.
n-p
»
~2
R £ max( R 2 ; R 2 ) < R 2 .
»
»
»
»
Ïîêàæåì, ÷òî äëÿ ñòàòèñòèê R 2 è R 2 âîçìîæíû ñëó÷àè R 2 < R 2 , R 2 > R 2 è R 2 = R 2 , è íàéäåì
ìíîæåñòâà çíà÷åíèé âåëè÷èí n, p è R 2 , ïðè êîòîðûõ ýòè ñëó÷àè èìåþò ìåñòî.
Èñïîëüçóÿ îïðåäåëåíèÿ, ïðåäñòàâèì ðàçíîñòü ýòèõ ñòàòèñòèê â âèäå
R 2 - R 2 = 2( 1- R 2 )
( n - p + 2 )( n - p + 4 ) - ( n - 3 )( 1- R 2 )[( n - p + 4 ) + 4(1- R 2 )]
.
( n - p )( n - 3 )( n - p + 2 )( n - p + 4 )
Ïðè ôèêñèðîâàííûõ çíà÷åíèÿõ n è p èññëåäóåì íåîïðåäåëåííîå íåðàâåíñòâî
f ( y ) º 4( n - 3 ) y 2 + ( n - 3 )( n - p + 4 ) y - ( n - p + 2 )( n - p + 4 ) Ú 0,
â êîòîðîì ïåðåìåííàÿ y = (1- R 2 ) óäîâëåòâîðÿåò íåðàâåíñòâó0 £ y £ 1. Î÷åâèäíî, ÷òî óðàâíåíèå f ( y ) = 0 èìååò êîðíè y- , y+ ðàçíûõ çíàêîâ, íåðàâåíñòâî f ( y ) £ 0 âûïîëíÿåòñÿ ïðè
0 £ y £ min(1; y ). Èìååì min(1; y+ ) = y+ , åñëè f (1) > 0, íî min(1; y+ ) = 1, åñëè f (1) £ 0.
Òàêèì îáðàçîì, íåîáõîäèìî èññëåäîâàòü íåðàâåíñòâîf (1) = [ 4 (n -3 ) + (n -3 )(n - p + 4 ) -(n - p + 2)(n - p + 4 )] Ú 0, ó÷èòûâàÿ, ÷òî ïàðàìåòðû n è p óäîâëåòâîðÿþò óñëîâèþ n > p ³ 3.
Ââåäÿ íåîòðèöàòåëüíóþ ïåðåìåííóþ x = (n - p - 1) ³ 0, ïðåäñòàâèì íåðàâåíñòâî f (1) Ú 0
â âèäå ( x + p - 2)( x + 9 ) -( x + 3 )( x + 5) º ( p + 1)(n - p + 1) -33 Ú 0 èëè n Ú [( p + 1) + 33 ( p + 1)] º
ºh( p ).
R Теория и методология
73
Э. Б. Ершов
Ñâîéñòâà ôóíêöèè F (1; 1; g ; z ) ïåðåìåííîé z ïðè 0 £ z £ 1, y = 0 , 5(n - p ) + 1 èçâåñòíû:
F(1; 1; g ; 0 ) = 1; ïðè 0 £ z < 1 ðÿä (4) ñõîäèòñÿ, a ïðè z = 1 ðàñõîäèòñÿ, åñëè n - p = 1èëè 2,
è ñõîäèòñÿ, åñëè n - p ³ 3 [Ãðàäøòåéí, Ðûæèê (1962), ñ. 1054].
~
Ñòàòèñòèêà R 2 äî íàñòîÿùåãî âðåìåíè, íàñêîëüêî íàì èçâåñòíî, íå èñïîëüçîâàëàñü,
ïî-âèäèìîìó, èç-çà ïðèçíàíèÿ ïðàêòè÷åñêè íåâîçìîæíûì èëè íåöåëåñîîáðàçíûì âû÷èñëÿòü çíà÷åíèÿ F (1; 1; 0 , 5q; z ) ïðè öåëûõ q è 0 < z < 1.
~
 ýòèõ óñëîâèÿõ ìîæíî âîñïîëüçîâàòüñÿ àïïðîêñèìàöèåé äëÿ R 2 , ïîëó÷àåìîé èç (5) ïðè
áîëüøîì ÷èñëå íàáëþäåíèé.  [Êåíäàëë, Ñòüþàðò (1973), ñ. 456] ïðåäëàãàåòñÿ èñïîëüçîâàòü
~
ïåðâûå ÷ëåíû ðàçëîæåíèÿ R 2 â ðÿä
Ðàññìîòðèì òðè ñëó÷àÿ äëÿ ïàð (p; n) ïàðàìåòðîâ, õàðàêòåðèçóþùèõ ðåãðåññèþ, — ÷èñëà
íàáëþäåíèé â âûáîðêå (n) è ÷èñëà îöåíèâàåìûõ êîýôôèöèåíòîâ ( p = m + 1.)
Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
»
»
1. Åñëè n h(p), òî f(1) 0. Ñëåäîâàòåëüíî, f ( y ) º ( R 2 - R 2 ) < 0 ïðè 0 £ (1- R 2 ) < y+ è R 2 > R 2
ïðè y+ < (1- R 2 ) £ 1, ãäå y+ — ïîëîæèòåëüíûé êîðåíü óðàâíåíèÿ f(y) = 0. Òàêèå ïàðû (p; n)
áóäåì íàçûâàòü ïàðàìè òèïà À. Äëÿ íèõ, ò. å. äëÿ äîñòàòî÷íî áîëüøîãî ÷èñëà íàáëþäåíèé,
ïðè á î ë ü ø è õ çíà÷åíèÿõ êîýôôèöèåíòà äåòåðìèíàöèè R 2 ñêîððåêòèðîâàííûé íà ÷èñëî
ñòåïåíåé ñâîáîäû êðèòåðèé R 2 ç à â û ø à å ò »îöåíêó êà÷åñòâà ðåãðåññèè ïî ñðàâíåíèþ ñ àïïðîêñèìèðóþùèì ñòàòèñòèêó  2 êðèòåðèåì R 2 . Îäíàêî ïðè ì à ë û õ R 2 òàêàÿ îöåíêà êà÷åñòâ
à çàíèæàåòñÿ.
2. Ïðè íåáîëüøîì ÷èñëå íàáëþäåíèé n, óäîâëåòâîðÿþùåì
íåðàâåíñòâó ( p + 1) £ n < h( p ),
»
ò. å. äëÿ ïàð òèïà B, èìååì f (1) < 0 è f ( y ) º ( R 2 - R 2 ) < 0 äëÿ âñåõ âîçìîæíûõ çíà÷åíèé R 2 ,
ò. å. ïðè 0 < R 2 < 1, è êðèòåðèé R 2 õàðàêòåðèçóåò ðåãðåññèþ, ï ð å ó â å ë è ÷ è â à ÿ îöåíêó åå
êà÷åñòâà.
3.  îñîáîì ñëó÷àå, êîãäà n = h( p ), ñ ó÷åòîì îãðàíè÷åíèÿ n > p ³ 3 ñóùåñòâóþò âñåãî äâà
çíà÷åíèÿ
p = 10 è p = 32, ïðè êîòîðûõ 33 ( p + 1) è h(p) — öåëûå ÷èñëà. Òàêèì îáðàçîì,
»
2
2
R = R òîëüêî ïðè p = 10, m = 9, n = 14 èëè ïðè p = 32, m = 31, n = 34, ò. å. â äâóõ èñêëþ÷èòåëüíûõ è íåèíòåðåñíûõ äëÿ ïðèëîæåíèé ñëó÷àÿõ.
Äëÿ ëþáîãî p çíà÷åíèÿ n, îáðàçóþùèå ïàðû ( p; n) ýòèõ òèïîâ, ëåãêî íàõîäÿòñÿ. Òàê, ïðè
p = 3 À-ìíîæåñòâî ïàð ( p; n) = (3; n) çàäàåòñÿ íåðàâåíñòâîì 12 £ n, à B-ìíîæåñòâî ïðåäñòàâëÿåòñÿ â âèäå (3; n), n Î { 4 ; 5; 6 ; 7 ; 8 ; 9 ; 10 ; 11}. Íàïðèìåð, ïðè p = 7 òàêèìè ìíîæåñòâàìè çíà÷åíèé äëÿ n ñîîòâåòñòâåííî áóäóò 12 £ n è n Î { 8 ; 9 ; 10 ; 11}. Çàìåòèì, ÷òî ïðè
p ³ 33 A-ìíîæåñòâà çàäàþòñÿ íåðàâåíñòâàì è ( p + 2) £ n , à B-ìíîæåñòâà «âûðîæäàþòñÿ»
â ( p ; n ) º ( p ; p + 1.)
»
~
Ïðèâåäåííûé àíàëèç íåðàâåíñòâà R 2 £ max( R 2 ; R 2 ) < R 2 ïîêàçûâàåò, ÷òî ïðè R 2 < 1
»
ñòàòèñòèêè
R 2 , R 2 , R 2 ñìåùåíû îòíîñèòåëüíî Â 2 çàâåäîìî ïîëîæèòåëüíî, à äëÿ êðèòåðèåâ
»
R 2 è R 2 õàðàêòåð òàêîãî ñìåùåíèÿ çàâèñèò îò ïàðàìåòðîâ p, n è ñòàòèñòèêè R 2 . Ïîýòîìó öåëåñîîáðàçíî ïðîäîëæèòü ïîèñê äðóãèõ ïîäõîäîâ ê êîíñòðóèðîâàíèþ íà îñíîâå ñòàòèñòèêè R 2
êðèòåðèåâ êà÷åñòâà ðåãðåññèé.
 [Àéâàçÿí è äð. (1985), ñ. 190–192] áûëî ïðåäëîæåíî ïðè âûáîðå ðåãðåññîðîâ ìàêñèìè2
2
çèðîâàòü íå R 2 , à òàê íàçûâàåìóþ íèæíþþ ãðàíèöó Rmin,
P äëÿ Â ïðè çàäàâàåìîé äîâåðè2
òåëüíîé âåðîÿòíîñòè P. Ñòàòèñòèêà Rmin, P îïðåäåëÿëàñü ïðè óïðîùàþùåì ïðåäïîëîæå2
íèè î ïðîïîðöèîíàëüíîñòè ðàçíîñòè ( R 2 - Rmin,
P ) àñèìïòîòè÷åñêîé (ïðè áîëüøèõ n) îöåíêå
2
ñðåäíåêâàäðàòè÷åñêîé îøèáêè ñëó÷àéíîé âåëè÷èíû R 2 . Êðèòåðèé Rmin,
P çàäàâàëñÿ ôîðìóëîé
2
2
2
Rmin,
P = R - l( P )( 1- R )
2( p - 1)( n - p )
.
( n - 1) 2 ( n + 1)
(7)
Çíà÷åíèå ìíîæèòåëÿ l( P ) ïðåäëàãàëîñü âûáèðàòü â çàâèñèìîñòè îò P. Îäíàêî ôóíêöèÿ
l( P ) íå ïîääàåòñÿ èäåíòèôèêàöèè, è âîñïîëüçîâàòüñÿ ôîðìóëîé (7) ïðè îãðàíè÷åííîì, à òåì
áîëåå ïðè ìàëîì ÷èñëå íàáëþäåíèé íåâîçìîæíî. Çíà÷åíèå êîýôôèöèåíòà l( P ) ïðèõîäèòñÿ
çàäàâàòü, èñõîäÿ èç ïðàãìàòè÷åñêèõ ñîîáðàæåíèé.
74
Теория и методология R
é 2( p - 1)( n - p ) ù
2
Rmin
= R 2 - 2( 1- R 2 ) ê
ú
êë ( n - 1) 2 ( n + 1) úû
0 ,5
.
(8)
Ýòà ñòàòèñòèêà òàêæå íàçûâàåòñÿ íèæíåé äîâåðèòåëüíîé ãðàíèöåé (òî÷íåå, åå îöåíêîé) äëÿ
 2 , íî áåç óïîìèíàíèÿ çàäàâàåìîé äîâåðèòåëüíîé âåðîÿòíîñòè.
~
~
2
2
Ñðàâíèì çíà÷åíèÿ ñòàòèñòèê R 2 è Rmin
. Äëÿ ðàçíîñòè ( R 2 - Rmin
), èñïîëüçóÿ (5), (8) è íåðàâåíñòâî n > p ³ 3, ïîëó÷àåì
0 ,5
ìï ( n - 1) - ( n - 3 ) F
é 2( p - 1)( n - p ) ù ü
ï
~2
2
ï
R - Rmin
= ( 1- R 2 )ïí
+ 2ê
ú
ý,
2
ïï
ï
ê
ú
(
)
(
n+
)
n
p
n
1
1
ë
û
ï
î
þ
ãäå, êàê è ïðåæäå, F º F (1; 1; 0 , 5(n - p ) + 1; 1- R 2 ). Èç (5) íàõîäèòñÿ ñëåäóþùàÿ ôîðìóëà äëÿ
~
(n - 3 )F (n - p ): (n - 3 )F (n - p ) = (1- R 2 ) (1- R 2 ) ³ 1. Òîãäà ïðè R 2 < 1 èìååì
0 ,5
0 ,5
~
ì
ì n -1
é 2( p - 1)( n - p ) ù ü
é 2( p - 1)( n - p ) ù ü
ï n - 1 1- R 2
ï
ï
~2
2
2 ï
ï
ï
ï
(
1
R
)
1
2
R - Rmin
= ( 1- R 2 )ï
+
2
>
+
ê
ê
ú
ú
í
ý
í
ý=
2
2
2
ï
ï
ï
ï
ê
ê
ú
ú
(
)
(
n
+
1
)
n
p
n
p
1
R
n
1
(
n
)
(
n
+
)
1
1
ë
ë
û
û
ï
ï
ï
ï
î
þ
î
þ
0 ,5
ü
ìï p - 1
é
ù
2( p - 1)( n - p ) ï
= ( 1- R 2 )íï
+ 2ê
ú ï
ý > 0.
2
ïï n - p
ê
ë ( n - 1) ( n + 1) úû ï
ï
î
þ
~
2
è ñòàòèÑëåäîâàòåëüíî, äëÿ ìàòåìàòè÷åñêèõ îæèäàíèé ýòèõ ñòàòèñòèê èìååì ER 2 > ERmin
2
2
ñòèêà Rmin ñìåùåíà îòíîñèòåëüíî  , ÷òî è ñëåäîâàëî îæèäàòü, ó÷èòûâàÿ èõ îïðåäåëåíèÿ.
~
2
 òî æå âðåìÿ èç îïðåäåëåíèé (5) è (8) äëÿ R 2 è Rmin
ñëåäóåò, ÷òî ñ ðîñòîì n èõ çíà÷åíèÿ ñáëè2
æàþòñÿ, ñòðåìÿñü ê R . Îäíàêî ïðè îãðàíè÷åííîì ÷èñëå íàáëþäåíèé ýêâèâàëåíòíîñòü ïðè~
2
ìåíåíèÿ êðèòåðèåâ Rmin
è R 2 â çàäà÷å âûáîðà ðåãðåññèé ïî ìåíüøåé ìåðå íå î÷åâèäíà. Ïî~
ýòîìó ïðîàíàëèçèðóåì âîçìîæíîñòü ýôôåêòèâíîãî âû÷èñëåíèÿ íåñìåùåííîé îöåíêè R 2
äëÿ Â 2 .
~
3. Эффективно вычисляемая форма представления статистики R 2
~
×òîáû îöåíêà R 2 äëÿ  2 ìîãëà ïðèìåíÿòüñÿ â êà÷åñòâå êðèòåðèÿ âûáîðà ìíîæåñòâà ðåãðåññîðîâ, äîñòàòî÷íî èìåòü âîçìîæíîñòü âû÷èñëÿòü çíà÷åíèÿ ôóíêöèè F (1; 1; g ; z ) ïðè
g = 0 , 5(n - p ) + 1 è 0 £ z = (1- R 2 ) £ 1. Ýòî ìîæíî ñäåëàòü ñëåäóþùèìè ñïîñîáàìè.
 î - ï å ð â û õ, ýòî çíà÷åíèå ìîæíî ðàññ÷èòûâàòü, èñïîëüçóÿ îïðåäåëåíèå (4) äëÿ ôóíêöèè F.
Òîãäà
¥
ü
ìï
k !( 1- R 2 ) k
ï
n -3
~2
ï
R = 1( 1- R 2 )ïí1+ ( 1- R 2 ) å
ý.
ï
ïïî
n- p
(
)
(
k
)
g
g
L
g
+
1
+
k=0
ï
þ
(5’)
Îäíàêî òàêîé ñïîñîá ìîæåò áûòü ñëîæåí äëÿ ðåàëèçàöèè èç-çà íåîáõîäèìîñòè âû÷èñëÿòü
çíà÷åíèÿ êîýôôèöèåíòîâ ïðè z k = (1- R 2 ) k .
 î - â ò î ð û õ, ìîæíî âîñïîëüçîâàòüñÿ ïðåäñòàâëåíèåì ôóíêöèè F (1; 1; g ; z ) â âèäå îïðåäåëåííîãî èíòåãðàëà [Ãðàäøòåéí, Ðûæèê (1962), ôîðìóëà (9.111)]:
R Теория и методология
75
Э. Б. Ершов
2
 ðàçâèòèå èäåè, íà êîòîðîé îñíîâûâàëîñü ââåäåíèå ñòàòèñòèêè Rmin,
P , â [Àéâàçÿí, Ìõèòà~2
ðÿí (1998), ñ. 420, 663, 664] ââåäåí çàìåíÿþùèé ñòàòèñòèêó R , ïðîñòî âû÷èñëÿåìûé, ìàêñè2
ìèçèðóåìûé ïîêàçàòåëü êà÷åñòâà ðåãðåññèè Rmin
:
F( 1; 1; g ; z ) =
1
g( g ; z )
1
( 1- u ) g- 2
.
du º
ò
B ( 1; g - 1) 0 1- uz
B ( 1; g - 1)
(9)
Çíà÷åíèå áåòà-ôóíêöèè B (1; g-1)ºB (1; 0 , 5(n -p )) ëåãêî âû÷èñëÿåòñÿ: B (1; g -1)=Ã(1)Ã(g -1) Ã(g ),
¥
ãäå Ã( x + 1) = ò e - t t x dt — ãàììà-ôóíêöèÿ, Ã(1) = 1, Ã(x + 1) = x Ã(x) è B(1; g -1) = 2 (n - p ). Îïðå0
äåëåííûé èíòåãðàë g( g ; z ) ìîæåò âû÷èñëÿòüñÿ ìåòîäàìè ÷èñëåííîãî èíòåãðèðîâàíèÿ. Êîìáèíèðóÿ ôîðìóëû (5) è (9) è ïåðåõîäÿ ê ïåðåìåííîé t = (1- u ), ïîëó÷àåì èíòåãðàëüíîå ïðåä~
ñòàâëåíèå ñòàòèñòèêè R 2 :
1
Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
t 0 , 5( n- p )-1
~2
R = 1- 0,5( n - 3 ) ò
dt ,
c+t
0
(5’‘)
ãäå c = R 2 (1- R 2 ) è R 2 ¹ 1.
Çàìåòèì, ÷òî ñ ïîìîùüþ (9) âû÷èñëÿåòñÿ çíà÷åíèå F (1; 1; 0 , 5(n - p ) + 1; 1), ïîëó÷àåìîå ïðè
R 2 = 0, òàê êàê
1
1
g( g ; 1) = ò ( 1- u ) g- 3 du = ò t g- 3dt è g - 3 = 0,5( n - p - 4 ).
0
0
Åñëè n = p + 1, òî g - 3 = -15
, ,
Åñëè n = p + 2, òî g - 3 = -1,
òt
òt
g-3
g-3
dt = -2t -0 , 5 è g( g ; 1) = +¥.
dt = ln t è g( g ; 1) = +¥.
1
Åñëè n ³ p + 3, òî ò t g-3 dt = 2 (n - p - 2).
0
Òàêèì îáðàçîì, ïðè ìèíèìàëüíîì çíà÷åíèè R 2 = 0 ñòàòèñòèêè R 2 ïîëó÷àåì
p -1
ì
ï
ïðè n ³ p + 3 ;
ï
n -3
~2
ï
R ( 0 ) º 1F( 1; 1; 0,5( n - p ) + 1; 1) = í n - p - 2
ï
n- p
ï
ïðè n = p + 1 èëè p + 2.
ï
î-¥
(10)
 - ò ð å ò ü è õ, ôóíêöèÿ g( g ; z ) ïðè g = 0 , 5(n - p ) + 1ïðåäñòàâèìà â âèäå ñóììû êîíå÷íîãî
÷èñëà ñëàãàåìûõ, ÿâëÿþùèõñÿ èçâåñòíûìè ôóíêöèÿìè àðãóìåíòîâ (n - p ) è z = (1- R 2 ). Âîçìîæíîñòü ïîëó÷åíèÿ òàêîãî ïðåäñòàâëåíèÿ äî íàñòîÿùåãî âðåìåíè, ïî-âèäèìîìó, íå áûëà
çàìå÷åíà.
Äëÿ íàõîæäåíèÿ îïðåäåëåííîãî èíòåãðàëà â ôîðìóëå (9) c ïàðàìåòðîì ( g - 2) =
= 0 , 5(n - p ) - 1, ïðèíèìàþùèì çíà÷åíèÿ {–0,5; 0; +0,5; 1; ...} ïð è n - p = 1, 2, ... , ââåäåì ïåðåìåííóþ z = (1- R 2 ). Ïðåäïîëàãàÿ, ÷òî R 2 < 1 è c = (1- z ) z = R 2 (1- R 2 ), ðàññìîòðèì ñëåäóþùèå ñëó÷àè äëÿ g( g ; z ):
· Ïðè n - p = 2 èìååì
1
g( g ; z ) =
76
1
1
1
dt = ln( 1+ c -1 ).
ò
z 0 c+t
z
Теория и методология R
g( g ; z ) =
1
ù
ck
1 t s- 0 , 5
1 é s -1
dt = ê å
+ ( -1) s ×2 c s- 0 , 5arctg( c -0 , 5 )ú .
ò
úû
z 0 c+t
z êë k = 0 s - k - 0,5
· Ïðè ÷ å ò í î ì n - p = 2( s + 1), s = 1, 2,... , èñïîëüçóÿ ôîðìóëó (2.153) èç [Ãðàäøòåéí, Ðûæèê (1962)], ïîëó÷àåì
g( g ; z ) =
1
ù
ts
1
1 é s -1 c k
dt = ê å
+ ( -1) s c s ln( 1+ c -1 )ú .
ò
úû
z 0 c+t
z êë k = 0 s - k
~
Ïðèâåäåííûå ôîðìóëû ïîçâîëÿþò ïðåäñòàâèòü ñòàòèñòèêó R 2 â âèäå
~2
R = 1- 0,5( n - 3 ) G( n - p ; c ),
ãäå ôóíêöèÿ G (n - p ; c ) îïðåäåëåíà ïðè 0 < c = R 2 (1- R 2 ), 0 < R 2 < 1, p = m + 1 ñëåäóþùèì
îáðàçîì:
s -1
G( n - p ; c ) = 2 å ( -1) k
k=0
ck
+ ( -1) s ×2 c s- 0 , 5arctg( c -0 , 5 ) º H1( s ; c ) + H 2( s ; c ), åñëè n - p = 2s + 1;
2( s - k ) - 1
(11)
s -1
G( n - p ; c ) = å ( -1) k
k=0
k
c
+ ( -1) s c s ln(1+ c -1) º H 3( s ; c ) + H 4 ( s ; c ),
s- k
åñëè n - p = 2( s + 1),
çäåñü s = 0 , 1, 2, ... .
Âû÷èñëåíèå çíà÷åíèé ìíîãî÷ëåíîâ H1(s; c) è H3(s; c) îò ïåðåìåííîé ñ ìîæåò ïðèâîäèòü
ê ïîòåðå òî÷íîñòè ïðè áîëüøèõ çíà÷åíèÿõ ñ, ò. å. ïðè R 2 » 1, ïîýòîìó äëÿ çíà÷åíèé ñ è R 2 âûäåëèì ñëåäóþùèå ñëó÷àè:
1) 0 £ R 2 £ 0 , 5, c £ 1, c -1 ³ 1;
2) 0 , 5 £ R 2 < 1, c ³ 1, c -1 £ 1.
Ïðè îòíîñèòåëüíî íåáîëüøèõ çíà÷åíèÿõ R 2 , ò. å. ïðè R 2 £ 0 , 5, öåëåñîîáðàçíî èñïîëüçîâàòü ôîðìóëû (11) äàæå ïðè áîëüøèõ çíà÷åíèÿõ (n – p), òàê êàê ñ £ 1.  ñëó÷àå R 2 ³ 0 , 5 âîñïîëüçóåìñÿ ðàçëîæåíèåì ôóíêöèé arctg x è ln(1 + x) â ñòåïåííûå ðÿäû:
¥
arctg x = å ( -1) k
k=0
¥
x 2 k +1
ïðè x 2 £ 1 è x º c -0 , 5 £ 1;
2k + 1
ln( 1+ x ) = å ( -1) k
k=0
k
x
k
(12)
ïðè - 1 < x £ 1 è x º c -1 £ 1.
Ñ ïîìîùüþ (12) ïîêàçûâàåòñÿ, ÷òî ìíîãî÷ëåíû H1(s; c) è H2(s; c) ðàâíû ñóììàì ñëàãàåìûõ
â ôóíêöèÿõ H3(s; c) è H4(s; c) ñîîòâåòñòâåííî, ñîäåðæàùèõ íåîòðèöàòåëüíûå ñòåïåíè ïåðåìåí-
R Теория и методология
77
Э. Б. Ершов
· Ïðè í å ÷ å ò í û õ çíà÷åíèÿõ ïàðàìåòðà n - p = 2s + 1, s = 1, 2,... , ïðèìåíÿÿ ôîðìóëû
(2.211) è (2.212) èç [Ãðàäøòåéí, Ðûæèê (1962)], íàõîäèì
íîé ñ. Òàêèì îáðàçîì, äëÿ G (n - p ; c ) ïðè R 2 ³ 0 , 5 ïîëó÷àåì îáùåå äëÿ ÷åòíûõ è íå÷åòíûõ çíà÷åíèé (n – p) ïðåäñòàâëåíèå â âèäå ñòåïåííîãî ðÿäà
¥
G( n - p ; c ) = 2 c -1 å ( -1) k ( 2 k + n - p ) -1c - k ,
k=0
Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
â êîòîðîì 0 £ c -1 = (1 R 2 ) - 1£ 1.
~
 èòîãå äëÿ ñòàòèñòèêè R 2 ïîëó÷àåì èñ÷åðïûâàþùåå âñå âîçìîæíûå ñëó÷àè ïðåäñòàâëåíèå â âèäå ôóíêöèè îò R 2 , ÷èñëà íàáëþäåíèé n è ÷èñëà êîýôôèöèåíòîâ p â óðàâíåíèè ðåãðåññèè (ïðåäïîëàãàåòñÿ, ÷òî n > p ³ 3, c = R 2 (1- R 2 ) è q — öåëàÿ ÷àñòü ÷èñëà
0 , 5(n - p - 1)):
ïìï-¥,
ïï
p -1
,
ïïn
p -2
ïï
é q -1
ù
ï
ck
~ 2 ïï1- ( n - 3 ) ê ( -1) k
+ ( -1) q c q- 0 , 5arctg( 1 R 2- 1)0, 5ú ,
R =í
å
ê k=0
ú
n-p -2 k -2
ïï
ë
û
ïï
q
1
k
é
ù
c
ïï1- ( n - 3 ) ê ( -1) k
+ ( -1) q c q ln( 1 R 2 ) 0 , 5 ú ,
ïï
êë å
úû
n - p -2k -2
k=0
ïï
1
,
ïî
åñëè R 2 = 0 è n = p + 1, p + 2 ;
åñëè R 2 = 0 è n ³ p + 3 ;
åñëè 0 < R 2 < 1 è n - p = 2 q + 1; (5’‘’)
åñëè 0 < R 2 < 1 è n - p = 2( q + 1);
åñëè R 2 = 1.
 ñëó÷àå åñëè 0 , 5 £ R 2 < 1è c ³ 1, ìîæíî òàêæå âîñïîëüçîâàòüñÿ ôîðìóëîé
¥
~2
R = 1- ( n - 3 ) c -1 å ( -1) k ( 2 k + n - p ) -1 c - k .
(5’‘’‘)
k=0
~
Ïðåäñòàâëåíèå (5’‘’), (5’‘’‘) ñòàòèñòèêè R 2 ïî ñðàâíåíèþ ñ (5’), èñïîëüçóþùèì êîýôôèöèåí2
k
òû k ! [g ( g + 1)... ( g + k )] ïðè (1- R ) , îòëè÷àåòñÿ ïðîñòîòîé ôîðìóë äëÿ êîýôôèöèåíòîâ ïðè
~
ñòåïåíÿõ ïåðåìåííûõ ñ è c -1 . Ìåòîä âû÷èñëåíèÿ ñòàòèñòèêè R 2 ïî ôîðìóëàì (5’‘’) ðåàëèçîâàí
ñîâìåñòíî ñ êàíä. ýêîí. íàóê Í. À. Òîëìà÷åâîé.
~
4. Примеры применения статистики R 2 при выборе наилучшей регрессии
Ïîäõîäû ê âûáîðó íàèëó÷øåé ðåãðåññèè â çàäà÷å ñ íåáîëüøèì ÷èñëîì ïîòåíöèàëüíûõ
ôàêòîðîâ â íàó÷íûõ ìîíîãðàôèÿõ è ó÷åáíèêàõ èëëþñòðèðóþòñÿ íà íåñêîëüêèõ ïîâòîðÿåìûõ
ïðèìåðàõ. Ýòî ïîçâîëÿåò ñðàâíèâàòü ðåçóëüòàòû, ïîëó÷àåìûå ñ èñïîëüçîâàíèåì ïîñòîÿííî
îáíîâëÿåìûõ èäåé è îáùèõ èñõîäíûõ äàííûõ. Íà äâóõ òàêèõ ïðèìåðàõ ïðîäåìîíñòðèðóåì
~
âîçìîæíîñòü ïðèìåíåíèÿ ñòàòèñòèêè R 2 .
4.1. Ïðèìåð Õàëüäà
 [Äðåéïåð, Ñìèò (1987)] è [Ñåáåð (1980)] äåòàëüíî àíàëèçèðóþòñÿ âñå âàðèàíòû ðåãðåññèé, áàçèðóþùèõñÿ íà äàííûõ èç [Woods et al. (1932)] è [Õàëüä (1956)]. Îáúÿñíÿåìàÿ ïåðåìåííàÿ y = ( y k ) â ýòîì ïðèìåðå — òåïëî, âûäåëÿþùååñÿ ïðè ïðîèçâîäñòâå öåìåíòà (êàëîðèÿ/ãðàìì), a x j = ( xk j ), j = 1,... , 4 (m = 4 ), — ïåðåìåííûå, õàðàêòåðèçóþùèå ñîäåðæàíèå
÷åòûðåõ âåùåñòâ â êëèíêåðå (â %) â 13 íàáëþäåíèÿõ (k = 1,... , n ; n = 13 ). Ôàêòîðû x j ïðèáëèæåííî ìóëüòèêîëëèíåàðíû, òàê êàê èõ ñóììû â êàæäîì íàáëþäåíèè áëèçêè ê 100. Âû-
78
Теория и методология R
(x1; x2), (x1; x4), (x1; x2; x3), (x1; x2; x4), (x1; x3; x4), (x2; x3; x4), (x1; x2; x3; x4).
»
~
2
Òàáëèöà 1 ñîäåðæèò çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 , Rmin
,»R 2 è R 2 äëÿ âñåõ 15 âàðèàíòîâ íàáîðà
~2
2
ôàêòîðîâ x1, ... , x4 .  ýòîì ïðèìåðå çíà÷åíèÿ ñòàòèñòèê R è R ïðèâîäÿòñÿ
ñ áî´ëüøèì ÷èñëîì
»
~
çíàêîâ äëÿ òîãî, ÷òîáû ñäåëàòü ÿâíûì âûïîëíåíèå íåðàâåíñòâà R 2 > R 2 . Îòîáðàííûå âàðèàíòû ÷åòêî âûäåëÿþòñÿ ñðåäè ðåãðåññèé ñ ôèêñèðîâàííûì ÷èñëîì ôàêòîðîâ. Ïðè ýòîì ðåã2
ðåññèè ñ îäíèì ôàêòîðîì ( m = 1, p = 2) óñòóïàþò ïî êðèòåðèÿì R 2 è Rmin
ðåãðåññèÿì-ïðåòåíäåíòàì.
Òàáëèöà 1
Çíà÷åíèÿ êðèòåðèåâ âûáîðà ðåãðåññèè, îñíîâàííûõ íà ôóíêöèÿõ îò ñòàòèñòèêè R 2 ,
äëÿ ïðèìåðà Õàëüäà
Ìàêñèìèçèðóåìûå êðèòåðèè
Íàáîð
ôàêòîðîâ
Ñòàòèñòèêà
R2
R
R
R
Ðàíã íàáîðà
ôàêòîðîâ*
(x1)
0,53395
0,49158
0,39421
—
—
—
(x2)
0,66627
0,63593
0,56620
—
—
—
(x3)
0,28587
0,22095
0,07175
—
—
—
2
R
2
min
~2
»2
(x4)
0,67454
0,64495
0,57696
—
—
—
(x1; x2)
0,97868
0,97441
0,96841
0,9786026
0,9786021
4
(x1; x3)
0,54817
0,45780
0,33051
0,5141412
0,5088098
11
(x1; x4)
0,97247
0,96697
0,95921
0,9723448
0,9723437
6
(x2; x3)
0,84703
0,81643
0,77333
0,8431252
0,8429443
9
(x2; x4)
0,68006
0,61607
0,52594
0,6630002
0,6612219
10
(x3; x4)
0,93529
0,92235
0,90412
0,9345918
0,9345785
8
(x1; x2; x3)
0,98228
0,97638
0,97058
0,9802529
0,9802526
2
(x1; x2; x4)
0,98234
0,97645
0,97067
0,9803097
0,9803094
1
(x1; x3; x4)
0,98128
0,97504
0,96891
0,9791304
0,9791300
3
(x2; x3; x4)
0,97282
0,96376
0,95486
0,9696507
0,9696495
7
(x1; x2; x3; x4)
0,98238
0,97356
0,96728
0,9778919
0,9778914
5
»
~
2
* Ïðèâåäåíû ðàíãè ðåãðåññèé, äëÿ êîòîðûõ îïðåäåëåíû ñòàòèñòèêè R 2, Rmin
, R 2 è R 2 . Ðàíãè ïðèñâàèâàþòñÿ â
ñîîòâåòñòâèè ñ óáûâàíèåì çíà÷åíèé ëþáîãî èç êðèòåðèåâ.
R Теория и методология
79
Э. Б. Ершов
áîðî÷íûå çíà÷åíèÿ êîýôôèöèåíòîâ êîððåëÿöèè äëÿ ïàð ôàêòîðîâ ïîäòâåðæäàþò ïðåäïîëîæåíèå î ìóëüòèêîëëèíåàðíîñòè (r ( x1; x3 ) @ -0 , 8241, r ( x2 ; x4 ) @ -0 ,9730 ), òàê æå êàê è çíà÷åíèå det( X’ X ) @ 0 ,0010677 äåòåðìèíàíòà ìàòðèöû X’ X, ãäå X — ìàòðèöà ðàçìåðîì 13 ´ 5,
ñîäåðæàùàÿ çíà÷åíèÿ àðãóìåíòîâ â ðåãðåññèè y = a 0 + a1 x1 + ... + a 4 x 4 , è ñîáñòâåííûå
çíà÷åíèÿ êîððåëÿöèîííîé ìàòðèöû C º cor( x1, ... , x4 ) äëÿ ôàêòîðîâ: l 1( C ) @ 2, 23569,
, l 3 ( C ) @ 0 ,18661 è l 4( C ) @ 0 ,00162.
,
l 2( C ) @ 157606
C èñïîëüçîâàíèåì ðàçëè÷íûõ ïîäõîäîâ â [Äðåéïåð, Ñìèò (1987)] è [Ñåáåð (1980)]
áûëè âûäåëåíû ñëåäóþùèå ïðåòåíäåíòû íà ðîëü íàáîðà ôàêòîðîâ äëÿ íàèëó÷øåé ðåãðåññèè:
Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
»
~
2
Äëÿ ðåãðåññèè ñ ôàêòîðàìè (x1; x2) çíà÷åíèÿ ñòàòèñòèê R 2 , Rmin
, R 2 è R 2 áîëüøå, ÷åì äëÿ
ðåãðåññèè ñ ôàêòîðàìè (x1; x4). Àíàëîãè÷íûì îáðàçîì ðåãðåññèÿ ñ ôàêòîðàìè (x1; x2; x4) îêàçûâàåòñÿ ïðåäïî÷òèòåëüíåå äðóãèõ ðåãðåññèé ñ òðåìÿ è äâóìÿ ôàêòîðàìè. Äðåéïåð è Ñìèò,
èñïîëüçóÿ ìåòîä èñêëþ÷åíèÿ ôàêòîðîâ è «øàãîâûé ìåòîä» (ìåòîä ïîïîëíåíèÿ ìíîæåñòâà
ôàêòîðîâ), ïðèíèìàÿ áåç òåñòèðîâàíèÿ ãèïîòåçó íîðìàëüíîñòè îøèáîê è çàäàâàÿ áåç îáîñíîâàíèÿ óðîâåíü çíà÷èìîñòè äëÿ F-êðèòåðèåâ, îòäàëè ïðåäïî÷òåíèå ðåãðåññèè ñ ôàêòîðàìè (x1; x2) .  êà÷åñòâå êðèòåðèÿ âûáîðà ôàêòîðîâ èìè èñïîëüçîâàëàñü è ïðåäëîæåííàÿ Ìýëëîóçîì Ñp-ñòàòèñòèêà, ÷òî òàêæå ïðèâåëî ê âûáîðó ðåãðåññèè ñ ôàêòîðàìè (x1; x2). Îäíàêî
ïðè ýòîì íå áûëî îáðàùåíî âíèìàíèå íà òî, ÷òî â ýòîì êðèòåðèè â êà÷åñòâå íàäåæíîé, ïî
ïðåäïîëîæåíèþ íåñìåùåííîé îöåíêè äèñïåðñèè ñëó÷àéíûõ îøèáîê èñïîëüçóåòñÿ òàêàÿ âåëè÷èíà, êàê «s2 — îñòàòî÷íûé ñðåäíèé êâàäðàò ÌÍÊ-îòêëîíåíèÿ äëÿ óðàâíåíèÿ, ñîäåðæàùåãî âñå ïåðåìåííûå» [Äðåéïåð, Ñìèò (1987), ñ. 14, 15]. Äëÿ ïðèìåðà Õàëüäà ñ ÿâíî ìóëüòèêîëëèíåàðíûìè äàííûìè óêàçàííîå äîïóùåíèå âðÿä ëè ìîæåò áûòü îïðàâäàíî. Òàêîé îöåíêîé
áûëî áû åñòåñòâåííåå ñ÷èòàòü ñòàòèñòèêó s 2 äëÿ èñêîìîé «íàèëó÷øåé ðåãðåññèè», íî ýòî ðàçðóøàëî áû êîíñòðóêöèþ ìåòîäà, èñïîëüçóþùåãî ñòàòèñòèêó Cp.
Ïîëåçíî èìåòü â âèäó, ÷òî òàê íàçûâàåìàÿ ÏÐÅÑÑ-ïðîöåäóðà [Äðåéïåð, Ñìèò (1987),
ñ. 40–42] òîæå ïîçâîëèëà âûäåëèòü âàðèàíòû ðåãðåññèé, äëÿ êîòîðûõ êðèòåðèé «ïðåäñêàçàííàÿ ñóììà êâàäðàòîâ» (Prediction sum square) PSS( xj (1) , ... , xj (m ) ) ïðèíèìàë íàèìåíüøèå, íî îòíîñèòåëüíî ìàëî ðàçëè÷àþùèåñÿ çíà÷åíèÿ: PSS( x1; x2 ) @ 95, PSS( x1; x4 ) @ 121, PSS( x1; x2 ; x3 ) @ 91,
PSS( x1; x2 ; x4 ) @ 85, PSS( x1; x3 ; x4 ) @ 87, PSS( x1; x2 ; x3 ; x4 ) @ 110. Äëÿ îñòàëüíûõ ðåãðåññèé çíà÷åíèÿ êðèòåðèÿ PSS îêàçàëèñü â ïðåäåëàõ îò PSS( x3 ; x4 ) @ 264 äî PSS( x3 ) @ 2616. Ïî-âèäèìîìó,
ñòðåìëåíèå âûáèðàòü óðàâíåíèå êàê ìîæíî ñ ìåíüøèì ÷èñëîì àðãóìåíòîâ õîòÿ áû ÷àñòè÷íî
îáúÿñíÿåòñÿ ïðåóâåëè÷åíèåì òðóäíîñòåé ðåàëèçàöèè ÌÍÊ, âîçíèêàþùèõ ñ ðîñòîì ÷èñëà
ôàêòîðîâ. Îäíàêî äëÿ ðåãðåññèé ñ äâóìÿ è òðåìÿ ôàêòîðàìè ýòà ïîçèöèÿ àâòîðîâ íå ìîæåò
îáúÿñíÿòüñÿ âîçðàñòàþùåé «ñëîæíîñòüþ» ðàñ÷åòîâ. Ñêîðåå ñëåäîâàëî áû ãîâîðèòü îá óãðîçå âîçíèêíîâåíèÿ ìóëüòèêîëëèíåàðíîñòè ôàêòîðîâ ñ óâåëè÷åíèåì èõ ÷èñëà è î íåîáõîäèìîñòè ïðîãíîçèðîâàòü áîëüøåå ÷èñëî ôàêòîðîâ.
Ìîæíî ñ÷èòàòü, ÷òî â äàííîì ïðèìåðå ÏÐÅÑÑ-ïðîöåäóðà â êà÷åñòâå êîíêóðèðóþùèõ ðåãðåññèé îïðåäåëÿåò óðàâíåíèÿ ñ íàáîðàìè ôàêòîðîâ (x1; x2; x4), (x1; x3; x4), äëÿ êîòîðûõ çíà÷åíèÿ
êðèòåðèÿ PSS ìèíèìàëüíû. Ïðè ýòîì â ÷èñëî êîíêóðèðóþùèõ ïðåòåíäåíòîâ
âêëþ÷åíà ðåã»
~2
2
2
2
ðåññèÿ (x1; x2; x4) ñ íàèáîëüøèìè çíà÷åíèÿìè ñòàòèñòèê R , Rmin , R è R .
Ýòîò æå íàáîð ôàêòîðîâ (x1; x2; x4) îïðåäåëÿåòñÿ â êà÷åñòâå íàèëó÷øåãî è ïðè ïðèìåíåíèè
ïðåäëîæåííîãî â [Webster et al. (1974)] ìîäèôèöèðîâàííîãî ÌÍÊ, èëè ìåòîäà «ðåãðåññèè íà
ãëàâíûå êîìïîíåíòû». Ýòîò ìåòîä èñïîëüçóåò ñîáñòâåííûå âåêòîðû êîððåëÿöèîííîé ìàòðèöû äëÿ îáúÿñíÿåìîé ïåðåìåííîé è âñåõ ðàññìàòðèâàåìûõ ôàêòîðîâ. Ôîðìàëüíîå èçëîæåíèå ìåòîäà è åãî ïðèìåíåíèå ê äàííûì ïðèìåðà Õàëüäà èìåþòñÿ â [Äðåéïåð, Ñìèò (1987),
ñ. 48–52].
Ñåáåð, èñïîëüçóÿ ïîíÿòèå R 2 -àäåêâàòíîãî (a )-íàáîðà ðåãðåññîðîâ, ïðåäëîæåííîå â
[Aitkin (1974)], ïðèâîäèò âñå òàêèå íàáîðû äëÿ ïðèìåðà Õàëüäà, ñîîòâåòñòâóþùèå äîâåðèòåëüíîé âåðîÿòíîñòè a = 0 ,05. Èìè îêàçàëèñü (x1; x2), (x1; x4) è âñå ÷åòûðå íàáîðà, ñîäåðæàùèå
òðè ôàêòîðà [Ñåáåð (1980), ñ. 351, 352]. Îäíàêî ýòîò ïîäõîä íå ïîçâîëèë â ýòîì ïðèìåðå ñóçèòü ìíîæåñòâî ðåãðåññèé-êîíêóðåíòîâ.
Íåñîâïàäåíèå ðåçóëüòàòîâ âûáîðà íàèëó÷øåé ðåãðåññèè ðàçíûìè ìåòîäàìè èëè ôàêòè÷åñêàÿ íååäèíñòâåííîñòü ðåçóëüòàòîâ òàêîãî âûáîðà îòìå÷àåòñÿ ïî÷òè âñåìè èññëåäîâàòå-
80
Теория и методология R
4.2. Àíàëèç óðîæàéíîñòè çåðíîâûõ êóëüòóð
Ïî äàííûì 20 ñåëüñêîõîçÿéñòâåííûõ ðàéîíîâ íåêîòîðîé îáëàñòè â ïðèìåðå 15.1 èç [Àéâàçÿí, Ìõèòàðÿí (1998), ñ. 631, 632, 636, 644–646, 652, 654, 664–668] èññëåäóåòñÿ çàâèñèìîñòü óðîæàéíîñòè çåðíîâûõ êóëüòóð y (ö/ãà) îò ïÿòè ôàêòîðîâ: x1 — ÷èñëî òðàêòîðîâ íà
100 ãà; x2 — ÷èñëî çåðíîóáîðî÷íûõ êîìáàéíîâ íà 100 ãà; x3 — ÷èñëî îðóäèé ïîâåðõíîñòíîé
îáðàáîòêè ïî÷âû íà 100 ãà; x4 — êîëè÷åñòâî óäîáðåíèé, ðàñõîäóåìûõ íà ãåêòàð (ö/ãà); x5 —
êîëè÷åñòâî ðàñõîäóåìûõ õèìè÷åñêèõ ñðåäñòâ çàùèòû ðàñòåíèé (ö/ãà). Îòìå÷àåòñÿ âûñîêàÿ
ìóëüòèêîëëèíåàðíîñòü ôàêòîðîâ, ïðè÷åì êîððåëèðîâàííîñòü ôàêòîðîâ x1 è x3 ñëåäóåò èç
òîãî, ÷òî «îðóäèÿ ïîâåðõíîñòíîé îáðàáîòêè ïî÷âû ðåàëèçóþòñÿ â ïîäàâëÿþùåì áîëüøèíñòâå ñ ïîìîùüþ òðàêòîðîâ» [Àéâàçÿí, Ìõèòàðÿí (1998); ñ. 652, 654]. Ïîýòîìó èç äàëüíåéøåãî
àíàëèçà èñêëþ÷èì ôàêòîð x1.
»
~
2
 òàáë. 2 ïðèâåäåíû çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 , Rmin
, R 2 è R 2 äëÿ âñåõ âàðèàíòîâ
ðåãðåññèé. Ñðåäè óðàâíåíèé ñ îäíèì ôàêòîðîì ( m = 1, p = 2) ÿâíî âûäåëÿåòñÿ ðåãðåññèÿ
ñ ôàêòîðîì x4, äëÿ êîòîðîé çíà÷åíèÿ âñåõ ðàññ÷èòàííûõ êðèòåðèåâ ñóùåñòâåííî ïðåâîñõîäÿò èõ çíà÷åíèÿ äëÿ äðóãèõ îäíîôàêòîðíûõ óðàâíåíèé. Èç ìíîæåñòâà óðàâíåíèé ñ äâóìÿ
ôàêòîðàìè ( m = 2) ïî çíà÷åíèÿì âñåõ ïÿòè ñòàòèñòèê âûäåëÿþòñÿ ðåãðåññèè ñ ôàêòîðàìè
(x2; x4) è (x3; x4). Äëÿ óðàâíåíèÿ ñ ôàêòîðàìè (x3; x4) çíà÷åíèÿ âñåõ ìàêñèìèçèðóåìûõ ñòàòèñòèê
áîëüøå, ÷åì äëÿ ðåãðåññèè ñ ôàêòîðàìè (x2; x4). Ñðåäè òðåõôàêòîðíûõ ðåãðåññèé ïî çíà÷åíèÿì âñåõ ñòàòèñòèê ïðåòåíäåíòàìè íà ðîëü íàèëó÷øåé ðåãðåññèè îêàçûâàþòñÿ óðàâíåíèÿ
ñ íàáîðàìè ôàêòîðîâ (x2; x4; x5) è (x3; x4; x5). Îäíàêî äëÿ ðåãðåññèè ñ ôàêòîðàìè (x2; x4; x5) çíà÷åíèÿ ñòàòèñòèê áîëüøå, ÷åì ó êîíêóðèðóþùåãî óðàâíåíèÿ. Òàêèì îáðàçîì, âûáîð íàèëó÷øåé
ðåãðåññèè ñâîäèòñÿ ê âûáîðó ìåæäó óðàâíåíèÿìè ñ ôàêòîðàìè (x3; x4) è (x2; x4; x5), ïîñêîëüêó
2
ñóùåñòâåííî ìåíüäëÿ «ëó÷øåé» îäíîôàêòîðíîé ðåãðåññèè çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 è Rmin
øå, ÷åì äëÿ ýòèõ ïðåòåíäåíòîâ. Íàïîìíèì, ÷òî äëÿ ðåãðåññèé ñ îäíèì ôàêòîðîì íå âñå ðàññìàòðèâàåìûå ñòàòèñòèêè îïðåäåëåíû. Ðåãðåññèÿ ñ ÷åòûðüìÿ ôàêòîðàìè óñòóïàåò îòîáðàííûì äâóì êîíêóðèðóþùèì óðàâíåíèÿì ïî âñåì êðèòåðèÿì çà èñêëþ÷åíèåì R 2 , ÷òî åñòåñòâåííî.
R Теория и методология
81
Э. Б. Ершов
ëÿìè. Òàê, â [Ñåáåð (1980), ñ. 372] çàìå÷åíî, ÷òî ìåòîä ïîñëåäîâàòåëüíîãî âêëþ÷åíèÿ ôàêòîðîâ âûäåëÿåò íàáîð (x1; x2; x4), â òî âðåìÿ êàê ìåòîä ïîñëåäîâàòåëüíîãî èõ èñêëþ÷åíèÿ — íàáîð (x1; x2). Çàìåòèì, ÷òî â ýòèõ ìåòîäàõ äîâåðèòåëüíûå âåðîÿòíîñòè çàäàþòñÿ ýêçîãåííî, áåç
ó÷åòà òîãî, íàñêîëüêî ðàçëè÷àþòñÿ çíà÷åíèÿ âîçìîæíûõ êðèòåðèåâ êà÷åñòâà ðåãðåññèé ïî
íàáîðàì ôàêòîðîâ, è áåç òåñòèðîâàíèÿ íîðìàëüíîñòè.
Òàêèì îáðàçîì, ðàññìàòðèâàåìûå Äðåéïåðîì, Ñìèòîì è Ñåáåðîì ìåòîäû îïðåäåëåíèÿ
íàèëó÷øåé ðåãðåññèè â ïðèìåðå Õàëüäà ôàêòè÷åñêè ïîçâîëèëè âûäåëèòü ìíîæåñòâî
ðåãðåññèé-êîíêóðåíòîâ, à íå îäíó, äåéñòâèòåëüíî ëó÷øóþ, ðåãðåññèþ.
 òî æå âðåìÿ íà ïðèìåðå Õàëüäà
âèäíî, ÷òî äëÿ âàðèàíòîâ ðåãðåññèé ñî çíà÷åíèÿìè R 2 ,
~ 2 »2
áëèçêèìè ê 1, ñòàòèñòèêè R è R ñòàíîâÿòñÿ, êàê îòìå÷àëîñü, ïî÷òè ðàâíûìè.  ýòîì»ïðèìå~
2
ðå ðàíãè, ïðèñâîåííûå ðåãðåññèÿì ïî óáûâàíèþ çíà÷åíèé êðèòåðèåâ R 2 , Rmin
, R2 è R 2,
íå ÿâëÿþùèõñÿ íåóáûâàþùèìè ïðè äîáàâëåíèè ôàêòîðîâ, ñîâïàäàþò. Ñëåäîâàòåëüíî, ïðè~
ìåíåíèå íåñìåùåííîé îöåíêè R 2 äëÿ êîýôôèöèåíòà äåòåðìèíàöèè  2 êàê êðèòåðèÿ êà÷åñòâà ðåãðåññèé â ýòîì ñëó÷àå íå ïðîòèâîðå÷èò ðåêîìåíäàöèÿì ïðèìåíÿòü äðóãèå ðàññìàòðèâàåìûå êðèòåðèè.
Òàáëèöà 2
Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации
Çíà÷åíèÿ êðèòåðèåâ âûáîðà ðåãðåññèè, îñíîâàííûõ íà ôóíêöèÿõ îò ñòàòèñòèêè R 2,
äëÿ ïðèìåðà àíàëèçà óðîæàéíîñòè çåðíîâûõ êóëüòóð
Ìàêñèìèçèðóåìûå êðèòåðèè
Íàáîð
ôàêòîðîâ
Ñòàòèñòèêà
R2
R
(x2)
0,13994
0,09215
(x3)
0,16253
(x4)
0,33329
R
R
Ðàíã íàáîðà
ôàêòîðîâ*
–0,02638
—
—
—
0,11601
0,00058
—
—
—
0,29625
0,20436
—
—
—
2
R
2
min
~2
»2
(x5)
0,11031
0,06089
–0,06173
—
—
—
(x2; x3)
0,16408
0,06573
–0,09261
0,09052
0,07524
11
(x2; x4)
0,46196
0,39866
0,29674
0,43148
0,42783
4
(x2; x5)
0,17248
0,07512
–0,08163
0,10039
0,08562
10
(x3; x4)
0,48237
0,42147
0,32342
0,45416
0,45093
2
(x3; x5)
0,21503
0,12268
–0,02601
0,15017
0,13776
8
(x4; x5)
0,33330
0,25486
0,12858
0,28651
0,27924
7
(x2; x3; x4)
0,48386
0,38708
0,27092
0,42015
0,41635
6
(x2; x3; x5)
0,22120
0,07518
–0,10010
0,10093
0,08651
9
(x2; x4; x5)
0,51346
0,42223
0,31273
0,45510
0,45195
1
(x3; x4; x5)
0,49823
0,40415
0,29122
0,43715
0,43367
3
(x2; x3; x4; x5)
0,51730
0,38858
0,26712
0,42188
0,41819
5
»
~
2
* Ïðèâåäåíû ðàíãè ðåãðåññèé, äëÿ êîòîðûõ îïðåäåëåíû ñòàòèñòèêè R 2, Rmin
, R 2 è R 2 . Ðàíãè ïðèñâàèâàþòñÿ â ñîîòâåòñòâèè ñ óáûâàíèåì çíà÷åíèé ëþáîãî èç êðèòåðèåâ.
2
Ñ. À. Àéâàçÿí è Â. Ñ. Ìõèòàðÿí, ðåêîìåíäóþùèå ñòàòèñòèêó Rmin
êàê êðèòåðèé êà÷åñòâà ðåãðåññèè,
2
îòäàþò ïðåäïî÷òåíèå óðàâíåíèþ ñ ôàêòîðàìè (x3; x4), òàê êàê» Rmin
y;~
x3 , ~
x4 ) @ 0 ,323 > 0 ,313 @
(~
2
2 ~2
2
~
~
~
~
@ Rmin ( y ; x2 , x4 , x5 ). Îäíàêî ïî çíà÷åíèÿì ñòàòèñòèê R , R è R ðåãðåññèÿ ñ ôàêòîðàìè (x2; x4; x5)
ïðåäïî÷òèòåëüíåå, õîòÿ ðàçíèöû çíà÷åíèé êðèòåðèåâ äëÿ ýòèõ äâóõ êîíêóðèðóþùèõ óðàâíåíèé ìàëû. Òàêèì îáðàçîì, íà äàííîì ïðèìåðå ïîêàçàíî, ÷òî âûáîð ðåãðåññèè
ïî êðèòåðèÿì
»
~
~
2
è R 2 ìîæåò ïðèâîäèòü ê ðàçíûì ðåçóëüòàòàì. Çíà÷åíèÿ ñòàòèñòèê R 2 è R 2 ìîãóò äëÿ äàíRmin
íîãî íàáîðà ôàêòîðîâ ñóùåñòâåííî ðàçëè÷àòüñÿ, íî ïðè ýòîì ðàíãè ðåãðåññèé, ïðèñâàèâàåìûå â ñîîòâåòñòâèè ñ óáûâàíèåì ýòèõ êðèòåðèåâ, ìîãóò ïîëíîñòüþ èëè ÷àñòè÷íî ñîâïàäàòü.
5. Заключение
~
Ïðåäëîæåíèå èñïîëüçîâàòü
íåñìåùåííóþ îöåíêó R 2 êîýôôèöèåíòà äåòåðìèíàöèè Â 2
»
èëè åå àïïðîêñèìàöèþ R 2 êàê êðèòåðèé êà÷åñòâà âûáèðàåìîãî íàáîðà ðåãðåññîðîâ îñíîâûâàåòñÿ íà ñòðîãî ôîðìóëèðóåìîì ïðåäïîëîæåíèè î íîðìàëüíîñòè ðàñïðåäåëåíèÿ äëÿ ñîâîêóïíîñòè ïåðåìåííûõ, ïîðîæäàþùèõ èñïîëüçóåìûå âûáîðî÷íûå äàííûå, è íà òåîðåòè÷åñêîì îïðåäåëåíèè ïîêàçàòåëÿ êà÷åñòâà çàâèñèìîñòè îäíîé èç òàêèõ ïåðåìåííûõ îò çàäàííî~
ãî íàáîðà äðóãèõ ïåðåìåííûõ-ôàêòîðîâ. Ïðè ïðèìåíåíèè ñòàòèñòèêè R 2 íå èñïîëüçóåòñÿ
82
Теория и методология R
Список литературы
Àéâàçÿí Ñ. À., Åíþêîâ È. Ñ., Ìåøàëêèí Ä. Ä. Ïðèêëàäíàÿ ñòàòèñòèêà. Èññëåäîâàíèå çàâèñèìîñòåé: Ñïðàâî÷íîå èçäàíèå. Ì.: Ôèíàíñû è ñòàòèñòèêà, 1985.
Àéâàçÿí Ñ. À., Ìõèòàðÿí Â. Ñ. Ïðèêëàäíàÿ ñòàòèñòèêà è îñíîâû ýêîíîìåòðèêè. Ì.: ÞÍÈÒÈ,
1998.
Ãðàäøòåéí È. Ñ., Ðûæèê È. Ì. Òàáëèöû èíòåãðàëîâ, ñóìì, ðÿäîâ è ïðîèçâåäåíèé. Ì.: Ãîñ.
èçä. ôèç.-ìàò. ëèòåðàòóðû, 1962.
Äðåéïåð Í., Ñìèò Ã. Ïðèêëàäíîé ðåãðåññèîííûé àíàëèç. Êíèãà 2. Ì.: Ôèíàíñû è ñòàòèñòèêà, 1987.
Êåíäàëë Ì., Ñòüþàðò À. Ñòàòèñòè÷åñêèå âûâîäû è ñâÿçè. Ì.: Íàóêà, 1973.
Ñåáåð Äæ. Ëèíåéíûé ðåãðåññèîííûé àíàëèç. Ì.: Ìèð, 1980.
Õàëüä À. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà ñ òåõíè÷åñêèìè ïðèëîæåíèÿìè. Ì.: ÈË, 1956.
Aitkin M. A. Simultaneous inference and the choice of variable subsets // Technometrics. 1974.
V. 16, P. 221–227.
Olkin I., Pratt J. W. Unbaised estimation of certain correlation coefficients // Ann. Math. Statist.
1958. V. 29.
Webster J. T., Gunst R. F., Mason R. L. Latent root regression analysis // Technometrics. 1974. V. 16.
P. 513–522.
Wishart J. The mean and second moment coefficient of the multiple correlation coefficient in
sumples from a normal population // Biometrica. 1931. V. 22.
Woods H., Steinour Y. H., Starke H. R. Effect of Composition of Portland on Heat Evolved during
Hardening // Industrial and Engineering Chemistre. 1932. V. 24. P. 1207–1214.
R Теория и методология
83
Э. Б. Ершов
ïðåäïîëîæåíèå î áîëüøîì ÷èñëå íàáëþäåíèé.  ýòîì ñîñòîÿò ïðåèìóùåñòâà ïðåäëîæåííîãî ïîäõîäà ê îïðåäåëåíèþ êîíêóðèðóþùèõ ðåãðåññèé ïî ñðàâíåíèþ ñ ýâðèñòè÷åñêèìè ïî
2
ñâîåìó õàðàêòåðó ìåòîäàìè, èñïîëüçóþùèìè ñòàòèñòèêè R 2 è Rmin
. Ðåàëèçîâàííûé ìåòîä
~2
ðàñ÷åòà çíà÷åíèé êðèòåðèÿ-ñòàòèñòèêè R óíèâåðñàëåí è ýôôåêòèâåí â øèðîêîì äèàïàçîíå
öåëî÷èñëåííûõ õàðàêòåðèñòèê óðàâíåíèé ðåãðåññèè — ÷èñëà íàáëþäåíèÿ è ÷èñëà îöåíèâàåìûõ êîýôôèöèåíòîâ.
~
Òî, ÷òî â ðàññìîòðåííûõ ïðèìåðàõ ïðèìåíåíèå ñòàòèñòèêè R 2 ïðèâîäèò ê âûäåëåíèþ íàáîðîâ ðåãðåññîðîâ, ïîëó÷åííûõ äðóãèìè, áîëåå ïðîñòûìè â ðåàëèçàöèè ìåòîäàìè, ìîæåò
ðàññìàòðèâàòüñÿ êàê îïðàâäàíèå èñïîëüçîâàíèÿ ýâðèñòè÷åñêèõ ìåòîäîâ â êîíêðåòíûõ ñëó÷àÿõ, íî íå îçíà÷àåò ýêâèâàëåíòíîñòü òàêèõ ìåòîäîâ â îáùåì ñëó÷àå.
~
Ïîñêîëüêó ñòàòèñòèêà R 2 è äðóãèå ñðàâíèâàåìûå ñòàòèñòèêè ïðåäñòàâëÿþò ñîáîé ñëó÷àéíûå âåëè÷èíû, ìîæíî ñ÷èòàòü, ÷òî èõ ïðèìåíåíèå êàê êðèòåðèåâ êà÷åñòâà íàáîðîâ ôàêòîðîâ â ðåãðåññèè ñ îáùåé âûáðàííîé îáúÿñíÿåìîé ïåðåìåííîé ïîçâîëÿåò âñåãî ëèøü âûäåëÿòü êîíêóðèðóþùèå âàðèàíòû ðåãðåññèé, äëÿ êîòîðûõ çíà÷åíèÿ êðèòåðèåâ áëèçêè. Âûáîð
ïðåäïî÷òèòåëüíûõ âàðèàíòîâ ðåãðåññèé èç ìíîæåñòâà êîíêóðèðóþùèõ, à â ïåðñïåêòèâå
è êîíñòðóèðîâàíèå ñ èñïîëüçîâàíèåì îòîáðàííûõ ðåãðåññèé óðàâíåíèé, ìîäåëèðóþùèõ
îáúÿñíÿåìóþ ïåðåìåííóþ, ïî-âèäèìîìó, ìîæíî è öåëåñîîáðàçíî îñíîâûâàòü íà ñïåöèàëüíî îáñóæäàåìûõ êà÷åñòâåííûõ òðåáîâàíèÿõ ê íèì. Îáîñíîâàíèå òàêèõ êîíñòðóêòèâíî ðåàëèçóåìûõ òðåáîâàíèé — çàäà÷à ïðîâîäèìûõ â íàñòîÿùåå âðåìÿ èññëåäîâàíèé.
Скачать