Ý. Á. Åðøîâ Âûáîð ðåãðåññèè, ìàêñèìèçèðóþùèé íåñìåùåííóþ îöåíêó êîýôôèöèåíòà äåòåðìèíàöèè Ïîëó÷åíà ôîðìà íåñìåùåííîé îöåíêè êîýôôèöèåíòà äåòåðìèíàöèè äëÿ ëèíåéíîãî óðàâíåíèÿ ðåãðåññèè, âû÷èñëÿåìàÿ ïî âûáîðî÷íûì äàííûì èç ìíîãîìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ýòó îöåíêó ïðåäëàãàåòñÿ ïðèìåíÿòü êàê àëüòåðíàòèâíûé êðèòåðèé âûáîðà ôàêòîðîâ â ðåãðåññèè. 1. Введение áùåèçâåñòåí âàðèàíò èñõîäíûõ ïðåäïîëîæåíèé ìåòîäà íàèìåíüøèõ êâàäðàòîâ (ÌÍÊ), ïðè êîòîðîì èñïîëüçóåìûå çíà÷åíèÿ îáúÿñíÿåìîé ïåðåìåííîé y è ôàêòîðîâ x1 ,... , xm â ðåãðåññèè ïîðîæäàþòñÿ âûáîðêîé èç ìíîãîìåðíîãî íåâûðîæäåííîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Âìåñòî åãî íåèçâåñòíûõ ïàðàìåòðîâ èñïîëüçóþòñÿ èõ îöåíêè, âû÷èñëÿåìûå ïî âûáîðî÷íûì äàííûì. Íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà y, ïîëó÷àåìàÿ ïðè ôèêñèðîâàííûõ çíà÷åíèÿõ ôàêòîðîâ x1 ,... , xm , ïðåäñòàâèìà â âèäå Î m y = a 0 + å x j a j + e, (1) j =1 ãäå êîýôôèöèåíòû a 0 ,... , am — èçâåñòíûå ôóíêöèè îò ïàðàìåòðîâ çàêîíà ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû ( y , x1 ,... , xm ) è e — íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ íóëåâîå ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèþ s 2e , íå çàâèñÿùóþ îò çíà÷åíèé ôàêòîðîâ x1 ,... , xm . Õàðàêòåðèñòèêà  2 º  2 ( y ; x1 ,... , xm ), íàçûâàåìàÿ êîýôôèöèåíòîì äåòåðìèíàöèè, îïðåäåëÿåòñÿ ôîðìóëîé  2 º 1- s 2e s 2 ( y ), ãäå s 2 ( y ) — äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû y. Ïîêàçàòåëü  2 çàâèñèò îò ôàêòîðîâ x1 ,... , xm , íî íå îò èõ çíà÷åíèé, ò.å. õàðàêòåðèçóåò ñâÿçü ìåæäó y è ôàêòîðàìè. Ïî äàííûì âûáîðêè, ñîñòîÿùåé èç íàáëþäåíèé ( ~ y k ;~ x k 1 ,... , ~ x km ), k = 1,... , n, c ïîìîùüþ $ ÌÍÊ íàõîäÿòñÿ îöåíêè a j , j = 0 , 1, ... , m, êîýôôèöèåíòîâ â (1), ÌÍÊ-îñòàòêè e$ k , îöåíêè 1 1 y ) = å (~ y k -~ y )2 è s2 (~ y;~ x1 , ... , ~ xm ) = å e$ k2 äèñïåðñèé s 2 ( y ) è s 2e , à çàòåì âûáîðî÷íîå s2 (~ n k n k 2 ~ ~ 2 ~ ~ ~ ~ çíà÷åíèå R ( y ; x ,... , x ) = 1-s ( y ; x ,... , x ) s 2 ( ~ y ) êîýôôèöèåíòà äåòåðìèíàöèè. Ïðè çà1 m 1 m äàííîì íàáîðå { x1 , ... , x M } ïîòåíöèàëüíûõ ôàêòîðîâ âûáîð íàáîðà { x i (1) , ... , x i (m ) } àðãóìåíòîâ n îáû÷íî ñâîäÿò ê ìèíèìèçàöèè íåñìåùåííîé îöåíêè s2 (~ y;~ x1 , ... , ~ xm ) äèñïåðñèè s 2e èëè n-p ê ìàêñèìèçàöèè ñòàòèñòèêè R Теория и методология 71 n -1 2 , R 2 ( ~y ; ~ x 1, ..., ~ x m ) º R 2 º R adj º 1- [ 1- R 2 ( ~y ; ~ x 1, ..., ~ x m )] n- p (2) ãäå p = (m + 1) — ÷èñëî îöåíèâàåìûõ êîýôôèöèåíòîâ â (1). Ñòàòèñòèêó R 2 íàçûâàþò âûáîðî÷íûì êîýôôèöèåíòîì äåòåðìèíàöèè, ñêîððåêòèðîâàííûì íà ÷èñëî ñòåïåíåé ñâîáîäû. Ïðèâåäåííûå îïðåäåëåíèÿ âêëþ÷àþòñÿ â ó÷åáíèêè ïî ìíîãîìåðíîìó ñòàòèñòè÷åñêîìó àíàëèçó è ýêîíîìåòðèêå. Ìåíåå èçâåñòíî, ÷òî ìàòåìàòè÷åñêèå îæèäàíèÿ ER 2 è ER 2 ñòàòèñòèê R 2 è R 2 íå ðàâíû  2 . Ýòî âàæíî, ïîñêîëüêó âûáîð ôàêòîðîâ íå äîëæåí áûòü îðèåíòèðîâàí òîëüêî íà îáåñïå÷åíèå íàèáîëüøåé áëèçîñòè âûðaâíåííûõ çíà÷åíèé m y$k = a$ 0 + å xk j a$ j , k = 1, ... , n, ïåðåìåííîé y ê âûáîðî÷íûì çíà÷åíèÿì y k , òàê êàê óðàâj =1 m íåíèå y$ = a$ 0 + å x j a$ j èñïîëüçóåòñÿ è ïðè äðóãèõ çíà÷åíèÿõ ôàêòîðîâ.  ñâÿçè ñ ýòèì ââîВыбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации j =1 äÿòñÿ ðàçëè÷íûå êðèòåðèè âûáîðà ôàêòîðîâ, èñïîëüçóþùèå ïðåäïîëîæåíèÿ î ãåíåðàëüíîé ñîâîêóïíîñòè ïåðåìåííûõ y , x1 , ... , x M , íàïðèìåð î íîðìàëüíîñòè ñîîòâåòñòâóþùåãî ðàñïðåäåëåíèÿ. Ïðè òàêîì ïðåäïîëîæåíèè ïîêàçàòåëü  2 åñòåñòâåííî ðàññìàòðèâàòü êàê õàðàêòåðèñòèêó îöåíèâàåìîé ðåãðåññèè è, âûáèðàÿ ôàêòîðû, ìàêñèìèçèðîâàòü åå íåñìåùåííóþ îöåíêó. 2. Несмещенная оценка коэффициента детерминации  2 , ее аппроксимации и заменители Óèøàðò [Wishart (1931)] ïîêàçàë, ÷òî ER 2 è  2 ñâÿçàíû ñîîòíîøåíèåì [Êåíäàëë, Ñòüþàðò (1973), ñ. 454] ER 2 = 1- n- p ( 1-  2 ) F( 1; 1; 0,5( n + 1);  2 ). n -1 (3) Çäåñü F (a ; b ; g ; z ) — ñïåöèàëüíàÿ ãèïåðãåîìåòðè÷åñêàÿ ôóíêöèÿ, îïðåäåëÿåìàÿ â âèäå ðÿäà [Ãðàäøòåéí, Ðûæèê (1962), ñ. 1053] a ( a + 1)( a + 2 ) b( b + 1)( b + 2 ) z abz a ( a + 1) b( b + 1) z + ... , + + 1×2 ×3 × g ( g + 1)( g + 2 ) 1× g 1×2 × g ( g + 1) 2 F( a ; b ; g ; z ) = 1+ 3 (4) ñõîäÿùåãîñÿ àáñîëþòíî è ðàâíîìåðíî âíóòðè åäèíè÷íîãî êðóãà äëÿ êîìïëåêñíîé ïåðåìåííîé z, åñëè g ¹ 0 , -1, -2, ... . Äëÿ äàëüíåéøåãî âàæíî, ÷òî ôóíêöèÿ F (a ; b ; g ; z ) äåéñòâèòåëüíîé ïåðåìåííîé z ïðè z ³ 0 è ïîëîæèòåëüíûõ a , b , g ÿâëÿåòñÿ âîçðàñòàþùåé, à òàêæå òî, ÷òî ôîðìóëà (3) íå ïîçâîëÿåò íàõîäèòü ER 2 ïî äàííûì âûáîðêè, òàê êàê ñâÿçûâàåò íåèçâåñòíûå äåòåðìèíèðîâàííûå âåëè÷èíû  2 è ER 2 . Âàæíåéøèé ðåçóëüòàò áûë ïîëó÷åí Îëêèíûì è Ïðýòòîì [Olkin, Pratt (1958)], íàøåäøèìè ~ ~ îïðåäåëåííóþ ïðè n > p ³ 3 ñòàòèñòèêó R 2 ( ~ y;~ x1, ... , ~ x m ) º R 2 [Êåíäàëë, Ñòüþàðò (1973), ñ. 456]: n -3 ~2 R = 1( 1- R 2 ) F( 1; 1; 0,5( n - p ) + 1; 1- R 2 ), n- p (5) ïðåäñòàâëÿþùóþ ñîáîé íåñìåùåííóþ îöåíêó äëÿ  2 ( y ; x1 , ... , xm ). 72 Теория и методология R p -3 2( n - 3 ) ~2 R = R2 ( 1- R 2 ) ( 1- R 2 ) 2 - O ( n-2 ). n- p ( n - p )( n - p + 2 ) » Òàêèì îáðàçîì, â ðàññìîòðåíèå ââîäèòñÿ ñòàòèñòèêà R 2 : » R2= R2 - p -3 2( n - 3 ) ( 1- R 2 ) ( 1- R 2 ) 2 , n- p ( n - p )( n - p + 2 ) (6) êîòîðóþ â [Àéâàçÿí è äð. (1985), ñ. 284] ïðåäëàãàåòñÿ ïðèìåíÿòü êàê êðèòåðèé êà÷åñòâà ðåã» ðåññèè. Èç îïðåäåëåíèé ñòàòèñòèê R 2 è R 2 ñëåäóåò, ÷òî ïðè áëèçêèõ ê íóëþ çíà÷åíèÿõ R 2 îíè ïðèíèìàþò îòðèöàòåëüíûå çíà÷åíèÿ. Ýòî æå ñâîéñòâî îòìå÷àåòñÿ â [Êåíäàëë, Ñòüþàðò ~ (1973), ñ. 456–457] è äëÿ R 2 . » ~ Ñðàâíèì çíà÷åíèÿ ðàññìàòðèâàåìûõ ñòàòèñòèê R 2 , R 2 , R 2 è R 2 , íå âû÷èñëÿÿ èõ, íî ó÷èòûâàÿ, ÷òî 0 < R 2 < 1, n > p ³ 3 è F º F (1; 1; 0 , 5(n - p ) + 1; 1- R 2 ) > 1. Èç (2), (5) è (6) ïîëó÷àåì » » p -1 ~ R2 -R 2 = (1- R 2 ) > 0, R 2 - R 2 > 0 , R 2 - R 2 > 0, ò. å. n-p » ~2 R £ max( R 2 ; R 2 ) < R 2 . » » » » Ïîêàæåì, ÷òî äëÿ ñòàòèñòèê R 2 è R 2 âîçìîæíû ñëó÷àè R 2 < R 2 , R 2 > R 2 è R 2 = R 2 , è íàéäåì ìíîæåñòâà çíà÷åíèé âåëè÷èí n, p è R 2 , ïðè êîòîðûõ ýòè ñëó÷àè èìåþò ìåñòî. Èñïîëüçóÿ îïðåäåëåíèÿ, ïðåäñòàâèì ðàçíîñòü ýòèõ ñòàòèñòèê â âèäå R 2 - R 2 = 2( 1- R 2 ) ( n - p + 2 )( n - p + 4 ) - ( n - 3 )( 1- R 2 )[( n - p + 4 ) + 4(1- R 2 )] . ( n - p )( n - 3 )( n - p + 2 )( n - p + 4 ) Ïðè ôèêñèðîâàííûõ çíà÷åíèÿõ n è p èññëåäóåì íåîïðåäåëåííîå íåðàâåíñòâî f ( y ) º 4( n - 3 ) y 2 + ( n - 3 )( n - p + 4 ) y - ( n - p + 2 )( n - p + 4 ) Ú 0, â êîòîðîì ïåðåìåííàÿ y = (1- R 2 ) óäîâëåòâîðÿåò íåðàâåíñòâó0 £ y £ 1. Î÷åâèäíî, ÷òî óðàâíåíèå f ( y ) = 0 èìååò êîðíè y- , y+ ðàçíûõ çíàêîâ, íåðàâåíñòâî f ( y ) £ 0 âûïîëíÿåòñÿ ïðè 0 £ y £ min(1; y ). Èìååì min(1; y+ ) = y+ , åñëè f (1) > 0, íî min(1; y+ ) = 1, åñëè f (1) £ 0. Òàêèì îáðàçîì, íåîáõîäèìî èññëåäîâàòü íåðàâåíñòâîf (1) = [ 4 (n -3 ) + (n -3 )(n - p + 4 ) -(n - p + 2)(n - p + 4 )] Ú 0, ó÷èòûâàÿ, ÷òî ïàðàìåòðû n è p óäîâëåòâîðÿþò óñëîâèþ n > p ³ 3. Ââåäÿ íåîòðèöàòåëüíóþ ïåðåìåííóþ x = (n - p - 1) ³ 0, ïðåäñòàâèì íåðàâåíñòâî f (1) Ú 0 â âèäå ( x + p - 2)( x + 9 ) -( x + 3 )( x + 5) º ( p + 1)(n - p + 1) -33 Ú 0 èëè n Ú [( p + 1) + 33 ( p + 1)] º ºh( p ). R Теория и методология 73 Э. Б. Ершов Ñâîéñòâà ôóíêöèè F (1; 1; g ; z ) ïåðåìåííîé z ïðè 0 £ z £ 1, y = 0 , 5(n - p ) + 1 èçâåñòíû: F(1; 1; g ; 0 ) = 1; ïðè 0 £ z < 1 ðÿä (4) ñõîäèòñÿ, a ïðè z = 1 ðàñõîäèòñÿ, åñëè n - p = 1èëè 2, è ñõîäèòñÿ, åñëè n - p ³ 3 [Ãðàäøòåéí, Ðûæèê (1962), ñ. 1054]. ~ Ñòàòèñòèêà R 2 äî íàñòîÿùåãî âðåìåíè, íàñêîëüêî íàì èçâåñòíî, íå èñïîëüçîâàëàñü, ïî-âèäèìîìó, èç-çà ïðèçíàíèÿ ïðàêòè÷åñêè íåâîçìîæíûì èëè íåöåëåñîîáðàçíûì âû÷èñëÿòü çíà÷åíèÿ F (1; 1; 0 , 5q; z ) ïðè öåëûõ q è 0 < z < 1. ~  ýòèõ óñëîâèÿõ ìîæíî âîñïîëüçîâàòüñÿ àïïðîêñèìàöèåé äëÿ R 2 , ïîëó÷àåìîé èç (5) ïðè áîëüøîì ÷èñëå íàáëþäåíèé.  [Êåíäàëë, Ñòüþàðò (1973), ñ. 456] ïðåäëàãàåòñÿ èñïîëüçîâàòü ~ ïåðâûå ÷ëåíû ðàçëîæåíèÿ R 2 â ðÿä Ðàññìîòðèì òðè ñëó÷àÿ äëÿ ïàð (p; n) ïàðàìåòðîâ, õàðàêòåðèçóþùèõ ðåãðåññèþ, — ÷èñëà íàáëþäåíèé â âûáîðêå (n) è ÷èñëà îöåíèâàåìûõ êîýôôèöèåíòîâ ( p = m + 1.) Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации » » 1. Åñëè n h(p), òî f(1) 0. Ñëåäîâàòåëüíî, f ( y ) º ( R 2 - R 2 ) < 0 ïðè 0 £ (1- R 2 ) < y+ è R 2 > R 2 ïðè y+ < (1- R 2 ) £ 1, ãäå y+ — ïîëîæèòåëüíûé êîðåíü óðàâíåíèÿ f(y) = 0. Òàêèå ïàðû (p; n) áóäåì íàçûâàòü ïàðàìè òèïà À. Äëÿ íèõ, ò. å. äëÿ äîñòàòî÷íî áîëüøîãî ÷èñëà íàáëþäåíèé, ïðè á î ë ü ø è õ çíà÷åíèÿõ êîýôôèöèåíòà äåòåðìèíàöèè R 2 ñêîððåêòèðîâàííûé íà ÷èñëî ñòåïåíåé ñâîáîäû êðèòåðèé R 2 ç à â û ø à å ò »îöåíêó êà÷åñòâà ðåãðåññèè ïî ñðàâíåíèþ ñ àïïðîêñèìèðóþùèì ñòàòèñòèêó  2 êðèòåðèåì R 2 . Îäíàêî ïðè ì à ë û õ R 2 òàêàÿ îöåíêà êà÷åñòâ à çàíèæàåòñÿ. 2. Ïðè íåáîëüøîì ÷èñëå íàáëþäåíèé n, óäîâëåòâîðÿþùåì íåðàâåíñòâó ( p + 1) £ n < h( p ), » ò. å. äëÿ ïàð òèïà B, èìååì f (1) < 0 è f ( y ) º ( R 2 - R 2 ) < 0 äëÿ âñåõ âîçìîæíûõ çíà÷åíèé R 2 , ò. å. ïðè 0 < R 2 < 1, è êðèòåðèé R 2 õàðàêòåðèçóåò ðåãðåññèþ, ï ð å ó â å ë è ÷ è â à ÿ îöåíêó åå êà÷åñòâà. 3.  îñîáîì ñëó÷àå, êîãäà n = h( p ), ñ ó÷åòîì îãðàíè÷åíèÿ n > p ³ 3 ñóùåñòâóþò âñåãî äâà çíà÷åíèÿ p = 10 è p = 32, ïðè êîòîðûõ 33 ( p + 1) è h(p) — öåëûå ÷èñëà. Òàêèì îáðàçîì, » 2 2 R = R òîëüêî ïðè p = 10, m = 9, n = 14 èëè ïðè p = 32, m = 31, n = 34, ò. å. â äâóõ èñêëþ÷èòåëüíûõ è íåèíòåðåñíûõ äëÿ ïðèëîæåíèé ñëó÷àÿõ. Äëÿ ëþáîãî p çíà÷åíèÿ n, îáðàçóþùèå ïàðû ( p; n) ýòèõ òèïîâ, ëåãêî íàõîäÿòñÿ. Òàê, ïðè p = 3 À-ìíîæåñòâî ïàð ( p; n) = (3; n) çàäàåòñÿ íåðàâåíñòâîì 12 £ n, à B-ìíîæåñòâî ïðåäñòàâëÿåòñÿ â âèäå (3; n), n Î { 4 ; 5; 6 ; 7 ; 8 ; 9 ; 10 ; 11}. Íàïðèìåð, ïðè p = 7 òàêèìè ìíîæåñòâàìè çíà÷åíèé äëÿ n ñîîòâåòñòâåííî áóäóò 12 £ n è n Î { 8 ; 9 ; 10 ; 11}. Çàìåòèì, ÷òî ïðè p ³ 33 A-ìíîæåñòâà çàäàþòñÿ íåðàâåíñòâàì è ( p + 2) £ n , à B-ìíîæåñòâà «âûðîæäàþòñÿ» â ( p ; n ) º ( p ; p + 1.) » ~ Ïðèâåäåííûé àíàëèç íåðàâåíñòâà R 2 £ max( R 2 ; R 2 ) < R 2 ïîêàçûâàåò, ÷òî ïðè R 2 < 1 » ñòàòèñòèêè R 2 , R 2 , R 2 ñìåùåíû îòíîñèòåëüíî  2 çàâåäîìî ïîëîæèòåëüíî, à äëÿ êðèòåðèåâ » R 2 è R 2 õàðàêòåð òàêîãî ñìåùåíèÿ çàâèñèò îò ïàðàìåòðîâ p, n è ñòàòèñòèêè R 2 . Ïîýòîìó öåëåñîîáðàçíî ïðîäîëæèòü ïîèñê äðóãèõ ïîäõîäîâ ê êîíñòðóèðîâàíèþ íà îñíîâå ñòàòèñòèêè R 2 êðèòåðèåâ êà÷åñòâà ðåãðåññèé.  [Àéâàçÿí è äð. (1985), ñ. 190–192] áûëî ïðåäëîæåíî ïðè âûáîðå ðåãðåññîðîâ ìàêñèìè2 2 çèðîâàòü íå R 2 , à òàê íàçûâàåìóþ íèæíþþ ãðàíèöó Rmin, P äëÿ  ïðè çàäàâàåìîé äîâåðè2 òåëüíîé âåðîÿòíîñòè P. Ñòàòèñòèêà Rmin, P îïðåäåëÿëàñü ïðè óïðîùàþùåì ïðåäïîëîæå2 íèè î ïðîïîðöèîíàëüíîñòè ðàçíîñòè ( R 2 - Rmin, P ) àñèìïòîòè÷åñêîé (ïðè áîëüøèõ n) îöåíêå 2 ñðåäíåêâàäðàòè÷åñêîé îøèáêè ñëó÷àéíîé âåëè÷èíû R 2 . Êðèòåðèé Rmin, P çàäàâàëñÿ ôîðìóëîé 2 2 2 Rmin, P = R - l( P )( 1- R ) 2( p - 1)( n - p ) . ( n - 1) 2 ( n + 1) (7) Çíà÷åíèå ìíîæèòåëÿ l( P ) ïðåäëàãàëîñü âûáèðàòü â çàâèñèìîñòè îò P. Îäíàêî ôóíêöèÿ l( P ) íå ïîääàåòñÿ èäåíòèôèêàöèè, è âîñïîëüçîâàòüñÿ ôîðìóëîé (7) ïðè îãðàíè÷åííîì, à òåì áîëåå ïðè ìàëîì ÷èñëå íàáëþäåíèé íåâîçìîæíî. Çíà÷åíèå êîýôôèöèåíòà l( P ) ïðèõîäèòñÿ çàäàâàòü, èñõîäÿ èç ïðàãìàòè÷åñêèõ ñîîáðàæåíèé. 74 Теория и методология R é 2( p - 1)( n - p ) ù 2 Rmin = R 2 - 2( 1- R 2 ) ê ú êë ( n - 1) 2 ( n + 1) úû 0 ,5 . (8) Ýòà ñòàòèñòèêà òàêæå íàçûâàåòñÿ íèæíåé äîâåðèòåëüíîé ãðàíèöåé (òî÷íåå, åå îöåíêîé) äëÿ  2 , íî áåç óïîìèíàíèÿ çàäàâàåìîé äîâåðèòåëüíîé âåðîÿòíîñòè. ~ ~ 2 2 Ñðàâíèì çíà÷åíèÿ ñòàòèñòèê R 2 è Rmin . Äëÿ ðàçíîñòè ( R 2 - Rmin ), èñïîëüçóÿ (5), (8) è íåðàâåíñòâî n > p ³ 3, ïîëó÷àåì 0 ,5 ìï ( n - 1) - ( n - 3 ) F é 2( p - 1)( n - p ) ù ü ï ~2 2 ï R - Rmin = ( 1- R 2 )ïí + 2ê ú ý, 2 ïï ï ê ú ( ) ( n+ ) n p n 1 1 ë û ï î þ ãäå, êàê è ïðåæäå, F º F (1; 1; 0 , 5(n - p ) + 1; 1- R 2 ). Èç (5) íàõîäèòñÿ ñëåäóþùàÿ ôîðìóëà äëÿ ~ (n - 3 )F (n - p ): (n - 3 )F (n - p ) = (1- R 2 ) (1- R 2 ) ³ 1. Òîãäà ïðè R 2 < 1 èìååì 0 ,5 0 ,5 ~ ì ì n -1 é 2( p - 1)( n - p ) ù ü é 2( p - 1)( n - p ) ù ü ï n - 1 1- R 2 ï ï ~2 2 2 ï ï ï ï ( 1 R ) 1 2 R - Rmin = ( 1- R 2 )ï + 2 > + ê ê ú ú í ý í ý= 2 2 2 ï ï ï ï ê ê ú ú ( ) ( n + 1 ) n p n p 1 R n 1 ( n ) ( n + ) 1 1 ë ë û û ï ï ï ï î þ î þ 0 ,5 ü ìï p - 1 é ù 2( p - 1)( n - p ) ï = ( 1- R 2 )íï + 2ê ú ï ý > 0. 2 ïï n - p ê ë ( n - 1) ( n + 1) úû ï ï î þ ~ 2 è ñòàòèÑëåäîâàòåëüíî, äëÿ ìàòåìàòè÷åñêèõ îæèäàíèé ýòèõ ñòàòèñòèê èìååì ER 2 > ERmin 2 2 ñòèêà Rmin ñìåùåíà îòíîñèòåëüíî  , ÷òî è ñëåäîâàëî îæèäàòü, ó÷èòûâàÿ èõ îïðåäåëåíèÿ. ~ 2  òî æå âðåìÿ èç îïðåäåëåíèé (5) è (8) äëÿ R 2 è Rmin ñëåäóåò, ÷òî ñ ðîñòîì n èõ çíà÷åíèÿ ñáëè2 æàþòñÿ, ñòðåìÿñü ê R . Îäíàêî ïðè îãðàíè÷åííîì ÷èñëå íàáëþäåíèé ýêâèâàëåíòíîñòü ïðè~ 2 ìåíåíèÿ êðèòåðèåâ Rmin è R 2 â çàäà÷å âûáîðà ðåãðåññèé ïî ìåíüøåé ìåðå íå î÷åâèäíà. Ïî~ ýòîìó ïðîàíàëèçèðóåì âîçìîæíîñòü ýôôåêòèâíîãî âû÷èñëåíèÿ íåñìåùåííîé îöåíêè R 2 äëÿ  2 . ~ 3. Эффективно вычисляемая форма представления статистики R 2 ~ ×òîáû îöåíêà R 2 äëÿ  2 ìîãëà ïðèìåíÿòüñÿ â êà÷åñòâå êðèòåðèÿ âûáîðà ìíîæåñòâà ðåãðåññîðîâ, äîñòàòî÷íî èìåòü âîçìîæíîñòü âû÷èñëÿòü çíà÷åíèÿ ôóíêöèè F (1; 1; g ; z ) ïðè g = 0 , 5(n - p ) + 1 è 0 £ z = (1- R 2 ) £ 1. Ýòî ìîæíî ñäåëàòü ñëåäóþùèìè ñïîñîáàìè.  î - ï å ð â û õ, ýòî çíà÷åíèå ìîæíî ðàññ÷èòûâàòü, èñïîëüçóÿ îïðåäåëåíèå (4) äëÿ ôóíêöèè F. Òîãäà ¥ ü ìï k !( 1- R 2 ) k ï n -3 ~2 ï R = 1( 1- R 2 )ïí1+ ( 1- R 2 ) å ý. ï ïïî n- p ( ) ( k ) g g L g + 1 + k=0 ï þ (5’) Îäíàêî òàêîé ñïîñîá ìîæåò áûòü ñëîæåí äëÿ ðåàëèçàöèè èç-çà íåîáõîäèìîñòè âû÷èñëÿòü çíà÷åíèÿ êîýôôèöèåíòîâ ïðè z k = (1- R 2 ) k .  î - â ò î ð û õ, ìîæíî âîñïîëüçîâàòüñÿ ïðåäñòàâëåíèåì ôóíêöèè F (1; 1; g ; z ) â âèäå îïðåäåëåííîãî èíòåãðàëà [Ãðàäøòåéí, Ðûæèê (1962), ôîðìóëà (9.111)]: R Теория и методология 75 Э. Б. Ершов 2  ðàçâèòèå èäåè, íà êîòîðîé îñíîâûâàëîñü ââåäåíèå ñòàòèñòèêè Rmin, P , â [Àéâàçÿí, Ìõèòà~2 ðÿí (1998), ñ. 420, 663, 664] ââåäåí çàìåíÿþùèé ñòàòèñòèêó R , ïðîñòî âû÷èñëÿåìûé, ìàêñè2 ìèçèðóåìûé ïîêàçàòåëü êà÷åñòâà ðåãðåññèè Rmin : F( 1; 1; g ; z ) = 1 g( g ; z ) 1 ( 1- u ) g- 2 . du º ò B ( 1; g - 1) 0 1- uz B ( 1; g - 1) (9) Çíà÷åíèå áåòà-ôóíêöèè B (1; g-1)ºB (1; 0 , 5(n -p )) ëåãêî âû÷èñëÿåòñÿ: B (1; g -1)=Ã(1)Ã(g -1) Ã(g ), ¥ ãäå Ã( x + 1) = ò e - t t x dt — ãàììà-ôóíêöèÿ, Ã(1) = 1, Ã(x + 1) = x Ã(x) è B(1; g -1) = 2 (n - p ). Îïðå0 äåëåííûé èíòåãðàë g( g ; z ) ìîæåò âû÷èñëÿòüñÿ ìåòîäàìè ÷èñëåííîãî èíòåãðèðîâàíèÿ. Êîìáèíèðóÿ ôîðìóëû (5) è (9) è ïåðåõîäÿ ê ïåðåìåííîé t = (1- u ), ïîëó÷àåì èíòåãðàëüíîå ïðåä~ ñòàâëåíèå ñòàòèñòèêè R 2 : 1 Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации t 0 , 5( n- p )-1 ~2 R = 1- 0,5( n - 3 ) ò dt , c+t 0 (5’‘) ãäå c = R 2 (1- R 2 ) è R 2 ¹ 1. Çàìåòèì, ÷òî ñ ïîìîùüþ (9) âû÷èñëÿåòñÿ çíà÷åíèå F (1; 1; 0 , 5(n - p ) + 1; 1), ïîëó÷àåìîå ïðè R 2 = 0, òàê êàê 1 1 g( g ; 1) = ò ( 1- u ) g- 3 du = ò t g- 3dt è g - 3 = 0,5( n - p - 4 ). 0 0 Åñëè n = p + 1, òî g - 3 = -15 , , Åñëè n = p + 2, òî g - 3 = -1, òt òt g-3 g-3 dt = -2t -0 , 5 è g( g ; 1) = +¥. dt = ln t è g( g ; 1) = +¥. 1 Åñëè n ³ p + 3, òî ò t g-3 dt = 2 (n - p - 2). 0 Òàêèì îáðàçîì, ïðè ìèíèìàëüíîì çíà÷åíèè R 2 = 0 ñòàòèñòèêè R 2 ïîëó÷àåì p -1 ì ï ïðè n ³ p + 3 ; ï n -3 ~2 ï R ( 0 ) º 1F( 1; 1; 0,5( n - p ) + 1; 1) = í n - p - 2 ï n- p ï ïðè n = p + 1 èëè p + 2. ï î-¥ (10)  - ò ð å ò ü è õ, ôóíêöèÿ g( g ; z ) ïðè g = 0 , 5(n - p ) + 1ïðåäñòàâèìà â âèäå ñóììû êîíå÷íîãî ÷èñëà ñëàãàåìûõ, ÿâëÿþùèõñÿ èçâåñòíûìè ôóíêöèÿìè àðãóìåíòîâ (n - p ) è z = (1- R 2 ). Âîçìîæíîñòü ïîëó÷åíèÿ òàêîãî ïðåäñòàâëåíèÿ äî íàñòîÿùåãî âðåìåíè, ïî-âèäèìîìó, íå áûëà çàìå÷åíà. Äëÿ íàõîæäåíèÿ îïðåäåëåííîãî èíòåãðàëà â ôîðìóëå (9) c ïàðàìåòðîì ( g - 2) = = 0 , 5(n - p ) - 1, ïðèíèìàþùèì çíà÷åíèÿ {–0,5; 0; +0,5; 1; ...} ïð è n - p = 1, 2, ... , ââåäåì ïåðåìåííóþ z = (1- R 2 ). Ïðåäïîëàãàÿ, ÷òî R 2 < 1 è c = (1- z ) z = R 2 (1- R 2 ), ðàññìîòðèì ñëåäóþùèå ñëó÷àè äëÿ g( g ; z ): · Ïðè n - p = 2 èìååì 1 g( g ; z ) = 76 1 1 1 dt = ln( 1+ c -1 ). ò z 0 c+t z Теория и методология R g( g ; z ) = 1 ù ck 1 t s- 0 , 5 1 é s -1 dt = ê å + ( -1) s ×2 c s- 0 , 5arctg( c -0 , 5 )ú . ò úû z 0 c+t z êë k = 0 s - k - 0,5 · Ïðè ÷ å ò í î ì n - p = 2( s + 1), s = 1, 2,... , èñïîëüçóÿ ôîðìóëó (2.153) èç [Ãðàäøòåéí, Ðûæèê (1962)], ïîëó÷àåì g( g ; z ) = 1 ù ts 1 1 é s -1 c k dt = ê å + ( -1) s c s ln( 1+ c -1 )ú . ò úû z 0 c+t z êë k = 0 s - k ~ Ïðèâåäåííûå ôîðìóëû ïîçâîëÿþò ïðåäñòàâèòü ñòàòèñòèêó R 2 â âèäå ~2 R = 1- 0,5( n - 3 ) G( n - p ; c ), ãäå ôóíêöèÿ G (n - p ; c ) îïðåäåëåíà ïðè 0 < c = R 2 (1- R 2 ), 0 < R 2 < 1, p = m + 1 ñëåäóþùèì îáðàçîì: s -1 G( n - p ; c ) = 2 å ( -1) k k=0 ck + ( -1) s ×2 c s- 0 , 5arctg( c -0 , 5 ) º H1( s ; c ) + H 2( s ; c ), åñëè n - p = 2s + 1; 2( s - k ) - 1 (11) s -1 G( n - p ; c ) = å ( -1) k k=0 k c + ( -1) s c s ln(1+ c -1) º H 3( s ; c ) + H 4 ( s ; c ), s- k åñëè n - p = 2( s + 1), çäåñü s = 0 , 1, 2, ... . Âû÷èñëåíèå çíà÷åíèé ìíîãî÷ëåíîâ H1(s; c) è H3(s; c) îò ïåðåìåííîé ñ ìîæåò ïðèâîäèòü ê ïîòåðå òî÷íîñòè ïðè áîëüøèõ çíà÷åíèÿõ ñ, ò. å. ïðè R 2 » 1, ïîýòîìó äëÿ çíà÷åíèé ñ è R 2 âûäåëèì ñëåäóþùèå ñëó÷àè: 1) 0 £ R 2 £ 0 , 5, c £ 1, c -1 ³ 1; 2) 0 , 5 £ R 2 < 1, c ³ 1, c -1 £ 1. Ïðè îòíîñèòåëüíî íåáîëüøèõ çíà÷åíèÿõ R 2 , ò. å. ïðè R 2 £ 0 , 5, öåëåñîîáðàçíî èñïîëüçîâàòü ôîðìóëû (11) äàæå ïðè áîëüøèõ çíà÷åíèÿõ (n – p), òàê êàê ñ £ 1.  ñëó÷àå R 2 ³ 0 , 5 âîñïîëüçóåìñÿ ðàçëîæåíèåì ôóíêöèé arctg x è ln(1 + x) â ñòåïåííûå ðÿäû: ¥ arctg x = å ( -1) k k=0 ¥ x 2 k +1 ïðè x 2 £ 1 è x º c -0 , 5 £ 1; 2k + 1 ln( 1+ x ) = å ( -1) k k=0 k x k (12) ïðè - 1 < x £ 1 è x º c -1 £ 1. Ñ ïîìîùüþ (12) ïîêàçûâàåòñÿ, ÷òî ìíîãî÷ëåíû H1(s; c) è H2(s; c) ðàâíû ñóììàì ñëàãàåìûõ â ôóíêöèÿõ H3(s; c) è H4(s; c) ñîîòâåòñòâåííî, ñîäåðæàùèõ íåîòðèöàòåëüíûå ñòåïåíè ïåðåìåí- R Теория и методология 77 Э. Б. Ершов · Ïðè í å ÷ å ò í û õ çíà÷åíèÿõ ïàðàìåòðà n - p = 2s + 1, s = 1, 2,... , ïðèìåíÿÿ ôîðìóëû (2.211) è (2.212) èç [Ãðàäøòåéí, Ðûæèê (1962)], íàõîäèì íîé ñ. Òàêèì îáðàçîì, äëÿ G (n - p ; c ) ïðè R 2 ³ 0 , 5 ïîëó÷àåì îáùåå äëÿ ÷åòíûõ è íå÷åòíûõ çíà÷åíèé (n – p) ïðåäñòàâëåíèå â âèäå ñòåïåííîãî ðÿäà ¥ G( n - p ; c ) = 2 c -1 å ( -1) k ( 2 k + n - p ) -1c - k , k=0 Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации â êîòîðîì 0 £ c -1 = (1 R 2 ) - 1£ 1. ~  èòîãå äëÿ ñòàòèñòèêè R 2 ïîëó÷àåì èñ÷åðïûâàþùåå âñå âîçìîæíûå ñëó÷àè ïðåäñòàâëåíèå â âèäå ôóíêöèè îò R 2 , ÷èñëà íàáëþäåíèé n è ÷èñëà êîýôôèöèåíòîâ p â óðàâíåíèè ðåãðåññèè (ïðåäïîëàãàåòñÿ, ÷òî n > p ³ 3, c = R 2 (1- R 2 ) è q — öåëàÿ ÷àñòü ÷èñëà 0 , 5(n - p - 1)): ïìï-¥, ïï p -1 , ïïn p -2 ïï é q -1 ù ï ck ~ 2 ïï1- ( n - 3 ) ê ( -1) k + ( -1) q c q- 0 , 5arctg( 1 R 2- 1)0, 5ú , R =í å ê k=0 ú n-p -2 k -2 ïï ë û ïï q 1 k é ù c ïï1- ( n - 3 ) ê ( -1) k + ( -1) q c q ln( 1 R 2 ) 0 , 5 ú , ïï êë å úû n - p -2k -2 k=0 ïï 1 , ïî åñëè R 2 = 0 è n = p + 1, p + 2 ; åñëè R 2 = 0 è n ³ p + 3 ; åñëè 0 < R 2 < 1 è n - p = 2 q + 1; (5’‘’) åñëè 0 < R 2 < 1 è n - p = 2( q + 1); åñëè R 2 = 1.  ñëó÷àå åñëè 0 , 5 £ R 2 < 1è c ³ 1, ìîæíî òàêæå âîñïîëüçîâàòüñÿ ôîðìóëîé ¥ ~2 R = 1- ( n - 3 ) c -1 å ( -1) k ( 2 k + n - p ) -1 c - k . (5’‘’‘) k=0 ~ Ïðåäñòàâëåíèå (5’‘’), (5’‘’‘) ñòàòèñòèêè R 2 ïî ñðàâíåíèþ ñ (5’), èñïîëüçóþùèì êîýôôèöèåí2 k òû k ! [g ( g + 1)... ( g + k )] ïðè (1- R ) , îòëè÷àåòñÿ ïðîñòîòîé ôîðìóë äëÿ êîýôôèöèåíòîâ ïðè ~ ñòåïåíÿõ ïåðåìåííûõ ñ è c -1 . Ìåòîä âû÷èñëåíèÿ ñòàòèñòèêè R 2 ïî ôîðìóëàì (5’‘’) ðåàëèçîâàí ñîâìåñòíî ñ êàíä. ýêîí. íàóê Í. À. Òîëìà÷åâîé. ~ 4. Примеры применения статистики R 2 при выборе наилучшей регрессии Ïîäõîäû ê âûáîðó íàèëó÷øåé ðåãðåññèè â çàäà÷å ñ íåáîëüøèì ÷èñëîì ïîòåíöèàëüíûõ ôàêòîðîâ â íàó÷íûõ ìîíîãðàôèÿõ è ó÷åáíèêàõ èëëþñòðèðóþòñÿ íà íåñêîëüêèõ ïîâòîðÿåìûõ ïðèìåðàõ. Ýòî ïîçâîëÿåò ñðàâíèâàòü ðåçóëüòàòû, ïîëó÷àåìûå ñ èñïîëüçîâàíèåì ïîñòîÿííî îáíîâëÿåìûõ èäåé è îáùèõ èñõîäíûõ äàííûõ. Íà äâóõ òàêèõ ïðèìåðàõ ïðîäåìîíñòðèðóåì ~ âîçìîæíîñòü ïðèìåíåíèÿ ñòàòèñòèêè R 2 . 4.1. Ïðèìåð Õàëüäà  [Äðåéïåð, Ñìèò (1987)] è [Ñåáåð (1980)] äåòàëüíî àíàëèçèðóþòñÿ âñå âàðèàíòû ðåãðåññèé, áàçèðóþùèõñÿ íà äàííûõ èç [Woods et al. (1932)] è [Õàëüä (1956)]. Îáúÿñíÿåìàÿ ïåðåìåííàÿ y = ( y k ) â ýòîì ïðèìåðå — òåïëî, âûäåëÿþùååñÿ ïðè ïðîèçâîäñòâå öåìåíòà (êàëîðèÿ/ãðàìì), a x j = ( xk j ), j = 1,... , 4 (m = 4 ), — ïåðåìåííûå, õàðàêòåðèçóþùèå ñîäåðæàíèå ÷åòûðåõ âåùåñòâ â êëèíêåðå (â %) â 13 íàáëþäåíèÿõ (k = 1,... , n ; n = 13 ). Ôàêòîðû x j ïðèáëèæåííî ìóëüòèêîëëèíåàðíû, òàê êàê èõ ñóììû â êàæäîì íàáëþäåíèè áëèçêè ê 100. Âû- 78 Теория и методология R (x1; x2), (x1; x4), (x1; x2; x3), (x1; x2; x4), (x1; x3; x4), (x2; x3; x4), (x1; x2; x3; x4). » ~ 2 Òàáëèöà 1 ñîäåðæèò çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 , Rmin ,»R 2 è R 2 äëÿ âñåõ 15 âàðèàíòîâ íàáîðà ~2 2 ôàêòîðîâ x1, ... , x4 .  ýòîì ïðèìåðå çíà÷åíèÿ ñòàòèñòèê R è R ïðèâîäÿòñÿ ñ áî´ëüøèì ÷èñëîì » ~ çíàêîâ äëÿ òîãî, ÷òîáû ñäåëàòü ÿâíûì âûïîëíåíèå íåðàâåíñòâà R 2 > R 2 . Îòîáðàííûå âàðèàíòû ÷åòêî âûäåëÿþòñÿ ñðåäè ðåãðåññèé ñ ôèêñèðîâàííûì ÷èñëîì ôàêòîðîâ. Ïðè ýòîì ðåã2 ðåññèè ñ îäíèì ôàêòîðîì ( m = 1, p = 2) óñòóïàþò ïî êðèòåðèÿì R 2 è Rmin ðåãðåññèÿì-ïðåòåíäåíòàì. Òàáëèöà 1 Çíà÷åíèÿ êðèòåðèåâ âûáîðà ðåãðåññèè, îñíîâàííûõ íà ôóíêöèÿõ îò ñòàòèñòèêè R 2 , äëÿ ïðèìåðà Õàëüäà Ìàêñèìèçèðóåìûå êðèòåðèè Íàáîð ôàêòîðîâ Ñòàòèñòèêà R2 R R R Ðàíã íàáîðà ôàêòîðîâ* (x1) 0,53395 0,49158 0,39421 — — — (x2) 0,66627 0,63593 0,56620 — — — (x3) 0,28587 0,22095 0,07175 — — — 2 R 2 min ~2 »2 (x4) 0,67454 0,64495 0,57696 — — — (x1; x2) 0,97868 0,97441 0,96841 0,9786026 0,9786021 4 (x1; x3) 0,54817 0,45780 0,33051 0,5141412 0,5088098 11 (x1; x4) 0,97247 0,96697 0,95921 0,9723448 0,9723437 6 (x2; x3) 0,84703 0,81643 0,77333 0,8431252 0,8429443 9 (x2; x4) 0,68006 0,61607 0,52594 0,6630002 0,6612219 10 (x3; x4) 0,93529 0,92235 0,90412 0,9345918 0,9345785 8 (x1; x2; x3) 0,98228 0,97638 0,97058 0,9802529 0,9802526 2 (x1; x2; x4) 0,98234 0,97645 0,97067 0,9803097 0,9803094 1 (x1; x3; x4) 0,98128 0,97504 0,96891 0,9791304 0,9791300 3 (x2; x3; x4) 0,97282 0,96376 0,95486 0,9696507 0,9696495 7 (x1; x2; x3; x4) 0,98238 0,97356 0,96728 0,9778919 0,9778914 5 » ~ 2 * Ïðèâåäåíû ðàíãè ðåãðåññèé, äëÿ êîòîðûõ îïðåäåëåíû ñòàòèñòèêè R 2, Rmin , R 2 è R 2 . Ðàíãè ïðèñâàèâàþòñÿ â ñîîòâåòñòâèè ñ óáûâàíèåì çíà÷åíèé ëþáîãî èç êðèòåðèåâ. R Теория и методология 79 Э. Б. Ершов áîðî÷íûå çíà÷åíèÿ êîýôôèöèåíòîâ êîððåëÿöèè äëÿ ïàð ôàêòîðîâ ïîäòâåðæäàþò ïðåäïîëîæåíèå î ìóëüòèêîëëèíåàðíîñòè (r ( x1; x3 ) @ -0 , 8241, r ( x2 ; x4 ) @ -0 ,9730 ), òàê æå êàê è çíà÷åíèå det( X’ X ) @ 0 ,0010677 äåòåðìèíàíòà ìàòðèöû X’ X, ãäå X — ìàòðèöà ðàçìåðîì 13 ´ 5, ñîäåðæàùàÿ çíà÷åíèÿ àðãóìåíòîâ â ðåãðåññèè y = a 0 + a1 x1 + ... + a 4 x 4 , è ñîáñòâåííûå çíà÷åíèÿ êîððåëÿöèîííîé ìàòðèöû C º cor( x1, ... , x4 ) äëÿ ôàêòîðîâ: l 1( C ) @ 2, 23569, , l 3 ( C ) @ 0 ,18661 è l 4( C ) @ 0 ,00162. , l 2( C ) @ 157606 C èñïîëüçîâàíèåì ðàçëè÷íûõ ïîäõîäîâ â [Äðåéïåð, Ñìèò (1987)] è [Ñåáåð (1980)] áûëè âûäåëåíû ñëåäóþùèå ïðåòåíäåíòû íà ðîëü íàáîðà ôàêòîðîâ äëÿ íàèëó÷øåé ðåãðåññèè: Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации » ~ 2 Äëÿ ðåãðåññèè ñ ôàêòîðàìè (x1; x2) çíà÷åíèÿ ñòàòèñòèê R 2 , Rmin , R 2 è R 2 áîëüøå, ÷åì äëÿ ðåãðåññèè ñ ôàêòîðàìè (x1; x4). Àíàëîãè÷íûì îáðàçîì ðåãðåññèÿ ñ ôàêòîðàìè (x1; x2; x4) îêàçûâàåòñÿ ïðåäïî÷òèòåëüíåå äðóãèõ ðåãðåññèé ñ òðåìÿ è äâóìÿ ôàêòîðàìè. Äðåéïåð è Ñìèò, èñïîëüçóÿ ìåòîä èñêëþ÷åíèÿ ôàêòîðîâ è «øàãîâûé ìåòîä» (ìåòîä ïîïîëíåíèÿ ìíîæåñòâà ôàêòîðîâ), ïðèíèìàÿ áåç òåñòèðîâàíèÿ ãèïîòåçó íîðìàëüíîñòè îøèáîê è çàäàâàÿ áåç îáîñíîâàíèÿ óðîâåíü çíà÷èìîñòè äëÿ F-êðèòåðèåâ, îòäàëè ïðåäïî÷òåíèå ðåãðåññèè ñ ôàêòîðàìè (x1; x2) .  êà÷åñòâå êðèòåðèÿ âûáîðà ôàêòîðîâ èìè èñïîëüçîâàëàñü è ïðåäëîæåííàÿ Ìýëëîóçîì Ñp-ñòàòèñòèêà, ÷òî òàêæå ïðèâåëî ê âûáîðó ðåãðåññèè ñ ôàêòîðàìè (x1; x2). Îäíàêî ïðè ýòîì íå áûëî îáðàùåíî âíèìàíèå íà òî, ÷òî â ýòîì êðèòåðèè â êà÷åñòâå íàäåæíîé, ïî ïðåäïîëîæåíèþ íåñìåùåííîé îöåíêè äèñïåðñèè ñëó÷àéíûõ îøèáîê èñïîëüçóåòñÿ òàêàÿ âåëè÷èíà, êàê «s2 — îñòàòî÷íûé ñðåäíèé êâàäðàò ÌÍÊ-îòêëîíåíèÿ äëÿ óðàâíåíèÿ, ñîäåðæàùåãî âñå ïåðåìåííûå» [Äðåéïåð, Ñìèò (1987), ñ. 14, 15]. Äëÿ ïðèìåðà Õàëüäà ñ ÿâíî ìóëüòèêîëëèíåàðíûìè äàííûìè óêàçàííîå äîïóùåíèå âðÿä ëè ìîæåò áûòü îïðàâäàíî. Òàêîé îöåíêîé áûëî áû åñòåñòâåííåå ñ÷èòàòü ñòàòèñòèêó s 2 äëÿ èñêîìîé «íàèëó÷øåé ðåãðåññèè», íî ýòî ðàçðóøàëî áû êîíñòðóêöèþ ìåòîäà, èñïîëüçóþùåãî ñòàòèñòèêó Cp. Ïîëåçíî èìåòü â âèäó, ÷òî òàê íàçûâàåìàÿ ÏÐÅÑÑ-ïðîöåäóðà [Äðåéïåð, Ñìèò (1987), ñ. 40–42] òîæå ïîçâîëèëà âûäåëèòü âàðèàíòû ðåãðåññèé, äëÿ êîòîðûõ êðèòåðèé «ïðåäñêàçàííàÿ ñóììà êâàäðàòîâ» (Prediction sum square) PSS( xj (1) , ... , xj (m ) ) ïðèíèìàë íàèìåíüøèå, íî îòíîñèòåëüíî ìàëî ðàçëè÷àþùèåñÿ çíà÷åíèÿ: PSS( x1; x2 ) @ 95, PSS( x1; x4 ) @ 121, PSS( x1; x2 ; x3 ) @ 91, PSS( x1; x2 ; x4 ) @ 85, PSS( x1; x3 ; x4 ) @ 87, PSS( x1; x2 ; x3 ; x4 ) @ 110. Äëÿ îñòàëüíûõ ðåãðåññèé çíà÷åíèÿ êðèòåðèÿ PSS îêàçàëèñü â ïðåäåëàõ îò PSS( x3 ; x4 ) @ 264 äî PSS( x3 ) @ 2616. Ïî-âèäèìîìó, ñòðåìëåíèå âûáèðàòü óðàâíåíèå êàê ìîæíî ñ ìåíüøèì ÷èñëîì àðãóìåíòîâ õîòÿ áû ÷àñòè÷íî îáúÿñíÿåòñÿ ïðåóâåëè÷åíèåì òðóäíîñòåé ðåàëèçàöèè ÌÍÊ, âîçíèêàþùèõ ñ ðîñòîì ÷èñëà ôàêòîðîâ. Îäíàêî äëÿ ðåãðåññèé ñ äâóìÿ è òðåìÿ ôàêòîðàìè ýòà ïîçèöèÿ àâòîðîâ íå ìîæåò îáúÿñíÿòüñÿ âîçðàñòàþùåé «ñëîæíîñòüþ» ðàñ÷åòîâ. Ñêîðåå ñëåäîâàëî áû ãîâîðèòü îá óãðîçå âîçíèêíîâåíèÿ ìóëüòèêîëëèíåàðíîñòè ôàêòîðîâ ñ óâåëè÷åíèåì èõ ÷èñëà è î íåîáõîäèìîñòè ïðîãíîçèðîâàòü áîëüøåå ÷èñëî ôàêòîðîâ. Ìîæíî ñ÷èòàòü, ÷òî â äàííîì ïðèìåðå ÏÐÅÑÑ-ïðîöåäóðà â êà÷åñòâå êîíêóðèðóþùèõ ðåãðåññèé îïðåäåëÿåò óðàâíåíèÿ ñ íàáîðàìè ôàêòîðîâ (x1; x2; x4), (x1; x3; x4), äëÿ êîòîðûõ çíà÷åíèÿ êðèòåðèÿ PSS ìèíèìàëüíû. Ïðè ýòîì â ÷èñëî êîíêóðèðóþùèõ ïðåòåíäåíòîâ âêëþ÷åíà ðåã» ~2 2 2 2 ðåññèÿ (x1; x2; x4) ñ íàèáîëüøèìè çíà÷åíèÿìè ñòàòèñòèê R , Rmin , R è R . Ýòîò æå íàáîð ôàêòîðîâ (x1; x2; x4) îïðåäåëÿåòñÿ â êà÷åñòâå íàèëó÷øåãî è ïðè ïðèìåíåíèè ïðåäëîæåííîãî â [Webster et al. (1974)] ìîäèôèöèðîâàííîãî ÌÍÊ, èëè ìåòîäà «ðåãðåññèè íà ãëàâíûå êîìïîíåíòû». Ýòîò ìåòîä èñïîëüçóåò ñîáñòâåííûå âåêòîðû êîððåëÿöèîííîé ìàòðèöû äëÿ îáúÿñíÿåìîé ïåðåìåííîé è âñåõ ðàññìàòðèâàåìûõ ôàêòîðîâ. Ôîðìàëüíîå èçëîæåíèå ìåòîäà è åãî ïðèìåíåíèå ê äàííûì ïðèìåðà Õàëüäà èìåþòñÿ â [Äðåéïåð, Ñìèò (1987), ñ. 48–52]. Ñåáåð, èñïîëüçóÿ ïîíÿòèå R 2 -àäåêâàòíîãî (a )-íàáîðà ðåãðåññîðîâ, ïðåäëîæåííîå â [Aitkin (1974)], ïðèâîäèò âñå òàêèå íàáîðû äëÿ ïðèìåðà Õàëüäà, ñîîòâåòñòâóþùèå äîâåðèòåëüíîé âåðîÿòíîñòè a = 0 ,05. Èìè îêàçàëèñü (x1; x2), (x1; x4) è âñå ÷åòûðå íàáîðà, ñîäåðæàùèå òðè ôàêòîðà [Ñåáåð (1980), ñ. 351, 352]. Îäíàêî ýòîò ïîäõîä íå ïîçâîëèë â ýòîì ïðèìåðå ñóçèòü ìíîæåñòâî ðåãðåññèé-êîíêóðåíòîâ. Íåñîâïàäåíèå ðåçóëüòàòîâ âûáîðà íàèëó÷øåé ðåãðåññèè ðàçíûìè ìåòîäàìè èëè ôàêòè÷åñêàÿ íååäèíñòâåííîñòü ðåçóëüòàòîâ òàêîãî âûáîðà îòìå÷àåòñÿ ïî÷òè âñåìè èññëåäîâàòå- 80 Теория и методология R 4.2. Àíàëèç óðîæàéíîñòè çåðíîâûõ êóëüòóð Ïî äàííûì 20 ñåëüñêîõîçÿéñòâåííûõ ðàéîíîâ íåêîòîðîé îáëàñòè â ïðèìåðå 15.1 èç [Àéâàçÿí, Ìõèòàðÿí (1998), ñ. 631, 632, 636, 644–646, 652, 654, 664–668] èññëåäóåòñÿ çàâèñèìîñòü óðîæàéíîñòè çåðíîâûõ êóëüòóð y (ö/ãà) îò ïÿòè ôàêòîðîâ: x1 — ÷èñëî òðàêòîðîâ íà 100 ãà; x2 — ÷èñëî çåðíîóáîðî÷íûõ êîìáàéíîâ íà 100 ãà; x3 — ÷èñëî îðóäèé ïîâåðõíîñòíîé îáðàáîòêè ïî÷âû íà 100 ãà; x4 — êîëè÷åñòâî óäîáðåíèé, ðàñõîäóåìûõ íà ãåêòàð (ö/ãà); x5 — êîëè÷åñòâî ðàñõîäóåìûõ õèìè÷åñêèõ ñðåäñòâ çàùèòû ðàñòåíèé (ö/ãà). Îòìå÷àåòñÿ âûñîêàÿ ìóëüòèêîëëèíåàðíîñòü ôàêòîðîâ, ïðè÷åì êîððåëèðîâàííîñòü ôàêòîðîâ x1 è x3 ñëåäóåò èç òîãî, ÷òî «îðóäèÿ ïîâåðõíîñòíîé îáðàáîòêè ïî÷âû ðåàëèçóþòñÿ â ïîäàâëÿþùåì áîëüøèíñòâå ñ ïîìîùüþ òðàêòîðîâ» [Àéâàçÿí, Ìõèòàðÿí (1998); ñ. 652, 654]. Ïîýòîìó èç äàëüíåéøåãî àíàëèçà èñêëþ÷èì ôàêòîð x1. » ~ 2  òàáë. 2 ïðèâåäåíû çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 , Rmin , R 2 è R 2 äëÿ âñåõ âàðèàíòîâ ðåãðåññèé. Ñðåäè óðàâíåíèé ñ îäíèì ôàêòîðîì ( m = 1, p = 2) ÿâíî âûäåëÿåòñÿ ðåãðåññèÿ ñ ôàêòîðîì x4, äëÿ êîòîðîé çíà÷åíèÿ âñåõ ðàññ÷èòàííûõ êðèòåðèåâ ñóùåñòâåííî ïðåâîñõîäÿò èõ çíà÷åíèÿ äëÿ äðóãèõ îäíîôàêòîðíûõ óðàâíåíèé. Èç ìíîæåñòâà óðàâíåíèé ñ äâóìÿ ôàêòîðàìè ( m = 2) ïî çíà÷åíèÿì âñåõ ïÿòè ñòàòèñòèê âûäåëÿþòñÿ ðåãðåññèè ñ ôàêòîðàìè (x2; x4) è (x3; x4). Äëÿ óðàâíåíèÿ ñ ôàêòîðàìè (x3; x4) çíà÷åíèÿ âñåõ ìàêñèìèçèðóåìûõ ñòàòèñòèê áîëüøå, ÷åì äëÿ ðåãðåññèè ñ ôàêòîðàìè (x2; x4). Ñðåäè òðåõôàêòîðíûõ ðåãðåññèé ïî çíà÷åíèÿì âñåõ ñòàòèñòèê ïðåòåíäåíòàìè íà ðîëü íàèëó÷øåé ðåãðåññèè îêàçûâàþòñÿ óðàâíåíèÿ ñ íàáîðàìè ôàêòîðîâ (x2; x4; x5) è (x3; x4; x5). Îäíàêî äëÿ ðåãðåññèè ñ ôàêòîðàìè (x2; x4; x5) çíà÷åíèÿ ñòàòèñòèê áîëüøå, ÷åì ó êîíêóðèðóþùåãî óðàâíåíèÿ. Òàêèì îáðàçîì, âûáîð íàèëó÷øåé ðåãðåññèè ñâîäèòñÿ ê âûáîðó ìåæäó óðàâíåíèÿìè ñ ôàêòîðàìè (x3; x4) è (x2; x4; x5), ïîñêîëüêó 2 ñóùåñòâåííî ìåíüäëÿ «ëó÷øåé» îäíîôàêòîðíîé ðåãðåññèè çíà÷åíèÿ ñòàòèñòèê R 2 , R 2 è Rmin øå, ÷åì äëÿ ýòèõ ïðåòåíäåíòîâ. Íàïîìíèì, ÷òî äëÿ ðåãðåññèé ñ îäíèì ôàêòîðîì íå âñå ðàññìàòðèâàåìûå ñòàòèñòèêè îïðåäåëåíû. Ðåãðåññèÿ ñ ÷åòûðüìÿ ôàêòîðàìè óñòóïàåò îòîáðàííûì äâóì êîíêóðèðóþùèì óðàâíåíèÿì ïî âñåì êðèòåðèÿì çà èñêëþ÷åíèåì R 2 , ÷òî åñòåñòâåííî. R Теория и методология 81 Э. Б. Ершов ëÿìè. Òàê, â [Ñåáåð (1980), ñ. 372] çàìå÷åíî, ÷òî ìåòîä ïîñëåäîâàòåëüíîãî âêëþ÷åíèÿ ôàêòîðîâ âûäåëÿåò íàáîð (x1; x2; x4), â òî âðåìÿ êàê ìåòîä ïîñëåäîâàòåëüíîãî èõ èñêëþ÷åíèÿ — íàáîð (x1; x2). Çàìåòèì, ÷òî â ýòèõ ìåòîäàõ äîâåðèòåëüíûå âåðîÿòíîñòè çàäàþòñÿ ýêçîãåííî, áåç ó÷åòà òîãî, íàñêîëüêî ðàçëè÷àþòñÿ çíà÷åíèÿ âîçìîæíûõ êðèòåðèåâ êà÷åñòâà ðåãðåññèé ïî íàáîðàì ôàêòîðîâ, è áåç òåñòèðîâàíèÿ íîðìàëüíîñòè. Òàêèì îáðàçîì, ðàññìàòðèâàåìûå Äðåéïåðîì, Ñìèòîì è Ñåáåðîì ìåòîäû îïðåäåëåíèÿ íàèëó÷øåé ðåãðåññèè â ïðèìåðå Õàëüäà ôàêòè÷åñêè ïîçâîëèëè âûäåëèòü ìíîæåñòâî ðåãðåññèé-êîíêóðåíòîâ, à íå îäíó, äåéñòâèòåëüíî ëó÷øóþ, ðåãðåññèþ.  òî æå âðåìÿ íà ïðèìåðå Õàëüäà âèäíî, ÷òî äëÿ âàðèàíòîâ ðåãðåññèé ñî çíà÷åíèÿìè R 2 , ~ 2 »2 áëèçêèìè ê 1, ñòàòèñòèêè R è R ñòàíîâÿòñÿ, êàê îòìå÷àëîñü, ïî÷òè ðàâíûìè.  ýòîì»ïðèìå~ 2 ðå ðàíãè, ïðèñâîåííûå ðåãðåññèÿì ïî óáûâàíèþ çíà÷åíèé êðèòåðèåâ R 2 , Rmin , R2 è R 2, íå ÿâëÿþùèõñÿ íåóáûâàþùèìè ïðè äîáàâëåíèè ôàêòîðîâ, ñîâïàäàþò. Ñëåäîâàòåëüíî, ïðè~ ìåíåíèå íåñìåùåííîé îöåíêè R 2 äëÿ êîýôôèöèåíòà äåòåðìèíàöèè  2 êàê êðèòåðèÿ êà÷åñòâà ðåãðåññèé â ýòîì ñëó÷àå íå ïðîòèâîðå÷èò ðåêîìåíäàöèÿì ïðèìåíÿòü äðóãèå ðàññìàòðèâàåìûå êðèòåðèè. Òàáëèöà 2 Выбор регрессии, максимизирующий несмещенную оценку коэффициента детерминации Çíà÷åíèÿ êðèòåðèåâ âûáîðà ðåãðåññèè, îñíîâàííûõ íà ôóíêöèÿõ îò ñòàòèñòèêè R 2, äëÿ ïðèìåðà àíàëèçà óðîæàéíîñòè çåðíîâûõ êóëüòóð Ìàêñèìèçèðóåìûå êðèòåðèè Íàáîð ôàêòîðîâ Ñòàòèñòèêà R2 R (x2) 0,13994 0,09215 (x3) 0,16253 (x4) 0,33329 R R Ðàíã íàáîðà ôàêòîðîâ* –0,02638 — — — 0,11601 0,00058 — — — 0,29625 0,20436 — — — 2 R 2 min ~2 »2 (x5) 0,11031 0,06089 –0,06173 — — — (x2; x3) 0,16408 0,06573 –0,09261 0,09052 0,07524 11 (x2; x4) 0,46196 0,39866 0,29674 0,43148 0,42783 4 (x2; x5) 0,17248 0,07512 –0,08163 0,10039 0,08562 10 (x3; x4) 0,48237 0,42147 0,32342 0,45416 0,45093 2 (x3; x5) 0,21503 0,12268 –0,02601 0,15017 0,13776 8 (x4; x5) 0,33330 0,25486 0,12858 0,28651 0,27924 7 (x2; x3; x4) 0,48386 0,38708 0,27092 0,42015 0,41635 6 (x2; x3; x5) 0,22120 0,07518 –0,10010 0,10093 0,08651 9 (x2; x4; x5) 0,51346 0,42223 0,31273 0,45510 0,45195 1 (x3; x4; x5) 0,49823 0,40415 0,29122 0,43715 0,43367 3 (x2; x3; x4; x5) 0,51730 0,38858 0,26712 0,42188 0,41819 5 » ~ 2 * Ïðèâåäåíû ðàíãè ðåãðåññèé, äëÿ êîòîðûõ îïðåäåëåíû ñòàòèñòèêè R 2, Rmin , R 2 è R 2 . Ðàíãè ïðèñâàèâàþòñÿ â ñîîòâåòñòâèè ñ óáûâàíèåì çíà÷åíèé ëþáîãî èç êðèòåðèåâ. 2 Ñ. À. Àéâàçÿí è Â. Ñ. Ìõèòàðÿí, ðåêîìåíäóþùèå ñòàòèñòèêó Rmin êàê êðèòåðèé êà÷åñòâà ðåãðåññèè, 2 îòäàþò ïðåäïî÷òåíèå óðàâíåíèþ ñ ôàêòîðàìè (x3; x4), òàê êàê» Rmin y;~ x3 , ~ x4 ) @ 0 ,323 > 0 ,313 @ (~ 2 2 ~2 2 ~ ~ ~ ~ @ Rmin ( y ; x2 , x4 , x5 ). Îäíàêî ïî çíà÷åíèÿì ñòàòèñòèê R , R è R ðåãðåññèÿ ñ ôàêòîðàìè (x2; x4; x5) ïðåäïî÷òèòåëüíåå, õîòÿ ðàçíèöû çíà÷åíèé êðèòåðèåâ äëÿ ýòèõ äâóõ êîíêóðèðóþùèõ óðàâíåíèé ìàëû. Òàêèì îáðàçîì, íà äàííîì ïðèìåðå ïîêàçàíî, ÷òî âûáîð ðåãðåññèè ïî êðèòåðèÿì » ~ ~ 2 è R 2 ìîæåò ïðèâîäèòü ê ðàçíûì ðåçóëüòàòàì. Çíà÷åíèÿ ñòàòèñòèê R 2 è R 2 ìîãóò äëÿ äàíRmin íîãî íàáîðà ôàêòîðîâ ñóùåñòâåííî ðàçëè÷àòüñÿ, íî ïðè ýòîì ðàíãè ðåãðåññèé, ïðèñâàèâàåìûå â ñîîòâåòñòâèè ñ óáûâàíèåì ýòèõ êðèòåðèåâ, ìîãóò ïîëíîñòüþ èëè ÷àñòè÷íî ñîâïàäàòü. 5. Заключение ~ Ïðåäëîæåíèå èñïîëüçîâàòü íåñìåùåííóþ îöåíêó R 2 êîýôôèöèåíòà äåòåðìèíàöèè  2 » èëè åå àïïðîêñèìàöèþ R 2 êàê êðèòåðèé êà÷åñòâà âûáèðàåìîãî íàáîðà ðåãðåññîðîâ îñíîâûâàåòñÿ íà ñòðîãî ôîðìóëèðóåìîì ïðåäïîëîæåíèè î íîðìàëüíîñòè ðàñïðåäåëåíèÿ äëÿ ñîâîêóïíîñòè ïåðåìåííûõ, ïîðîæäàþùèõ èñïîëüçóåìûå âûáîðî÷íûå äàííûå, è íà òåîðåòè÷åñêîì îïðåäåëåíèè ïîêàçàòåëÿ êà÷åñòâà çàâèñèìîñòè îäíîé èç òàêèõ ïåðåìåííûõ îò çàäàííî~ ãî íàáîðà äðóãèõ ïåðåìåííûõ-ôàêòîðîâ. Ïðè ïðèìåíåíèè ñòàòèñòèêè R 2 íå èñïîëüçóåòñÿ 82 Теория и методология R Список литературы Àéâàçÿí Ñ. À., Åíþêîâ È. Ñ., Ìåøàëêèí Ä. Ä. Ïðèêëàäíàÿ ñòàòèñòèêà. Èññëåäîâàíèå çàâèñèìîñòåé: Ñïðàâî÷íîå èçäàíèå. Ì.: Ôèíàíñû è ñòàòèñòèêà, 1985. Àéâàçÿí Ñ. À., Ìõèòàðÿí Â. Ñ. Ïðèêëàäíàÿ ñòàòèñòèêà è îñíîâû ýêîíîìåòðèêè. Ì.: ÞÍÈÒÈ, 1998. Ãðàäøòåéí È. Ñ., Ðûæèê È. Ì. Òàáëèöû èíòåãðàëîâ, ñóìì, ðÿäîâ è ïðîèçâåäåíèé. Ì.: Ãîñ. èçä. ôèç.-ìàò. ëèòåðàòóðû, 1962. Äðåéïåð Í., Ñìèò Ã. Ïðèêëàäíîé ðåãðåññèîííûé àíàëèç. Êíèãà 2. Ì.: Ôèíàíñû è ñòàòèñòèêà, 1987. Êåíäàëë Ì., Ñòüþàðò À. Ñòàòèñòè÷åñêèå âûâîäû è ñâÿçè. Ì.: Íàóêà, 1973. Ñåáåð Äæ. Ëèíåéíûé ðåãðåññèîííûé àíàëèç. Ì.: Ìèð, 1980. Õàëüä À. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà ñ òåõíè÷åñêèìè ïðèëîæåíèÿìè. Ì.: ÈË, 1956. Aitkin M. A. Simultaneous inference and the choice of variable subsets // Technometrics. 1974. V. 16, P. 221–227. Olkin I., Pratt J. W. Unbaised estimation of certain correlation coefficients // Ann. Math. Statist. 1958. V. 29. Webster J. T., Gunst R. F., Mason R. L. Latent root regression analysis // Technometrics. 1974. V. 16. P. 513–522. Wishart J. The mean and second moment coefficient of the multiple correlation coefficient in sumples from a normal population // Biometrica. 1931. V. 22. Woods H., Steinour Y. H., Starke H. R. Effect of Composition of Portland on Heat Evolved during Hardening // Industrial and Engineering Chemistre. 1932. V. 24. P. 1207–1214. R Теория и методология 83 Э. Б. Ершов ïðåäïîëîæåíèå î áîëüøîì ÷èñëå íàáëþäåíèé.  ýòîì ñîñòîÿò ïðåèìóùåñòâà ïðåäëîæåííîãî ïîäõîäà ê îïðåäåëåíèþ êîíêóðèðóþùèõ ðåãðåññèé ïî ñðàâíåíèþ ñ ýâðèñòè÷åñêèìè ïî 2 ñâîåìó õàðàêòåðó ìåòîäàìè, èñïîëüçóþùèìè ñòàòèñòèêè R 2 è Rmin . Ðåàëèçîâàííûé ìåòîä ~2 ðàñ÷åòà çíà÷åíèé êðèòåðèÿ-ñòàòèñòèêè R óíèâåðñàëåí è ýôôåêòèâåí â øèðîêîì äèàïàçîíå öåëî÷èñëåííûõ õàðàêòåðèñòèê óðàâíåíèé ðåãðåññèè — ÷èñëà íàáëþäåíèÿ è ÷èñëà îöåíèâàåìûõ êîýôôèöèåíòîâ. ~ Òî, ÷òî â ðàññìîòðåííûõ ïðèìåðàõ ïðèìåíåíèå ñòàòèñòèêè R 2 ïðèâîäèò ê âûäåëåíèþ íàáîðîâ ðåãðåññîðîâ, ïîëó÷åííûõ äðóãèìè, áîëåå ïðîñòûìè â ðåàëèçàöèè ìåòîäàìè, ìîæåò ðàññìàòðèâàòüñÿ êàê îïðàâäàíèå èñïîëüçîâàíèÿ ýâðèñòè÷åñêèõ ìåòîäîâ â êîíêðåòíûõ ñëó÷àÿõ, íî íå îçíà÷àåò ýêâèâàëåíòíîñòü òàêèõ ìåòîäîâ â îáùåì ñëó÷àå. ~ Ïîñêîëüêó ñòàòèñòèêà R 2 è äðóãèå ñðàâíèâàåìûå ñòàòèñòèêè ïðåäñòàâëÿþò ñîáîé ñëó÷àéíûå âåëè÷èíû, ìîæíî ñ÷èòàòü, ÷òî èõ ïðèìåíåíèå êàê êðèòåðèåâ êà÷åñòâà íàáîðîâ ôàêòîðîâ â ðåãðåññèè ñ îáùåé âûáðàííîé îáúÿñíÿåìîé ïåðåìåííîé ïîçâîëÿåò âñåãî ëèøü âûäåëÿòü êîíêóðèðóþùèå âàðèàíòû ðåãðåññèé, äëÿ êîòîðûõ çíà÷åíèÿ êðèòåðèåâ áëèçêè. Âûáîð ïðåäïî÷òèòåëüíûõ âàðèàíòîâ ðåãðåññèé èç ìíîæåñòâà êîíêóðèðóþùèõ, à â ïåðñïåêòèâå è êîíñòðóèðîâàíèå ñ èñïîëüçîâàíèåì îòîáðàííûõ ðåãðåññèé óðàâíåíèé, ìîäåëèðóþùèõ îáúÿñíÿåìóþ ïåðåìåííóþ, ïî-âèäèìîìó, ìîæíî è öåëåñîîáðàçíî îñíîâûâàòü íà ñïåöèàëüíî îáñóæäàåìûõ êà÷åñòâåííûõ òðåáîâàíèÿõ ê íèì. Îáîñíîâàíèå òàêèõ êîíñòðóêòèâíî ðåàëèçóåìûõ òðåáîâàíèé — çàäà÷à ïðîâîäèìûõ â íàñòîÿùåå âðåìÿ èññëåäîâàíèé.