Êðàòêîå ñîäåðæàíèå ëåêöèé 1-3. Ñòàòèñòè÷åñêàÿ ïàðàäèãìà N Èìååòñÿ òåîðåòè÷åñêèé ñëó÷àéíûé îáúåêò, êîòîðûé îïèñûâàåò íåêîòîðîå ÿâëåíèå.Y = {Yj }j=1 . Ñàì îáúåêò íàì íå äîñòóïåí, äîñòóïíû òîëüêî íàáëþäåíèÿ, ïîëó÷åííûå â õîäå ýêñïåðèìåíòà: y1 , . . . , yN . Çàäà÷à: ïîëó÷èòü èíôîðìàöèþ îá Y ïî y . ×àùå âñåãî â âèäå ñëó÷àéíîãî îáúåêòà âûñòóïàåò íåçàâèñèìàÿ âûáîðêà. Ïîäõîä Front-oce, ñòàòèñòèêîâ: X1 , . . . , Xn ýòî íàáëþäåíèÿ, òî åñòü êîíêðåòíûå öèôðû ïîëó÷åííûå èç äàííûõ. Ïîäõîä Box-oce, âåðîÿòíîñòíèêîâ: X1 , . . . , Xn íåçàâèñèìûå îäèíêîâî ðàñïðåäåëåííûå ñëó÷àéíûå âåëè÷èíû. Îïðåäåëåíèå. Ñòàòèñòèêà ôóíêöèÿ îò ðåàëèçàöèè ñëó÷àéíîãî îáúåêòà f (X1 , . . . , Xn ) ñòàòèñòèêà Äëÿ âû÷èñëåíèÿ ñòàòèñòèêè íå òðåáóåòñÿ çíàòü íåèçâåñòíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, òîëüêî çíà÷åíèÿ íàáëþäåíèé. Ôóíêöèÿ ðàñïðåäåëåíèÿ FXi (y) = P (Xi ≤ y) íåèçâåñòíà. Çàäà÷è ñòàòèñòèêè: 1. Îöåíèòü FXi 2. Îöåíèòü ïàðàìåòðû ðàñïðåäåëåíèÿ Xi Ïàðàìåòðè÷åñêàÿ ïîñòàíîâêà. Ðàñïðåäåëåíèå Xi çàâèñèò îò ïàðàìåòðà ìîäåëè. P (Xi ∈ B) = Pθ (Xi ∈ B) Ðàñïðåäåëåíèå Pθ ïðèíàäëåæèò çàðàíåå èçâåñòíîìó êëàññó. Ïðèìåð: èçâåñòíî, ÷òî âðåìÿ æèçíè ìûøè ýêñïîíåíöèàëüíî ðàñïðåäåëåíî, íåèçâåñòåí ïàðàìåòð ýêñïîíåíöèàëüíîãî ðàñïðåäåëåíèÿ. Çàìå÷àíèå: ïàðàìåòð θ ìîæåò áûòü ìíîãîìåðíûì, ýòî ïîçâîëÿåò "ñîõðàíÿòü" â íåì äîñòàòî÷íî ìíîãî èíôîðìàöèè, â òîì ÷èñëå è ëîãè÷åñêîãî òèïà (0/1 èñòèíà/ëîæü). Ñëó÷àé íåïðåðûâíîãî ðàñïðåäåëåíèÿ: f (x , θ) ïëîòíîñòü Xi , çàâèñÿùàÿ îò ïàðàìåòðà Ñëó÷àé äèñêðåòíîãî ðàñïðåäåëåíèÿ: Pθ (X1 = m) = g(m, θ) Ýòè äâà ñëó÷àÿ îõâàòûâàþò âñå ðàñïðåäåëíèÿ, êîòîðûå íóæíû äëÿ îïèñàíèÿ áîëüøèíñòâà èññëåäóåìûõ îáúåêòîâ. Îöåíêà ïàðàìåòðîâ ìîäåëè. Îïðåäåëåíèå. Îöåíêîé íàçûâàåòñÿ ñòàòèñòèêà, çíà÷åíèå êîòîðîé â òîì èëè èíîì ñìûñëå áëèçêî ê èñòèíîìó çíà÷åíèþ îöåíèâàåìîãî ïàðàìåòðà (èëè ôóíêöèè îò ïàðàìåòðà). θ̂(X1 , . . . , Xn ) = f (X1 , . . . , Xn ) ≈ θ Ïðèìåð îöåíêè äëÿ âûáîðêè X1 , . . . , Xn èç Bi(1, p): Pn p̂ = X = i=1 n Xi P →EX =p Íåïàðàìåòðè÷åñêàÿ ïîñòàíîâêà Ïðî ðàñïðåäåëåíèå X1 íå èçâåñòíî íè÷åãî. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ýòî îöåíêà äëÿ "áåñêîíå÷íîìåðíîãî ïàðàìåòðà" èñòèíîé ôóíêöèè ðàñïðåäåëåíèÿ. 1 Fn (z ) = n 1 X I(Xi ≤z ) n i=1 Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ñõîäèòñÿ ïî âåðîÿòíîñòè ê èñòèíîìó çíà÷åíèþ ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû X1 â äàííîé òî÷êå. P Fn (z )→FX1 (z ) Êðîìå òîãî èìååò ìåñòî ðàâíîìåðíàÿ ñõîäèìîñòü ýìïåðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ ê èñòèíîìó çíà÷åíèþ. (Òåîðåìà Ãëèâåíêî-Êàíòåëëè) .. sup |Fn (z ) − FX1 (z )| →0 z Çàìå÷àíèå: Òåîðåìó Ãëèâåíêî-Êàíòåëëè ýâðèñòè÷åñêè äîñòàòî÷íî ëåãêî óâèäåòü èç ýìïèðè÷åñêîãî ñìûñëà ïëîòíîñòè è ñâÿçè ïëîòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ. Òî÷å÷íûå îöåíêè ïàðàìåòðîâ ìîäåëåé Ñëó÷àé ïðîèçâîëüíîãî ïàðàìåòðè÷åñêîãî ðàñïðåäåëåíèÿ. Äàíî ïàðàìåòðè÷åñêîå ðàñïðåäåëåíèå fX1 (x, θ), Ïðèìåð θ = (θ1 , . . . , θk ) fX1 (x, θ) = e−θ1 x Ix≥θ1 C(θ) Ìåòîäû ïîñòðîåíèÿ îöíåêè: 1. Ìåòîä ìîìåíòîâ. 2. Ìåòîä ìàêñèìóìà ïðàâäîïîäîáèÿ. Ìåòîä ìîìåíòîâ Äëÿ ëþáîãî ðàñïðåäåëåíèÿ ñ êîíå÷íûì m-ì ìîìåíòîì ìîæåì âû÷èñëèòü EX1 = h1 (θ1 , . . . , θk ) EX 2 = h (θ , . . . , θ ) 2 1 k 1 · ·· m EX1 = hm (θ1 , . . . , θk ) Ïóñòü θ = h−1 (EX1 , . . . , EXm ), åñëè h−1 ñóùåñòâóåò è äîñòàòî÷íî õîðîøàÿ (íàïðèìåð, íåïðåðûâíàÿ ïî âñåì àðãóìåíòàì), òîãäà ˆ 1 , . . . , EX ˆ m) θ̂ = h−1 (EX  ñëó÷àå åñëè am = EX1m ñóøåñòâóåò, îöåíêè Pn â1 = X = â2 = X 2 = i=1 Pn n i=1 Xi Xi2 n ··· Pn âm = X m = i=1 Xim n ÿâëÿþòñÿ ñîñòîÿòåëüíûìè îöåíêàìè. Çàìå÷àíèå: ñõîäèìîñòü îöåíîê ìîìåíòîâ ãàðàíòèðóåòñÿ çàêîíîì áîëüøèõ ÷èñåë. Ìåòîä ìàêñèìóìà ïðàâäîïîäîáèÿ 2 Ïðàâäîïîäîáèåì íàçûâàåòñÿ ïëîòíîñòü ðàñïðåäåëíèÿ ñëó÷àéíîãî âåêòîðà âûáîðêè äëÿ íåïðåðûâíîãî ñëó÷àÿ, èëè åãî ðàñïðåäåëåíèå äëÿ äèñêðåòíîãî ñëó÷àÿ. f (X, θ) = f (x1 , θ) · · · f (xn , θ)→ max θ X = (X1 , . . . , Xn ) âåêòîð âûáîðêè îöåíêà θ̂ = argmaxθ f(x, θ) Ìåòîä ïîñòðîåíèÿ îöåíîê èç ýìïèðè÷åñêèõ ñîîáðàæåíèé Ïóñòü îöåíêà f (x) íà âàø âçãëÿä îöåíèâàåò ïàðàìåòð τ (θ). Ðàññìîòðèì ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí ξn = f (X). P Åñëè äëÿ ýòîé ïîñëåäîâàòåëüíîñòè óäàåòñÿ ïîëó÷èòü ñõîäèìîñòü ïî âåðîÿòíîñòè ê òðåáóåìîé ôóíêöèè (ξn →τ (θ)), òî íàìè ïîëó÷åíà ñîñòîÿòåëüíàÿ îöåíêà äàííîãî ïàðàìåòðà. Ýñïèðè÷åñêèé ñìûñë çàêîíà áîëüøèõ ÷èñåë è öåíòðàëüíîé ïðåäåëüíîé òåîðåìû. Çàêîí áîëüøèõ ÷èñåë (ÇÁ×): Ïóñòü X1 , X2 , . . . íåçàâèñèìûå îäèíàêîâî ðàñïðåäåëåííûå ñëó÷àéíûå âåëè÷èíû (í.î.ð.ñ.â.) ñ êîíå÷íûì ìàòîæèäàíèåì. Òîãäà Pn i=1 Xi P →EX1 n Òî åñòü èõ ñóììàðíîå çíà÷åíèå äåëåííîå íà êîëè÷åñòâî îáÿçàíî âåñòè ñåáÿ íåñëó÷àéíî: áûòü ïðèìåðíî ðàâíûì ìàòåìàòè÷åñêîìó îæèäàíèþ. Öåíòðàëüíàÿ ïðåäåëüíàÿ òåîðåìà (ÖÏÒ) Ïóñòü X1 , X2 , . . . íåçàâèñèìûå îäèíàêîâî ðàñïðåäåëåííûå ñëó÷àéíûå âåëè÷èíû (í.î.ð.ñ.â.) ñ êîíå÷íûì âòîðûì ìîìåíòîì (äèñïåðñèåé) è íå ðàâíûå êîíñòàíòå. Òîãäà v u n Pn Pn Pn Pn u X X − EX X − EX d i i i i i=1 i=1 i=1 i=1 tD √ Xi →N(0, 1) − √ = n ∗ DXi i=1 Òî åñòü èõ ñóììàðíîå çíà÷åíèå, äåëåííîå íà êîðåíü èç êîëè÷åñòâà ñ òî÷íîñòüþ äî íåêîòîðîé íîðìèðîâêè âåäåò ñåáÿ âïîëíå êîíêðåòíûì îáðàçîì êàê ñòàíàäðòíàÿ íîðìàëüíàÿ ñëó÷àéíàÿ âåëè÷èíà. Ïðîâåðêà ñòàòèñòè÷åñêèõ ãèïîòåç. Ãèïîòåçà H0 Ïðèìåð: Ñìåðòü ìûøè ïîñëå ýêñïåðèìåíòà ÿâëÿåòñÿ áåðíóëëèåâñêîé ñëó÷àéíîé âåëè÷èíîé ñ ïàðàìåòðîì p = p0 = 0.01 (ãèïîòåçà î áåçîïàñíîñòè ýêñïåðèìåíòà). Àëüòåðíàòèâà H1 Ïðèìåð: Ñìåðòü ìûøè ïîñëå ýêñïåðèìåíòà ÿâëÿåòñÿ áåðíóëëèåâñêîé ñëó÷àéíîé âåëè÷èíîé ñ ïàðàìåòðîì p > p0 . Êðèòåðèé: f (X1 , . . . , Xn ) > T Åñëè íåðàâåíñòâî â êðèòåðèè âûïîëíÿåòñÿ, òî ñëåäóåò îòáðîñèòü ãèïîòåçó. Ïðèìåð: Äëÿ ýêñïåðèìåíòà ñ ìûøàìè êðèòåðèé âûãëÿäèò òàê: X1 + . . . + Xn > T , òî åñòü ñ÷èòàåì ÷èñëî ìåðòâûõ ìûøåé è ñðàâíèâàåì ñ íåêîòîðûì ïîðîãîâûì (Threshold) çíà÷åíèåì. Åñëè ïîãèáëî ñëèøêîì ìíîãî ìûøåé îòáðàñûâàåì ãèïîòåçó î áåçîïàñíîñòè ýêñïåðèìåíòà. Îøèáêà ïåðâîãî ðîäà. P (f (X1 , . . . , Xn ) > T |H0 ) = α Âåðîÿòíîñòü ñðàáàòûâàíèÿ êðèòåðèÿ ïðè âåðíîé ãèïîòåçå. Çàìå÷àíèå: Îøèáêó ïåðâîãî ðîäà ÷àñòî áûâàåò çíà÷èòåëüíî ïðîùå ðàñ÷èòàòü ÷åì âñå îñòàëüíûå ïàðàìåòðû, êðîìå òîãî îøèáêà ïåðâîãî ðîäà ýòî îñíîâíîé ïàðàìåòð âûáîðà êðèòåðèåâ (â ñëó÷àå îòáðîñà õîðîøåé ãèïîòåçû, âû å¼ óæå íå ñìîæåòå ïåðåïðîâåðèòü, â ñëó÷àå íåîòáðîñà ïëîõîé î÷åâèäíî áóäóò ïðîâîäèòüñÿ åùå òåñòû). Ïîýòîìó ãðàíè÷íîå çíà÷åíèå äëÿ êðèòåðèÿ âûáèðàåòñÿ èìåííî èç îøèáêè ïåðâîãî ðîäà è ÷àñòî îáîçíà÷àåòñÿ Tα . Ïðèìåðû ãèïîòåç è êðèòåðèåâ. 3 1. Ãèïîòåçû äëÿ ïðîñòûõ äèñêðåòíûõ ìîäåëåé. Êîíñòðóèðóþòñÿ âðó÷íóþ â òå ñëó÷àÿõ, êîãäà âîçìîæåí ïîäñ÷åò âåðîÿòíîñòè îøèáêè ïåðâîãî ðîäà. 2. t-êðèòåðèè ðàçëè÷èÿ ñðåäíåãî çíà÷åíèÿ âûáîðêè 3. Êðèòåðèé âèëêîêñîíà ðàçëè÷èÿ ñðåäíèõ çíà÷åíèé íåïàðàìåòðè÷åñêèõ âûáîðîê 4. Êðèòåðèè ñîãëàñèÿ Êîëìîãîðîâà-Ñìèðíîâà 5. Êðèòåðèé ñîãëàñèÿ õè-êâàäðàò ïèðñîíà Äîâåðèòåëüíîå îöåíèâàíèå ïàðàìåòðîâ Äîâåðèòåëüíûé èíòåðâàë ýòî ìíîæåñòâî ïîñòðîåííîå ïî íàáëþäåíèÿì, â êîòîðîå ñ áîëüøîé âåðîÿòíîñòüþ ïîïàäàåò èñòèíîå çíà÷åíèå ïàðàìåòðà. P θ ∈ [θ̂α− , θ̂α+ ] = P θ ∈ [θ̂α− (X1 , . . . , Xn ), θ̂α+ (X1 , . . . , Xn )] = 1 − α Îáùåå îïðåäåëåíèå P θ ∈ Θ̂α (X1 , . . . , Xn ) ≥ γ = 1 − α, ãäå Θ̂α (X1 , . . . , Xn ) ⊂ Rk . γ óðîâåíü çíà÷èìîñòè îáû÷íî âûáèðàåòñÿ äîñòàòî÷íî âûñîêèì (95%, 99%). Ïðèìåð ðàñ÷åòà äîâåðèòåëüíîãî èíòåðâàëà äëÿ íîðìàëüíîé âûáîðêè. X1 , . . . , Xn âûáîðêà èç N (a, 1) òî÷å÷íàÿ îöåíêà â = X xα/2 xα/2 P a ∈ â − √ , â + √ =1−α n n Äîâåðèòåëüíûå èíòåðâàëû äëÿ ïàðàìåòðîâ ãàóññîâñêîé âûáîðêè. Äîâåðèòåëüíûå èíòåðâàëû äëÿ N (a, σ 2 ) 1. Äëÿ a ïðè èçâåñòíîì σ 2 = σ02 xα/2 σ 2 xα/2 σ 2 a ∈ X − √ 0 ,X + √ 0 , n n ãäå xα êâàíòèëü óðîâåíÿ α ðàñïðåäåëåíèÿ N (0, 1) 2. Äëÿ σ 2 ïðè èçâåñòíîì a = a0 " # ns2 ns2 σ ∈ , 2− , χ2+ α/2 χα/2 2 ãäå s2 = 1 n P 2+ 2 (Xi − a0 )2 , χ2− α , χα íèæíèé è âåðõíèé êâàíòèëè ðàñïðåäåëåíèÿ χ ñ n ñòåïåíÿìè ñâîáîäû 3. Äëÿ a ïðè íåèçâåñòíîì σ 2 √ √ # tα/2 s 2 tα/2 s 2 a∈ X− √ ,X + √ , n n " ãäå tα êâàíòèëü óðîâåíÿ α ðàñïðåäåëåíèÿ ñòüþäåíòà (t-ðàñïðåäåëåíèÿ) c n − 1 ñòåïåíüþ ñâîáîäû 4. Äëÿ σ 2 ïðè íåèçâåñòíîì a " # 2 2 (n − 1)s (n − 1)s σ2 ∈ , , χ2+ χ2− α/2 α/2 ãäå s2 = 1 n−1 P (Xi − X)2 , 4 2+ 2 χ2− α , χα íèæíèé è âåðõíèé êâàíòèëè ðàñïðåäåëåíèÿ χ ñ n − 1 ñòåïåíüþ ñâîáîäû 5. Äëÿ a è σ 2 îäíîâðåìåííî xβ/2 σ xβ/2 σ ≤a≤X+ √ X− √ n n 2 (n − 1)s (n − 1)s2 2 ≤ σ ≤ χ2+ χ2− β/2 β/2 P 1 (Xi − X)2 , xβ/2 êâàíòèëü N (0, 1), Çäåñü s2 = n−1 2+ 2 χ2− β/2 , χβ/2 âåðõíèå è íèæíèå êâàíòèëè ðàñïðåäåëåíèÿ χ ñ n − 1 ñòåïåíüþ ñâîáîäû, 2 β : (1 − β) = 1 − α. Äîâåðèòåëüíé èíòåðâàë ïàðàìåòðà ýêñïîíåíöèàëüíîãî ðàñïðåäåëåíèÿ " λ ∈ λ̂ 2n χ2− 2n,α/2 , λ̂ # 2n χ2+ 2n,α/2 Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ïàðàìåòðîâ ðàñïðåäåëåíèÿ ìåòîäîì öåíòðàëüíîé ôóíêöèè ñì. Ëàãóòèí. Ìåäèàíà m : P (ξ < m) = P (ξ > m) (= Âûáîðî÷íàÿ ìåäèàíà 1 2 äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé) , n − íå÷åòíîå X([ n+1 2 ]) m̂ = 1 X([ n ]) + X([ n ]+1) , n − ÷åòíîå 2 2 2 Äîâåðèòåëüíûé èíòåðâàë äëÿ ìåäèàíû h i − + m̂ ∈ X(kn,α ) , X(kn,α ) Áîëüøèå âûáîðêè " − kn,α 1 = n − xα/2 2 r 11 n 22 # " + kn,α , 1 = n + xα/2 2 r 11 n 22 # Ìàëûå âûáîðêè 1 + P Bi(n, ) ∈ k− , k ≥1−α n,α n,α 2 Ñâîéñòâà îöåíîê è ãèïîòåç. Îöåíêè P 1. Ñîñòîÿòåëüíîñòü: θ̂→θ .. Ñèëüíàÿ ñîñòîÿòåëüíîñòü: θ̂→θ 2. Íåñìåùåííîñòü: Eθ̂ = θ 3. Îïòèìàëüíîñòü: îöåíêà θ̂1 ëó÷øå ÷åì îöåíêà θ̂2 , åñëè Dθ̂1 ≤ Dθ̂2 √ d 2 4. Àñìèïòîòè÷åñêàÿ íîðìàëüíîñòü: n(θ̂ − θ)→N(0, σàññ ). Ãèïîòåçû 1. Ñîñòîÿòåëüíîñòü: P (f (X1 , . . . , Xn ) > T |H0 ) → 0, P (f (X1 , . . . , Xn ) > T |H1 ) → 1 2. Íåñìåùåííîñòü: P (f (X1 , . . . , Xn ) > T |H0 ) ≤ P (f (X1 , . . . , Xn ) > T |H1 ) 3. Îïòèìàëüíîñòü: Ñðàâíåíèå ôóíêöèé ìîùíîñòè êðèòåðèÿ. Àñèìïòîòè÷åñêàÿ ýôôåêòèâíîñòü. 5