Смоленский институт бизнеса и предпринимательства РАСЧЕТНОЕ ЗАДАНИЕ по курсу «Теория вероятностей и математическая статистика» Вариант 5 Группа: Студент: Преподаватель: Прохоренкова А.Т. СМОЛЕНСК, 2011 г. 2.1 Классическое определение вероятности. Условие: В коробке находится 5 деталей, из которых 2 детали имеют скрытые дефекты. Наугад берется деталь. Какова вероятность того, что эта деталь имеет скрытый дефект? Решение: Вероятность того что выбранная деталь имеет дефект рассчитывается по формуле p = m n 2 = = 0.4. 5 Ответ: 40% Условие: Ребенок, не умеющий читать, имеет 5 кубиков с буквами К, Н, И, Г, А. Какова вероятность того, что разложив кубики случайным образом, он получит слово «книга»? Решение: Необходимо подсчитать количество возможных слов из пяти предложенных букв. n = 5! = 120. → p = Ответ: m n = 1 120 . 1 120 2 2.2 Теоремы сложения и умножения вероятностей Условие: Среди 100 лотерейных билетов есть 5 выигрышных. Наудачу выбрали 3 билета. Какова вероятность, что среди них есть 2 выигрышных? Решение: 3 Общее количество вариантов выбора пяти билетов из ста равно N = Cnk = C100 = 100! 3!∙(100−3)! 5! 2!∙(5−2)! . Количество вариантов выбора выигрышных равно K = Cnk = C52 = . Количество вариантов выбора оставшегося невыигрышного билета 1 ̅ = Cnk = C95 равно K = p= ̅ K∙K N = 95! 1!∙(95−1)! 5! 95! ∙ 2!∙(5−2)! 1!∙(95−1)! 100! 3!∙(100−3)! = . Подсчитаем вероятность события по формуле 5!∙95!∙3!∙97! 2!∙3!∙1!∙94!∙100! = 3∙4∙5∙95 100∙99∙98 Ответ: 0,0059 3 = 0,0059. 2.3 Формула полной вероятности. Условие: В тире имеется 5 ружей, вероятность попадания из которых 0,5; 3 ружья с вероятностью попадания 0,7 и два ружья с вероятностью попадания 0,8. Определить вероятность попадания при одном выстреле, если ружье выбрано наугад? Решение: Для подсчета вероятности попадания воспользуемся формулой полной вероятности p = ∑ ai ∙ pi , где a – вероятность выбора ружья, p – вероятность попадания из ружья. p = ∑ ai ∙ pi = 5 10 ∙ 0,5 + Ответ: 0,62 4 3 10 ∙ 0,7 + 2 10 ∙ 0,8 = 0,62. 2.4 Повторение испытаний Условие: Стрелок сделал 14 выстрелов по мишени, причем вероятность его попадания в мишень 0,2. Найти наивероятнейшее число попаданий и его вероятность? Решение: Наивероятнейшее число попаданий является математическим ожиданием случайной величины «попадание в мишень», математическое ожидание рассчитывается по формуле m = npq, где n – количество испытаний, p – вероятность удачного исхода испытания, q – вероятность неудачного исхода испытания. q = 1 − p = 1 − 0.2 = 0.8. m = 14 ∙ 0,2 ∙ 0,8 = 2,24. Ответ: 2,24 5 2.5 Дискретные случайные величины Условие: Задан закон распределения дискретной случайной величины X. Найти математическое ожидание, дисперсию, среднее квадратическое отклонение. Построить график функции распределения вероятностей случайной величины X. X 11 21 21,4 22 P 0,2 0,2 0,3 22,8 0,2 0,1 Решение: Подсчитаем математическое ожидание случайной величины: 5 m = ∑ xi ∙ pi = 11 ∙ 0,2 + 21 ∙ 0,2 + 21,4 ∙ 0,3 + 22 ∙ 0,2 + 22,8 ∙ 0,1 = 19,5. i=1 Подсчитаем дисперсию случайной величины по формуле: 5 D = ∑(xi − m)2 ∙ pi = i=1 = (11 − 19,5)2 ∙ 0,2 + (21 − 19,5)2 ∙ 0,2 + (21,4 − 19,5)2 ∙ 0,3 + (22 − 19,5)2 ∙ 0,2 + (22,8 − 19,5)2 ∙ 0,1 = 18,322. Подсчитаем СКО по формуле: σ = √D = √18,322 = 4,28. Построим график функции распределения ДСВ и полигон распределения ДСВ: 6 Функция распределения вероятности ДСВ 1.2 1 0.8 0.6 0.4 0.2 0 1 2 3 4 5 Полигон распределения вероятности ДСВ 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 11 21 21.4 7 22 22.8 2.6 Непрерывные случайные величины Условие: Непрерывная случайная величина X задана функцией распределения (варианты 1-5) или плотностью распределения вероятностей (варианты 6-10). Требуется найти: плотность распределения (варианты 1-5) или функцию распределения вероятностей (варианты 6-10); математическое ожидание; дисперсию; среднее квадратическое отклонение; вероятность того, что случайная величина отклонится от своего математического ожидания не более, чем на одну четвертую длины всего интервала возможных значений этой величины; построить графики функции распределения и плотности распределения вероятностей. Решение: 0, x≤0 F(x) = {√x, 0 < 𝑥 ≤ 1 1, x>1 Найдем плотность распределения НСВ, как производную от функции распределения НСВ: 0, 1 x≤0 ,0 < 𝑥 ≤ 1 f(x) = F ′ (x) = { 2√ x 0, x>1 Посчитаем математическое ожидание НСВ по формуле: 1 31 1 1 M(x) = ∫ x ∙ f(x)dx = ∫ x ∙ dx = x 2 | = − 0 = . 3 0 3 3 2√ x −∞ 0 ∞ 1 1 Посчитаем дисперсию НСВ по формуле: 1 2 D(x) = ∫ (x − M(x)) ∙ f(x)dx = ∫ x ∙ f(x)dx − M(x) = ∫ x ∙ dx − ( ) 3 2 √x −∞ −∞ 0 1 1 3 1 1 51 1 1 1 4 2 = ∫ x dx − = x 2 | − = − 0 − = . 2 0 9 5 0 9 5 9 45 ∞ ∞ 2 1 2 8 2 2 1 Посчитаем СКО по формуле: σ = √D = √ 4 2 = ≈ 0,298. 45 3√5 Подсчитаем вероятность того, что случайная величина отклонится от своего математического ожидания не более, чем на одну четвертую длины всего интервала возможных значений этой величины: 1 1 1 1 7 1 7 1 √7 − 1 P( − ≤ x ≤ + ) = F( ) − F( ) = √ − √ = ≈ 0,475. 3 4 3 4 12 12 12 12 2 √3 2.7 Система двух случайных величин Условие: Закон распределения дискретной двумерной случайной величины (X,Y) задан таблицей. Требуется: определить одномерные законы распределения случайных величин X и Y; 9 найти условные плотности распределения вероятностей величин; m вычислить математические ожидания x и m y; вычислить дисперсии x и y ; вычислить ковариацию xy ; r вычислить коэффициент корреляции xy . Возможные значения случайных величин выбрать по номеру варианта. y1 x1 x2 x3 x4 0,04 0,04 0,05 0,03 y2 y3 y4 y5 0,04 0,07 0,08 0,04 0,03 0,06 0,09 0,04 0,03 0,05 0,08 0,06 0,01 0,03 0,05 0,08 X (3; 2; 2;7); Y (8,10,12,14,16) Решение: Определим одномерные законы распределения случайных величин X и Y, сложив для Р (х1-х4) значений в строках, а для Р (у1-у5) значения в столбцах : Р (-3)=0,04+0,04+0,03+0,03+0,01=0,15 Р (8)=0,04+0,04+0,05+0,03=0,16 Р (-2)=0,25 Р (10)=0,23 Р (2)=0,35 Р (12)=0,22 Р (7)=0,25 Р (14)=0,22 Р (16)=0,17 Сумма вероятностей Р (х1-х4) и Р (у1-у5) равна 1. Найдем условные плотности распределения p( x , y ) i j p( y / x ) . j i p( x ) i воспользовавшись формулой : Например, для р (8/-3)=0,04/0,15=0,27 10 вероятностей величин, Для значений Х: -3 -2 2 7 8 0,27 0,16 0,14 0,12 10 0,27 0,28 0,23 0,16 12 0,20 0,24 0,26 0,16 14 0,20 0,20 0,23 0,24 16 0,06 0,12 0,14 0,32 -3 -2 2 7 8 0,25 0,25 0,31 0,19 10 0,17 0,30 0,36 0,17 12 0,14 0,27 0,41 0,18 14 0,14 0,23 0,36 0,27 16 0,06 0,18 0,29 0,47 Для значений Y: m Вычислим математические ожидания x и M( X / Y y ) m x p( x / y ). i i 1 i и m y , используя формулы M(Y / X x ) n y p( y / x ). j j1 j М(-3)=8*0,27+10*0,27+12*0,2+14*0,14+16*0,06=10,18 М(-2)=11,68 М(2)=11,16 М(7)=12,96 М(8)=(-3)*0,25+(-2)*0,25+2*0,31+7*0,19=0,70 М(10)=0,80 М(12)=1,12 М(14)=1,73 М(16)=3,33 11 Вычислим D( X ) дисперсии [ x M ( X )] xи y; по формулам 2 f ( x , y )dxdy; D( Y ) [ y M ( Y )] 2 f ( x , y )dxdy. D(-3)=(8-10,18)^2*0,27+(10-10,18)^2*0,27+(12-10,18)^2*0,20+(1410,18)^2*0,20+(16-10,18)^2*0,06=6,91 D(-2)=6,30 D(2)=7,03 D(7)=7,37 D(8)=(-3-0,7)^2*0,25+(-2-0,7)^2*0,25+(2-0,7)^2*0,31+(7-0,7)^2*0,19=13,31 D(10)=11,86 D(12)=11,55 D(14)=13,86 D(16)=14,36 D(X)=D(-3)+D(-2)+D(2)+D(7)=27,61 D(X)=D(8)+D(10)+D(12)+D(14)+D(16)=64,94 Для вычисления ковариации xy n m i1j1 xy ; воспользуемся следующей формулой: [ x M ( X )] [ y M ( Y )] p( x , y ). i j i j : xy =(-3-10,18)*(8-0,7)*0,04+…+(7-12,96)*(16-3,33)*0,08=-105,01 12 Чтобы r xy вычислить коэффициент корреляции r xy ., используя xy . x y r xy =-105,01/(27,61*64,94)=-0,06 или -6%. 2.8 Закон больших чисел и предельные теоремы Условие: 13 формулу 2 Дисперсия случайной величины X равна . Требуется: С помощью неравенства Чебышева оценить вероятность того, что случайная величина отклониться от своего математического ожидания не более чем на величину . Параметры выбрать по номеру варианта; Для рассматриваемой случайной величины X оценивается математическое ожидание. Сколько нужно сделать измерений, чтобы с вероятностью, не меньшей 0,95, среднее арифметическое этих измерений отклонилось от истинного значения математического ожидания не более чем на величину . Вариант 2 5 1 1,8 Решение: Поскольку D( X ) . , то используя формулу получаем: Р=1-(1/(1,8^2))=0,69 или 69%. P( X M ( X ) ) 1 Используем P( D( X ) . 2 , формулу X X ... X M ( X ) M ( X ) ... M ( X ) 1 2 n 1 2 n ) 1 С . n n n 2 для того, чтобы 2 найти n – кол-во измерений, с учетом того, что Р=95%, С= =1 и Получаем n=6,17 или с учетом округления n=7. =1,8. Ответ: 69%, 7. 2. 9 Статистическая обработка экспериментальных данных. Оценка параметров. Проверка статистических гипотез Условие: 14 По заданной выборке случайной величины X вычислить основные эмпирические характеристики: выборочную среднюю; выборочную дисперсию; исправленное значение выборочной дисперсии; среднее квадратическое отклонение; построить доверительный интервал для оценки математического ожидания. Считать надежность оценки равной 0,95; построить доверительный интервал для оценки дисперсии. Считать надежность оценки равной 0,95. Построить по данным выборки полигон и гистограмму. Подобрать подходящий теоретический закон распределения вероятностей. Проверить гипотезу о соответствии эмпирического закона распределения выбранному теоретическому при уровне значимости . Данные выборки выбирать по номеру варианта. 0,2 1,6 1,9 0,5 0,8 0,1 1,8 0,3 0,2 1,7 1,7 0,2 2,6 2,6 3,9 0,8 2,6 1,0 1,3 1,8 4,9 1,0 0,0 0,4 2,9 0,2 0,8 1,2 0,0 0,4 2,5 4,3 1,1 2,3 2,3 0,3 1,1 2,6 0,3 3,5 2,4 0,9 1,5 1,2 0,7 0,2 2,7 2,6 0,2 4,1 Решение: Выборочная средняя: ∑𝑛𝑖=1 𝑥𝑖 ∑60 𝑖=1 𝑥𝑖 𝑚𝑥 = = = 1,52 𝑛 60 Выборочная дисперсия: 𝑛 1 𝑆𝑛2 = ∑(𝑥𝑖 − 𝑚𝑥 )2 = 1,67 𝑛 𝑖=1 Исправленное значение выборочной дисперсии: 𝑆2 = 𝑛 𝑆𝑛2 = 1,7 𝑛−1 Доверительный интервал для математического ожидания 15 1,9 0,9 0,4 2,0 1,5 0,5 5,8 0,5 1,1 0,5 По имеющимся данным из таблицы находим процентиль распределения Стьюдента: 𝑡1−𝛼,𝑛−1 = 𝑡1−0,95 2 ,59 2 = 1,96 Общая формула доверительного интервала для математического ожидания: 𝑚𝑥 − 𝑡1−𝛼,𝑛−1 𝑆 2 √𝑛 ≤ 𝜇 ≤ 𝑚𝑥 + 𝑡1−𝛼,𝑛−1 𝑆 2 √𝑛 В нашем случае: 1,52 − 1,96 ∙ √1,67 √60 ≤ 𝜇 ≤ 1,52 + 1,96 ∙ √1,67 √60 ⇒ 1,193 ≤ 𝜇 ≤ 1,847 Доверительный интервал для дисперсии По имеющимся данным из таблицы находим процентили распределения хиквадрат: 𝜒𝛼2 = 82,2 2 2 𝜒1− 𝛼 = 39,58 2 Общая формула доверительного интервала для дисперсии: (𝑛 − 1)𝑆 2 𝜒𝛼2 2 ≤𝜎 ≤ 2 (𝑛 − 1)𝑆 2 𝜒2 𝛼 1− 2 В нашем случае: (60 − 1) ∙ 1,67 (60 − 1) ∙ 1,67 ≤ 𝜎2 ≤ ⇒ 1,1987 ≤ 𝜎 2 ≤ 2,4894 82,2 39,58 Полигон 16 fi 0.5 0.45 0.4 0.35 0.3 0.25 1,851652622 2,535165067 fi 0.2 0.15 0.1 0.05 0 0.48 0.96 1.45 1.94 2.43 2.92 3.41 3.9 4.39 4.88 5.37 5.86 Гистограмма fi 0.5 0.45 0.4 0.35 0.3 fi 0.25 0.2 0.15 0.1 0.05 0 0.48 0.96 1.45 1.94 2.43 2.92 3.41 3.9 4.39 4.88 5.37 5.86 По гистограмме и полигону распределение выдвигается гипотеза соответствии выборки экспоненциальному закону распределения, где 17 об 𝜆= 1 = 0,6571 𝑚𝑥 Проверим гипотезу критерием Стьюдента: 𝑘 2 (𝑝𝑖теор − 𝑝𝑖 ) 𝜒2 = 𝑛 ∙ ∑ , 𝑝𝑖теор 𝑖=1 где: 𝑝𝑖 – экспериментальное значение вероятности попадания случайной величины в i-й интервал. Оно равно отношению количества элементов выборки, попавших в данных интервал, к общему количеству элементов в выборке. На основании данных вероятностей построена гистограмма и полигон распределения. 𝑝𝑖теор – теоретическое значение вероятности попадания случайной величиный в i-й интервал; 𝑝𝑖теор = 𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 , где: 𝐴𝑖 – левая граница интервала 𝐵𝑖 – правая граница интервала В итоге получаем формулу: 𝑘 2 (𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 − 𝑝𝑖 ) 2 𝜒 = 𝑛∙∑ = 13,6039 𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 𝑖=1 Т.к. 𝜒 2 < 𝜒𝛼2 , то наша гипотеза верна. 2 18 2.10 Дисперсионный анализ Условие: Сделано по 5 измерений случайной величины X на каждом их четырех уровней фактора F. Методом дисперсионного анализа проверить гипотезу о том, что фактор F не влияет на математическое ожидание величины X. Сделать вывод. Номер испытания i 1 2 3 4 5 𝐹1 7 5 2 9 4 Уровни фактора j 𝐹2 𝐹3 5 5 4 7 6 6 6 4 9 3 𝐹4 8 5 3 9 5 Решение: 𝑄 = 𝑄1 + 𝑄2 𝑚 𝑛𝑘 2 𝑄 = ∑ ∑ 𝑥𝑖𝑘 − 𝑛𝑥̅ 2 = 363 − 312,05 = 50,95 𝑘=1 𝑖=1 𝑚 𝑄1 = ∑ 𝑛𝑘 𝑥̅𝑘2 − 𝑛𝑥̅ 2 = 325,4 − 312,05 = 13,35 𝑘=1 𝑚 𝑛𝑘 𝑚 2 𝑄2 = ∑ ∑ 𝑥𝑖𝑘 − ∑ 𝑛𝑘 𝑥̅𝑘2 = 363 − 325,4 = 37,6 𝑘=1 𝑖=1 𝑘=1 В качестве критерия воспользуемся критерием Фишера: 𝑄1 𝐹 = 𝑚 − 1 = 1,8936 𝑄2 𝑛−𝑚 Теоретическое значение критерия: 𝐹𝜆,𝑚−1,𝑛−𝑚 = 3,24 𝐹 < 𝐹𝜆,𝑚−1,𝑛−𝑚 , следовательно, нет оснований считать, то фактор оказывает влияние на разброс средних значений. 19 2.11 Регрессионный анализ Условие: При изучении зависимости между величиной X и величиной Y были получены следующие значения (см. таблицу соответствующего варианта). Требуется: построить график Y=f(X); · · рассчитать параметры уравнения линейной регрессии методом наименьших квадратов; · оценить качество полученного уравнения регрессии с помощью средней ошибки аппроксимации; найти коэффициент корреляции; · · оценить значимость коэффициента корреляции и коэффициента регрессии по критерию Стьюдента (t- критерий) при уровне значимости 0,95; сделать выводы. · X Y -1 -0,1 -0,8 -0,5 -0,6 -1,1 -0,4 -1,6 -0,2 -1,9 0 -1,3 0,2 -1,2 0,4 -0,8 0,6 0,8 1 1,2 1,4 1,6 1,8 1,3 2,6 4,2 5,7 7,7 8,4 9,9 Решение: Изобразим на диаграмме заданные в условии точки: Корелляционное облако 12 10 8 6 Корелляционное облако 4 2 0 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 -2 -4 20 1 1.2 1.4 1.6 1.8 Для построения графика линейной регрессии, который имеет вид 𝑦 = 𝑎 + 𝑏 ∙ 𝑥 необходимо определить коэффициенты 𝑎 и 𝑏. Методом наименьших квадратов. ∑15 ∑15 𝑖=1 𝑦𝑖 𝑖=1 𝑥𝑖 =𝑎+𝑏∙ 𝑛 𝑛 15 15 15 ∑ 𝑥𝑖 𝑦𝑖 = 𝑎 (∑ 𝑥𝑖 ) + 𝑏 (∑ 𝑥𝑖2 ) { 𝑖=1 𝑖=1 𝑖=1 Подсчитаем значения соответствующих сумм: 15 15 15 𝑖=1 𝑖=1 𝑖=1 ∑15 ∑15 𝑖=1 𝑥𝑖 𝑖=1 𝑦𝑖 2 = 0,4; = 2,09; ∑ 𝑥𝑖 𝑦𝑖 = 57,56; ∑ 𝑥𝑖 = 6; ∑ 𝑥𝑖 = 13,6; 𝑛 𝑛 Решив систему, найдем коэффициенты линейной регрессии: 𝑎 = 0,478 2,09 = 𝑎 + 𝑏 ∙ 0,4 ⇒{ { 𝑏 = 4,021 57,56 = 𝑎 ∙ 6 + 𝑏 ∙ 13,6 Уравнение линии получится следующим: 𝑦 = 0,478 + 4,021 ∙ 𝑥; Построим данную прямую над корреляционным облаком: 12 10 8 6 Корелляци онное облако 4 Функция корреляци и 2 0 -2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 -4 -6 21 1 1.2 1.4 1.6 1.8 Оценим ошибку аппроксимации по формулам: 𝑛 1 𝑦 − 𝑦̂ 𝑍1 = ( ∑ | |) ∙ 100% ≈ 334,85% 𝑛 𝑦 𝑖=1 Также применяют среднюю оценку точности, рассчитанную по формуле: 𝑛 100% √∑(𝑦 − 𝑦̂)2 ≈ 47,80% 𝑍2 = 𝑛 𝑖=1 Оценка по первому методу оказалась завышенной, т.к. значения в корелляционном облаке сильно приближены к нулю. Подсчитаем поэффициент корреляции по формуле: 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) ∙ (∑ 𝑦𝑖 ) 𝑟= √(𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ) ∙ (𝑛 ∑ 𝑦𝑖2 ≈ 0,88 − (∑ 𝑦𝑖 )2 ) Оценим значимость коэффицента корреляции, для этого введем случайную величину вида: 𝑡= 𝑟 ∙ (𝑛 − 2) √1 − 𝑟 2 Которая имеет распределении Стьюдента с n-2 степенью свободы, следовательно подсчитаем значение 𝑡 и сравним с табличным: 𝑡= 𝑟 ∙ (𝑛 − 2) √1 − 𝑟 2 = 0,88 ∙ 13 √1 − 0,882 ≈ 50,7 Табличное значение распределения Стьюдента с вероятностью 0,95 𝑡̂𝑘=13;𝛼=0,95 = 2,16, как видно значение нашего параметра t больше табличного, следовательно, оценка коэффициента корреляции является значимой. Проверим коэффициент линейной регрессии на значимость, для этого подсчитаем параметр t, который соответствует распределению Стьюдента с (n-2) степенями свободы: 22 𝑏 𝑡= 1 √ ∙ (𝑛 − 2) ≈ 6,76 ∑15 𝑖=1(𝑦 ∑15 𝑖=1(𝑥 − 𝑦̂)2 − 𝑥̅ )2 Табличное значение распределения Стьюдента с вероятностью 0,95 𝑡̂𝑘=13;𝛼=0,95 = 2,16, как видно значение нашего параметра t больше табличного, следовательно, оценка коэффициента линейной регрессии является значимой. 23