2.1 Классическое определение вероятности. 1. Бросаются две игральные кости. Найти вероятность того, что выпадет четное количество очков на обеих костях? 3 Вероятность того, что четное число выпадет на одной кости: 6 = 0.5 Вероятность того, что четное число выпадет на обеих костях: 𝑝 = 𝑝1 ∙ 𝑝2 = 0.5 ∙ 0.5 = 0.25 2. В мастерскую для ремонта поступило 10 телевизоров, из которых 3 нуждаются в общем ремонте. Мастер наугад берет первые 5 штук. Какова вероятность того, что два из выбранных 5 телевизоров нуждаются в общем ремонте. По формуле полной вероятности: 𝑝 = 𝑚 . 𝑛 В нашем случае n – все возможные выборки 5-ти деталей из 10-ти; m – такие выборки, в которых мастер выберет 2 детали, нуждающиеся в общем ремонте, из 3-х и 3 детали из 7, которые нуждаются в обычном ремонте. Соответственно: 5 𝑛 = 𝐶10 , 𝑚 = 𝐶32 ∙ 𝐶73 . 𝑛= 10! 3628800 = = 252 5! (10 − 5)! 120 ∙ 120 𝑚= 3! 7! 6 5040 ∙ = ∙ = 105 2! (3 − 2)! 3! (7 − 3)! 2 6 ∙ 24 𝑝= 105 = 0,42 252 2.2 Теоремы сложения и умножения вероятностей В урне 4 белых и 6 черных шаров. Их урны наугад извлекают 4 шара. Какова вероятность, что среди них будет хотя бы два черных шара? В нашем случае n – все возможные выборки 4-хшаров из 10-ти; m – такие выборки, в которых выберут либо 2, либо 3, либо 4 черных шара. Соответственно: 4 𝑛 = 𝐶10 , 𝑚 = 𝐶42 ∙ 𝐶62 + 𝐶41 ∙ 𝐶63 + 𝐶40 ∙ 𝐶64 . 𝑛= 𝑚= 10! 3628800 = = 210 4! (10 − 4)! 24 ∙ 720 4! 6! 4! 6! 4! 6! ∙ + ∙ + ∙ 2! (4 − 2)! 2! (6 − 2)! 1! (4 − 1)! 3! (6 − 3)! 0! (4 − 0)! 4! (6 − 4)! 24 720 24 720 24 720 = ∙ + ∙ + ∙ = 90 + 60 + 15 = 165 4 48 6 36 24 48 𝑝= 105 = 0,42 252 2.3 Формула полной вероятности.Формула Байеса. В продажу поступили телевизоры трех заводов. Продукция первого завода содержит 20% телевизоров со скрытыми дефектами, второго 10% и третьего 5%. Какова вероятность приобрести исправный телевизор, если в магазине находится 30% телевизоров 1-го завода, 20% второго завода и 50% третьего? Для подсчета вероятности попадания воспользуемся формулой полной вероятности 𝑝 = ∑ 𝑎𝑖 ∙ 𝑝𝑖 , где a – вероятность того, что телевизор содержит дефект, p – вероятность попадания дефектного телевизора в магазин. 𝑝 = ∑ 𝑎𝑖 ∙ 𝑝𝑖 = 0,2 ∙ 0,3 + 0,1 ∙ 0,2 + 0,05 ∙ 0,5 = 0,105. 2.4 Повторение испытаний Монету бросают 6 раз. Найти вероятность того, что герб выпадет 2 раза (вероятность выпадения герба 0,5). По формуле Бернулли: 𝑃𝑛 (𝑘) = 𝐶𝑛𝑘 𝑝𝑘 𝑞𝑛−𝑘 , Где p –вероятность выпадения герба (0,5) q– вероятность выпадения решки (0,5) k – 2 (количество раз, когда должен выпасть герб) n – 6 (количество бросков). Соответственно: 𝑃𝑛 (𝑘) = 𝐶𝑛𝑘 𝑝𝑘 𝑞𝑛−𝑘 = 6! ∙ 0,52 ∙ 0,54 = 0,234 2! (6 − 2)! 2.5 Дискретные случайные величины Задан закон распределения дискретной случайной величины X. Найти математическое ожидание, дисперсию, среднее квадратическое отклонение. Построить график функции распределения вероятностей случайной величины X. X 10,6 20,6 21 21,6 22,4 P 0,3 0,3 0,2 0,1 0,1 Подсчитаем математическое ожидание случайной величины: 5 𝑚 = ∑ 𝑥𝑖 ∙ 𝑝𝑖 = 10,6 ∙ 0,3 + 20,6 ∙ 0,3 + 21 ∙ 0,2 + 21,6 ∙ 0,1 + 22,4 ∙ 0,1 = 17,96. 𝑖=1 Подсчитаем дисперсию случайной величины по формуле: 5 𝐷 = ∑(𝑥𝑖 − 𝑚)2 ∙ 𝑝𝑖 = 𝑖=1 = (10,6 − 17,96)2 ∙ 0,3 + (20,6 − 17,96)2 ∙ 0,3 + (21 − 17,96)2 ∙ 0,2 + (21,6 − 17,96)2 ∙ 0,1 + (22,4 − 17,96)2 ∙ 0,1 = 23,4864. Подсчитаем СКО по формуле: 𝜎 = √𝐷 = √23,4864 = 4,85. Построим график функции распределения ДСВ: Основной Основной Основной Основной Основной Основной Основной Основной 2.6 Основной Основной Основной Основной Непрерывные случайные величины Непрерывная случайная величина X задана функцией распределения (варианты 1-5) или плотностью распределения вероятностей (варианты 6-10). Требуется найти: плотность распределения (варианты 1-5) или функцию распределения вероятностей (варианты 6-10); математическое ожидание; дисперсию; среднее квадратическое отклонение; вероятность того, что случайная величина отклонится от своего математического ожидания не более, чем на одну четвертую длины всего интервала возможных значений этой величины; построить графики функции распределения и плотности распределения вероятностей. 0, 𝑥≤0 𝐹(𝑥) = {√𝑥, 0 < 𝑥 ≤ 1 1, 𝑥>1 Найдем плотность распределения НСВ, как производную от функции распределения НСВ: 0, 1 𝑥≤0 ,0 < 𝑥 ≤ 1 𝑓(𝑥) = 𝐹 ′ (𝑥) = { 2√𝑥 0, 𝑥>1 Посчитаем математическое ожидание НСВ по формуле: ∞ 1 𝑀(𝑥) = ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∙ −∞ 0 1 31 1 1 𝑑𝑥 = 𝑥 2 | = − 0 = . 3 0 3 3 2√𝑥 1 Посчитаем дисперсию НСВ по формуле: ∞ ∞ 1 𝐷(𝑥) = ∫ (𝑥 − 𝑀(𝑥))2 ∙ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 2 ∙ 𝑓(𝑥)𝑑𝑥 − 𝑀(𝑥)2 = ∫ 𝑥 2 ∙ −∞ −∞ 0 1 2 𝑑𝑥 − ( ) 3 2√𝑥 1 1 1 3 1 1 51 1 1 1 4 = ∫ 𝑥 2 𝑑𝑥 − = 𝑥 2 | − = − 0 − = . 2 0 9 5 0 9 5 9 45 Посчитаем СКО по формуле: 4 2 𝜎 = √𝐷 = √ = ≈ 0,298. 45 3√5 Подсчитаем вероятность того, что случайная величина отклонится от своего математического ожидания не более, чем на одну четвертую длины всего интервала возможных значений этой величины: 1 1 1 1 7 1 7 1 √7 − 1 𝑃( − ≤ 𝑥 ≤ + ) = 𝐹( )−𝐹( ) = √ −√ = ≈ 0,475. 3 4 3 4 12 12 12 12 2√3 2.7 Система двух случайных величин Закон распределения дискретной двумерной случайной величины (X,Y) задан таблицей. Требуется: определить одномерные законы распределения случайных величин X и Y; найти условные плотности распределения вероятностей величин; вычислить математические ожидания𝑚𝑥 и 𝑚𝑦 ; вычислить дисперсии𝜎𝑥 и 𝜎𝑦 ; вычислить ковариацию 𝜇𝑥𝑦 ; вычислить коэффициент корреляции 𝑟𝑥𝑦 . Возможные значения случайных величин выбрать по номеру варианта. 0,04 0,04 0,03 0,03 0,01 0,04 0,07 0,06 0,05 0,03 0,05 0,08 0,09 0,08 0,05 0,03 0,04 0,04 0,06 0,08 X = {2, 3, 5, 8} Y = {7, 9, 10, 11, 13} Найдем закон распределения отдельно СВ Х и отдельно СВ Y: X P(x = xi) 2 0,15 Y P(y=yi) 7 0,16 3 0,25 9 0,23 5 0,35 10 0,22 8 0,25 11 0,22 13 0,17 11 0,1364 0,2273 0,3636 0,2727 13 0,0588 0,1765 0,2941 0,4706 Найдем условные плотности распределения вероятностей величин. Общая формула нахождения элемента условного закона распределения: 𝑥 𝑃 { 𝑖⁄𝑦𝑗 } = 𝑃𝑖𝑗 𝑃{𝑌 = 𝑦𝑗 } 𝑃𝑖𝑗 𝑦 𝑃 { 𝑗⁄𝑥𝑖 } = 𝑃{𝑋 = 𝑥𝑖 } Зафиксируем Y Y 𝑃(𝑥 = 2) 𝑃(𝑥 = 3) 𝑃(𝑥 = 5) 𝑃(𝑥 = 8) 7 0,25 0,25 0,3125 0,1875 9 0,1739 0,3043 0,3478 0,1739 10 0,1364 0,2727 0,4091 0,1818 Зафиксируем Х X 𝑃(𝑦 = 7) 𝑃(𝑦 = 9) 𝑃(𝑦 = 10) 𝑃(𝑦 = 11) 𝑃(𝑦 = 13) 2 0,27 0,27 0,2 0,2 0,06 Найдем математические ожидания. 3 0,16 0,28 0,24 0,2 0,12 5 0,14 0,23 0,26 0,23 0,14 8 0,12 0,16 0,16 0,24 0,32 𝑛 𝑚 𝑚𝑥 = ∑ (𝑥𝑖 ∙ ∑ 𝑃𝑖𝑗 ) = 4,8 𝑖=1 𝑗=1 𝑚 𝑛 𝑚𝑦 = ∑ (𝑦𝑗 ∙ ∑ 𝑃𝑖𝑗 ) = 10,02 𝑗=1 𝑖=1 Найдем дисперсии 𝑛 𝜎𝑥2 = 𝑚 2 ∑ (𝑥𝑖 ∙ ∑ 𝑃𝑖𝑗 ) 𝑖=1 𝑗=1 𝑚 𝜎𝑦2 = − 𝑚𝑥2 = 4,56 𝑛 ∑ (𝑦𝑗2 𝑗=1 ∙ ∑ 𝑃𝑖𝑗 ) − 𝑚𝑦2 = 3,4196 𝑖=1 Вычислим ковариацию 𝑛 𝑚 𝜇𝑥𝑦 = ∑ ∑(𝑥𝑖 − 𝑚𝑥 )(𝑦𝑖 − 𝑚𝑦 )𝑃𝑖𝑗 = 0,914 𝑖=1 𝑗=1 Вычислим коэффициент корреляции 𝜇𝑥𝑦 𝑟𝑥𝑦 = 𝜎 𝑥 𝜎𝑦 =0,23146 2.8 Закон больших чисел и предельные теоремы Дисперсия случайной величины X равна σ2 . Требуется: С помощью неравенства Чебышева оценить вероятность того, что случайная величина отклониться от своего математического ожидания не более чем на величину 𝜀. Параметры выбрать по номеру варианта; Для рассматриваемой случайной величины X оценивается математическое ожидание. Сколько нужно сделать измерений, чтобы с вероятностью, не меньшей 0,95, среднее арифметическое этих измерений отклонилось от истинного значения математического ожидания не более чем на величину ε. 𝜎 2 = 1,2; 𝜀 = 1,8 По неравенству Чебышева: 𝑃(|𝑥 − 𝑚𝑥 | < 𝜀) = 1 − 𝜎2 = 0,6296 𝜀2 Из первой теоремы Чебышева: ∑ 𝑥𝑖 𝜎2 𝑃 {| − 𝑚𝑥 | ≤ 𝜀} ≥ 1 − 2 𝑛 𝑛𝜀 Следовательно: 𝑛≥ 𝜎2 (1 − 𝑃 {| ∑ 𝑥𝑖 𝑛 − 𝑚𝑥 | ≤ 𝜀}) 𝜀 2 = 7.4 2. 9 Статистическая обработка экспериментальных данных. Оценка параметров. Проверка статистических гипотез По заданной выборке случайной величины X вычислить основные эмпирические характеристики: выборочную среднюю; выборочную дисперсию; исправленное значение выборочной дисперсии; среднее квадратическое отклонение; построить доверительный интервал для оценки математического ожидания. Считать надежность оценки равной 0,95; построить доверительный интервал для оценки дисперсии. Считать надежность оценки равной 0,95. Построить по данным выборки полигон и гистограмму. Подобрать подходящий теоретический закон распределения вероятностей. Проверить гипотезу о соответствии эмпирического закона распределения выбранному теоретическому при уровне значимости . Данные выборки выбирать по номеру варианта. 0,0 0,4 1,5 0,7 2,9 0,3 2,1 0,6 0,2 0,3 7,4 0,2 0,1 1,3 1,5 0,3 1,0 0,1 2,5 1,2 3,5 5,2 1,3 1,0 3,3 2,5 9,6 1,6 0,5 3,1 0,8 1,9 0,0 0,5 1,5 2,1 3,0 2,3 1,0 2,3 1,5 2,2 1,4 0,3 0,9 1,2 2,3 0,3 1,1 2,0 0,2 1,3 0,4 0,1 6,2 4,4 1,4 0,9 1,7 0,5 Выборочная средняя: 𝑚𝑥 = ∑𝑛𝑖=1 𝑥𝑖 ∑60 𝑖=1 𝑥𝑖 = = 1,6983 𝑛 60 Выборочная дисперсия: 𝑛 𝑆𝑛2 1 = ∑(𝑥𝑖 − 𝑚𝑥 )2 = 3,23 𝑛 𝑖=1 Исправленное значение выборочной дисперсии: 𝑛 𝑆 2 = 3,285 𝑛−1 𝑛 𝑆2 = Доверительный интервал для математического ожидания По имеющимся данным из таблицы находим процентиль распределения Стьюдента: 𝑡1−𝛼,𝑛−1 = 𝑡1−0,95,59 = 1,96 2 2 Общая формула доверительного интервала для математического ожидания: 𝑚𝑥 − 𝑡1−𝛼,𝑛−1 𝑆 2 √𝑛 ≤ 𝜇 ≤ 𝑚𝑥 + 𝑡1−𝛼,𝑛−1 𝑆 2 √𝑛 В нашем случае: 1,6983 − 1,96 ∙ √3,285 √60 ≤ 𝜇 ≤ 1,6983 + 1,96 ∙ √3,285 √60 1,2397 ≤ 𝜇 ≤ 2,1569 Доверительный интервал для дисперсии По имеющимся данным из таблицы находим процентили распределения хи-квадрат: 𝜒𝛼2 = 82,2 2 2 𝜒1− 𝛼 = 39,58 2 Общая формула доверительного интервала для дисперсии: (𝑛 − 1)𝑆 2 𝜒𝛼2 2 ≤𝜎 ≤ 2 (𝑛 − 1)𝑆 2 2 𝜒1− 𝛼 2 В нашем случае: (60 − 1) ∙ 3,2849 (60 − 1) ∙ 3,2849 ≤ 𝜎2 ≤ 82,2 39,58 2,3578 ≤ 𝜎 2 ≤ 4,8967 Полигон fi 0.5 0.45 0.4 0.35 0.3 0.25 2,156942092 4,896660771 fi 0.2 0.15 0.1 0.05 0 Гистограмма fi 0.5 0.45 0.4 0.35 0.3 0.25 fi 0.2 0.15 0.1 0.05 0 0-0,8 0,9-1,6 1,7-2,4 2,5-3,2 3,3-4,0 4,1-4,8 4,9-5,6 5,7-6,4 6,5-7,2 7,3-8,0 8,1-8,8 8,9-9,6 По гистограмме и полигону распределение выдвигается гипотеза об соответствии выборки экспоненциальному закону распределения, где 𝜆= 1 = 0,5888 𝑚𝑥 Проверим гипотезу критерием Стьюдента: 𝑘 2 (𝑝𝑖теор − 𝑝𝑖 ) 𝜒 =𝑛∙∑ , 𝑝𝑖теор 2 𝑖=1 где: 𝑝𝑖 – экспериментальное значение вероятности попадания случайной величины в i-й интервал. Оно равно отношению количества элементов выборки, попавших в данных интервал, к общему количеству элементов в выборке. На основании данных вероятностей построена гистограмма и полигон распределения. 𝑝𝑖теор – теоретическое значение вероятности попадания случайной величиный в i-й интервал; 𝑝𝑖теор = 𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 , где: 𝐴𝑖 – левая граница интервала 𝐵𝑖 – правая граница интервала В итоге получаем формулу: 𝑘 2 (𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 − 𝑝𝑖 ) 𝜒 =𝑛∙∑ = 14,2649 𝑒 −𝜆𝐴𝑖 − 𝑒 −𝜆𝐵𝑖 2 𝑖=1 Т.к. 𝜒 2 < 𝜒𝛼2 , то наша гипотеза верна. 2 2.10 Дисперсионный анализ Сделано по 5 измерений случайной величины X на каждом их четырех уровней фактора F. Методом дисперсионного анализа проверить гипотезу о том, что фактор F не влияет на математическое ожидание величины X. Сделать вывод. Номер испытания i 1 2 3 4 5 𝑄 = 𝑄1 + 𝑄2 Уровни фактора j 𝐹1 3 9 4 2 6 𝐹2 7 5 5 3 9 𝐹3 2 6 2 5 5 𝐹4 5 5 8 4 8 𝑚 𝑛𝑘 2 𝑄 = ∑ ∑ 𝑥𝑖𝑘 − 𝑛𝑥̅ 2 = 623 − 530,45 = 92,55 𝑘=1 𝑖=1 𝑚 𝑄1 = ∑ 𝑛𝑘 𝑥̅𝑘2 − 𝑛𝑥̅ 2 = 543,4 − 530,45 = 12,95 𝑘=1 𝑚 𝑄2 = 𝑛𝑘 2 ∑ ∑ 𝑥𝑖𝑘 𝑘=1 𝑖=1 𝑚 − ∑ 𝑛𝑘 𝑥̅𝑘2 = 623 − 543,4 = 79,6 𝑘=1 В качестве критерия воспользуемся критерием фишера: 𝐹= 𝑄1 𝑚−1 𝑄2 𝑛−𝑚 = 0,867671692 Теоретическое значение критерия: 𝐹𝜆,𝑚−1,𝑛−𝑚 = 3,24 𝐹 < 𝐹𝜆,𝑚−1,𝑛−𝑚 , следовательно нет оснований считать, то фактор оказывает влияние на разброс средних значений. Регрессионный анализ 2.11 При изучении зависимости между величиной X и величиной Y были получены следующие значения (см. таблицу соответствующего варианта). Требуется: · построить график Y=f(X); · рассчитать параметры уравнения линейной регрессии методом наименьших квадратов; · оценить качество полученного уравнения регрессии с помощью средней ошибки аппроксимации; · найти коэффициент корреляции; · оценить значимость коэффициента корреляции и коэффициента регрессии по критерию Стьюдента (t- критерий) при уровне значимости 0,95; · сделать выводы. X -1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 Y -0,1 -0,5 -1,1 -1,6 -1,9 -1,3 -1,2 -0,8 1,3 2,6 4,2 5,7 7,7 8,4 9,9 Изобразим на диаграмме заданные в условии точки: Корелляционное облако 10 8 6 4 2 0 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 -2 -4 Для построения графика линейной регрессии, который имеет вид 𝑦 = 𝑎 + 𝑏 ∙ 𝑥 необходимо определить коэффициенты 𝑎 и 𝑏. Методом наименьших квадратов. 15 ∑15 ∑15 𝑖=1 𝑦𝑖 𝑖=1 𝑥𝑖 =𝑎+𝑏∙ 𝑛 𝑛 15 15 ∑ 𝑥𝑖 𝑦𝑖 = 𝑎 (∑ 𝑥𝑖 ) + 𝑏 (∑ 𝑥𝑖2 ) { 𝑖=1 𝑖=1 𝑖=1 Подсчитаем значения соответствующих сумм: 15 ∑ 𝑥𝑖 = 6; 𝑖=1 15 ∑ 𝑥𝑖2 𝑖=1 15 ∑15 ∑15 𝑖=1 𝑥𝑖 𝑖=1 𝑦𝑖 = 13,6; = 0,4; = 1,147; ∑ 𝑥𝑖 𝑦𝑖 = 51,6; 𝑛 𝑛 𝑖=1 Решив систему найдем коэффициенты линейной регрессии: 1,147 = 𝑎 + 𝑏 ∙ 0,4 𝑎 = −0,45 => { { 51,6 = 𝑎 ∙ 6 + 𝑏 ∙ 13,6 𝑏 = 3,99 Уравнение линии получится следующим: 𝑦 = −0,45 + 3,99 ∙ 𝑥; Построим данную прямую над корреляционным облаком: 10 8 6 Корелляци онное облако Функция корреляци и 4 2 0 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 -2 -4 -6 Оценим ошибку аппроксимации по формулам: 𝑛 1 𝑦 − 𝑦̂ 𝑍1 = ( ∑ | |) ∙ 100% ≈ 153,19% 𝑛 𝑦 𝑖=1 Также применяют среднюю оценку точности, рассчитанную по формуле: 𝑛 100% √∑(𝑦 − 𝑦̂)2 ≈ 50,04% 𝑍2 = 𝑛 𝑖=1 Оценка по первому методу оказалась завышенной, т.к. значения в корелляционном облаке сильно приближены к нулю. Подсчитаем коэффициент корреляции по формуле: 𝑟= 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) ∙ (∑ 𝑦𝑖 ) √(𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ) ∙ (𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 ≈ 0,87 )2 ) Оценим значимость коэффицента корреляции, для этого введем случайную величину вида: 𝑡= 𝑟 ∙ (𝑛 − 2) √1 − 𝑟 2 Которая имеет распределении Стьюдента с n-2 степенью свободы, следовательно подсчитаем значение 𝑡 и сравним с табличным: 𝑡= 𝑟 ∙ (𝑛 − 2) √1 − 𝑟 2 = 0,88 ∙ 13 √1 − 0,882 ≈ 6,42 Табличное значение распределения Стьюдента с вероятностью 0,95 𝑡̂𝑘=13;𝛼=0,95 = 2,16, как видно значение нашего параметра t больше табличного, следовательно, оценка коэффициента корреляции является значимой. Проверим коэффициент линейной регрессии на значимость, для этого подсчитаем параметр t, который соответствует распределению Стьюдента с (n-2) степенями свободы: 𝑡= 𝑏 ∑15 (𝑦−𝑦̂)2 1 √(𝑛−2) ∙ ∑𝑖=1 15 (𝑥−𝑥̅ )2 𝑖=1 ≈ 6,42 Табличное значение распределения Стьюдента с вероятностью 0,95 𝑡̂𝑘=13;𝛼=0,95 = 2,16, как видно значение нашего параметра t больше табличного, следовательно, оценка коэффициента линейной регрессии является значимой.