Теория вероятностей Основные понятия комбинаторики • . • Опр. Последовательность элементов называется упорядоченной, если порядок следования элементов в ней задан • Опр. Размещением из n элементов по m элементов наз-ся любое упорядоченное подмножество из m элементов множества, состоящего из n различных элементов: n! A ( n m)! m n • Опр. Перестановками из n элементов наз-ся любое упорядоченное множество, в которое входят по одному разу все n различные элементы данного множества: Pn n! • Опр. Сочетанием из n элементов по m элементов наз-ся любое подмножество из m элементов, которые принадлежат множеству, состоящему из n различных элементов: n! C ( n m)!m! m n СЛУЧАЙНЫЕ СОБЫТИЯ И ПРЕДМЕТ ТЕОРИИ ВЕРОЯТНОСТЕЙ • Опр. Событие называется случайным по отношению к данному опыту, если при осуществлении этого опыта оно может наступить или не наступить. • Событие обозначается: A, B, C ,.... • Опр. Событие называется невозможным в опыте , если при повторении опыта оно никогда не происходит. • Ему соответствует пустое подмножество в , которое обозначается . • Опр. Событие называется достоверным в опыте , если при повторении опыта оно происходит всегда. • Ему соответствует само пространство . АЛГЕБРА СОБЫТИЙ • Опр. Суммой событий A и B называется событие A+ B , состоящее в том, что в опыте произойдет хотя бы одно из этих событий (событию A + B соответствует объединение подмножеств множества ). Если наступление обозначить“+”, не наступление “-“, то можно составить таблицу для наступления A + B • Если A и B высказывания, то A B – соответственно дизъюнкция: • Опр. Произведением событий A и B называется событие AB , состоящее в одновременном появлении этих событий (событию AB соответствует пересечение подмножеств.) Если A , B высказывания, то AB - конъюнкция: • Опр. Разностью событий A и B называется событие A \ B , состоящее в том, что событие A произойдет, а событие B нет. • Опр. Событие А называется противоположным событию A , если оно считается наступившим тогда и только тогда, когда A не наступает. ВЕРОЯТНОСТЬ СОБЫТИЯ • Опр. Пусть при n-кратном повторении опыта G событие A произошло m A раз. Частотой n (A) события A называется отношение mA n ( A) n Свойства n (A) : 1. n ( A) 0 , так как mA 0, n 0 . 2. n ( A) 1 , так как m A n . Если A и B несовместны, причем событие A появится m A раз, событие • B - mB раз,то m A mB m A mB n ( A B) n ( A) n ( B) n n n • • • СВОЙСТВА ВЕРОЯТНОСТИ • • • • • 1. р ( А) 1 2. р () 0 3.Если А В, то р ( А) р ( В ) 4. р( А В) р( А) р( В) р( АВ) 5. р( А В) р( А) р( В) • Теорема. Если Аi ,i 1, n полную группу событий, то образуют p( А1 ) ... p( Аn ) 1 . • Теорема. p ( A) 1 p ( A) . • Теорема. Если событие A представимо в виде суммы m благоприятствующих случаев из n, то вероятность такого события равна m . n “Геометрические” вероятности. • События - всевозможные измеримые подмножества в . • ( A) , p( A) () где ( A) мера подмножества A Условная вероятность • Опр. Условной вероятностью события A относительно события B называется вероятность p ( A \ B ) осуществления события A при условии, что событие B уже произошло. • По определению р( АВ) р( А \ В) р( В) • Пример. Слово “лотос” составлено из одинаковых букв- кубиков. Кубики рассыпаны. Берут наугад один за другим три кубика. Какова вероятность того, что при этом появиться слово “сто”. • Решение: A - проявиться слово «сто» A1 - первой извлечена “с” A2 - второй извлечена “т” A3 - третьей извлечена “о” • Представим событие A в виде: A A1 A2 A3 • Тогда: 1 1 2 р( А) р( А1 ) р( А2 \ А1 ) р( А3 \ А1 А2 ) 5 4 3 НЕЗАВИСИМЫЕ СОБЫТИЯ • Опр. События A и B называются независимыми, если р( ВА) р( В) р( А), то есть, p( A) p( A \ B ) –условная вероятность события A равна безусловной вероятности. Правило умножения вероятностей. • Если события A и то B независимы, р( ВА) р( В) р( А) • Теорема. Если события A и B независимы, то независимы события А и B , а также и события А и В ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ • Предположим, что событие A может наступить только вместе с одним из нескольких попарно несовместных событий Н1 ,..., Н n тогда имеет место формула n р( А) p( H i ) p( A \ H i ) i 1 ФОРМУЛА БАЙЕСА • Эта формула решает следующую задачу: пусть произведен опыт, и в результате него наступило событие A. Сам по себе этот факт ещё не позволяет сказать, какое из событий Н1 ,..., Н n имело место в проделанном опыте. Можно поставить следующую задачу: найти вероятности p( Н i \ А) : р( Н i ) p( A \ H i ) p ( Н i \ А) p ( A) Формула Бернулли P( A) Pn ( k ) C p q k n k n k • где n- столько раз проводили опыт; k - число появления соб. A ; p - вероятность появления соб. A ; q - вероятность не появления соб. A , ( q 1 p ). ( q p ) n q n Cn1 q n 1 p Cn2 q n 2 p 2 ... Cnn 1 q p n1 p n k k n k P ( k ) C p q n т.к. p q 1 и n , то эту формулу можно переписать в виде Pn (0) Pn (1) Pn (2) ... Pn (n 1) Pn (n) 1 • Событие A произойдет: • а) менее k раз Pn (0) Pn (1) Pn (2) ... Pn (k 1); • б) не менее k раз Pn (k ) Pn (k 1) ... Pn (n 1) Pn (n); • в) более k раз Pn (k 1) Pn (k 2) ... Pn (n 1) Pn (n); • г) не более k раз Pn (0) Pn (1) Pn (2) ... Pn (k 1) Pn (k ); Наиболее вероятное число успехов np q k0 np p Вероятность Pn (k ) при больших значениях n Локальная приближенная формула Лапласа ( n -велико) 1 k np Pn (k ) ( x ), где x ; npq npq ( x) 1 e 2 x2 2 ; ( x) ( x) Интегральная формула Лапласа • Пусть x x t2 2 1 ( x ) (t )dt e dt; 2 0 0 ( x ) ( x ) • Тогда Pn (k1 k k2 ) ( x1 ) ( x2 ), • где k1 np k2np x1 , x2 . npq npq Вероятность того, что частота наступления соб. A в n опытах отклонится от вероятности соб. A не более чем на : mA P p 2 n n pq Приближенная формула Пуассона • n велико, p 0,1 Pn (k ) k k! e , np. Случайные величины • Опр. Случайной называется величина, которая в результате опыта может принять то или иное возможное значение, неизвестное заранее, но обязательно одно. • Опр. Дискретной случайной величиной называют такую случайную величину, множество возможных значений которой либо конечно, либо бесконечно, но обязательно счетно. • Опр. Непрерывной случайной величиной называют такую случайную величину, которая может принять любое значение из некоторого конечного или бесконечного интервала. • Случайные величины: • значения: x, y, z,.... . X ,Y , Z ,....; Операции над случайными величинами. X : x1 , x2 ,..., xi ,..., xn ; Y : y1 , y2 ,..., y j ,..., ym . Определение. • Суммой X Y случайных величин X и Y называется случайная величина Z , возможные значения которой есть x1 y1 , x1 y2 , x1 y3 ,..., x1 y j , x2 y1 , x2 y2 ,..., x2 y j ,..., xi y1 , xi y 2 , xi y3 ,..., xi y j ,..., xn y m . • Опр. Произведением X Y случайных величин X и Y называется случайная величина Z , возможные значения которой есть x1 y1 , x1 y 2 , ..., x1 y j , x2 y1 , x2 y2 ,..., x2 y j ,.. ..., xi y1 , xi y2 ,..., xi y j ,.. ..., xn ym . • Опр. Произведением C X случайной величины X на C постоянную называется случайная величина Z , возможные значения которой есть Cx1 , Cx2 , Cx3 ,..., Cxi . Закон распределения случайной величины • Опр. Законом распределения дискретной случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими вероятностями. • Закон распределения случайной величины можно задать, как и функцию: табличным, графическим и аналитическим способами. • Опр. Две случайные величины наз-ся независимыми, если закон распределения вероятностей одной из них не зависит от того какие возможные значения приняла другая. Табличный способ Ряд распределения случайной величины • Пусть X x1 тогда P( X x1 ) p1 ; X x2 тогда P( X x2 ) p2 ; X x3 тогда P ( X x3 ) p 3 ; ………………………………… X xn тогда P ( X x n ) p n. xi x1 x2 x3 pi p1 p2 p3 n p i 1 i 1. …… xn …… pn Графический способ Многоугольник распределения xi 1 2 3 4 5 pi 0,1 0,3 0,2 0,3 0,1 pi 0,3 0,2 0,1 1 2 3 4 5 xi Аналитический способ Функция распределения вероятностей • Опр. Функцией распределения вероятностей случайной величины X называется функция F (x) , задающая вероятность того, что случайная величина X принимает значение, меньшее x , т.е. F ( x) P( X x) . Свойства функции распределения. • 1. 0 F ( x ) 1 ; • 2. F (x ) - неубывающая функция и для P( X ) F ( ) F ( ); 3. Если F (x ) - функция распределения, то lim F ( x) 0, lim F ( x) 1. x x 4.Если X - непрерывная случайная величина, то P( X ) 0 . P( X ) P( X ) P( X ) P( X ). • Если X - дискретная случайная величина, F ( x) P( X xi ). то xi x xi x1 x2 x3 pi p1 p2 p3 in p i 1 i 1. …….. …….. xn pn x x1 , F ( x) P( X x1 ) 0; x1 x x2 , x2 x x3 , F ( x) P( X x2 ) P( X x1 ) p1; F ( x) P( X x3 ) P( X x1 ) P( X x2 ) p1 p2 ; …………………………………………........... xn1 x xn , F ( x) P( X xn ) P( X x1 ) P( X x2 ) ... P( X xn1 ) p1 p2 ... pn1; x xn , F ( x) P( X xn ) p1 p2 ... pn 1. x x1 ; 0, p , ; x x x 2 1 1 p1 p2 , x2 x x3 ; F ( x) .......... .......... p1 p2 ... pn 1 , xn 1 x xn ; 1, x xn . F (x ) 1 p1 p2 ... pn1 ............... p1 p2 p1 x1 x 2 x3 ........ x n pi Плотность распределения вероятностей • Опр. Дифференциальной функцией распределения или плотностью распределения вероятностей наз. первая производная интегральной функции распределения F (x ). • График дифференциальной функции распределения f (x) наз. кривой распределения: f (x ) x Свойства плотности распределения вероятности. • 1.Для x f ( x) 0. • 2.Для f (x ) имеет место равенство P( X ) f ( x)dx. • 3. f ( x)dx 1. x • 4. F ( x) f (t )dt Числовые характеристики случайных величин. Математическое ожидание. xi x1 x2 x3 pi p1 p2 p3 in p i 1 i 1. …….. …….. xn pn • Опр. Математическим ожиданием MX дискретной случайной величины X наз. сумма произведений всех возможных значений случайной величины на соответствующие вероятности появления этих значений: n MX xi pi . i 1 • Опр. Математическим ожиданием непрерывной случайной величины X , возможные значения которой принадлежат a; b , называется b f ( x)dx. a • Если возможные значения принадлежат ; , то MX f ( x)dx. Свойства математического ожидания 1. MC C. 2. M (CX ) C MC . 3.Если X , Y независимые случайные величины, то M ( X Y ) MX MY . 4.Если X , Y независимые случайные величины, то M ( XY ) MX MY . 5. M ( X MX ) 0. • Пример 1. xi 2 5 8 19 p i 0,2 0,3 0,4 0,1 MX 2 0,2 5 0,3 8 0,4 19 0,1 7. Пример 2. 0 , x 1, f ( x) x 3 , 0, x 1; 1 x 2; 2 x 3; x 3. MX x f ( x)dx 1 2 3 2 1 2 3 1 x 0dx x ( x 1)dx x (3 x)dx x 0dx ( x 2 x)dx 3 (3x x 2 )dx 2 2 x x 3 2 1 3 2 2 3x x 2. 3 2 2 2 3 f (x ) 2 1 2 3 xi Дисперсия • Опр. Математическое ожидание квадрата отклонения СВ X от её математического ожидания MX называют дисперсией СВ X : • DX M ( X MX ) . 2 • Если СВ X - дискретная СВ, то n DX ( xi MX ) pi . 2 i 1 • Если СВ X - дискретная СВ, то DX ( x MX ) f ( x)dx. 2 • Среднее квадратическое отклонение ( x) DX . Свойства дисперсии • • • • • 1. 2. 3. 4. 5. D( X Y ) DX DY . DC 0. D(CX ) C DX . 2 DX MX ( MX ) . 2 2 D( X MX ) DX . • Опр. Начальным моментом k го порядка k СВ X называется k MX . k k MX : • Опр. Центральным моментом k порядка k СВ X называется го M ( X MX ) : k M ( X MX ) . k k • Опр. Коэффициентом асимметрии наз-ся величина : 3 3 x . 3 A 3. x A • Опр. Эксцессом 4 3. 4 x E наз-ся величина 4 E 4 3. x Виды распределения Равномерное распределение 0, 1 f ( x) , a b 0, x a; a x b; x b. f (x ) 1 ba a ba MX , 2 b x (b a) DX , 12 2 A 0, E 0. Нормальное распределение f ( x) 1 2 e ( xa ) 2 2 2 . MX a, • Если СВ X~ DX , 2 A 0, E 0. N ( a, ) , то a a P( X ) Ф Ф . • Если СВ X ~ N ( a, ) , то P ( X a ) 2 Ф . • Обозначим z , тогда P( X a z) 2 Фz . • Пусть z 1, P( X a ) 2Ф(1) 0,6437; z 2, P( X a 2 ) 2Ф(2) 0,9545; z 3, P( X a 3 ) 2Ф(3) 0,9973. • Правило «трёх сигм»: если СВ X распределена по нормальному закону, то отклонение этой величины от её MX по абсолютной величине практически не превышает утроенного среднего квадратического отклонения. Биномиальное распределение xi pi x1 x2 ………… xn p1 p2 ………… pn in p i 1 pi Pn (k ) C p q k n MX np, k i nk 1. , DX npq. Распределение Пуассона xi pi x1 x2 ………… xn p1 p2 ………… pn in p i 1 pi Pn (k ) MX , k k! e , DX . i 1. Математическая статистика Задачи математической статистики • Оценка неизвестной функции распределения. • Оценка неизвестных параметров распределения. • Статистическая проверка гипотез. • Опр. Исследуемая совокупность объектов N наз. генеральной совокупностью ( N -очень велико, в некоторых случаях количество значений, образующих генеральную совокупность, можно мыслить и бесконечной). • Опр. Совокупность объектов n , отобранных случайным образом из генеральной совокупности наз. выборочной совокупностью (выборкой), где n N . • Число n наз. объемом выборки. Виды выборок • Собственно-случайная; • механическая; • типическая; • серийная. Способы образования выборки • Повторный отбор; • бесповторный. • Варианты: x1 , x2 , x3 ,..., xn . • Вариационный ряд: x1 x2 x3 ... xn • или x1 x2 x3 ... xn . • Из генеральной совокупности извлечена выборка объема n : • x1 наблюдалось n1 раз; • x2 наблюдалось n 2 раз; • x3 наблюдалось n3 раз; • ………………………………… • наблюдалось раз. k k n x k • Причем . n n i i 1 • Числа n1 , n2 ,...., nk называются частотами. • Числа ni wi n , где i 1,2,..., k наз. относительными частотами. Статистическое распределение выборки x1 n1 x3 n3 x2 n2 k n i 1 i n ………… xk ………… nk Полигон частот nk n3 n1 n2 x1 x 2 x3 .......... x k Полигон относительных частот wk w3 w1 w2 x1 x 2 x3 .......... x k • Эмпирическая функция распределения это функция равная отношению числа вариант, меньших x , к объему выборки: n( x ) . F ( x) n Свойства эмпирической функции распределения • 1) 0 F ( x) 1; • 2) F (x) - неубывающая; • 3) если x1 наименьшая варианта, то F ( x) 0, при x x1 ; 4) если x k наибольшая варианта, то F ( x) 1, при x x k . Статистическая совокупность x0 ; x1 x1 ; x2 x2 ; x3 n1 n2 n3 ………… ………… xk 1 ; xk nk h x1 x0 x2 x1 .... xk xk 1 Гистограмма частот ni h n2 h n1 h nk h x1 x 2 x3 xk 1x k • Площадь гистограммы частот k S S i , i 1 ni S i h ni , h k тогда S ni n. i 1 Гистограмма относительных частот wi h w2 h w1 h wk h x1 x 2 x3 xk 1x k Площадь гистограммы относительных частот wi Si h wi , h k S S i , i 1 тогда k k k ni S wi i 1 i 1 n n i 1 n i n 1. n Статистические оценки параметров распределения Свойства точечных оценок Несмещенность • Статистическая оценка наз. несмещенной, если её математическое ожидание равно оцениваемому параметру при любом объеме выборки: M ( ) . Эффективность • Статистическая оценка наз. эффективной, если она имеет наименьшую возможную дисперсию. Состоятельность • Статистическая оценка наз. состоятельной, которая при n • стремится по вероятности к оцениваемому параметру : lim P n 1. Генеральная средняя N xг x i i 1 N или N xг x i 1 i N Ni . Выборочная средняя n xв x i i 1 n или n xв x n i 1 i n i . Генеральная дисперсия N Dг 2 ( x x ) г i i 1 N или N Dг 2 ( x x ) Ni г i i 1 N . Выборочная дисперсия x n Dв или i 1 n x n Dв xв i 2 i 1 i xв n 2 i , n 1 n Dв xi x г n i 1 x 2 в xг . 2 • Несмещенная оценка генеральной дисперсии - исправленная выборочная дисперсия: n S Dв . n 1 2 Мода (nk nk 1 ) h M 0 xk (nk nk 1 ) (nk nk 1 ) Медиана n Ti 1 2 M e xi h . ni Метод произведений u i-условные варианты, xi C ui , C h -условный нуль. xi u i h C , n xв x n i 1 i i n n n i n 1 ni (C ui h) C i 1 h n i 1 n 1 C hМ , n где М k k n u i i i 1 n . xв C h М 1 n n u i 1 i n i 2 2 1 Dв ( М ( М ) ) h 2 3 h ( М 3М М 2( М ) ), 3 3 1 2 3 1 4 h ( М 4М М 6М ( М ) 3( М ) ). 4 4 1 3 2 2 1 4 1 Статистическая проверка статистических гипотез • Нулевая гипотеза ( H 0 ) - выдвинутая гипотеза. • Конкурирующая гипотеза ( H 1 ) - гипотеза, которая противоречит нулевой гипотезе. Простая гипотеза – гипотеза, содержащая одно предположение: H0 : 5, где параметр распределения Пуассона. Сложная гипотеза – гипотеза, которая состоит из конечного или бесконечного числа простых гипотез: H0 : 5, где параметр распределения Пуассона. • Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. • Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. • Уровень значимости ( ) – вероятность совершить ошибку первого рода. • Статистический критерий (K ) случайная величина, которая служит для проверки нулевой гипотезы. • Наблюдаемым значением ( K набл ) значение критерия, вычисленное по выборке. • Критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают. • Область принятия гипотезы совокупность значений критерия, при которых нулевую гипотезу принимают. • Критические точки ( K кр ) - точки, отделяющие критическую область от области принятия гипотезы. • Правосторонняя критическая область – критическая область определяющаяся неравенством: K K кр , K кр 0 0 K кр K кр ищут, исходя из требования чтобы P( K K кр ) . • Левосторонняя критическая область – критическая область, определяющаяся K K кр , K кр 0. неравенством: K кр K кр 0 ищут, исходя из требования чтобы P( K K кр ) . • Двусторонняя критическая область – критическая область, определяющаяся неравенством: K K1 , K K 2 . K1 0 K2 K1 , K 2 ищут, исходя из требования чтобы P( K K1 ) P( K K 2 ) . • Если распределение критерия симметрично относительно 0 и имеются основания выбрать симметричные относительно нуля точки: K кр и K кр ( K кр 0), то P( K K кр ) P( K K кр ). Тогда P(K K1 ) P(K K 2 ) заменится P( K K кр ) P( K K кр ) или P( K K кр ) / 2. • Доверительная вероятность (надежность)- вероятность с которой осуществляется неравенство , т.е. P . • Доверительный интервал – интервал, который покрывает неизвестный параметр с заданной надежностью . Доверительный интервал для оценки математического ожидания нормального распределения при известном . xв Число t t n a xв t n определяется из равенства Ф (t ) 2 . Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном . xв Число t S n a xв t S n t определяется по таблице t t ( , n). • Критерий согласия – критерий проверки гипотезы о предполагаемом законе неизвестного распределения. • Критерии согласия: ( хи квадрат) Пирсона, Колмогорова, Смирнова и др. 2