ЛЕКЦИЯ № 22 Случайные величины. Закон распределения вероятностей и числовые характеристики дискретных случайных величин Распределения дискретных случайных величин Цель: Изучение дискретных случайных величин. Задачи: 1. Дать понятие случайных величин, их виды. 2. Рассмотреть закон распределения вероятностей дискретных случайных величин. 3. Рассмотреть математическое ожидание, дисперсию, среднее квадратическое отклонение дискретной случайной величины. 4. Рассмотреть законы распределения дискретных случайных величин. Желаемый результат: Студенты должны знать дискретные случайные величины и их характеристики. Учебные вопросы: 1. Случайные величин, их виды. 2. Законы распределения вероятностей дискретных случайных величин. 3. Числовые характеристики дискретных случайных величин. 4. Распределения дискретных случайных величин. Случайные величины, виды случайных величин. Определение. Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены. В зависимости oт количества значений, которое может принимать случайная величина в промежутке своего изменения, различают 2 вида случайных величин дискретные и. непрерывные. Определение. Случайная величина называется дискретной (прерывной), если она в процессе своего изменения может принимать изолированные (чаще всего целые) значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным и бесконечным (число дождливых дней в году, число студентов, сдавших экзамен в сессию и т.д.) Определение. Случайная величина называется непрерывной, если она в процессе своего изменения может принимать любые значения в определенном интервале. Очевидно, число возможных значений непрерывной случайной величины бесконечно расход воды предприятием за определенный период, 1 напряжение электрической сети и т.д. Данное определение непрерывной случайной величины не является точным. Закон распределения вероятностей дискретных случайных величин Для задания дискретной случайной величины недостаточно перечислить все возможные её значения, нужно ещё указать их вероятности. Случайная величина считается полностью заданной, если известны соотношения, устанавливающие связь между значениями случайной величины и их вероятностями. Эти соотношения называются законами распределения случайной величины. Эти, законы можно задать таблично, аналитически и графически. При табличном задании закона распределения случайной величины: X x1 x2 … xn P p1 p2 … pn Первая строка содержит возможные значения, а вторая - их вероятности. Так как случайная, величина при одном испытании принимает одно и только одно возможное значение, заключаем, что события х1, х2, х3, … хn образуют полную группу и, следовательно, сумма вероятностей равна 1: р1 + р2 + р3+ …+ рn=1. Если множество возможных значений X бесконечно, то ряд р1 + р2 + р3+ …+ рn сходится и его сумма равна 1. Для наглядности закон распределения дискретной случайной величины можно изобразить и графически, для чего в прямоугольной системе координат строят точки (хi; рi) и затем соединяют их отрезками прямых. Полученную фигуру называют многоугольником распределения. Следует помнить, что соединение вершин ординат делается только в целях наглядности, так как в промежутках между х1 и х2, х2 и х3 и т.д. cлучайная величина х значений принять не может, поэтому вероятности её появления в этих промежутках равны нулю. Многоугольник распределения, так же как и ряд распределения, является одной из форм задания закона распределения дискретной случайной величины х. 2 Многоугольники распределения могут иметь самую различную форму, однако все они обладают одним общим свойством: Сумма ординат многоугольника распределения, представляющая собой сумму вероятностей всех возможных значений случайной величины, всегда равна единице. Пример. Распределение вероятностей числа попаданий в цель при пяти независимых выстрелах, если вероятность попаданий в цель при одном выстреле равна 0,6 является следующим: р1=0,01024, р2=0,0768, р3=0,2304, р4 =0,3456, р5=0,25, р6=0,07776 Возможными значениями случайной величины Х является х1=0 х2=1 х3=2 х4=3 х5=4 х6=5 Ряд распределения величины имеет вид: Хi Рi 0 0,01024 1 0,0768 2 3 0,2304 0,3456 4 5 0,25 0,07776 Многоугольник распределения изображен на рис. Математическое ожидание дискретной случайной величины. Известно, что закон распределения полностью характеризует случайную величину. Однако часто закон распределения неизвестен и приходится ограничиваться меньшими сведениями. Иногда, удобнее пользоваться числами, которые описывают случайную величину суммарно, такие числа называют числовыми характеристиками случайной величины. К числу таких характеристик относится математическое ожидание. Математическое ожидание приближенно 3 равно среднему значению случайной величины. Определение. Математическим ожиданием дискретной случайной величины Х называется сумма произведение всех ее возможных значений на их вероятности Pi М(Х)= k (3) X i Pi i=1 Математическое ожидание М(x) называют еще и центром распределения случайной величины Х Свойства математического ожидания. Свойство 1. Математическое ожидание постоянной величины равно самой постоянной. Доказательство. Будем рассматривать постоянную с как дискретную случайную величину, которая имеет одно возможное значение с и принимает его с вероятностью Р=1. Следовательно, М(С)=с·1=с. Свойство 2. Постоянный множитель можно выносить за знак математического ожидания М(СХ)=СМ(Х) Доказательство. Математическое ожидание случайной величины СХ равно: M(CX)=CX1P1+CX2P2+...+CXnPn+=C(X1P1+X2P2+...+XnPn)=CM(X) Итак M(CX)=CM(X), что и требовалось доказать. Свойство3. Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий M(XY)=M(X)M(Y). Доказательство. Пусть независимые случайные величины Х и У заданы своими законами распределения вероятностей Х x1 x2 Y y1 y2 P p1 p2 Q q1 q2 Напишем закон распределения ХУ, предполагая, что все возможные значения произведения различны ХY x1y1 x2y1 x1y2 P p1q1 x2y2 p2q1 p1q2 p2q2 Математическое ожидание равно сумме произведений всех возможных значений на их вероятности М(XY)=x1y1 p1q1+x2y1 p2q1+x1y2 p1q2+x2y2 p2q2= =y1q1 (x1p1+x2p2)+y2q2(x1p1+x2 p2)=(x1p1+x2 p2)(y1q1+y2p2)=M(X) M(Y) Итак М(XY)=M(X) M(Y), что и требовалось доказать. 4 Следствие. Математическое ожидание произведения нескольких взаимно- независимых случайных величин равно произведению их математических ожиданий. Например, для трех случайных величин, имеем М(XYZ)=M(X)· M(Y)· M(Z)=M(XY)· M(Z) Для произвольного числа случайных величин доказательство проводится методом математической индукции. Свойство 4. Математическое ожидание суммы двух случайных величин равна сумме математических ожиданий слагаемых М(Х+У)=М(Х)+М(У) Доказательство. Пусть случайные величины Х и У заданы следующими законами распределения Х x1 x2 Y y1 y2 P p1 p2 Q q1 q2 Составим все возможные значения величины Х+У, тогда будем (x1+y1), (x1+y2), (x2+y1), (x2+y1). Предположим для простоты, что эти возможные значения различны и обозначим их вероятности через p11 p12; p21 p22. Математическое ожидание суммы Х+У равно сумме произведений возможных значений на их вероятности М(X+Y)=(x1+y1)p11+(x1+y2) p12+(x2+y1)p21+(x2+y2)p22= =x1 (p11+p12)+x2(p21+p22)+y1(p11+ p21)+y2(p12+p22). Событие, состоящее в том, что Х примет значение Х1,влечет за собой событие, которое состоит в том, что Х+У примет значение Х1+У1 или Х1+У2 (вероятность этого события по теореме сложения равна p11+p12), и обратно. Отсюда и следует, что p11+p12=p1. Аналогично доказываются равенства p21+p22=p2; p11+p21=q1; p12+p22=q2. Подставляя эти значения в соотношение для М(X+Y) получим: М(X+Y)=(x1p1+x2р2)+(y1q1+y2q2)=М(X)+M(Y) что и требовалось доказать. Следствие. Математическое ожидание суммы нескольких случайных величин равно сумме математических ожиданий слагаемых. 5 Например. Для трех слагаемых величин, имеем М(X+Y+Z)=M[(X+Y)+Z]=M(X+Y)+M(Z)=M(X)+M(Y)+M(Z). Для произвольного числа слагаемых величин доказательство производится методом математической индукции. Дисперсия дискретной случайной величины Можно легко указать такие случайные величины, которые имеют одинаковые математические ожидания, но различные возможные значения. Таким образом, зная лишь математическое ожидание случайной величины еще нельзя судить ни о том, какие возможные значения она может принимать, ни о том, как они рассеяны вокруг математического ожидания. Другими словами, математическое ожидание полностью случайную величину не характеризует. По этой причине наряду с математическим ожиданием вводят и другие числовые характеристики. Так, например, чтобы оценить, как рассеяны возможные случайные величины вокруг ее математического ожидания, пользуются, в частности, числовой характеристикой, которую называют дисперсией. Пусть Х случайная величина и М(Х)- ее математическое ожидание отклонение. Рассмотрим разность [Х-М(Х)]. Тогда отклонением называют разность между случайной величиной и ее математическим ожиданием. Приведем важное свойство отклонения. Теорема. Математическое ожидание отклонения равно нулю М[X-M(X)]=0 Доказательство. Пользуясь свойствами математического ожидания и приняв во внимание, что М(х)- постоянная величина, имеем M[X-M(X)]=M(X)-M[M(X)]=M(X)-M(X)=0 Основной числовой характеристикой рассеяния случайной величины Х служит среднее квадратическое отклонение δ(Х( = М Х Определение. Дисперсией М(Х) (рассеянием) 2 дискретной случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания D(Х( = М Х - М(Х ) 6 2 По определению дисперсии имеем 2 2 D( Х)= М Х - М(Х ) = Х1 М(Х) р1 + Х 2 2 М(Х) р2 +...+ Х n 2 М(Х) рn Таким образом, чтобы вычислить дисперсию, достаточно вычислить сумму произведений возможных значений квадрата отклонения на их вероятности. Формула для вычисления дисперсии Теорема. Дисперсия равна разности между математическим ожиданием квадрата случайной величины Х и квадратом ее математического ожидания: D(Х(= М(Х 2 ) М(Х) 2 Доказательство: 2 D(Х( = М Х - М(ХХ = М Х 2 2 ХМ(Х)+ М 2 (ХХ= М(Х 2 ) 2М(ХХ)М(Х+ М 2 (ХХ= М(Х 2 ) 2М 2 (ХХ+ М 2 (ХХ= М(Х 2 ) М 2 (ХХ Тогда D(Х(= М(Х 2 ) М(Х) 2 Квадратная скобка введена для удобства запоминания Свойства дисперсии Свойство1. Дисперсия постоянной величины С равна нулю D(С)=0. Доказательство. По определению D(С( = М [С - М(С)]2 Пользуясь 1-м свойством математического ожидания получим: D(С( = М [( С - С )2 ] = М( 0 ) = 0 Тогда Д(С)=0. Свойство становится очевидным, если учесть, что постоянная величина сохраняет одно и тоже значение и рассеяние. Свойство 2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат D( СХ ) = С 2 D(Х( Доказательство. D( СХ ) = М( СХ )2 - М 2 ( СХ ) = М(С2 Х 2 ) 2 СМ(ХХ = С 2 М(Х 2 ) С 2 М 2 (ХХ= С 2 D(Х( Свойство 3. Дисперсия суммы двух независимых случайных величин Х и У равна сумме дисперсии этих величин D(Х +У) = D(Х(+ D(У( Доказательство. D(Х + У) = М(Х + У)2 - М 2 (Х + У) = М(Х 2 + 2ХУ + У 2 ) М(Х 2 ) + 2М(ХХ)М(У+ М(У 2 ) - М 2 (ХХ- 2М(ХХ)М(У- М 2 (УУ= М(Х 2 ) - М 2 (ХХ+ М(У 2 ) - М 2 (УУ= D(Х(+ D(У( 7 2 М(Х)+ М(У) = Следствие 1. Дисперсия суммы нескольких взаимно-независимых случайных величин равна сумме дисперсий. Например, для трех слагаемых имеем Д(Х+У+Z)=Д(Х)+Д(У)+Д(Z) Для произвольного числа слагаемых доказательство приводится методом математической индукции. Следствие 2. Дисперсия суммы постоянной величины и случайной равна дисперсии случайной величины Д(Х+С)=Д(Х) Доказательство. Величины С и Х независимы, поэтому по 3-му свойству Д(С+Х)=Д(С)+Д(Х), а в силу 1-го свойства Д(с)=0, тогда окончательно Д(С+Х)=Д(Х) Свойство понятно, если учесть, что величины Х и (Х+С) отличаются лишь началом отсчета и, значит, рассеяны вокруг своих математических ожиданий одинаково. Свойство 4. Дисперсия разности двух независимых случайных величин равна сумме дисперсий Д(Х-У)=Д(Х)+Д(У) Доказательство. В силу 3-го свойства Д(Х-У)=Д(Х)+Д(-У) По второму свойству Д(Х-У)=Д(Х)+(-1)2Д(У) или Д(Х-У)=Д(Х)+Д(У) Среднее квадратичное отклонение Для оценки рассеяния возможных значений случайной величины вокруг её среднего значения кроме дисперсии служат и некоторые другие характеристики. К их числу относится среднее квадратическое отклонение. Определение. Средним квадратическим отклонением случайной величины Х называют квадратный корень из дисперсии: ( x) = D( x) Дисперсия имеет размерность равную квадрату размерности случайной величины, а размерность среднего квадратического отклонения совпадает с размерностью случайной величины. Биномиальное распределение. Пусть производится n независимых испытаний в каждом из которых событие А может появиться или нет. Вероятность наступления события во всех испытаниях постоянна и равна р, следовательно q=1-p. Рассмотрим в качестве дискретной 8 случайной величины X число появлений события А в этих испытаниях. Поставим задачу: найти закон распределения величины X. Для её решения требуется определить возможные значения Х их вероятность. Вероятности возможных значений можно определить по формуле Бернулли: Pn (k)= Cnk pk qn k , (1) где k=0, 1, 2…, n. Формула (1) и является аналитическим выражением искомого закона распределения. Биномиальным называют распределение вероятностей, определяемое формулой Бернулли. Закон назван "биноминальным", потому что правую часть равенства (1) можно рассматривать как общий член разложения бинома Ньютона: (p + q)n = pn Cnn + Cnn 1 pn 1 qn + ...+ Cnk pk qn k + ...+ qn Cn0 . Таким образом, первый член разложения pn определяет вероятность наступления рассматриваемого события n раз в n называемых испытаниях, второй член определяет вероятность наступления события (n-1) раз, последний член определяет вероятность того, что событие не появится ни разу. Напишем биноминальный закон в виде таблицы: Х n n-1 P pn npn-1 - q … k 0 Cnk pk qn k qn Распределение Пуассона Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна p. Для определения вероятности к появлений события в этих испытаниях используют формулу Бернулли. Если n велико, то пользуются асимптотической формулой Лапласа. Однако эта формула непригодна, если, вероятность события мала (р≤0,1). В этих случаях (n велико, р мало) прибегают к асимптотической формуле Пуассона. Поставим задачу: Найти вероятность того, что событие наступит ровно к раз, если вероятность появления в каждом испытании мала. Сделаем допущение произведение np сохраняет постоянное значение, а именно np=λ. Это означает, что среднее число испытаний появлений события в различных 9 сериях испытаний, т.е. при различных значениях, остается неизменным. Воспользуемся формулой Бернулли для вычисления вероятности: Pn (K) = n(n 1 )(n 2 )... n (K 1 ) p K ( 1 p)n K! K так как pn=λ , то следовательно λ n n(n 1 )(n 2 )... n (K 1 ) Pn (K) = K! K λ 1 n n K Будет найдено лишь приближенное значение отыскиваемой вероятности, так как n хотя и велико, но конечно, а при отыскании предела n если pn=const , то при n n n 1 n 2 ... n k! вероятность p k 1 λk λ 1 k n n n k λ = 1 n Таким образом: λ n 1 n K = . Заметим, что 0 1 2 k 1 λ == 1 1 1 ... 1 1 n n n n n k = λK e K! λk e k! λ λ n k = 1 1 (2) Эта формула выражает закон распределения Пуассона вероятностей массовых (n велико) и редких (р мало) событий. Имеются специальные таблицы, пользуясь которыми можно найти pn(k), зная K и . Пример. Завод изготовил и отправил 4000 транзисторных приёмников. Вероятность того, что изделия в пути повредятся, равна 0,00025. Найти вероятность того, что потребителям придут 3 неисправных приёмника. Решения. По условию, n = 4000, Р= 0,00025, К=3 Найдем λ: λ =np=4000 0,000 25 = 1,0. По формуле Пуассона искомая вероятность приближенно равна: P4000 ( 3 ) = e λ λ K e 1 13 1 = = = 0.06. K! 3! 6 e Геометрическое распределение Пусть производятся независимые испытания, в каждом из которых 10 вероятность появления события А равна р ( 0 <p<1 ) и, следовательно, вероятность его не появления q= 1− p . Испытания заканчиваются, как только появится событие A. Таким образом, если событие А появилось в к-м испытании, то в предшествующих k-1 испытаниях оно не появлялось. Обозначим через Х дискретную случайную величину - число испытаний, которые нужно провести до первого появления события А. Очевидно, возможными значениями X являются натуральные числа х1=1, х2=2, х3=3, … Пусть в первых (k-1) испытаниях событие А не наступило, а в k-м испытании появилось. Вероятность этого события; по теореме умножения вероятностей независимых событий p(x=k)=q k-1p (3) Полагая k=I,2,... в формуле (3) получим геометрическую прогрессию с первым членом р и знаменателем q (c p, pq, pq2…qn-1p (4) По этой причине распределение (3) называют геометрическим. Легко убедиться, что ряд (4) сходится и сумма его равна единице. Действительно, сумма ряда есть Пример. Производится стрельба по цели, из орудия до первого попадания. Вероятность попадания в цель р=0,6. Найти вероятность того, что попадание произойдет при третьем выстреле. Решение. По условию р=0,6, q=0,4, k=3 Искомая вероятность по формуле (3) р(х=3)=q3-1p=0,42·0,6=0,096. Гипергеометрическое распределение. Рассмотрим задачу: Пусть в партии из N изделий имеется М стандартных (М N). Из партии отбирают случайно n изделий (каждое изделие может быть извлечено с одинаковой вероятностью), причем отобранное изделие перед отбором 11 следующего не возвращается в партию (поэтому Формула Бернулли здесь неприменима). Обозначим Х - случайную величину - число m стандартных изделий среди n - отобранных. Очевидно, возможные значения Х таковы 0,1,2,...., m ,n. Найдем вероятность того, что Х=m, т.е. среди n отобранных изделий ровно m стандартных. Используем для этого классическое определение вероятности. Общее чисто возможных исходов испытания равна числу способов, которыми можно извлечь n изделий из N изделий, т.е. числу сочетаний C Nп . Найдём число исходов, благоприятствующих событию: m стандартных m изделий можно извлечь из М стандартных изделий C M способами, при этом остальные (n-m) изделий должны быть нестандартными. Взять же (n-m) n− m нестандартных изделий из N-M нестандартных изделий можно C N − M способами. m n− m Следовательно, число благоприятствующих исходов равно C M C N − M Искомая вероятность равна отношению числа исходов благоприятствующих событию X=m, к числу всех элементарных исходов. CMm CNn p x= m = CNn m M (5) Эта формула определяет распределение вероятностей, которые называют: гипергеометрическим. Учитывая, что m случайная величина, можно сделать вывод, что гипергеометрическое распределение определяется тремя параметрами: N, M и n. Иногда в качестве параметров этого распределения рассматривают N, n и р=M/N, где р - вероятность того, что первое извлеченное изделие стандартное. Отметим, что если п значительно меньше N (если n ), то гипергеометрическое распределение даёт вероятности близкие к вероятностям, найденным по биномиальному закону. Вопросы для самопроверки: 1. Что такое случайные величины? 2. Какая случайная величина называется дискретной? 3. Какая случайная величина называется непрерывной? 4. Какие числовые характеристики дискретной случайной величины вы знаете? 5. Какие распределения дискретных случайных величин вы знаете? 12