Uploaded by klyuev.dm1t

Бидерман. Элементы теории вероятностей. Хаб., 2017

advertisement
В. И. Бидерман
ЭЛЕМЕНТЫ
ТЕОРИИ
ВЕРОЯТНОСТЕЙ
Хабаровск 2017
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«Тихоокеанский государственный университет»
В. И. Бидерман
Элементы
теории вероятностей
Утверждено издательско-библиотечным советом университета
в качестве учебного пособия
Хабаровск
Издательство ТОГУ
2017
УДК 519.21(07)
ББК 22.171
Б 597
Р е ц е н з е н т ы:
Кафедра «Высшая математика» ДВГУПС (завкафедрой
д-р физ.-мат. наук, доц. П. В. Виноградова);
Е. А. Мясников, канд. физ.-мат. наук, доц. кафедры М и ММЭ ХГАУиП.
Н а у ч н ы й р е д а к т о р канд. физ.-мат. наук, доц. В. Я. Прудников
Бидерман, В. И.
Б597 Элементы теории вероятностей : учебное пособие / В. И. Бидерман;
[науч. ред. В. Я. Прудников]. − Хабаровск : Изд-во Тихоокеан. гос.
ун-та, 2017. − 232 с.
ISBN 978-5-7389-2152-0
Пособие соответствует федеральному государственному образовательному
стандарту в области математики для технических специальностей и технических и экономических направлений бакалавриата и предназначено для студентов университета дневной, заочной и дистанционной форм обучения.
Рассматриваются классические разделы теории вероятностей. Пособие содержит большое количество задач, иллюстрирующих изучаемые темы.
УДК 519.21(07)
ББК 22.171
c Бидерман В. И., 2017
ISBN 978-5-7389-2152-0
c Тихоокеанский государственный
университет, 2017
Оглавление
Предисловие . . . . . . . . . . . . . . . . . . .
1 Элементы комбинаторики
1.1 Операции над множествами . . . . . . . .
1.2 Правило суммы . . . . . . . . . . . . . . .
1.3 Правило произведения . . . . . . . . . . .
1.4 Понятие факториала . . . . . . . . . . . .
1.5 Перестановки . . . . . . . . . . . . . . . .
1.6 Размещения без повторения . . . . . . . .
1.7 Перестановки с повторениями двух типов
1.8 Сочетания без повторения . . . . . . . . .
1.9 Размещения с повторением . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Введение в теорию вероятностей
2.1 Понятие события. Классификация событий . .
2.2 Классическое определение вероятности . . . .
2.3 Статистистическое определение вероятности .
2.4 Геометрическое определение вероятности . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
.
.
.
.
.
.
.
.
.
5
5
8
9
11
12
12
13
14
15
.
.
.
.
18
18
20
26
28
3 Алгебра событий
3.1 Сложение вероятностей событий . . . . . . . . . . . . . . . .
3.2 Умножение вероятностей событий . . . . . . . . . . . . . . .
3.3 Примеры применения алгебры событий . . . . . . . . . . . .
3.3.1 Связь между вероятностями противоположных событий
3.3.2 Вероятность работы схем теории надёжности . . . . .
3.4 Формула полной вероятности . . . . . . . . . . . . . . . . . .
3.5 Формула Байеса . . . . . . . . . . . . . . . . . . . . . . . . .
34
34
37
41
41
44
46
50
4 Схема Бернулли
4.1 Формула Бернулли . . . . . . . . . . . . . . . . . . . . . .
4.2 Формула Пуассона . . . . . . . . . . . . . . . . . . . . . .
4.3 Локальная и интегральная теоремы Лапласа . . . . . . .
4.4 Вероятность отклонения относительной частоты события
от постоянной вероятности в независимых испытаниях .
4.5 Наивероятнейшее число наступлений события
в схеме независимых испытаний . . . . . . . . . . . . . .
. .
. .
. .
54
54
56
60
. .
65
. .
67
3
5 Дискретные случайные величины
5.1 Понятие случайной величины . . . . . . . . . . . . . . . . . .
5.2 Закон распределения дискретной случайной величины . . .
5.2.1 Определение закона распределения дискретной случайной величины . . . . . . . . . . . . . . . . . . . . .
5.2.2 Табличное задание закона распределения . . . . . . .
5.2.3 Графическое задание закона распределения . . . . . .
5.3 Функция распределения дискретной случайной величины
и её свойства . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Определение функции распределения дискретной
случайной величины . . . . . . . . . . . . . . . . . . .
5.3.2 Свойства функции распределения . . . . . . . . . . .
5.4 Числовые характеристики дискретной случайной величины
5.4.1 Математическое ожидание распределения дискретной
случайной величины . . . . . . . . . . . . . . . . . . .
5.4.2 Вероятностный смысл математического ожидания . .
5.4.3 Понятие индикатора события . . . . . . . . . . . . . .
5.4.4 Свойства математического ожидания . . . . . . . . .
5.4.5 Мода дискретной случайной величины . . . . . . . . .
5.4.6 Дисперсия дискретной случайной величины . . . . . .
5.4.7 Свойства дисперсии . . . . . . . . . . . . . . . . . . .
5.4.8 Среднее квадратическое отклонение . . . . . . . . . .
5.5 Одинаково распределённые независимые случайные
величины . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.6 Примеры распределений дискретных случайных величин . .
5.6.1 Биномиальное распределение вероятностей . . . . . .
5.6.2 Распределение Пуассона . . . . . . . . . . . . . . . . .
6 Непрерывные случайные величины
6.1 Определение непрерывной случайной величины . . . . . . .
6.2 Плотность распределения вероятностей непрерывной
случайной величины и её свойства . . . . . . . . . . . . . . .
6.3 Числовые характеристики непрерывной случайной
величины . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.1 Математическое ожидание непрерывной случайной величины . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2 Дисперсия непрерывной случайной величины . . . . .
6.4 Равномерное распределение . . . . . . . . . . . . . . . . . . .
6.4.1 Определение и график функции плотности
равномерного распределения . . . . . . . . . . . . . .
4
70
70
71
71
72
77
78
78
82
83
83
87
88
89
91
93
97
98
102
103
103
108
112
112
115
119
119
123
126
126
6.4.2
6.4.3
6.4.4
6.4.5
Интегральная функция равномерного распределения 126
Математическое ожидание равномерного распределения127
Дисперсия равномерного распределения . . . . . . . . 127
Среднее квадратическое отклонение равномерного распределения . . . . . . . . . . . . . . . . . . . . . . . . 128
6.5 Нормальное распределение . . . . . . . . . . . . . . . . . . . 130
6.5.1 Определение и график функции плотности
нормального распределения . . . . . . . . . . . . . . . 130
6.5.2 Нормированное нормальное распределение . . . . . . 133
6.5.3 Интегральная функция нормального распределения . 134
6.5.4 Математическое ожидание нормального распределения 137
6.5.5 Дисперсия нормального распределения . . . . . . . . 137
6.5.6 Среднее квадратическое отклонение нормального
распределения . . . . . . . . . . . . . . . . . . . . . . 138
6.5.7 Вероятность попадания нормально распределённой
случайной величины в заданный интервал . . . . . . 139
6.5.8 Вероятность отклонения нормально распределённой
случайной величины от её центра рассеивания . . . . 140
6.5.9 Правило трёх сигм . . . . . . . . . . . . . . . . . . . . 141
6.5.10 Примеры решения задач, связанных с нормальным
распределением . . . . . . . . . . . . . . . . . . . . . . 142
6.5.11 О роли нормального закона в теории вероятностей и
её приложениях . . . . . . . . . . . . . . . . . . . . . . 147
6.6 Показательное распределение . . . . . . . . . . . . . . . . . . 149
6.6.1 Определение и график функции плотности
показательного распределения . . . . . . . . . . . . . 149
6.6.2 Интегральная функция показательного распределения 149
6.6.3 Математическое ожидание показательного распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.6.4 Медиана показательного распределения . . . . . . . . 152
6.6.5 Дисперсия показательного распределения . . . . . . . 153
6.6.6 Среднее квадратическое отклонение показательного распределения . . . . . . . . . . . . . . . . . . . . . . . . 154
6.6.7 Вероятность попадания показательно распределённой
случайной величины в заданный интервал . . . . . . 154
6.6.8 Понятие о роли показательного распределения в теории надёжности . . . . . . . . . . . . . . . . . . . . . . 155
6.7 Понятие о моментах . . . . . . . . . . . . . . . . . . . . . . . 160
5
7 Закон больших чисел
7.1 Неравенство Маркова . . . . . . .
7.2 Неравенство Бьенеме − Чебышёва
7.3 Теорема Чебышёва . . . . . . . . .
7.4 Теорема Бернулли . . . . . . . . .
7.5 Сходимость по вероятности . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
170
170
172
175
179
181
8 Двумерные случайные величины
8.1 Понятие двумерной случайной величины . . . . . . . . . . .
8.2 Дискретные двумерные случайные величины . . . . . . . . .
8.2.1 Закон распределения дискретной двумерной случайной величины . . . . . . . . . . . . . . . . . . . . . . .
8.2.2 Функция распределения дискретной двумерной случайной величины . . . . . . . . . . . . . . . . . . . . .
8.3 Понятие независимости случайных величин . . . . . . . . . .
8.4 Условное распределение вероятностей . . . . . . . . . . . . .
8.5 Условное математическое ожидание . . . . . . . . . . . . . .
8.6 Функции, уравнения и линии регрессии . . . . . . . . . . . .
8.7 Общая характеристика зависимости случайных величин . .
8.8 Вывод уравнения линейной регрессии . . . . . . . . . . . . .
8.9 Свойства ковариации . . . . . . . . . . . . . . . . . . . . . .
8.10 Свойства коэффициента корреляции . . . . . . . . . . . . . .
8.11 Понятие корреляции случайных событий . . . . . . . . . . .
183
183
184
Заключение . . . . . . . . . . . . . . . . . . .
222
184
188
195
199
203
204
208
210
213
216
220
Библиографический список . . . . . . . . . . . . 223
Приложение 1 . . . . . . . . . . . . . . . . . . 225
Приложение 2 . . . . . . . . . . . . . . . . . . 226
Предметный указатель . . . . . . . . . . . . . 227
6
Предисловие
В условиях, когда при переходе на бакалавриат резко уменьшается количество аудиторных часов как лекционных, так и практических, а содержание курса математики при этом меняется незначительно, становится невозможным традиционное чтение лекций, при котором только при помощи
мела и тряпки или их современных заменителей: фломастера и губки −
можно довести до слушателя это самое содержание.
Если к исчезновению аудиторных часов ещё добавить проблемы школьной математики, выпавшие на долю практически каждого из решивших
стать бакалаврами или специалистами, то остаётся только надеяться, что
данное пособие в виде курса лекций совместно со временем, проведённым
студентом на лекциях и практических занятиях в учебных аудиториях,
поможет ему не только выполнить тот объём самостоятельной работы, который свалится на его голову, но и поможет ему найти дорогу от школьной
математики к математике высшей.
Настоящее пособие предназначено для студентов технических специальностей и технических, а также экономических направлений бакалавриата.
Пособие посвящено классическим темам теории вероятностей: алгебре
событий и случайным величинам. В качестве введения включены элементы комбинаторики, необходимой для изучения алгебры событий. Пособие
состоит из восьми глав, в которых рассматриваются вопросы теории и большое количество задач, иллюстрирующих эту теорию.
Причиной написания данного пособия, помимо вышеуказанных, является попытка за счёт использования логических конструкций и большего
внимания к деталям сделать решение задач теории вероятности доступным
не только студентам-отличникам, но и всем тем, кто в силу лаконичности
изложения не может разобраться в классической литературе по теории вероятностей.
При написании пособия автор пользовался классическими учебниками теории вероятностей и литературой по истории теории вероятностей.
Информацию об этих источниках можно найти как в библиографическом
списке, так и в сносках в конце страниц.
Как любое учебное пособие, это пособие имеет свои достоинства и свои
недостатки. Но автор надеется, что достоинства окажут большее влияние,
чем недостатки, и среди читателей найдутся те, для кого чтение предлагаемого пособия станет первым, но не последним шагом в мир теории вероятностей. И, в конечном итоге, они смогут читать классическую литературу по теории вероятностей, обратив своё внимание на библиографический
список литературы, который поможет им найти дорогу в этот мир.
7
Элементы комбинаторики
1
На зачёте по комбинаторике.
Сколькими способами могут зайти в аудиторию
пять студентов?
Ответ студента: Существует пять способов: через
дверь, окно, подкоп, люк в потолке и пролом стены.
Из математического фольклора1
Комбинаторикой называется раздел математики, изучающий соединения между элементами конечных множеств с количественной точки зрения.
Название комбинаторика происходит от латинского слова combina, что
в переводе на русский означает − сочетать, соединять.
В математику его ввёл В. Лейбниц2 , опубликовав в 1666 году «Рассуждения о комбинаторном искусстве».
Знание комбинаторики необходимо там, где приходится иметь дело с
конечными множествами. Так, в частности, в задачах теории вероятности
и математической статистики, которые в курсе математики являются следующим объектом изучения, предполагается умение решать задачи комбинаторики.
В дальнейшем нам понадобятся следующие
1.1
Операции над множествами
Определение 1.1. Объединением элементов двух множеств A и
B называется множество всех элементов этих множеств, каждый из
которых является элементом A или элементом B, или принадлежит и
тому, и другому множеству одновременно.
Обозначается объединение множеств следующим образом:
A ∪ B = {x : x ∈ A или x ∈ B или x ∈ A и B}.
Если множество A является кругом, а множество B квадратом, то графически объединение множеств A ∪ B можно изобразить (рис. 1.1) так:
1
Правильный ответ можно найти на странице 12.
См. Гнеденко Б. В. Курс теории вероятностей. М. : Наука, 1988. С. 85.
Лейбниц Готфрид Вильгельм (нем. Gottfried Wilhelm von Leibniz, 1646 - 1716) − немецкий
философ, логик, математик, механик, физик, юрист, историк, дипломат, изобретатель и языковед.
Наряду с И. Ньютоном основоположник математического анализа. Создатель комбинаторики как
науки, заложил основы математической логики. (См. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRL\T2A\cyre\T2A\cyrishrt\T2A\cyrb\T2A\cyrn\T2A\cyri\
T2A\cyrc,_\T2A\CYRG\T2A\cyro\T2A\cyrt\T2A\cyrf\T2A\cyrr\T2A\cyri\T2A\cyrd_\T2A\CYRV\T2A\
cyri\T2A\cyrl\T2A\cyrsftsn\T2A\cyrg\T2A\cyre\T2A\cyrl\T2A\cyrsftsn\T2A\cyrm (дата обращения: 12.06.2016)).
2
8
A
A∪B
B
Рис. 1.1
Например, если множество A состоит из тех, кто знает английский язык,
а множество B − из тех, кто знает немецкий язык, то объединение A ∪ B
включает как тех, кто знает только английский или только немецкий, так
и тех, кто знает оба эти языка.
Определение 1.2. Объединение элементов множеств A и B, не имеющих общих элементов, называется суммой множеств и обозначается
A + B = {x : x ∈ A или x ∈ B}.
A
A+B
B
Рис. 1.2
На рис. 1.2 в виде круга A и квадрата B показано объединение множеств,
не имеющих общих элементов.
Так, если элементами множества A являются знающие только английский язык, а элементами множества B − знающие только немецкий, то
суммой множеств A + B является множество знающих только один иностранный язык.
Определение 1.3. Пересечением множеств элементов A и B называется множество всех общих элементов этих множеств.
A ∩ B = {x : x ∈ A и x ∈ B}.
Если множество A является кругом, а множество B − квадратом, то
пересечение этих множеств изображено на рис. 1.3 в виде незакрашенного
множества клеток внутри множества, окрашенного в серый цвет.
В приведённом примере со знанием языков пересечением множеств является множество людей, знающих одновременно английский и немецкий
языки.
9
A
A∩B
B
Рис. 1.3
Определение 1.4. Произведением множеств элементов A и B
называется множество всех пар элементов (a; b), в которых a ∈ A, b ∈
B, то есть
AB = {(a; b) : a ∈ A, b ∈ B}.
Если, например, элементами множества A являются знающие только
английский язык, а элементами множества B − знающие только немецкий, то можно образовать произведение множеств AB как множество пар,
в каждой из которых один знает только английский, а другой − только
немецкий.
Определение 1.5. Разностью множеств элементов A и B называется множество тех элементов множества A, которые не являются
элементами множества B, то есть
A \ B = {a : a ∈ A, a ∈
/ B}.
Пусть множество A (рис. 1.4) есть серый круг, а множество B − белый
квадрат, тогда разность множеств A \ B выглядит как три четверти серого
круга.
A
A\B
B
Рис. 1.4
В примере с языками разность множеств представляет множество знающих английский язык, но не знающих немецкий.
Предположим, что Ω − представляет универсальное множество всех
изучаемых элементов, а ∅ − пустое множество, то есть множество не
содержащее ни одного элемента. С помощью этих множеств можно дать
следующее
Определение 1.6. Дополнением множества A (до универсального
множества Ω) называется множество всех элементов универсального
10
множества, которые не принадлежат множеству A, то есть
Ā = {x : x ∈ Ω, x ∈
/ A}.
Например, в ситуации с языками Ā − множество людей, незнающих
английский, а B̄ − множество людей, незнающих немецкий.
Сформулируем несколько следствий из приведённых определений.
Следствие 1.1. A + B = (A ∪ B) \ (A ∩ B).
Следствие 1.2. A + Ā = Ω; A ∩ Ā = ∅.
Следствие 1.3. A \ B = A ∩ B̄.
Замечание 1.1. В дальнейшем нам понадобятся такие неопределяемые
понятия как опыт или эксперимент.
Под опытом или экспериментом будем понимать некоторую воспроизводимую совокупность физических условий, на фоне которых наступает изучаемое явление, фиксируется тот или иной результат.
Опыт или эксперимент представляют некоторое универсальное множество Ω, элементами которого являются исходы опыта ω (или исходы эксперимента ω). При этом исходы будут делиться на благоприятные исходы
и неблагоприятные исходы. Благоприятные исходы будут образовывать
изучаемые события, которые будут обозначаться прописными буквами латинского алфавита: A, B, C, . . . Таким образом, событие A можно определить как подмножество исходов ω некоторого опыта Ω, то есть
A = {ω} ⊆ Ω.
С помощью данных определений и следствий обратимся к изучению
комбинаторики, в основе которой лежат два правила − правило суммы и
правило произведения.
1.2
Правило суммы
Теорема 1.1. Правило суммы. Если элементы множества A можно
выбрать m способами, а элементы другого множества B можно выбрать n способами, то элементы множества «A или B», то есть суммы
множеств A + B, можно выбрать m + n способами.
Данное утверждение настолько очевидно, что не нуждается в доказательстве.
Задача 1.1. На столе лежат две коробки с карандашами. В первой
коробке лежат 5 карандашей, а во второй коробке − 4 карандаша. Сколько
существует способов взять один карандаш со стола?
Решение. Событие A − со стола взят один карандаш может произойти
с помощью одного из двух событий:
11
1) событие A1 − из первой коробки взят один карандаш;
2) событие A2 − из второй коробки взят один карандаш.
Так как невозможно взять один карандаш одновременно из двух коробок, то событие со стола взят один карандаш эквивалентно тому, что из
первой коробки взят один карандаш ИЛИ из второй коробки взят один
карандаш. Формально это можно записать так:
A = A1 + A2 .
Так как событие из первой коробки взят один карандаш можно выполнить n1 = 5 способами, а событие из второй коробки взят один карандаш
− n2 = 4 способами, то согласно правилу суммы 1.1 событие со стола взят
один карандаш можно выполнить
NA = n1 + n2
способами. Поэтому NA = 5 + 4 = 9.
Итак, один карандаш со стола можно взять 9 способами .
1.3
Правило произведения
Теорема 1.2. Правило произведения. Если элементы множества A
можно выбрать m способами и если после такого выбора элементы множества B можно выбрать n способами, то элементы произведения множеств AB можно выбрать m · n способами.
Д о к а з а т е л ь с т в о. Так как произведение множеств по
определению (1.4) есть множество пар, то для каждого первого элемента
пары, выбранного с помощью m способов, можно подобрать второй элемент
n способами, поэтому множество пар будет содержать m · n элементов.
Задача 1.2. На столе лежат две коробки с карандашами. В первой
коробке лежат 5 синих карандашей, а во второй коробке − 4 красных
карандаша. Сколько существует способов взять два разноцветных карандаша со стола?
Решение. Событие B − со стола взяты два разноцветных карандаша
может произойти с помощью одного из двух событий:
1) событие B1 − из первой коробки взят один синий карандаш;
2) событие B2 − из второй коробки взят один красный карандаш.
Событие со стола взяты два разноцветных карандаша эквивалентно тому, что из первой коробки взят один синий карандаш И из второй коробки
взят один красный карандаш. То есть, фактически образуется множество
пар (c; к). Формально это можно записать так:
B = B1 B2 .
12
Так как событие из первой коробки взят один синий карандаш можно
выполнить n1 = 5 способами, а событие из второй коробки взят один
красный карандаш − n2 = 4 способами, то согласно правилу произведения
1.2 событие со стола взяты два разноцветных карандаша можно выполнить
NB = n1 · n2
способами. Поэтому NB = 5 · 4 = 20. Таким образом,
два разноцветных карандаша со стола можно взять 20 способами .
Замечание 1.2. О знании языка при решении задач комбинаторики. Объединяя правила суммы и произведения, можно сформулировать
общее правило, опирающееся на конструкции языка, связанные с использованием союзов «и» и «или».
Если предложение о некотором событии можно переформулировать
с помощью союзов «и» и «или», связывающих соответствующие микрособытия, то общее число исходов изучаемого события равно линейной
комбинации числа исходов полученных микрособытий. При этом в составленной линейной комбинации числа исходов союзам «и» соответствует умножение, а союзам «или» − сложение.
Задача 1.3. В магазине лежат 5 книг автора A, 4 книги автора B и 3
книги автора C. Кроме этого, 6 сборников (BC) состоят из произведений
авторов B и C, и 4 сборника (AC) содержат произведения авторов A и
B. Сколько существует вариантов купить по одному произведению всех
трёх авторов?
Решение. Введём обозначения событий, связанных с условием задачи.
Событие D − купить по одному произведению всех трёх авторов;
Событие A − купить одно произведение автора A;
Событие B − купить одно произведение автора B;
Событие C − купить одно произведение автора C;
Событие AC − купить сборник AC;
Событие BC − купить сборник BC.
Рассмотрим подробное текстовое решение задачи:
Купить по одному произведению всех трёх авторов это эквивалентно тому, что: купить одно произведение автора A и купить одно произведение
автора B и купить одно произведение автора C или купить одно произведение автора A и купить сборник BC или купить одно произведение
автора B и купить сборник AC.
Перепишем это решение в символьном виде:
D=A и B и C или A и BC или B и AC.
13
Далее воспользуемся замечанием 1.2, сопоставив каждому событию число его исходов:
ND = nA · nB · nC + nA · nBC + nB · nAC .
Теперь остаётся подставить численные значения соответствующих исходов:
ND = 5 · 4 · 3 + 5 · 6 + 4 · 4 ⇒ ND = 106.
Выходит, что существует
106 вариантов купить по одному произведению всех трёх авторов .
В дальнейшем нам понадобится одно техническое понятие из мира вычислений целых неотрицательных чисел.
1.4
Понятие факториала
Определение 1.7. Факториалом1 натурального числа n называется произведение всех натуральных чисел от единицы до n включительно.
То есть,
n! = 1 · 2 · 3 · . . . (n − 1) · n.
(Читается: «эн факториал»). По определению полагают, что 0! = 1.
Так, например, 3! = 1 · 2 · 3, то есть 3! = 6, а 5! = 1 · 2 · 3 · 4 · 5 ⇒ 5! = 120.
Можно заметить, что, зная то, что 3! = 6, 5! можно вычислить проще:
5! = 3! · 4 · 5, что позволяет значительно уменьшить объём вычислений.
4!
Задача 1.4. Сократите дробь .
7!
4!
4!
1
Решение. Так как 7! = 4! · 5 · 6 · 7, то
=
=
.
7! 4! · 5 · 6 · 7 210
4!
1
Следовательно,
=
.
7! 210
Правила суммы и произведения являются общими правилами решения
задач комбинаторики. С их помощью можно решать самые различные задачи. Но существует целый ряд задач, которые встречаются настолько часто, что есть смысл свести их решение к формулам2 .
1
Факториал (от фр. factor − множитель, производного от лат. factor − производящий) Символ
факториала в 1808 году ввёл в математику К. Крамп (см. Глейзер Г. И. История математики в школе:
IX-X кл. Пособие для учителей М. : Просвещение, 1983. С. 214).
Крамп Кристиан (Кретьен) (фр. Christian Kramp, 1760-1826) − французский математик. Автор работ по теории чисел, геометрии, математической кристаллографии, алгебре и механике. (см. Википедия
[Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRK\T2A\cyrr\T2A\cyra\T2A\
cyrm\T2A\cyrp,_\T2A\CYRK\T2A\cyrr\T2A\cyri\T2A\cyrs\T2A\cyrt\T2A\cyri\T2A\cyra\T2A\cyrn
(дата обращения: 12.06.2016)).
2
У формул, правда, тоже есть серьёзная проблема: их надо знать и помнить. Поэтому наряду с ними
там, где есть смысл, будет рассматриваться и второй вариант решения, опирающийся на замечание
1.2.
14
1.5
Перестановки
Определение 1.8. Перестановками1 во множестве из n элементов называются комбинации между всеми элементами множества,
отличающиеся друг от друга порядком входящих в них элементов.
Перестановки обозначаются символом Pn . Также обозначается и число
перестановок, для которого справедлива
Теорема 1.3. ∀ n Pn = n!
Д о к а з а т е л ь с т в о. Представим коробку, содержащую
n горизонтальных ячеек. Заполнив её разноцветными шариками, можно
получить пример перестановки во множестве из n разноцветных шариков.
Рассмотрим процесс построения перестановки (или заполнения коробки).
Заполнить коробку − это совершить такое событие A, которое состоит
из следующих событий:
A1 : положить в коробку первый шарик. Число способов nA1 = n; и
A2 : положить в коробку второй шарик. Число способов nA2 = n − 1; и
A3 : положить в коробку третий шарик. Число способов nA3 = n − 2; и
........................................................................и
An−1 : положить в коробку предпоследний шарик. Число способов nAn−1 = 2;
и
An : положить в коробку последний шарик. Число способов nAn = 1.
Таким образом, A = A1 и A2 и A3 и . . . An−1 и An .
Согласно принципу произведения 1.2
Pn = NA = n · (n − 1) · (n − 2) · . . . 2 · 1 ⇒ Pn = n!
Замечание 1.3. С помощью этой теоремы можно интерпретировать,
почему 0! = 1: Множество, состоящее из нулевого числа элементов, есть
пустое множество ∅. А оно является упорядоченным единственным образом.
Перестановки являются частным случаем следующего типа комбинаций.
1.6
Размещения без повторения
Определение 1.9. Размещениями без повторения2 называются
комбинации выбора k различных элементов во множестве из n элемен1
Перестановки (от лат. permutatio) ввёл в 1656 году в «Теории и практике арифметики»
(Arithmeticae theoria et praxis) А. Таке.
Таке Андре (Tacquet, Andrе, 1612-1660) − фламандский математик. 10 его произведений выдержали с 1654 по 2014 год 330 переизданий, его имя присвоено одному из лунных кратеров (см.
История математики с древнейших времен до начала XIX столетия : В 3 т. Т. 2 / Под ред. А.
П. Юшкевича. М. : Наука, 1970. С. 83, а также Википедия [Электронный ресурс] : URL : http:
//www.worldcat.org/identities/lccn-n86-864683/ (дата обращения: 12.06.2016)).
2
Размещения без повторения впервые рассмотрел в арифметике на иврите в 1321 году Леви бен
Гершом, а затем в 1705 году Яков Бернулли в его работе «Искусство предположений» (лат. Ars
15
тов, отличающиеся друг от друга по составу и порядку входящих в них
элементов. Размещения без повторения обозначаются символом Akn . Также
обозначается и их число, для которого справедлива
n!
Теорема 1.4. Akn =
(n − k)!
Д о к а з а т е л ь с т в о. Доказательство этой теоремы полностью
повторяет процесс доказательства теоремы 1.3, отличие состоит только в
том, что в коробочку надо положить не n шаров, а k шаров. Поэтому
Akn = NA = n · (n − 1) · (n − 2) · . . . (n − (k − 1)).
А так как
n! = n · (n − 1) · (n − 2) · . . . (n − k + 1)(n − k) · (n − k − 1) · . . . 2 · 1, то
n!
n!
. Поэтому Akn =
.
n · (n − 1) · (n − 2) · . . . (n − k + 1) =
(n − k)!
(n − k)!
n!
n!
Следствие 1.4. Pn = Ann =
=
= n!
(n − n)!
0!
В предыдущих случаях перестановки касались различных элементов.
Но так бывает не всегда.
1.7
Перестановки с повторениями двух типов
Теорема 1.5. Если во множестве из n элементов существуют две группы одинаковых элементов, содержащие соответственно n1 и n2 элементов, то число перестановок в этом множестве
P (n1 , n2 ) =
n!
n1 !n2 !
(n = n1 + n2 ).
Д о к а з а т е л ь с т в о. Число элементов в каждой перестановке
равно n = n1 + n2 . Если бы все элементы во множестве были бы различными, то число перестановок Pn = n! Но из-за того, что некоторые элементы
совпадают, получится меньшее число перестановок. Так, в первой из групп
существует n1 ! перестановок, но так как они все одинаковые, то они ничего
conjectandi), опубликованной после его смерти в 1713 году (см. Гнеденко Б.В. Курс теории... С. 85.).
Леви бен Гершом (лат. Gersonides, 1288-1344) − средневековый еврейский учёныйуниверсал: философ, математик, астроном. (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRL\T2A\cyre\T2A\cyrv\T2A\cyri_\T2A\cyrb\T2A\
cyre\T2A\cyrn_\T2A\CYRG\T2A\cyre\T2A\cyrr\T2A\cyrsh\T2A\cyro\T2A\cyrm
(дата
обращения:
12.06.2016)).
Бернулли Якоб (нем. Jakob Bernoulli, 1655-1705) − швейцарский математик. Один из основателей теории вероятностей, математического анализа и вариационного исчисления. Иностранный
член Парижской и Берлинской академий наук (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRI\T2A\cyrs\T2A\cyrt\T2A\cyro\T2A\cyrr\T2A\cyri\T2A\
cyrya_\T2A\cyrt\T2A\cyre\T2A\cyro\T2A\cyrr\T2A\cyri\T2A\cyri_\T2A\cyrv\T2A\cyre\T2A\cyrr\
T2A\cyro\T2A\cyrya\T2A\cyrt\T2A\cyrn\T2A\cyro\T2A\cyrs\T2A\cyrt\T2A\cyre\T2A\cyrishrt
(дата обращения: 12.06.2016)).
16
не меняют. Точно также ничего не меняют и n2 ! перестановок во второй
группе.
Так как перестановки в первой и второй группе не зависят друг от друга,
то по правилу произведения 1.2 элементы этих групп можно переставить
n1 !n2 ! способами, при этом перестановка останется неизменной. Следовательно, число различных перестановок с повторениями, которые можно
выполнить с элементами данного множества при условии, что n = n1 + n2 ,
n!
P (n1 , n2 ) =
n1 !n2 !
Помимо множеств, состоящих из различных элементов, интерес представляют и множества, состоящие из одинаковых элементов, в которых
порядок расположения элементов в комбинациях роли не играет.
1.8
Сочетания без повторения
Определение 1.10. Сочетаниями1 без повторения называются комбинации выбора k одинаковых элементов во множестве из n элементов,
отличающиеся друг от друга только по составу входящих в них элементов.
Сочетания без повторения обозначаются символом Cnk . Также обозначается и число сочетаний, для которого справедлива
n!
Теорема 1.6. Cnk =
n!(n − k)!
1
Впервые сочетания определил Тарталья. Масссовое применение сочетания получили после того
m
как
в1654 году Б. Паскаль, а затем в 1806 году Л. Эйлер ввели обозначения Cn (от фр. combinasion)
n
и
соответственно (см. Гнеденко Б. В. Курс теории... С. 83).
k
Тарталья Никколо Фонтана (итал. Tartaglia Niccolо Fontana , 1499-1557) − итальянский математик
(см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRT\T2A\cyra\
T2A\cyrr\T2A\cyrt\T2A\cyra\T2A\cyrl\T2A\cyrsftsn\T2A\cyrya,_\T2A\CYRN\T2A\cyri\T2A\cyrk\
T2A\cyrk\T2A\cyro\T2A\cyrl\T2A\cyro (дата обращения: 12.06.2016)).
Паскаль Блез (фр. Pascal Blaise, 1623-1662) − французский математик, механик, физик,
литератор и философ. Классик французской литературы, один из основателей математического анализа, теории вероятностей и проективной геометрии, создатель первых образцов счётной
техники, автор основного закона гидростатики. (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRP\T2A\cyra\T2A\cyrs\T2A\cyrk\T2A\cyra\T2A\cyrl\T2A\
cyrsftsn,_\T2A\CYRB\T2A\cyrl\T2A\cyre\T2A\cyrz (дата обращения: 12.06.2016)).
Эйлер Леонард (нем. Euler Leonhard, 1707-1783) − швейцарский, немецкий и российский математик и механик, внёсший фундаментальный вклад в развитие этих наук (а также физики, астрономии
и ряда прикладных наук). Автор более чем 850 работ по математическому анализу, дифференциальной геометрии, теории чисел, приближённым вычислениям, небесной механике, математической
физике, оптике, баллистике, кораблестроению, теории музыки и другим областям. Он глубоко изучал
медицину, химию, ботанику, воздухоплавание, теорию музыки, множество европейских и древних
языков. Академик Петербургской, Берлинской, Туринской, Лиссабонской и Базельской академий
наук, иностранный член Парижской академии наук (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYREREV\T2A\cyrishrt\T2A\cyrl\T2A\cyre\T2A\cyrr,_\T2A\
CYRL\T2A\cyre\T2A\cyro\T2A\cyrn\T2A\cyra\T2A\cyrr\T2A\cyrd (дата обращения: 12.06.2016)).
17
Д о к а з а т е л ь с т в о. Выбирая k одинаковых элементов во
множестве из n элементов, можно заметить, что одновременно происходит
процесс «невыбора» других n − k элементов, которые также можно считать одинаковыми. Поэтому множество из n элементов разбивается на две
группы одинаковых элементов, состоящие из n1 = n и n2 = n−k элементов.
Следовательно, число сочетаний выбора k элементов из n без повторения совпадает с числом перестановок во множестве из двух типов элементов. А значит их число
n!
n!
=
Cnk = P (n1 , n2 ) =
n1 !n2 ! n!(n − k)!
Что и требовалось доказать.
Замечание 1.4. Заметим, что данную формулу можно доказать и
другим способом. Для этого выберем сначала все группы, содержащие k
элементов, не учитывая порядок входящих в них элементов. Таких групп
наберётся Cnk . Затем в каждой такой группе рассмотрим всевозможные перестановки. Общее число перестановок в каждой группе составляет Pk = k!
Тогда общее число комбинаций выбора и упорядочения равно произведению Cnk Pk . Которое по определению совпадает с числом размещения k элементов без повторения во множестве из n элементов. Поэтому Akn = Cnk Pk ,
Akn
n!
k
а значит Cn =
. То есть, Cnk =
.
Pk
n!(n − k)!
Приведём без доказательства некоторые свойства сочетаний.
Свойство 1.1. Cnk = Cnn−k .
Свойство 1.2. Cn0 = Cnn = 1.
Свойство 1.3. Cn1 = Cnn−1 .
В ряде задач важную роль играют
1.9
Размещения с повторением
Определение 1.11. Размещениями с повторением называются комбинации выбора k элементов во множестве элементов из n видов, отличающиеся друг от друга по составу и порядку входящих в них элементов.
Размещения с повторением обозначаются символом Ākn . Для них справедлива следующая теорема.
Теорема 1.7. Ākn = nk .
Д о к а з а т е л ь с т в о. Доказательство теоремы полностью повторяет доказательство теоремы 1.3 о перестановках. Отличие заключается
только в том, что каждый выбор совершается из n элементов множества,
18
поскольку допускает повторения. Поэтому выбирая первый элемент, И второй элемент, И третий элемент, И . . . , И k-й элемент, согласно принципу
произведения мы умножаем n
· · · · n}, что согласно известному из сред| · n{z
k
ней школы правилу сокращённого умножения приводит к возведению n в
степень с показателем k.
Задача 1.5. Номер телефона состоит из 11 цифр. Человек забыл три
последние цифры. Сколько неудачных попыток он может совершить, набирая нужный номер?
Решение. Каждая цифра номера определяет отдельный вид. Общее их
число n = 10. Длина комбинации, то есть нужного «слова» k = 3. Поэтому
Ā310 = 103 . То есть всего он может выполнить 1000 попыток. Но так как
одна удачная, то неудачных будет 999.
Возможен и второй вариант решения без формулы, но использующий
её доказательство и замечание 1.2.
Событие A : забыть последние три цифры. Это означает:
событие A1 : забыть первую цифру; И
событие A2 : забыть вторую цифру; И
событие A3 : забыть третью цифру.
Следовательно, A =A1 И A2 И A3 .
Так как каждая из трёх забытых позиций номера допускает 10 вариантов,
то используя замечание 1.2, сопоставим каждому событию число n = 10.
NA = 10 · 10 · 10 ⇒ NA = 103 ⇒ NA = 1000.
Далее следует учесть, что среди этих попыток есть одна удачная. При самом несчастливом варианте она будет последней. Поэтому
человек может совершить 999 неудачных попыток.
Замечание 1.5. В заключение темы следует заметить, что искусство
комбинаторики пригодилось не только в математике. С помощью математики оно сформировалось и нашло применение в музыкальной науке и
практике XVII-XVIII веков. Теоретические построения «Ars combinatoria»
поначалу были лишь опосредовано связаны с музыкальной практикой. Это
объяснялось не только общим характером музыкальной науки, которая была словесно-числовым осмыслением музыкального бытия, но и происхождением музыкального учения об «Ars combinatoria»: его логическая основа
была взята из математики. Две основные категории этого учения − пермутации и комбинации − также были введены в обиход математиками XVII
века, а словосочетание «Ars combinatoria» послужило в 1666 году заглавием диссертации Лейбница.
Как в математике, так и в музыкальной теории пермутация обозначала
19
перестановку элементов: abcd, abdc, adbc,... а комбинация − замену одних
элементов другими, аналогичными по функции: abcd, aPcd, aPcd.
Авторы трактатов рассматривали возможности пермутаций и комбинаций применительно к самому разному музыкальному материалу. В качестве переставляемых и взаимозаменяемых элементов комбинаторной конструкции мыслились: отдельные тоны в составе формул аккомпанемента;
сами эти формулы в их последовательности или же фигурации в составе
пассажей; мотивы в составе голосов контрапунктической ткани; отклонения в родственные тональности в пределах периода и многое другое1 .
1
Лебедева А. В. Ars combinatoria и музыкальная практика XVIII века : автореферат дис. ... кандидата искусствоведения/ Рос. акад. музыки им. Гнесиных. М., 2002. С. 4.
20
2
Введение в теорию вероятностей
Всегда имеется несколько способов
объяснения явлений, и из них мы
предпочтём наименее невероятное.
Бертран Рассел
2.1
Понятие события. Классификация событий
В предыдущей главе было определено понятие опыта (эксперимента) как
воспроизводимой совокупности физических условий, на фоне которых наступает некоторое изучаемое явление или фиксируется тот или иной результат.
Каждый опыт состоит из исходов опыта, на фоне которых происходит
изучаемое явление, которое в дальнейшем будет называться событие.
Событие, связанное с одним исходом, называется элементарным событием, а событие, связанное со множеством исходов, − составным
событием.
При этом все события можно разбить на три группы: достоверные,
невозможные и случайные.
Определение 2.1. Событие, которое при одних и тех же физических
условиях наступает всегда, называется достоверным событием.
Например, согласно календарю можно утверждать, что наступление после зимы весны является достоверным событием1 .
Определение 2.2. Событие, которое при одних и тех же физических
условиях не происходит никогда, называется невозможным событием.
Любой представитель общества защиты животных скажет, что событие
«на Северном полюсе гуляет верблюд» является невозможным событием.
Определение 2.3. Событие, которое при одних и тех же физических
условиях может произойти или не произойти, называется случайным
событием.
Так, например, при вашем участии в розыгрыше любой корректно устроенной лотереи кто-нибудь выигрывает. Но событие, при котором эту
лотерею выиграете вы, к сожалению для вас, является случайным событием.
В дальнейшем нас будут интересовать только случайные события, так
как теория вероятностей является разделом математики, который изу1
При этом, несмотря на то, что днём наступления весны является 1 марта, фактическое наступление
весны именно первого марта не является достоверным событием.
21
чает закономерности, возникающие при изучении массовых случайных
событий.
Как и в предыдущей главе, множество всех исходов опыта будем называть пространством элементарных исходов опыта Ω. Соответственно
исходы опыта ω являются его элементами: ω ∈ Ω. При этом исходы, составляющие изучаемое событие, являются его благоприятными исходами.
Если Ω состоит из конечного или сравнимого с натуральным рядом множества исходов, то оно называется дискретным пространством исходов опыта, иначе оно называется непрерывным пространством
исходов опыта.
Пространства исходов, связанные с подбрасыванием монеты или игральной кости, являются дискретными пространствами. А пространство множества осадков, выпадавших с первого по тридцать первое июля 1950 года,
является примером непрерывного пространства.
Заметим, что понятие Ω не является однозначным понятием. Так в случае подбрасывания монеты при исследовании выпадания чётного и нечётного числа очков возможны два определения:
Ω1 = {«1», «2», «3», «4», «5», «6»}
(2.1)
Ω2 = {«нечётное число очков», «чётное число очков»}.
(2.2)
и
Определение 2.4. Два события называются несовместными, если
их одновременное наступление является невозможным событием.
Так при подбрасывании монеты одновременное выпадение герба и решётки1 является невозможным событием2 .
Определение 2.5. Два события называются равновозможными,
если связанные с ними исходы являются симметричными относительно
их геометрических и физических свойств.
Например, выпадение «герба» и «решётки» при подбрасывании монеты
или одной из цифр при подбрасывании игральной кости являются событиями равновозможными, так как предполагается, что и монета и кость
сделаны из однородных материалов, имеют постоянную плотность этих материалов и являются геометрически правильными телами.
Определение 2.6. Несовместные и равновозможные события образу1
В XIV-XVI веках на одной из сторон монеты изображалась решётка, которая привела к современному жаргонному слову решка (см. Фëдорова T. JI., Щеглова О. А. Этимологический словарь русского
языка. М. : Ладком, 2012. С. 371).
2
Различают попарно несовместные или несовместные в совокупности события. Несовместные в
совокупности события одновременно являются и попарно несовместными. Обратное отношение может
не выполняться. Так попарная несовместность первого и третьего событий, а также первого и третьего
не влечёт за собой несовместность второго и третьего событий.
22
ют полную группу событий опыта, если в данном опыте невозможно
наступление другого события, отличного от данных.
При подбрасывании игральной кости события выпадения числа очков:
«1», «2», «3», «4», «5», «6» образуют полную группу исходов опыта, так как
эти события не только равновозможны и несовместны, но и невозможным
событием является наступление иного, кроме этих, события при подбрасывании кости.
Определение 2.7. Два события, образующие полную группу событий
опыта, называются противоположными событиями.
При подбрасывании одной монеты события: выпадение «герба» и выпадение «решётки» являются противоположными событиями.
Если обозначить через A некоторое событие, то событие, ему противоположное, обозначается через Ā. Сумма противоположных событий совпадает с Ω, а их пересечение пусто, то есть
A ∩ Ā = ∅.
A + Ā = Ω,
2.2
Классическое определение вероятности
Вопрос: Какова вероятность, выйдя из
дома, встретить слона?
Ответ: 0,5. Так как вы его встретите
или не встретите.
Из математического фольклора
При рассмотрении случайных событий возникает вопрос о степени возможности этих событий, а также о сравнении этих степеней возможности
для разных событий. Логично связать степень возможности с числом, которое становится больше, если увеличивается возможность наступления
события. Это число и называется вероятностью события1 .
Но чтобы что-то сравнивать, нужно найти единицу сравнения. Такой
единицей может быть вероятность достоверного события, которую можно
считать равной единице. Так как невозможное событие является противоположным достоверному, то его вероятность логично принять равной нулю.
Таким образом, диапазон распределения вероятностей случайных событий
совпадает с промежутком от нуля до единицы2 .
1
Не надо только путать это понятие вероятности события с бытовым понятием, очень часто используемым в повседневном общении и даже неоднократно воспетым: по теории вероятностей после
радостей − неприятности.
2
Первой книгой, в которой рассказывалось об этом была «Книга об азартных играх» (Liber de ludo
aleae), написанная в 1564 году Д. Кардано.
Кардано Джироламо (лат. Cardanus Hieronymus , итал. Cardano Girolamo, 1501-1576) − итальянский математик, инженер, философ, медик и астролог. В его честь названы открытые Сципионом
23
Для любого события A его вероятность P (A) удовлетворяет двойному
неравенству1
0 ≤ P (A) ≤ 1.
Предположим, что пространство некоторого опыта Ω состоит из n исходов, образующих его полную группу. И в этом опыте на фоне m исходов
наступает случайное событие A. Тогда имеет место следующее
Определение 2.8. Классическое определение вероятности2
Вероятностью события A называется отношение числа благоприятных данному событию m исходов опыта к числу n всех его исходов.
То есть,
m
P (A) =
.
n
Задача 2.1. Найдите вероятность выпадения нечётного числа очков
при одном подбрасывании игральной кости.
Решение
Вариант 1. Рассмотрим пространство исходов Ω1 (см. 2.1). Так как его
исходы несовместны и равновозможны, то они образуют полную группу из
n = 6 исходов. При этом интересующее нас событие A − «выпало нечётное
число очков» − может наступить три раза. То есть, благоприятное число
исходов m = 3. Поэтому, согласно классическому определению,
3
1
⇒ P (A) = или P (A) = 0, 5.
6
2
Вариант 2. Рассмотрим пространство исходов Ω2 (см. 8.5). В данном случае исходы опыта также несовместны и равновозможны. Поэтому они также образуют полную группу из n = 2 исходов. А интересующее нас событие
A − «выпало нечётное число очков» − может наступить один раз. А значит, благоприятное число исходов m = 1. Таким образом, из классического
определения следует, что
P (A) =
P (A) =
1
или P (A) = 0, 5.
2
При подбрасывании игральной кости один раз вероятность
выпадания нечётного числа очков равна 0,5.
дель Ферро формулы решения кубического уравнения (Кардано был их первым публикатором),
карданов подвес и карданный вал (см. [17, с. 40-41], а также Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRK\T2A\cyra\T2A\cyrr\T2A\cyrd\T2A\cyra\T2A\cyrn\T2A\
cyro,_\T2A\CYRD\T2A\cyrzh\T2A\cyre\T2A\cyrr\T2A\cyro\T2A\cyrl\T2A\cyra\T2A\cyrm\T2A\cyro
(дата обращения: 12.06.2016)).
1
Из знания этого факта следует, что, имея право на любую ошибку в вычислениях, связанную как
с расчётами, так и с отсутствием знаний, никто не имеет право выдавать за вероятность события число,
не попавшее в данный промежуток. Так как в этом случае он признаётся в том, что ничего не знает
о теории вероятностей.
2
Это определение впервые было дано Я. Бернулли в четвёртой части его работы «Искусство предположений» (см. Бернулли Я. О законе больших чисел. М. : Наука, 1986. С. 24).
24
Задача 2.2. В коробке лежат 10 лампочек из них 3 бракованные.
Найдите вероятность выбрать случайным образом одну стандартную
лампочку.
Решение. Обозначим событие − выбрать одну стандартную лампочку
− через A. Далее определим число n всех исходов и число m благоприятных исходов.
Взять одну произвольную лампочку можно десятью способами1 , поэтому общее число исходов n = 10. Так как стандартных лампочек семь, то
выбрать из них одну можно семью способами. Следовательно, число благоприятных исходов m = 7.
7
Следовательно, согласно определению 2.8, P (A) = . То есть,
10
вероятность выбрать случайным образом одну
стандартную лампочку равна 0,7.
Задача 2.3. В коробке лежат 10 лампочек, из них 3 бракованные.
Найдите вероятность выбрать случайным образом две стандартные лампочки.
Решение. Обозначим событие − выбрать две стандартные лампочки
− через B. Далее определим число n всех исходов и число m благоприятных исходов.
Так как при выборе двух произвольных лампочек, порядок выбора не
играет роли, то при общем числе элементов n = 10 выбор k = 2 элементов
2
определяется числом сочетаний C10 . В силу того, что стандартных лампочек семь, а выбираются две из них также без учёта порядка, то число
2
благоприятных исходов m = C7 .
2
C7
Поэтому согласно определению 2.8 P (B) = 2 . Применяя формулу
C10
n!
, получим
сочетаний Cnk =
k!(n − k)!
2
C7
7! · 2! · 8!
6·7
7
7
=
=
⇒ P (B) = .
2 =
2! · 5! · 10! 9 · 10 15
15
C10
(Здесь 10! = 8! · 9 · 10; 7! = 5! · 6 · 7.)
Таким образом,
1
«Красиво» с помощью формулы это означает, что из 10 одинаковых элементов нужно выбрать
один, не обращая внимания на порядок (ведь при выборе одного элемента порядок устанавливается
единственным образом). Поэтому при общем числе элементов n = 10 выбор k = 1 элементов опреде1
ляется числом сочетаний C10
= 10.
25
вероятность выбрать случайным образом две
7
стандартные лампочки равна .
15
Задача 2.4. В коробке лежат 10 лампочек, из них 3 бракованные.
Найдите вероятность выбрать случайным образом четыре лампочки, из
которых три стандартные.
Решение. Обозначим событие − выбрать случайным образом четыре
лампочки, из которых три стандартные − через C. Далее определим
число N всех исходов выбора четырёх произвольных лампочек из десяти.
Так как лампочки при таком выборе не отличаются друг от друга, то
их выбор определяется с помощью сочетаний N = C104 .
Определим число M благоприятных исходов. Выбрать четыре лампочки, из которых три стандартные, это значит: выбрать три стандартные
лампочки из семи стандартных и выбрать одну нестандартную из трёх
нестандартных. Поэтому событие C является произведением событий C1
− выбрать три стандартные лампочки из семи стандартных и C2 −
выбрать одну нестандартную из трёх нестандартных: C = C1 и C2 .
Следовательно, согласно правилу произведения (см. 1.2) из комбинаторики,
M = MC1 · MC2 .
3
1
При этом MC1 = C7 , а MC2 = C3 .
Так как, согласно классическому определению вероятности, P (C) =
то
3
M
,
N
1
MC1 · MC2
C ·C
⇒ P (C) = 7 4 3 .
P (C) =
N
C10
Теперь остаётся только выполнить арифметические преобразования согласно 2.3:
3
1
C7 · C3
7! · 3! · 4! · 6!
2! · 3 · 4 · 5 · 6 1
=
=
=
C104
3! · 4! · 1! · 2! · 10!
2! · 8 · 9 · 10
2
(здесь использовано то, что: 6! = 2! · 3 · 4 · 5 · 6 и 10! = 7! · 8 · 9 · 10.)
1
Таким образом, P (C) = . А это означает, что
2
вероятность выбрать случайным образом четыре лампоч.
ки, из которых три стандартные, равна 0,5
Задачи 2.2−2.4 являются частными случаями общей задачи о выборе
Задача 2.5. В коробке лежат L элементов, из которых K «хорошие».
Какова вероятность вытащить l элементов, из которых k элементов
являются «хорошими»?
26
Решение. Общее число n вариантов выбора l произвольных элементов
из L определяется с помощью формулы сочетаний 2.3: n = CLl .
Событие D − вытащить l элементов, из которых k элементов являются «хорошими» означает: вытащить k «хороших» элементов из K
«хороших» и вытащить l − k «нехороших» элементов из L − K «нехороших» элементов. Поэтому событие C является произведением этих
событий, которые можно назвать событиями C1 и C2 сооответственно. А
общее число исходов D будет определяться с помощью правила произведения (см. 1.2):
l−k
mD = mD1 · mD2 ⇒ mD = CKk · CL−K
.
Если обозначить интересующее нас событие как E, то из классического
m
определения вероятности 2.8 следует, что его вероятность P (E) = C .
n
Следовательно,
l−k
CKk · CL−K
P (E) =
.
(2.3)
CLl
Замечание 2.1. Следует обратить внимание на то, что в формуле
(2.3) заложена возможность проверки правильности расчётов. Так и в числителе, и в знаменателе выбор происходит из одного числа элементов L,
которые в числителе образуют сумму K + (L − K) = L. Точно также, и
в числителе, и в знаменателе выбирается одно и тоже число элементов l,
которые в числителе образуют сумму k + (l − k) = l.
Чтобы эта проверка имела место и в задаче 2.3, нужно обратить внимание на то, что когда выбираются элементы только одного типа (а в задаче происходит выбор только стандартных лампочек), то автоматически
выбирается нуль элементов другого типа (то есть в данной задаче нестандартных лампочек).
Для этого формулу расчёта вероятности P (B) нужно переписать так:
2
2
0
C7
C7 · C3
.
2 =
C10
C102
Теперь и в числителе и знаменателе описаны одни и те же процессы:
7 + 3 = 10; 2 + 0 = 2.
Задача 2.6. Найдите ошибку, допущенную при «решении» следующей
задачи: Брошены две игральные кости. Найдите вероятность того, что
сумма выпавших очков равна 4.
«Решение». Пусть событие A − сумма выпавших очков равна 4. Пространство элементарных исходов Ω состоит из двух исходов (n = 2): «сумма
27
выпавших очков равна 4» и «сумма выпавших очков не равна 4». Число
1
благоприятных событию A исходов m = 1. Поэтому P (A) = .
2
В данном «решении» предполагается, что исходы опыта равновозможны
(иначе невозможно воспользоваться классическим определением). На самом деле исходы «сумма выпавших очков равна 4» и «сумма выпавших
очков не равна 4» не являются равновозможными.
Рассмотрим, как же решается эта задача. Пространство элементарных
исходов Ω содержит 36 равновозможных исходов, так как подбросить две
кости, это значит: «подбросить первую кость» и «подбросить вторую кость».
На каждой из костей шесть граней, поэтому возможно выпадение любого
из шести чисел. Следовательно можно составить 36 пар чисел, в которых
первым элементом является число выпавших очков на первой кости, а вторым − число очков, выпавших на второй кости. Таким образом, n = 36.
Существует только три исхода, благоприятных событию A: (1; 3), (3; 1),
(2; 2). (В каждой из пар сумма чисел равна 4). То есть, m = 3. Поэтому
3
P (A) = . В результате,
36
1
вероятность того, что сумма выпавших очков равна 4, равна
.
12
Замечание 2.2. Классическое определение вероятности предполагает
несколько ограничений, накладываемых на изучаемые события.
Во-первых, конечное число исходов опыта является очень сильным ограничением, не позволяя определить вероятности событий, связанных с
бесконечным числом исходов опыта.
Во-вторых, условие равновозможности исходов, связанное с симметрией
физических и геометрических условий опыта, оказывается трудновыполнимым при рассмотрении реальных объектов1 .
В-третьих, невозможно представить результаты опыта в виде совокупности элементарных исходов.
При практическом изучении случайных событий учёт этих ограничений
не позволяет решать все задачи, как это хотелось бы в идеале. Эти недостатки привели к появлению новых определений вероятности.
1
Однако польским математикам удалось «обмануть» нестандартность монет. Для этого они предложили в ситуации, в которой выпадает серия герб-решётка, запоминать герб, а в серии решётка-герб
запоминать решётка. В сериях герб-герб и решётка-решётка ничего не запоминать. При таком выборе при любом подбрасывании любых монет вы имеете дело с идеальной монетой (см. Штейнгауз Г.
Задачи и размышления. М. : Мир, 1974. С. 42).
28
2.3
Статистистическое определение вероятности
Допустим, что в некотором опыте, состоящем из n однотипных исходов,
изучается случайное событие A.
Определение 2.9. Отношение числа появлений m события A к общему числу исходов n называется относительной частотой события
A.
Если обозначить относительную частоту события A через Wn (A), то из
определения вытекает, что
Wn (A) =
m
n
.
(2.4)
Так как 0 ≤ m ≤ n, то 0 ≤ Wn (A) ≤ 1.
Из формулы (2.4) вытекает
Следствие 2.1. Число появлений события A равно его относительной
частоте, умноженной на число испытаний, то есть
m = Wn (A) · n.
(2.5)
Задача 2.7. По данным шведской статистики1 , относительная частота рождаемости с 1751 по 1760 год по годам характеризуется следующими числами
1751
1752
1753
1754
1755
1756
1757
1758
1759
1760
0,0384 0,0358 0,0359 0,037 0,0373 0,036 0,0326 0,0334 0,0335 0,0355
Определите коэффициент рождаемости в данном десятилетии.
Решение. Так как относительная частота равна сумме этих чисел, делённых на 10, то число Wn (A) = 0, 0355 можно принять за приблизительное значение коэффициента рождаемости.
В опыте с массовым числом исходов одного и того же типа при числе
исходов n → ∞ относительная частота события Wn (A) → p, где p − некоторое постоянное число. При этом чем больше n, тем меньше относительная
частота отклоняется от этого числа.
Определение 2.10. Статистическое определение вероятности
Почти достоверный предел p = lim Wn (A) называется статистиn→∞
ческой вероятностью2 события A.
1
(См. Википедия [Электронный ресурс] : URL : http://svspb.net/sverige/demografija-shvecii.
php (дата обращения: 12.06.2016)).
2
Определение статистической вероятности было дано Р. Мизесом в 1919 году (см. Хинчин А. Я.
Учение Мизеса о вероятностях и принципы физической статистики. // Успехи физических наук. −
1929. − Т. IX. Вып. 2 С. 143).
фон Мизес Рихард Эдлер (нем. Richard Edler von Mises, 1883-1953) − математик и механик; работы посвящены аэродинамике, прикладной механике, механике жидкостей, аэронавтике,
29
То есть при очень больших n относительная частота события A приближённо совпадает с его статистической вероятностью.
В силу этого совпадения имеет смысл следующее
Определение 2.11. Средним числом появления события A в n
испытаниях называется число
µ = np.
Замечание 2.3. Следует заметить, что при увеличении числа исходов
опыта n статистическая вероятность приближается к вероятности в смысле
классического определения не с полной достоверностью, а с большей вероятностью. И эта вероятность тем больше, чем большее число исходов опыта.
Подробнее об этом рассказывается далее, в последней главе.
Введя понятие статистической вероятности события, можно получить
возможность приписать определённые вероятности, заключённые между
нулём и единицей, не только событиям, для которых можно определить
классическую вероятность, но и тем событиям, для которых эти условия
не применимы. Достаточно, чтобы проводимый опыт обладал свойством
устойчивости относительных частот, то есть мог бы быть неограниченно
воспроизводимым в практически одинаковых физических условиях.
Задача 2.8. В результате работы отдела технического контроля
было обнаружено, что при изучении партии из 200 деталей 188 деталей оказались стандартными. Какова вероятность того, что взятая деталь оказывается стандартной? Какое число деталей может оказаться
стандартным, если исследовать партию из 600 деталей?
Решение. Согласно статистическому определению вероятности
p=
188
⇒ p = 0, 94.
200
На практике, при определении статистической вероятности, часто используют процентное соотношение и говорят, что вероятность равна 94%.
Отсюда следует, что среднее число стандартных деталей в партии из 600
деталей примерно равно
µ = 600 · 0, 94 ⇒ µ = 564.
p = 94%; µ = 564 .
статистике и теории вероятностей. Ввёл в общее употребление интегралы Стилтьеса и первым
разъяснил роль теории марковских цепей в физике (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRM\T2A\cyri\T2A\cyrz\T2A\cyre\T2A\cyrs,_\T2A\CYRR\
T2A\cyri\T2A\cyrh\T2A\cyra\T2A\cyrr\T2A\cyrd_\T2A\CYREREV\T2A\cyrd\T2A\cyrl\T2A\cyre\T2A\
cyrr_\T2A\cyrf\T2A\cyro\T2A\cyrn(дата обращения: 12.06.2016)).
30
Замечание 2.4. Принципиальным отличием классического и статистического определения вероятности является тот факт, что классическая
вероятность является теоретической вероятностью, определяя вероятность события ещё до того, как это событие произошло.
Статистическая вероятность является практической (эмпирической)
вероятностью, так как определяется уже после опыта, в котором произошло изучаемое событие, исходя из накопленного известного статистического материала.
Замечание 2.5. Для определения статистической вероятности события
A требуется:
во-первых, возможность, хотя бы принципиально, производить неограниченное число испытаний, в каждом из которых событие A наступает или
не наступает;
во-вторых, устойчивость относительных частот появления A в различных сериях достаточно большого числа испытаний.
Недостатком статистического определения является неоднозначность статистической вероятности. Так, например, в задаче 2.7 в качестве вероятности события можно принять не только 0, 481, но и 0,49; 0,48 и так далее.
2.4
Геометрическое определение вероятности
Так как классическое определение вероятности невозможно применить
к опыту с бесконечным числом исходов, то в этом случае используют следующий подход к изучаемому событию.
Предположим, что пространство элементарных исходов опыта Ω является множеством точек, которое можно изобразить в виде ограниченного
множества точек D, расположенного на прямой, на плоскости или в пространстве. Так как изучаемое событие A как множество благоприятных
ему исходов опыта является подмножеством Ω, то его можно изобразить в
виде множества G, являющегося подмножеством множества D.
Если определить меру S соответствующего ограниченного множества
точек прямой, плоскости, пространства как его длину, площадь, объём, то
имеет место
Определение 2.12. Геометрическое определение вероятности
Геометрической вероятностью1 события A называется отноше1
Определение геометрической вероятности в 1740 году ввёл Т. Симпсон в своей работе «Природа и законы случая» (A treatise on the nature and laws of change) (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRS\T2A\cyri\T2A\cyrm\T2A\cyrp\
T2A\cyrs\T2A\cyro\T2A\cyrn,_\T2A\CYRT\T2A\cyro\T2A\cyrm\T2A\cyra\T2A\cyrs (дата обращения:
12.06.2016)).
Симпсон Томас (англ. Simpson Thomas, 1710-1761) − английский математик. Автор формулы Симп-
31
ние меры множества G к мере множества D, то есть
P (A) =
SG
SD
.
(2.6)
Замечание 2.6. Следует заметить, что данное определение предполагает следующие ограничения для любой точки, принадлежащей множеству
D:
во-первых, каждая точка множества G может быть расположенной
в любой точке множества D;
во-вторых, вероятность принадлежности точки множеству G пропорциональна мере SG и не зависит от расположения множества G во множестве
D.
Задача 2.9. Расстояние от пункта А до В автобус проходит за
2 минуты, а пешеход − за 15 минут. Интервал движения автобусов
25 минут. Вы подходите в случайный момент времени к пункту A и
отправляетесь в B пешком. Найдите вероятность того, что в пути
вас догонит очередной автобус.
Решение. Допустим, что чёрный прямоугольник изображает множество D длина которого SD = 25 единиц (рис. 2.1).
D
G
Рис. 2.1
А серый прямоугольник изображает множество G, длина которого определяется тем, что пешеход может сесть в автобус. Поэтому его длина есть
длина отрезка времени не большего, чем SG = 15 − 2 = 13 единиц (этот
отрезок находится на промежутке времени (10; 23)).
Если событие A − «в пути вас догонит очередной автобус», то согласно геометрическому определению вероятности вероятность этого события
можно вычислить как отношение длин серого и чёрного прямоугольников
13
P (A) = .
25
Следовательно,
вероятность того, что в пути вас догонит очередной автобус, равна 0, 52 .
сона для приближённого вычисления интегралов (см. там же).
32
Задача 2.10. Задача о встрече1 . Два человека условились встретиться в определенном месте между 12 и 13 часами дня. Пришедший
первым ожидает второго в течение четверти часа, после чего уходит.
Найдите вероятность того, что встреча состоится, если каждый человек выбирает момент своего прихода (в промежутке от 12 до 13 часов)
случайным образом.
Решение. Допустим, что множество D есть серый квадрат со стороной
единица (рис. 2.2).
Каждая точка квадрата с координатами (x; y) (0 ≤ x ≤ 1; 0 ≤ y ≤ 1)
определяет время прихода каждого из пришедших в пределах этого часа в
часах.
Они встретятся, если для времени встречи будет выполняться одно из
двух неравенств:
1
1
x−y ≤ ; y−x≤ ,
4
4
что эквивалентно неравенству
1
|x − y| ≤ .
4
y
1
3
4
1
4
0
1
4
3
4
1
x Рис. 2.2
Следовательно, множество встречи G определяется чёрным шестиугольником, ограниченным прямыми
y = 0; y = x − 0, 25; x = 1; y = 1; y = x + 0, 25; x = 0.
Площадь G удобнее вычислить как разность площади квадрата и двух
серых треугольников, вырезанных из квадрата шестиугольником:
SG = 1 − 2 ·
1
7
· (1 − 0, 25)2 . ⇒ SG = .
2
16
1
Задача впервые была опубликована в 1886 году в книге «Выбор и шанс» (Choice and chance)
В. Витворта и после этого включалась в большинство учебников по теории вероятности.
Витворт В. А. (Whitworth William Allen, 1840-1905) − английский математик и священник англиканской церкви (см. [13, c. 408], а также Википедия [Электронный ресурс] : URL : https://en.
wikipedia.org/wiki/William_Allen_Whitworth (дата обращения: 12.06.2016)).
33
Если определить эту случайную встречу как событие B, то согласно геометрическому определению вероятности вероятность этого события можно
вычислить как отношение площадей длин чёрного многоугольника и серо7
го квадрата P (B) =
: 1. В итоге имеем, что
16
вероятность того, что встреча произойдёт, равна 0, 4375 .
Cледующая задача на эту тему является одной из первых в истории
теории вероятностей.
Задача 2.11. Игла Бюффона1 . На плоскости заданы параллельные
прямые, находящиеся друг от друга на расстоянии 2a. Случайным образом на плоскость бросается игла, длина которой 2l, при этом l < a.
Найдите вероятность того, что игла пересечёт одну из прямых.
Решение. Для того чтобы определить, пересекает игла одну из прямых
или нет, нужно определить те параметры иглы, которые отвечают за её
местоположение на плоскости. Этими параметрами могут быть «расстояние от центра иглы до ближайшей прямой» и «угол поворота относительно
ближайшей прямой2 ».
Свяжем с этими прямыми систему координат, привязав к нижней прямой горизонтальную ось, направление на которой будет связано с углом
поворота иглы, который обозначим через α. Вертикальную ось, на которой
определяется расстояние до нижней прямой, обозначим через y. Расстояние от центра иглы до ближайшей прямой также обозначим y (рис. 2.3).
y
2a
l
y
l
α
α Рис. 2.3
Очевидно, что положение центра иглы y меняется от 0 до a, а угол поворота иглы меняется3 от 0 до π.
1
В поисках значения числа π Бюффон рассмотрел данную задачу. Его решение было приведено
в эссе «Опыт нравственной арифметики » (Essai d0 arithmetique morale), в его «Всеобщей и частной
истории» (Histoire naturelle, generale er particuliere) в 1777 году.
Граф де Бюффон Жорж-Луи Леклерк (фр. Georges-Louis Leclerc, Comte de Buffon, 17071788) − французский натуралист, биолог, математик, естествоиспытатель и писатель XVIII века
(см. Гнеденко Б.В. Курс теории... С. 406, а также Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRB\T2A\cyryu\T2A\cyrf\T2A\cyrf\T2A\cyro\T2A\cyrn,_\
T2A\CYRZH\T2A\cyro\T2A\cyrr\T2A\cyrzh-\T2A\CYRL\T2A\cyru\T2A\cyri_\T2A\CYRL\T2A\cyre\T2A\
cyrk\T2A\cyrl\T2A\cyre\T2A\cyrr\T2A\cyrk_\T2A\cyrd\T2A\cyre(дата обращения: 12.06.2016)).
2
Поскольку игла образует с прямой острый и тупой углы, то на прямой нужно выбрать направление,
а далее под углом подразумевать «угол между прямой и направлением».
3
При этом местоположение центра иглы не зависит от угла её поворота относительно ближайшей
прямой.
34
Множество всевозможных положений иглы можно описать с помощью
прямоугольника
П = {(α, y) : 0 ≤ α ≤ π, 0 ≤ y ≤ a}.
Игла будет пересекать ближайшую прямую, если расстояние от её центра до ближайшей прямой1 y ≤ l sin α.
На рис. 2.4 площадь, ограниченная кривой y = l sin α, окрашена в серый
цвет.
y
a
π
0
Величина этой площади
Zπ
S=
2
αРис. 2.4
l sin αdα.
0
Вычислим этот интеграл
Zπ
π
l sin αdα = −l cos α
= −l(cos π − cos 0) = 2l.
0
0
Следовательно, S = 2l.
Если вероятность того, что игла пересечёт одну из прямых, определить
как событие C, то согласно геометрическому определению вероятности вероятность этого события можно вычислить как отношение вычисленной
площади S к площади чёрного прямоугольника
2l
.
P (C) =
aπ
Таким образом получаем, что
вероятность того, что игла пересечёт
2l
одну из прямых, равна
.
aπ
Замечание 2.7. Геометрическое определение вероятности также имеет
свои недостатки, одним из которых является следующий:
Известно, что в случае классического определения вероятность достоверного или невозможного событий равна единице, соответственно нулю.
При этом справедливы обратные утверждения: если вероятность события равна единице, то событие достоверно и если вероятность события
равна нулю, то событие невозможно.
1
Если на рис. 2.3 мысленно опустить перпендикуляр на пунктир, то получится прямоугольный
треугольник, в котором вертикальный катет будет равен y = l sin α.
2
cos π = −1, cos 0 = 1.
35
А в случае геометрического определения вероятности обратные утверждения не имеют места. Так, например, вероятность попадания брошенной
точки в одну определенную точку области G равна нулю, однако это событие может произойти, и, следовательно, не является невозможным.
В 1933 году А. Н. Колмогоров1 дал аксиоматическое определение вероятности, для которого все рассмотренные выше определения являются частными случаями. Но рассмотрение этого вопроса выходит за рамки программы данного курса.
1
Колмогоров Андрей Николаевич (1903-1987) − советский математик, один из крупнейших
математиков ХХ века. Один из основоположников современной теории вероятностей, Автор основополагающих результатов в топологии, геометрии, математической логике, классической механике,
теории турбулентности, теории сложности алгоритмов, теории информации, теории функций, теории
тригонометрических рядов, теории меры, теории приближения функций, теории множеств, теории
дифференциальных уравнений, теории динамических систем, функциональном анализе и в ряде
других областей математики и её приложений, а также новаторских работ по философии, истории,
методологии науки и преподаванию математики, статистической физике. Иностранный член 14
Академий и математических обществ (см. Википедия [Электронный ресурс] : URL : https://ru.
wikipedia.org/wiki/\T2A\CYRK\T2A\cyro\T2A\cyrl\T2A\cyrm\T2A\cyro\T2A\cyrg\T2A\cyro\T2A\
cyrr\T2A\cyro\T2A\cyrv,_\T2A\CYRA\T2A\cyrn\T2A\cyrd\T2A\cyrr\T2A\cyre\T2A\cyrishrt_\T2A\
CYRN\T2A\cyri\T2A\cyrk\T2A\cyro\T2A\cyrl\T2A\cyra\T2A\cyre\T2A\cyrv\T2A\cyri\T2A\cyrch
(дата обращения: 12.06.2016)).
36
3
Алгебра событий
Играя против начинающего шахматиста
и против чемпиона, выиграть две партии
подряд вероятнее по схеме «чемпион − новичок − чемпион» или по схеме «новичок
− чемпион − новичок»?
Ф. Мостеллер
3.1
Сложение вероятностей событий
Теорема 3.1. Вероятность суммы двух несовместных событий равна
сумме их вероятностей.
То есть,
P (A + B) = P (A) + P (B), если AB = ∅.
Д о к а з а т е л ь с т в о. Допустим, что n есть число всевозможных
исходов опыта, в котором m1 раз наступает событие A и m2 раз наступает
событие B. Так как события A и B несовместны, то наступление одного из
них исключает наступление другого (см. определение 2.4). Поэтому число
благоприятных исходов опыта, в которых наступит событие A + B, равно
m1 + m2 .
Следовательно, из классического определения вероятности следует, что
P (A + B) =
m1 + m2
m
m
= 1 + 2 = P (A) + P (B).
n
n
n
Задача 3.1. В коробке лежат 5 красных, 3 белых и два синих шара
одного и того же радиуса. Какова вероятность вытащить из коробки
случайным образом цветной шар?
Решение. Предположим, что событие A − «вынимание красного шара
из коробки», а событие B − «вынимание синего шара из коробки». Так как
в один момент времени можно вытащить только красный или только синий
шар, то событие «вытащить цветной шар» является суммой несовместных
событий A и B. Поэтому его можно обозначить как A + B. Общее число
способов взять один шар из коробки n = 5 + 3 + 2, то есть n = 10. Из этих
способов благоприятными для A будут m1 = 5 способов, а благоприятными
для B − m2 = 2 способа. Следовательно,
P (A) =
5
2
; P (B) = .
10
10
37
А так как P (A + B) = P (A) + P (B), то P (A + B) = 0, 5 + 0, 2 = 0, 7.
Таким образом,
вероятность взять цветной шар из коробки равна 0,7 .
Из теоремы 3.1 вытекает
Следствие 3.1. Вероятность суммы конечного числа попарно несовместных событий равна сумме их вероятностей.
То есть, ∀ i 6= j : Ai Aj = ∅,
P (A1 + A2 + · · · + An ) = P (A1 ) + P (A2 ) + · · · + P (An ).
Теорема 3.2. Вероятность суммы событий, образующих полную группу, равна единице.
Д о к а з а т е л ь с т в о. Если события A1 , A2 , · · · , An образуют
полную группу событий опыта, то их сумма A1 + A2 + · · · + An = Ω, то есть
совпадает со всем пространством элементарных исходов опыта. Поэтому
P (A1 + A2 + · · · + An ) = 1.
А так как события полной группы попарно несовместны, то в силу следствия 3.1
P (A1 ) + P (A2 ) + · · · + P (An ) = 1.
Следствие 3.2. Из определения 2.7 вытекает, что Сумма вероятностей противоположных событий равна единице1 :
P (A) + P (Ā) = 1.
Так как противоположные события образую полную группу, то к ним
применима теорема 3.2.
Задача 3.2. Вероятность выигрыша в лотерее 0, 01. Найдите вероятность проигрыша в этой лотерее.
Решение. События A − «выигрыш в лотерее» и B − «проигрыш в лотерее» являются противоположными событиями. Поэтому B = Ā. А так
как P (A) = 0, 01, то
P (Ā) = 1 − P (A) ⇒ P (Ā) = 1 − 0, 01 ⇒ P (Ā) = 0, 99.
Следовательно, вероятность проигрыша в лотерее равна 0,99 .
1
Впервые это правило было установлено Я. Бернулли и Н. Бернулли (см. Гнеденко Б. В. Курс
теории... С. 409).
Бернулли Николай (Никола) (нем. Bernoulli Nikolaus II., 1695-1726) − сын Иоганна Бернулли,
швейцарский математик, философ, юрист; профессор математики Петербургской академии наук
(1725). Основные работы в области дифференциальных уравнений и механики. (см. Википедия
[Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRB\T2A\cyre\T2A\cyrr\T2A\
cyrn\T2A\cyru\T2A\cyrl\T2A\cyrl\T2A\cyri,_\T2A\CYRN\T2A\cyri\T2A\cyrk\T2A\cyro\T2A\cyrl\
T2A\cyra\T2A\cyrishrt (дата обращения: 12.06.2016)).
38
Теорема 3.3. Вероятность суммы двух совместных событий равна
сумме их вероятностей без учёта вероятности произведения этих событий1 .
То есть,
P (A + B) = P (A) + P (B) − P (AB), если AB 6= ∅.
Д о к а з а т е л ь с т в о. Заметим, что для совместных событий
их сумма является объединением множеств благоприятных исходов, соответствующих событиям A и B.
A
A∩B
B
Рис. 3.1
Поэтому P (A + B) = P (A ∪ B).
Допустим, что события A и B совместны, тогда существуют благоприятные исходы опыта, которые одновременно являются благоприятными как
для A, так и для B (множество этих исходов не закрашено на рисунке 3.1).
Пусть число таких исходов m1 , а число исходов, благоприятных событиям A и B, равно соответственно mA и mB . Тогда в объединении событий
A ∪ B в числе соответствующих благоприятных исходов m дважды учитывается число m1 : первый раз в числе исходов, благоприятных A, а второй
раз в числе исходов, благоприятных B. Следовательно, один раз это число
нужно вычесть из общей суммы:
m = mA + mB − m1 .
Тогда
P (A ∪ B) =
mA + mB − m1
m
m
m
= A + B − 1 = P (A) + P (B) − P (AB).
n
n
n
n
1
Первая точная формулировка этой теоремы была дана Т. Байесом в работе под названием
«Опыт решения задач по теории вероятностей покойного достопочтенного мистера Байеса, члена
Королевского общества. Сообщено мистером Прайсом в письме Джону Кентону 23 декабря 1763 года»
(An Essay towards solving a Problem in the Doctrine of Chanses/ By the late Rev. Mr. Bayes, F.R.S.
communicated by Mr. Price, in Letter to John Canton, A.M. F. R. S. Dec. 23, 1763). Работа была зачитана
на заседании Лондонского королевского общества 27 декабря 1763 года.
Байес Томас (англ. Bayes Reverend Thomas, 1702-1761) − английский математик и пресвитерианский священник, член Лондонского королевского общества (см. Гнеденко Б. В. Курс теории... С. 410,
а также Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRB\T2A\
cyra\T2A\cyrishrt\T2A\cyre\T2A\cyrs,_\T2A\CYRT\T2A\cyro\T2A\cyrm\T2A\cyra\T2A\cyrs (дата
обращения: 12.06.2016), https://en.wikipedia.org/wiki/An_Essay_towards_solving_a_Problem_in_
the_Doctrine_of_Chances (дата обращения: 12.06.2016)).
39
Таким образом, действительно
P (A + B) = P (A) + P (B) − P (AB).
Так как вопрос определения вероятности произведения P (AB) событий
A и B остаётся открытым, то решение задач отложим на некоторое время,
связанное с изучением следующего параграфа.
3.2
Умножение вероятностей событий
Определение 3.1. Вероятность события A при условии, что произошло событие B, называется условной вероятностью события A и
обозначается PB (A).
Замечание 3.1. При определении условной вероятности PB (A) наступления события A предполагается, что перед появлением события A уже
наступило событие B. То есть PB (A) есть вероятность «при условии», в
отличие от вероятности P (A), которую можно назвать «безусловной вероятностью».
Задача 3.3. В урне находятся 6 белых и 4 чёрных шара. Сравните
вероятности следующих событий:
1) событие A − «извлечение из урны белого шара»;
2) событие A1 − «извлечение из урны белого шара после удаления из урны
белого шара» (событие B);
3) событие A2 − «извлечение из урны белого шара после удаления из урны
чёрного шара» (событие C).
Решение.
6
= 0, 6.
1) P (A) =
10
2) Так как из урны извлекли белый шар, то в ней осталось 9 шаров, из
5
которых 5 белых. Поэтому P (A1 ) = PB (A) = ≈ 0, 56.
9
3) Поскольку из урны извлекли чёрный шар, то в ней осталось 9 шаров, из
6
которых 6 белых. Поэтому P (A2 ) = PC (A) = ≈ 0, 67.
9
Таким образом1 , PB (A) < P (A) < PC (A) .
Теорема 3.4. Вероятность произведения двух событий A и B равна произведению вероятности одного события на условную вероятность
второго события, при условии, что первое событие произошло2 . То есть,
P (AB) = P (A)PA (B).
1
То есть, условная вероятность события может быть как больше, так и меньше его безусловной
вероятности.
2
Теорема впервые была доказана А. де Муавром в его «Доктрине шансов» (The Doctrine of Chance:
A method of calculating the probabilities of events in play) в 1718 году.
40
Д о к а з а т е л ь с т в о. Предположим, что всё пространство
элементарных равновозможных исходов опыта Ω состоит из n исходов, из
которых m исходов являются благоприятными для A, а k исходов − благоприятными для произведения событий AB (естественно, что k ≤ m ≤ n).
Следовательно,
m
k
P (A) = , P (AB) = .
n
n
Так как событие A наступило раньше, чем событие B, то из m благоприятных для него исходов можно выделить k исходов, которые являются
благоприятными для события B. А это означает, что
PA (B) =
k
.
m
k
m k
=
· , то P (AB) = P (A)PA (B).
n
n m
Следствие 3.3. Для любых двух событий A и B справедливо равенство
P (A)PA (B) = P (A)PB (A).
Так как
В силу того, что AB = BA, получаем P (AB) = P (BA) = P (B)PB (A).
Задача 3.4. В урне находятся 6 белых и 4 чёрных шара. Какова вероятность вытащить случайным образом два разноцветных шара, если
первый из них − белый.
Решение. Так как первый из вытащенных шаров белый, то событие A −
«вынимание из урны белого шара». Последующее событие B − «вынимание
из урны чёрного шара» − зависит от предыдущего события. Поэтому вероятность события AB − «вынимание из урны двух разноцветных шаров»
− согласно теореме 3.4
P (AB) = P (A)PA (B).
6
3
4
3 4
4
= , а PA (B) = , то P (AB) = · = .
10 5
9
5 9 15
вероятность вытащить два разноцветных шара, из
Таким образом, которых первый является белым, приблизительно
равна 0, 27.
Так как P (A) =
де Муавр Абрахам (фр. и англ. Abraham de Moivre, 1667-1754) − английский математик. Основные
работы в математическом анализе и теории вероятности. Член Лондонского королевского общества,
Парижской и Берлинской академий наук. (см. Гнеденко Б. В. Курс теории... С. 410, а также Википедия
[Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRM\T2A\cyru\T2A\cyra\T2A\
cyrv\T2A\cyrr,_\T2A\CYRA\T2A\cyrb\T2A\cyrr\T2A\cyra\T2A\cyrh\T2A\cyra\T2A\cyrm_\T2A\cyrd\
T2A\cyre (дата обращения: 12.06.2016)).
41
Задача 3.5. Студент пришёл на экзамен, успев выучить только 15
вопросов из 20 вопросов программы. Билет содержал три вопроса программы. Какова вероятность того, что студент вытянул билет, в котором он знает1 ответ на все вопросы?
Решение. Предположим, что событие A − «студент знает ответ на все
три вопроса»; событие A1 − «студент знает ответ на первый вопрос»; событие A2 − «студент знает ответ на второй вопрос»; событие A3 − «студент
знает ответ на третий вопрос». Так как события A1 , A2 и A3 − зависимые,
то событие A = A1 и (A2 /A1 ) и (A3 /A1 A2 ). Найдём вероятности этих
событий:
14
13
15
P (A1 ) = ; PA1 (A2 ) = ; PA1 A2 (A3 ) = .
20
19
18
Следовательно,
P (A) =
15 14 13
91
·
·
⇒ P (A) =
≈ 0, 399.
20 19 18
228
Таким образом,
вероятность вытащить билет со всеми известными вопросами равна 0, 4 .
Замечание 3.2. Заметим, что эту задачу можно было решить, не используя понятие условной вероятности. Общее число вариантов n составления билета из трёх произвольных вопросов не зависит от порядка расположения вопросов в билете. Поэтому n = C203 . Так как в билете все вопросы
оказались знакомыми студенту, то они выбирались из 15. Поэтому m = C153 .
Следовательно,
C153
m
15! · 3! · 17! 15 · 14 · 13
P (A) =
⇒ P (A) = 3 =
=
≈ 0, 399.
n
C20
3! · 12! · 20! 20 · 19 · 18
Задача 3.6. В центральном офисе предприятия 20% работающих получают высокую заработную плату. Также известно, что 40% работающих в офисе − женщины, а 6% работающих − женщины, получающие
высокую заработную плату. Можно ли утверждать, что в офисе существует дискриминация женщин в оплате труда?
Решение. Переформулируем вопрос данной задачи: «Чему равна вероятность того, что случайно выбранный работник является женщиной,
имеющей высокую зарплату?»
Допустим, что событие A − «случайно выбранный работник имеет высокую зарплату», а событие B − «случайно выбранный работник − женщи1
На самом деле за этим знанием стоит та случайность, при помощи которой преподаватель составил
этот билет.
42
на». Тогда событие AB − «случайно выбранный работник является женщиной с высокой заработной платой». С учётом этих обозначений
PB (A) =
0, 06
P (AB)
⇒ PB (A) =
= 0, 15.
P (B)
0, 4
Так как среднее число получающих высокую зарплату 0, 21>0, 15, то
можно утверждать, что
в офисе существует дискриминация женщин в оплате труда .
Определение 3.2. Два события A и B называются независимыми1 , если вероятность каждого из них не зависит от наступления или
ненаступления другого из этих событий.
P (A) = PB (A) = PB (Ā).
P (B) = PA (B) = PA (B̄).
Из данного определения согласно теореме 3.4 следует
Теорема 3.5. Вероятность совместного наступления двух независимых событий A и B равна произведению вероятностей этих событий.
То есть,
P (AB) = P (A)P (B).
Задача 3.7. При страховании жизни для расчетов употребляются
таблицы, которые дают среднее распределение по годам смертных случаев некоторой совокупности лиц одинакового возраста:
Возраст 10
20 30 40 50 60 70 80 90
Число 1000 961 897 823 728 538 380 140 13
(из 1000 детей, достигших 10-летнего возраста, до 90 лет доживают
13).
Пусть в данный момент в некоторой семье мужу 30 лет, а жене − 20.
Найдите вероятность того, что оба будут живы через 50 лет.
Решение. Пусть событие A − «муж жив через 50 лет», а событие B −
«жена жива через 50 лет». Тогда событие AB − «муж и жена живы через
50 лет». Так как события A и B не зависят друг от друга, то согласно
теореме 3.5 P (AB) = P (A)P (B).
Из таблицы следует, что из 897 человек, доживших до 30 лет, 140 дожи140
ли до 80. Поэтому P (A) =
. А так как из 961 человека, дожившего до 20
897
1
Определение независимости событий дано А. де Муавром в вышеуказанной работе (см. сноску на
с. 37).
43
380
140
. Поэтому P (AB) =
·
961
897
380
муж и жена будут живы через 50 лет с вероятностью,
. Таким образом,
приблизительно равной 0, 06.
961
лет, до 70 доживают 380 человек, то P (B) =
Определение 3.3. События называются независимыми в совокупности, если каждое из них и любое произведение остальных являются независимыми друг от друга.
Из данного определения вытекает
Следствие 3.4. События, независимые в совокупности, являются
попарно независимыми событиями.
Обратный факт, очевидно, является неверным. Если первое из событий
не зависит от второго, а второе не зависит от третьего, то это не означает,
что первое и третье события являются независимыми событиями.
Следствие 3.5. Вероятность произведения конечного числа независимых в совокупности событий равна произведению вероятностей этих
событий. То есть,
P (A1 A2 . . . An ) = P (A1 ) · P (A2 ) · . . . P (An ).
3.3
3.3.1
Примеры применения алгебры событий
Связь между вероятностями противоположных событий
Существует большое количество задач, в которых поиск вероятности
«прямого» события A целесообразнее заменить поиском противоположного события Ā, используя следствие 3.2. Из этого следствия вытекают два
взаимосвязанных факта:
P (A) = 1 − P (Ā) и P (Ā) = 1 − P (A).
Рассмотрим следующую задачу:
Задача 3.8. События A1 , A2 , . . . , An , вероятности которых соответственно равны p1 , p2 , . . . , pn , образуют полную группу событий, независимых в совокупности. Найдите вероятность наступления хотя бы
одного события из этой группы.
Решение. Событие A − «наступит хотя бы одно событие из этой группы» можно переформулировать следующим образом: «наступит только одно событие из этой группы» или «наступят два события из этой группы»
или «наступят три события из этой группы» или . . . или «наступят все
события из этой группы одновременно».
44
Определение вероятностей всех этих несовместных между собой событий (а следовательно и их суммы) не представляет проблем в смысле создания алгоритма действий, но вызывает большие сомнения в необходимости
этих действий.
Событие A содержит все исходы пространства элементарных событий Ω,
кроме одного события: «не наступит ни одно из этих событий». Это событие
является противоположным событию A. Так как все события данной группы независимы в совокупности, то согласно определению 3.2 и противоположные им события Ā1 , Ā2 , . . . , Ān также независимы в совокупности.
Событие Ā − «не наступит ни одно из этих событий» − эквивалентно
тому, что наступит событие Ā1 и Ā2 и . . . и Ān . Тогда, согласно следствию
3.5,
P (Ā) = P (Ā1 ) · P (Ā2 ) · . . . P (Ān ).
Так как
P (Ā1 ) = 1 − p1 ; P (Ā2 ) = 1 − p2 ; . . . P (Ān ) = 1 − p1 ,
то
P (Ā) = (1 − p1 )(1 − p2 ) . . . (1 − pn ).
Следовательно, вероятность наступления хотя бы одного события из
этой группы
P (A) = 1 − (1 − p1 )(1 − p2 ) . . . (1 − pn ) .
Замечание 3.3. Следует заметить, что для любого n вероятность события «хотя бы один...» через вероятность противоположного события вычисляется по одному и тому же алгоритму.
Из решения задачи 3.8 вытекает
Следствие 3.6. Если события A1 , A2 , . . . , An имеют одинаковую вероятность, равную p, то вероятность появления хотя бы одного из этих
событий
P (A) = 1 − q n , где q = 1 − p.
Задача 3.9. Вероятность получить справку в одном из трёх отделов солидного государственного учреждения за 10 минут до обеденного
перерыва соответственно равна для первого 0, 3, для второго 0, 5, для
третьего 0, 4. Какова вероятность того, что вы получите справку хотя
бы в одном из этих отделов в указанное время?
Решение. Событие A − «вы получите справку хотя бы в одном из трёх
отделов». Ему противоположным является событие Ā − «вы не получите
справку ни в одном из трёх отделов». Событие Ā является произведением
трёх несовместных событий Ā1 , Ā2 и Ā3 , каждое из которых соответствует
45
тому, что «вы не получите справку соответственно в первом, втором и третьем отделах».
Так как P (A1 ) = 0, 3, P (A2 ) = 0, 5, P (A3 ) = 0, 4, то
P (Ā1 ) = 1−0, 3 = 0, 7, P (Ā2 ) = 1−0, 5 = 0, 5, P (Ā3 ) = 1−0, 4 = 0, 6. Тогда
P (Ā) = 0, 7 · 0, 5 · 0, 6 ⇒ P (Ā) = 0, 21. Поэтому P (A) = 1 − 0, 21 = 0, 79.
Таким образом,
вероятность того, что вы получите справку хотя бы
в одном из этих отделов в указанное время, равна 0, 79.
Задача 3.10. Вероятность безотказности станков первого завода
при включении равна 0,7, второго − 0,8, третьего − 0,75. Включили по
одному станку каждого завода. Какова вероятность того, что работает:
а) только один станок;
б) не более одного станка;
в) хотя бы один станок.
Решение. Определим следующие события: A1 − «работает станок первого завода»; A2 − «работает станок второго завода»; A3 − «работает станок третьего завода». События Ā1 , Ā2 , Ā3 определяют соответственно отказы станков первого, второго и третьего заводов.
а) Пусть событие A − «работает только один станок». Данное событие
можно представить с помощью союзов «и» и «или» следующим образом:
«работает только один станок» = «работает станок первого завода»
и «не работает станок второго завода» и «не работает станок третьего завода» или «не работает станок первого завода» и «работает
станок второго завода» и «не работает станок третьего завода» или
«не работает станок первого завода» и «не работает станок второго
завода» и « работает станок третьего завода»
В краткой форме это выглядит так:
A = A1 и Ā2 и Ā3 или Ā1 и A2 и Ā3 или Ā1 и Ā2 и A3 .
Следовательно,
P (A) = P (A1 ) · P (Ā2 ) · P (Ā3 ) + P (Ā1 ) · P (A2 ) · P (Ā3 ) + P (Ā1 ) · P (Ā2 ) · P (A3 ).
Так как
P (Ā1 ) = 1 − 0, 7 = 0, 3; P (Ā2 ) = 1 − 0, 8 = 0, 2; P̄ (A3 ) = 1 − 0, 75 = 0, 25,
то
P (A) = 0, 7 · 0, 2 · 0, 25 + 0, 3 · 0, 8 · 0, 25 + 0, 3 · 0, 2 · 0, 75 ⇒ P (A) = 0, 14.
б) Пусть событие B − «работает не более одного станка». Это событие можно представить как «работает нуль станков» или «работает один станок».
Так как вероятность события «работает один станок» определена в задании
а), то найдём вероятность события «работает нуль станков». Обозначим
46
это событие B1 . Оно означает, что «не работает станок первого завода» и
«не работает станок второго завода» и «не работает станок третьего
завода».
Поэтому его вероятность
P (B1 ) = P (Ā1 ) · P (Ā2 ) · P (Ā3 ) ⇒ P (B1 ) = 0, 3 · 0, 2 · 0, 25 ⇒ P (B1 ) = 0, 015.
В силу того, что B = A или B1 ,
P (B) = P (A) + P (B1 ) ⇒ P (B) = 0, 14 + 0, 015 = 0, 155 ≈ 0, 16.
в) Допустим, что событие C − «работает только хотя бы один станок». Из
задачи 3.8 следует, что P (C) = 1 − P (C̄), где C̄ − противоположное C
событие − «не работает ни один станок». Так как C̄ совпадает с событием
B1 из задания б), то P (C̄) = P (B1 ) = 0, 015. Поэтому P (C) = 1 − 0, 015 =
0, 985.
a) вероятность, что работает только один станок, равна 0, 14;
б) вероятность, что работает не более одного станка, равна 0, 16;
в) вероятность, что работает хотя бы один станок, равна 0, 99.
3.3.2
Вероятность работы схем теории надёжности
В теории надёжности работа эксплуатируемых систем определяется схемами соединения звеньев системы. При этом основными структурами в любой схеме являются параллельное и последовательное соединение звеньев.
Рассмотрим две основные задачи.
Задача 3.11. Найдите вероятность работы схемы при последовательном соединении двух элементов (рис. 3.2), если даны вероятности
работы каждого элемента.
p1
p2
Рис. 3.2
Решение. Событие R − «схема работает» − эквивалентно событию «Работает первый элемент» (событие R1 ) и «работает второй элемент» (событие R2 ). Поэтому
P (R) = P (R1 )P (R2 ).
Следовательно, вероятность работы схемы равна p1 p2 .
Задача 3.12. Найдите вероятность работы схемы при параллельном соединении двух элементов (рис. 3.3), если даны вероятности работы каждого элемента.
Решение. Событие S − «схема работает» − эквивалентно событию «Работает первый элемент» (событие S1 ) и «не работает второй элемент» (событие S̄2 ) или «не работает первый элемент» (событие S̄1 ) и «работает
47
второй элемент» (событие S2 ) или «работает первый элемент» (событие
S1 ) и « работает второй элемент» (событие S2 ).
p1
p2
Рис. 3.3
В компактном виде это можно записать так:
S = S1 и S̄2 или S̄1 и S2 или S1 и S2 .
Так как событие S является очень громоздким, попробуем рассмотреть
противоположное событие S̄ − «схема не работает».
Событие S̄ − «схема не работает» − эквивалентно произведению двух
независимых событий: «не работает первый элемент» (событие S̄1 ) и «не
работает второй элемент» (событие S̄2 ).
В компактном виде это имеет следующий вид: S̄ = S̄1 и S̄2 .
Следовательно,
P (S̄) = P (S̄1 )P (S̄2 ).
Так как P (S̄1 ) = 1 − p1 , а P (S̄2 ) = 1 − p2 , то вероятность того, что схема
не работает
P (S̄) = (1 − p1 )(1 − p2 ).
Учитывая P (S) = 1 − P (S̄), получаем
вероятность работы схемы равна 1 − (1 − p1 )(1 − p2 ).
Замечание 3.4. Если q1 = 1 − p1 , а q2 = 1 − p2 , то вероятность работы
схемы при параллельном соединении P (S) = 1 − q1 q2 .
Замечание 3.5. Из решений задач 3.11 и 3.12 вытекает, что при последовательном соединении легче найти вероятность того, что схема работает.
При параллельном же соединении проще искать вероятность того, что схема не работает.
Задача 3.13. Найдите вероятность работы схемы (рис. 3.4), если
даны вероятности работы каждого элемента.
Решение. Пусть событие D − «схема работает».
A
C
0, 8
0, 6
B
0, 7
0, 9
0, 6
0, 8
Рис. 3.4
48
Чтобы найти вероятность данного события, представим данную схему в
виде последовательно соединенных блоков A, B, C (рис. 3.5).
A
B
C
Рис. 3.5
Как следует из решения задачи 3.11
P (D) = P (A)P (B)P (C).
(3.1)
Чтобы найти вероятности P (A) и P (C), используем алгоритм задачи
3.12 и найдем вероятности противоположных событий Ā и C̄.
В блоке A вероятности работы элементов p1 = 0, 8, p2 = 0, 7, p3 = 0, 6.
Соответственно вероятности отказа этих элементов q1 = 0, 2, q2 = 0, 3,
q3 = 0, 4.
Следовательно,
P (Ā) = 0, 2 · 0, 3 · 0, 4 = 0, 024 ⇒ P (A) = 1 − 0, 024 = 0, 976.
В блоке C вероятности работы элементов p5 = 0, 6, p6 = 0, 8.
Соответственно, вероятности отказа этих элементов q5 = 0, 4, q2 = 0, 2.
Поэтому,
P (C̄) = 0, 4 · 0, 2 = 0, 08 ⇒ P (A) = 1 − 0, 08 = 0, 92.
Подставляя полученные значения в (3.1), находим
P (D) = 0, 976 · 0, 9 · 0, 92 ⇒ P (D) = 0, 8.
Таким образом, вероятность работы схемы равна 0, 8.
3.4
Формула полной вероятности
Предположим, что события H1 , H2 , . . . , Hn образуют полную группу
несовместных событий, при этом известны вероятности наступления каждого из этих событий: P (H1 ), P (H2 ), . . . , P (Hn ). Далее эти события будем
называть гипотезами. Допустим также, что на фоне только одного из этих
событий наступает интересующее нас событие A, и известны его условные
вероятности PH1 (A), PH2 (A), . . . , PHn (A). Тогда вероятность наступления
этого события определяется в следующей теореме.
Теорема 3.6. (Формула полной вероятности1 ). Вероятность события A, которое может наступить только при условии наступления
1
Формула полной вероятности была впервые сформулирована П. Лапласом в его работе «Опыт
философии теории вероятностей» (A Philosophical Essay on Probabilities) в 1814 году (математики
использовали формулу и до Лапласа, но точной формулировки её дать не могли).
де Лаплас Пьер-Симон, (фр. de Laplace Pierre-Simon, 1749-1827) − маркиз, французский математик,
49
одной из гипотез, образующих полную группу, равна скалярному произведению вектора вероятностей гипотез на вектор условных вероятностей
данного события. То есть,
P (A) = P (H1 )PH1 (A) + P (H2 )PH2 (A) + · · · + P (Hn )PHn (A),
если
P (H1 ) + P (H2 ) + · · · + P (Hn ) = 1.
Или в компактной форме
P (A) =
n
X
P (Hi )PHi (A), если
i=1
n
X
P (Hi ) = 1.
i=1
Д о к а з а т е л ь с т в о. Так как событие A наступает на
фоне только одного из несовместных событий H1 , H2 , . . . , Hn , то его можно
представить в виде
A = H1 A + H2 A + . . . , Hn A.
При этом события H1 A, H2 A, . . . , Hn A также являются несовместными событиями. Поэтому, согласно следствию 3.1,
P (A) = P (H1 A) + P (H2 A) + . . . , P (Hn A).
Для каждого из слагаемых из теоремы 3.4 следует, что
P (H1 A) = P (H1 )PH1 (A); P (H2 A) = P (H2 )PH2 (A); . . .
P (Hn A) = P (Hn )PHn (A).
Следовательно,
P (A) = P (H1 )PH1 (A) + P (H2 )PH2 (A) + · · · + P (Hn )PHn (A).
Задача 3.14. На складе в пяти ящиках лежат детали первого завода, в трёх ящиках − детали второго завода и в двух ящиках − детали
третьего завода. Для деталей первого завода вероятность вытащить
из ящика стандартную деталь равна 0,8. Для деталей второго завода −
0, 7. А для деталей третьего завода − 0, 9. Какова вероятность случайным образом взять одну стандартную деталь на этом складе?
механик, физик и астроном; известен работами в области небесной механики, дифференциальных уравнений, один из создателей теории вероятностей. Иностранный член шести академий наук и королевского общества. (cм. Гнеденко Б. В. Курс теории... С. 411, а также Википедия [Электронный ресурс] : URL:
https://ru.wikipedia.org/wiki/\T2A\CYRL\T2A\cyra\T2A\cyrp\T2A\cyrl\T2A\cyra\T2A\cyrs,_\
T2A\CYRP\T2A\cyrsftsn\T2A\cyre\T2A\cyrr-\T2A\CYRS\T2A\cyri\T2A\cyrm\T2A\cyro\T2A\cyrn,
https://en.wikipedia.org/wiki/Pierre-Simon_Laplace (дата обращения: 12.06.2016)).
50
Решение. Взятая деталь может оказаться деталью одного из трёх заводов. Поэтому существуют три независимые гипотезы: H1 − «деталь изготовлена на первом заводе», H2 − «деталь изготовлена на втором заводе»,
H3 − «деталь изготовлена на третьем заводе». Вероятность взять деталь
первого завода определяется тем, что она может быть в одном из m = 5
5
ящиков при общем количестве ящиков n = 10. Поэтому P (H1 ) =
= 0, 5.
10
2
3
= 0, 3, а P (H3 ) =
= 0, 2. Так как вероятность
Аналогично P (H2 ) =
10
10
того, что взятая из ящика первого завода деталь окажется стандартной,
равна 0, 8, то условная вероятность PH1 (A) = 0, 8. Соответственно
PH2 (A) = 0, 7, а PH3 (A) = 0, 9.
Подставляя эти данные в формулу полной вероятности, имеем:
P (A) = 0, 5 · 0, 8 + 0, 3 · 0, 7 + 0, 2 · 0, 9 ⇒ P (A) = 0, 79.
Таким образом,
вероятность случайным образом взять одну стандартную
деталь на этом складе равна 0, 79.
Замечание 3.6. Следует заметить, что решение подобных задач можно получить, пользуясь только комбинаторными правилами сложения. Из
правил вытекает, что если условие задачи переформулировать для
событий с помощью союзов «и» «или», а затем, взяв вероятности
событий, поставить между ними соответственно знаки умножения и сложения, то получим нужный результат.
Рассмотрим решение последней задачи, пользуясь эти алгоритмом.
Событие «взять стандартную деталь» можно переформулировать так: «подойти к ящикам первого завода» и «взять стандартную деталь первого
завода», или «подойти к ящикам второго завода» и «взять стандартную деталь второго завода», или «подойти к ящикам третьего завода»
и «взять стандартную деталь третьего завода». Далее, используя соответствующие обозначения перепишем этот текст кратко:
A = H1 и (A/H1 ) или H2 и (A/H2 ) или H3 и (A/H3 ).
«Повесим» вероятности на события и расставим соответствующие знаки
умножения и сложения:
P (A) = P (H1 )PH1 (A) + P (H2 )PH2 (A) + P (H3 )PH3 (A).
Таким образом, мы получили формулу полной вероятности в случае трёх
гипотез, используя только русский язык и правила комбинаторики1 .
Задача 3.15. В первой урне 5 белых и 6 чёрных шаров, а во второй
− 4 белых и 8 чёрных. Из первой урны случайным образом вынимают два
1
Можно заметить, что самым сложным в этом решении является переформулировка условия задачи
в виде текста с помощью союзов «и» и «или». Всё остальное происходит автоматически.
51
шара и опускают во вторую урну. После этого из второй урны так же
случайно вынимают 4 шара. Найти вероятность того, что:
а) из второй урны вытащили 4 белых шара;
б) только один шар белый.
Решение. Так как неизвестно какие шары доставали из первой урны,
то существуют три гипотезы:
H1 − «из первой урны достали и положили во вторую два белых шара».
Во второй урне теперь лежат 6 белых и 8 чёрных шаров.
C52
P (H1 ) = 2 ;
C11
H2 − «из первой урны достали и положили во вторую два чёрных шара».
Во второй урне теперь лежат 4 белых и 10 чёрных шаров.
C62
P (H2 ) = 2 .
C11
H3 − «из первой урны достали и положили во вторую разноцветные шары».
Во второй урне теперь лежат 5 белых и 9 чёрных шаров.
C51 · C61
P (H3 ) =
.
C112
а) Пусть событие A − «из второй урны вытащили 4 белых шара». Согласно
формуле полной вероятности 3.6 его вероятность можно представить
P (A) = P (H1 )PH1 (A) + P (H2 )PH2 (A) + P (H3 )PH3 (A).
C44
C54
C64
PH1 (A) = 4 ; PH2 (A) = 4 ; PH3 (A) = 4 .
C14
C14
C14
C52 · C64 + C62 · C44 + C51 · C61 · C54
P (A) =
=
C112 · C144
10 · 15 + 15 · 1 + 5 · 6 · 5
63
=
=
≈ 0, 006.
55 · 11 · 91
11011
б) Событие B − «из второй урны вытащили только один шар белый» означает, что «из второй урны вытащили один белый шар и три чёрных
шара». Согласно формуле полной вероятности 3.6 его вероятность можно
представить
P (B) = P (H1 )PH1 (B) + P (H2 )PH2 (B) + P (H3 )PH3 (B).
PH1 (B) =
C61 · C83
C41 · C103
C51 · C93
;
P
(B)
=
;
P
(B)
=
.
H2
H3
C144
C144
C144
52
C52 · C61 · C83 + C62 · C41 · C103 + C51 · C61 · C51 · C93
=
P (B) =
C112 · C144
10 · 6 · 56 + 15 · 4 · 105 + 5 · 6 · 5 · 84 22260
=
=
≈ 0, 44.
55 · 1001
50055
а) вероятность того, что из второй урны вытащили 4 белых шара,
равна 0, 006;
б) вероятность того, что из второй урны вытащили 4 шара,
из которых один белый, равна 0, 44.
3.5
Формула Байеса
Следствием теорем 3.4 и 3.6 является теорема гипотез или формула
Байеса1 .
Как и в предыдущем параграфе, предположим, что до наступления опыта можно выдвинуть гипотезы H1 , H2 , . . . , Hn , образующие полную группу
несовместных событий. Допустим также, что до проведения опыта известны предполагаемые вероятности2 этих гипотез: P (H1 ), P (H2 ), . . . , P (Hn ),
n
X
P (Hi ) = 1.
для которых
i=1
Теорема 3.7. (Теорема гипотез) Пусть проведен опыт, в котором
заранее известны предполагаемые вероятности гипотез H1 , H2 , . . . , Hn ,
образующих полную группу несовместных событий. Если в результате
опыта произошло событие A, для которого известны условные вероятности PH1 (A), PH2 (A), . . . , PHn (A), то для каждой из гипотез Hi можно
определить условную вероятность PA (Hi ) (i = 1, 2 . . . , n), то есть
∀ i = 1, n PA (Hi ) =
где
P (A) =
n
X
PHi (A)
P (A)
P (Hi )PHi (A), если
i=1
n
X
,
P (Hi ) = 1.
i=1
Д о к а з а т е л ь с т в о. Найдём условную вероятность PH1 (A):
P (AH1 ) = P (A)PA (H1 ) = P (H1 )PH1 (A).
1
Теорема впервые была сформулирована П. Лапласом в упомянутом выше «Опыте философии
теории вероятностей» (см. сноску на с. 46). Лаплас назвал полученную формулу формулой Байеса,
P (AB)
так как в работе Байеса (см. с. 36 в качестве одного из следствий было получено отношение
.
P (A)
В работах Байеса формула появится не могла, так как он не знал формулу полной вероятности (см.
Гнеденко Б. В. Курс теории... С. 411).
2
Такие вероятности называют априорными или теоретическими вероятностями.
53
Далее, отбросим левую часть двойного равенства:
P (A)PA (H1 ) = P (H1 )PH1 (A)
и разделим обе части равенства на P (A) (предполагая, что P (A) 6= 0):
PA (H1 ) =
P (H1 )PH1 (A)
.
P (A)
Затем заменим P (A) с помощью формулы полной вероятности (см. 3.6):
P (H1 )PH1 (A)
PA (H1 ) = P
.
n
P (Hi )PHi (A)
i=1
Так как этот процесс имеет место для любого целого числа i, пробегающего диапазон от 1 до n, то получаем, что
P (Hi )PHi (A)
(i = 1, n).
PA (Hi ) = P
n
P (Hi )PHi (A)
(3.2)
i=1
Формула (3.2) называется формулой Байеса. Она даёт возможность пересчитывать вероятности гипотез1 в свете информации о том, что в изучаемом опыте событие A наступило.
Задача 3.16. При отклонении прибора от нормального режима работы сигнализатор C1 срабатывает с вероятностью 0, 85, а сигнализатор C2 срабатывает с вероятностью 0, 9. Прибор снабжается сигнализаторами C1 или C2 с вероятностью соответственно 0, 6 и 0, 4. Прибор
отклонился от нормального режима. Что вероятнее: прибор снабжён
сигнализатором C1 или C2 ?
Решение. Существует только две гипотезы: H1 − «в приборе установлен сигнализатор C1 » и H2 − «в приборе установлен сигнализатор C2 ».
Эти гипотезы являются независимыми событиями, образующими полную
группу исходов опыта. Предполагаемые заранее вероятности этих гипотез
P (H1 ) = 0, 6 и P (H2 ) = 0, 4. Изучаемым событием является событие A −
«прибор отклонился от нормального режима работы». Для этого события
известны условные вероятности: PH1 (A) = 0, 85 и PH2 (A) = 0, 9. Известно,
что событие A произошло. Требуется найти вероятности событий H1 /A −
«аварийный прибор снабжён сигнализатором C1 » и H2 /A − «аварийный
прибор снабжён сигнализатором C2 . Используя формулу полной вероятности, найдём вероятность того, что «прибор отклонился от нормального
1
Новые условные вероятности гипотез называются апостериорными вероятностями.
54
режима работы».
P (A) = P (H1 )PH1 (A)+P (H2 )PH2 (A) ⇒ P (A) = 0, 6·0, 85+0, 4·0, 9 = 0, 87.
Последовательно применяя формулу Байеса (3.2), получим
PA (H1 ) =
P (H1 )PH1 (A)
0, 6 · 0, 85
⇒ PA (H1 ) =
⇒ PA (H1 ) ≈ 0, 59.
P (A)
0, 87
PA (H2 ) =
P (H2 )PH2 (A)
0, 4 · 0, 9
⇒ PA (H2 ) =
⇒ PA (H2 ) ≈ 0, 41.
P (A)
0, 87
Так как PA (H1 ) > PA (H2 ), то
вероятнее, что прибор снабжён сигнализатором C1 .
Замечание 3.7. Заметим, что до испытания вероятность гипотезы H1
была равна 0, 6, а после опыта вероятность этой гипотезы (точнее условная вероятность) изменилась и стала равна 0, 59. Следовательно, использование формулы Байеса (3.2) позволило переоценить вероятность данной
гипотезы.
Следующая задача1 связана со статистикой, психологией и криминалом.
Задача 3.17. Ночью таксист совершил наезд и скрылся с места проишествия. В городе работают две компании такси, «Зелёная» и «Синяя».
По данным полиции обе компании имеют одинаковое число машин, но
«Зелёные» такси были до этого связаны с 75% происшествий. На месте
происшествия оказался свидетель, который опознал такси как «Синее».
Судебная экспертиза проверила надёжность свидетеля в ночных условиях и установила, что свидетель правильно опознаёт каждый из двух
цветов в 80% случаев и неправильно − в 20% случаев.
Какова вероятность того, что такси, совершившее наезд, было «Синим», а не «Зелёным»?
Решение. Существуют две гипотезы: H1 − «наезд совершило «Зелёное»
такси» и H2 − «наезд совершило «Синее» такси». Эти гипотезы являются
независимыми событиями, образующими полную группу исходов опыта.
Предполагаемые заранее вероятности этих гипотез связаны со статистикой происшествий, ведущейся в полиции: P (H1 ) = 0, 75 и P (H2 ) = 0, 25.
Изучаемым событием является событие A − «свидетель увидел наезд».
Для этого события известны условные вероятности: в случае, если он не
увидел «Зелёное» такси» PH1 (A) = 0, 2, и, если он видел «Синее» такси
PH2 (A) = 0, 8. Известно, что событие A произошло.
Требуется найти вероятность того, что увиденный наезд был совершён
1
См. Канеман Д. Думай медленно... решай быстро. М. : Аст, 2014. С. 220.
55
«Синим» такси, то есть, вероятность события H2 /A.
Используя формулу полной вероятности (теорема 3.6), найдём вероятность того, что «свидетель увидел наезд».
P (A) = P (H1 )PH1 (A)+P (H2 )PH2 (A) ⇒ P (A) = 0, 75·0, 2+0, 25·0, 8 = 0, 35.
Применяя формулу Байеса (3.2), получим
PA (H2 ) =
P (H2 )PH2 (A)
0, 25 · 0, 8
⇒ PA (H2 ) =
⇒ PA (H2 ) ≈ 0, 57.
P (A)
0, 35
Таким образом1 ,
достоверность того, что увиденный наезд был
.
совершён именно «Синим» такси, равна 57%
1
Интересно, читая условия задачи с полицейской статистикой, вы бы поверили, учитывая репутацию
«Зелёной» компании, что наезд могло совершить «Синее» такси? Мораль этой задачи: не надо делать
поспешных выводов.
56
4
Схема Бернулли
Догадкам не место в тех вещах,
где можно достигнуть полной
достоверности.
Первое правило Я. Бернулли
Определение 4.1. Опыт, состоящий из n независмых испытаний, в
каждом из которых событие A наступает с постоянной вероятностью
p, называется схемой независимых испытаний с двумя исходами
или схемой Бернулли.
Целью опыта является определение вероятности того, что событие
A наступит k раз.
Замечание 4.1. Так как вероятность наступления события A в каждом из испытаний равна p, то вероятность ненаступления данного события
в каждом испытании равна q = 1 − p, а значит, является величиной постоянной. Можно также заметить, что наступление события A k раз в n
независимых испытаниях эквивалентно ненаступлению этого события n−k
раз.
4.1
Формула Бернулли
Теорема 4.1. Пусть в схеме из n независимых испытаний событие A
наступает в каждом из них с постоянной вероятностью p. Тогда вероятность того, что событие A наступит k раз, определяется формулой
Pn (k) = Cnk pk q n−k , где q = 1 − p.
(4.1)
Д о к а з а т е л ь с т в о. Рассмотрим ситуацию, в которой интересующее нас событие A в серии из n независимых испытаний наступает
k раз и не наступает n − k раз. Поскольку порядок в тех испытаниях, в
которых событие A происходит или не происходит, не играет роли, то мы
имеем дело с сочетаниями. Очевидно, что число таких ситуаций равно Cnk .
С точки зрения вероятностей все эти ситуации одинаковы, так как каждая из них наступает с вероятностью pk q n−k .
Поскольку все ситуации несовместны, то по теореме сложения вероятностей несовместных событий (cм. следствие 3.1) вероятность суммы
всех подобных ситуаций равна сумме вероятностей этих ситуаций.
Но так как вероятности-слагаемые равны между собой, то определяемая
вероятность равна произведению числа ситуаций Cnk на вероятность одной
ситуации pk q n−k .
57
В итоге, имеем Pn (k) = Cnk pk q n−k . Что и требовалось доказать.
Эта формула называется формулой Бернулли1 .
Задача 4.1. Тест состоит из 10 вопросов и включает 4 варианта ответа на каждый вопрос. Один из ответов является верным, а остальные
− нет. Какова вероятность случайно дать правильный ответ:
а) на один вопрос;
б) на два вопроса;
в) на три вопроса;
г) не более, чем на два вопроса;
д) менее, чем на два вопроса;
е) более, чем на два вопроса;
ж) не менее, чем на два вопроса?
Решение. Так как вероятность ответа на каждый из вопросов является
постоянной для этого теста, и ответ на каждый из вопросов не зависит от
ответов на другие вопросы, то решение данной задачи связано с формулой
Бернулли (4.1).
Вероятность правильного ответа на один вопрос p = 0, 25, соответственно вероятность не ответить на вопрос q = 0, 75. Эти числа, а также общее
число вопросов n = 10, являются для всех подвопросов задачи постоянными величинами.
а) Здесь k = 1, поэтому согласно формуле Бернулли (4.1) имеем
1
P10 (1) = C10
· (0, 25)1 · (0, 75)10−1 ⇒
⇒ P10 (1) = 10 · 0, 25 · (0, 75)9 ⇒ P10 (1) ≈ 0, 188.
б) Здесь k = 2, поэтому
2
P10 (2) = C10
· (0, 25)2 · (0, 75)10−2 ⇒
9 · 10
⇒ P10 (2) =
· (0, 25)2 · (0, 75)8 ⇒ P10 (1) ≈ 0, 282.
2
в) Здесь k = 3, поэтому
3
P10 (3) = C10
· (0, 25)3 · (0, 75)10−3 ⇒
8 · 9 · 10
· (0, 25)3 · (0, 75)7 ⇒ P10 (1) ≈ 0, 25.
⇒ P10 (3) =
2·3
г) Ответить на не более, чем два вопроса, это означает ответить на 0 вопросов, или ответить на 1 вопрос или ответить на 2 вопроса. Поэтому
P10 (k ≤ 2) = P10 (0) + P10 (1) + P10 (2).
1
Формула была получена Я. Бернулли в его работе «Искусство предположений» (лат. Ars
conjectandi). Сама работа была опубликована в 1713 году (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRI\T2A\cyrs\T2A\cyrt\T2A\cyro\T2A\cyrr\T2A\cyri\T2A\
cyrya_\T2A\cyrt\T2A\cyre\T2A\cyro\T2A\cyrr\T2A\cyri\T2A\cyri_\T2A\cyrv\T2A\cyre\T2A\cyrr\
T2A\cyro\T2A\cyrya\T2A\cyrt\T2A\cyrn\T2A\cyro\T2A\cyrs\T2A\cyrt\T2A\cyre\T2A\cyrishrt
(дата обращения: 12.06.2016)).
58
0
Вычислим P10 (0) = C10
· (0, 25)0 · (0, 75)10−0 ⇒
⇒ P10 (0) = 1 · (0, 25)0 · (0, 75)10 ⇒ P10 (0) ≈ 0, 056.
Подставляя найденное число, а также результаты, полученные в а) и б),
имеем
⇒ P10 (k ≤ 2) = 0, 056 + 0, 188 + 0, 282 ⇒ P10 (k ≤ 2) ≈ 0, 526.
д) Ответить менее, чем на два вопроса, это означает ответить на 0 вопросов, или ответить на 1 вопрос. Поэтому
P10 (k < 2) = P10 (0) + P10 (1).
Подставляя результаты, полученные в г) и а), имеем
⇒ P10 (k < 2) = 0, 056 + 0, 188 ⇒ P10 (k < 2) ≈ 0, 244.
е) Ответить более, чем на два вопроса, это означает ответить на 3 вопроса,
или ответить на 4 вопроса, или ответить на 5 вопросов, и так далее, пока
не ответишь на все 10 вопросов.
Естественно, решать таким способом задачу затруднительно, поэтому
нужно определить событие, противоположное данному.
Так как
P10 (k > 2) + P10 (k ≤ 2) = 1, то P10 (k > 2) = 1 − P10 (k ≤ 2).
Учитывая результат, полученный в пункте г), получаем
P10 (k > 2) = 1 − 0, 526 ⇒ P10 (k > 2) ≈ 0, 474.
ж) Аналогично можно ответить и на данный вопрос. Имеем
P10 (k ≥ 2) + P10 (k < 2) = 1.
Поэтому
P10 (k ≥ 2) = 1 − P10 (k < 2).
Подставляя результат, полученный в пункте д), находим
P10 (k ≥ 2) = 1 − 0, 244 ⇒ P10 (k > 2) ≈ 0, 756.
4.2
Формула Пуассона
Теорема 4.2. Пусть в схеме n независимых испытаний событие A наступает в каждом из них с вероятностью p, где n → ∞, а p → 0 таким
образом, что произведение λ = np является постоянным числом. Тогда
вероятность того, что событие A наступит k раз
P (k) = lim
n→∞
λk
k!
e−λ .
Д о к а з а т е л ь с т в о. Предположим, что n конечное число, а
событие A в серии независимых испытаний наступило k раз. Поэтому мы
59
можем применить формулу Бернулли (4.1).
Pn (k) = Cnk pk q n−k
(q = 1 − p).
Преобразуем сомножители правой части.
k
λ
λ
λk
k
Так как λ = np, то p = ⇒ p =
= k.
n
n
n
n−k n −k
λ
λ
λ
Следовательно, q k = 1 −
= 1−
1−
.
n
n
n
n!
Далее, преобразуем первый сомножитель Cnk =
, точнее, завиk!(n − k)!
сящие от n элементы числителя и знаменателя:
n(n − 1)(n − 2) . . . (n − (k − 1))(n − k)(n − k + 1) . . . 2 · 1
n!
=
=
(n − k)!
(n − k)(n − k + 1) . . . 2 · 1
= n(n − 1)(n − 2) . . . (n − (k − 1)).
После этих преобразований
n −k
λk n(n − 1)(n − 2) . . . (n − (k − 1))
λ
λ
Pn (k) =
· 1−
1−
·
.
k!
nk
n
n
Выпишем вторую дробь-сомножитель представления Pn (k) и почленно
поделим каждый сомножитель числителя на n:
n − (k − 1)
n(n − 1)(n − 2) . . . (n − (k − 1)) n n − 1 n − 2
=
·
·
.
.
.
=
nk
n
n
n
n
1
2
k−1
=1· 1−
· 1−
··· 1 −
.
n
n
n
Возвращая новое произведение вместо дроби, имеем
n −k
λk
1
2
k−1
λ
λ
Pn (k) =
· 1−
· 1−
··· 1 −
· 1−
1−
.
k!
n
n
n
n
n
Далее, заставив n стремиться к бесконечности1 , найдём lim Pn (k), учиn→∞
тывая при этом, что константу можно вынести за знак предела:
n −k
λk
1
2
k−1
λ
λ
lim Pn (k) =
· lim 1 −
· 1−
··· 1 −
· 1−
1−
.
n→∞
k! n→∞
n
n
n
n
n
Предполагая, что предел каждого сомножителя является конечным, используем тот факт, что предел произведения равен произведению пределов:
n −k
1
2
k−1
λ
λ
lim 1 −
· 1−
··· 1 −
· 1−
1−
=
n→∞
n
n
n
n
n
1
Так как при этом λ остаётся постоянным, то p → 0.
60
= lim
n→∞
n
−k
1
2
k−1
λ
λ
1−
· lim 1 −
. . . lim 1 −
· lim 1 −
· lim 1 −
.
n→∞
n→∞
n→∞
n n→∞
n
n
n
n
Очевидно, что первые k − 1 и последний пределы равны единице.
n
λ
Что же касается предела lim 1 −
, то он связан с неопределённостью
n→∞
n
типа (1)∞ , то есть, со вторым «замечательным» пределом
n
1
lim 1 +
= e.
n→∞
n
Поэтому, учитывая свойства показательных выражений, а также предела
от непрерывной функции, имеем
n
n
−λ
− nλ !−λ
·(−λ)
λ
λ
λ
= lim 1 −
= e−λ .
= lim 1 −
lim 1 −
n→∞
n→∞
n→∞
n
n
n
λk −λ
Таким образом, действительно lim Pn (k) = e .
n→∞
k!
В практических расчётах используют приближённую формулу, которая
называется формулой Пуассона1 :
λk −λ
∼
e .
Pn (k) =
k!
(4.2)
Замечание 4.2. В силу малости p формулу Пуассона (4.2) иногда называют формулой редких событий.
На практике установлено, что формулу целесообразно применять при
выполнении условий: p < 0, 1 и λ < 9 (или pqn ≤ 10).
Задача 4.2. Завод отправил на базу 5000 доброкачественных изделий.
Вероятность того, что в пути изделие повредится, равно 0,0002. Найдите вероятность того, что на базу прибудут 3 негодных изделия.
Решение. В данной задаче повреждение одного изделия не зависит
от повреждения другого изделия. А так как для каждого изделия вероятность повреждения p = 0, 0002 не меняется, то эта задача решается по
схеме независимых испытаний. Но ввиду того, что 0, 0002 < 0, 1, а n = 5000
достаточно большое число, решение этой задачи по формуле Бернулли (4.1)
1
Формула была получена Д. Пуассоном в его мемуаре «Исследования о вероятностях приговоров
в уголовных и гражданских делах» (Recherches sur la probabilite des jugements en matiere criminelle et
en matiere civile), опубликованном в 1837 году (cм. Гнеденко Б. В. Из истории науки о случайном. М.
: Знание, 1981. С. 42).
Пуассон Дени Симеон (фр. Siméon Denis Poisson, 1781-1840) − французский математик, механик
и физик (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRP\
T2A\cyru\T2A\cyra\T2A\cyrs\T2A\cyrs\T2A\cyro\T2A\cyrn,_\T2A\CYRS\T2A\cyri\T2A\cyrm\T2A\
cyre\T2A\cyro\T2A\cyrn_\T2A\CYRD\T2A\cyre\T2A\cyrn\T2A\cyri (дата обращения: 12.06.2016)).
61
не представляется возможным.
Поэтому можно попробовать, найти приближённое решение. Для этого
по формуле λ = np вычислим λ = 5000 · 0, 0002 ⇒ λ = 1.
Так как λ < 10, то условие задачи удовлетворяет формуле Пуассона (4.1).
13 · e−1
1
P5000 (3) ≈
⇒ P5000 (3) ≈
⇒ P5000 (3) ≈ 0, 06.
3!
6e
Задача 4.3. В работе службы скорой помощи районного центра происходит три вызова в час. Определите вероятность
а) хотя бы одного вызова за один час;
б) пяти вызовов за 2 часа.
Решение. Поскольку потенциальных клиентов1 у службы скорой помощи в районе неизмеримо больше, чем реальных клиентов, то вероятность k
вызовов вычисляется по формуле Пуассона (4.2), в которой λ − показатель
интенсивности: показывает число вызовов в час.
Поскольку определить буквально вероятность «хотя бы одного вызова»
невозможно, то найдём вероятность противоположного события: «нуль вызовов в час». То есть, имеем λ = 3, k = 0. Поэтому
30 · e−3
1
P (0) ≈
⇒ P (0) ≈ 3 ⇒ P (0) ≈ 0, 0498.
0!
e
Следовательно, вероятность искомого события определяется
P = 1 − P (0) ⇒ P = 1 − 0, 0498 ⇒ P = 0, 9502.
б) Эта задача связана с так называемым простейшим потоком событий, который вычисляется по изменённой формуле Пуассона:
(λt)k −(λt)
∼
Pn (k, t) =
e
.
k!
(4.3)
В нашем случае λ = 3, t = 2, k = 5. Поэтому
(3 · 2)5 −3·2
65
·e
⇒ P (5, 2) ≈
· e−6 ⇒ P (5, 2) ≈ 0, 1606.
P (5, 2) ≈
5!
120
Задача 4.4. В городке 1000 домов, каждый из которых застрахован
от пожара в некоторой страховой компании на сумму 1000000 рублей.
Страховой взнос за год составляет 2000 рублей. Для данного городка вероятность пожара в течение года оценивается в 0,003. Какова вероятность того, что в течение года страховая компания потерпит убытки?
Решение. Страховая компания собирает в городке со всех домов общий
взнос в 2000000 рублей. Следовательно, если сгорят за год не менее, чем
три дома, то компания потерпит убытки.
Вычислим параметр λ = 1000 · 0, 0003 ⇒ λ = 3. Так λ = 3 < 10,
1
К сожалению.
62
p = 0, 003 < 0, 1, а n = 1000 достаточно большое число, то можно применить изменённую формулу Пуассона (4.3).
Прежде, чем ответить на главный вопрос, вычислим предварительно
вероятности менее печальных событий: «не сгорит ни один дом», «сгорит
один дом», «сгорят два дома».
30 · e−3
1
P1000 (0) ≈
⇒ P (0) ≈ 3 ⇒ P (0) ≈ 0, 0498.
0!
e
1
−3
3 ·e
3
P1000 (1) ≈
⇒ P (0) ≈ 3 ⇒ P (0) ≈ 0, 1494.
1!
e
2
−3
3 ·e
9
P1000 (2) ≈
⇒ P (0) ≈ 3 ⇒ P (0) ≈ 0, 2241.
2!
2e
Зная эти вероятности, найдём вероятность события, противоположного
искомому: Ā =«сгорят менее трёх домов».
P (Ā) = 0, 0498 + 0, 1494 + 0, 2241 ⇒ P (Ā) = 0, 4233.
Если событие Ā =«сгорят не менее чем три дома», то так как
P (A) + P (Ā) = 1,
имеем P (A) = 1 − 0, 4233 ⇒ P (Ā) = 0, 5767.
вероятность того, что страховая компания в течение
Таким образом, года потерпит убытки, составляет 0, 5767.
4.3
Локальная и интегральная теоремы Лапласа
Если же при достаточно большом n условия формулы Пуассона (4.2) не
выполняются, следует обратиться к локальной теореме Муавра-Лапласа.
Для её формулировки понадобится следующее
Определение 4.2. Функция
x2
1 −2
ϕ(x) = √ e
.
2π
называется функцией Гаусса1 .
Функцию Гаусса в табличном виде можно найти во всех справочниках и
учебниках, имеющих отношение к теории вероятностей и математической
1
Гаусс Иоганн Карл Фридрих (нем. Gauβ Johann Carl Friedrich, 1777−1855, Гёттинген) −
немецкий математик, механик, физик, астроном и геодезист. Один из величайших математиков
всех времён, «король математиков Европы». Иностранный член Шведской и Российской Академий
наук, и английского Королевского общества. (см. Википедия [Электронный ресурс] : URL : https:
//ru.wikipedia.org/wiki/\T2A\CYRG\T2A\cyra\T2A\cyru\T2A\cyrs\T2A\cyrs,_\T2A\CYRK\T2A\
cyra\T2A\cyrr\T2A\cyrl_\T2A\CYRF\T2A\cyrr\T2A\cyri\T2A\cyrd\T2A\cyrr\T2A\cyri\T2A\cyrh
(дата обращения: 12.06.2016)).
63
статистике1 . Но для того, чтобы пользоваться её таблицей, нужно знать
следующие
Свойства функции Гаусса
1. Функция является чётной, то есть
ϕ(−x) = ϕ(x)
(4.4)
x → ∞, то ϕ(x) → 0.
(4.5)
2. Если2
Теорема 4.3. Локальная теорема Муавра-Лапласа3 . Если в схеме
n независимых испытаний событие A наступает в каждом из них с вероятностью p, где 0 < p < 1, а n → ∞, то вероятность того, что
событие A наступит k раз
P (k) = lim √
n→∞
k − np
ϕ(x), где x = √
.
npq
npq
1
(Здесь, как и ранее, q = 1 − p.) В практических расчётах используют
приближённую формулу, которая называется локальной формулой Лапласа:
k − np
1
ϕ(x), где x = √
(q = 1 − p).
(4.6)
Pn (k) ∼
= √
npq
npq
Замечание 4.3. Следует заметить, что чем ближе значения вероятностей p и q к 0, 5, тем точнее формула. А при p, близких к 0 или 1 локальная
формула Муавра-Лапласа (4.6) даёт большую погрешность, если сравнивать с результатами, полученным с помощью формулы Бернулли (4.1).
Являясь «конкурентом» формулы Пуассона (4.2), локальная формула
применяется обычно при npq > 10.
Задача 4.5. В честь праздника состоялся массовый забег на дистанцию 10 км. В забеге приняли участие 250 человек. Обычно в забегах такого типа из каждых десяти участников 8 доходят до финиша. Какова
вероятность того, что до финиша добежали 200 человек?
Решение. Так как вероятность добежать до финиша для каждого участника есть число постоянное, то перед нами схема Бернулли (см. определение 4.1) при большом числе испытаний. В силу того, что p = 0, 8 > 0, 1,
1
В частности, её можно найти в прил. 1.
Как видно из таблицы значений функции Гаусса, при x ≥ 4 ϕ(x) практически равна нулю.
3
Впервые теорема была опубликована А. де Муавром в работе «Аналитические этюды» (Miscellanea
Analytica) в 1730 году. В 1812 году П. Лаплас, обобщив результат Муавра, опубликовал теорему в
«Аналитической теории вероятностей» (Theorie analytique des probabilites) (см. Майстров Л. И. Теория вероятностей. Исторический очерк. М. : Наука, 1967. С. 174, Гнеденко Б. В. Из истории науки... С. 34, Википедия [Электронный ресурс] : URL : https://en.wikipedia.org/wiki/De_Moivre\
T2A\textendashLaplace_theorem (дата обращения: 12.06.2016)).
2
64
вероятность можно вычислить с помощью локальной формулы МуавраЛапласа (4.6).
Определим q = 1 − 0, 8 ⇒ q = 0, 2. По условию n = 250, а k = 200.
200 − 250 · 0, 8
Следовательно, аргумент функции Гаусса x = √
⇒ x = 0.
250 · 0, 8 · 0, 2
Из таблицы значений функции Гаусса (прил. 1) или с помощью калькулятора находим ϕ(0) = 0, 3989.
1
· 0, 3989 ⇒ P250 (200) ≈ 0, 063.
Таким образом, P250 (200) ≈ √
250 · 0, 8 · 0, 2
Поэтому,
вероятность того, что 200 человек добежали до финиша,
равна 0, 063.
Далее возникает вопрос, как определять вероятность того, что в схеме
независимых испытаний событие A наступает k раз, при этом значения
k ∈ [k1 ; k2 ]?
Если n не велико, а число значений, попавших в диапазон мало, то,
используя несовместность событий «k = k1 », «k = k1 + 1», ..., «k = k2 »,
можно там, где применимы формулы Бернулли (4.1) и Пуассона (4.2), воспользоваться ими.
Там же, где это невозможно, обращаются к интегральной теореме Лапласа. Прежде, чем её сформулировать, рассмотрим следующее
Определение 4.3. Функция
1
Φ(x) = √
2π
Zx
t2
e− 2 dt
0
называется интегральной функцией Лапласа.
Точно так же, как и функцию Гаусса, интегральную функцию Лапласа
можно найти в табличном виде во всех справочниках и учебниках, имеющих отношение к теории вероятностей и математической статистике1 . Но
для того, чтобы пользоваться таблицей функции, нужно знать следующие
Свойства интегральной функции Лапласа
1. Функция является нечётной, то есть
Φ(−x) = −Φ(x)
(4.7)
x → ∞, то Φ(x) → 0, 5.
(4.8)
2. Если2
1
В частности, её можно найти в прил. 2.
Как видно из таблицы значений интегральной функции Лапласа, при x ≥ 4 Φ(x) практически
равна 0, 5.
2
65
Теорема 4.4. Интегральная теорема Лапласа1 . Если в схеме n
независимых испытаний событие A наступает в каждом из них с вероятностью p, где 0 < p < 1, а n → ∞, то вероятность того, что событие
A наступит от k1 до k2 раз
k1 − np
k2 − np
P (k1 ; k2 ) = lim (Φ(x2 ) − Φ(x1 )), где x1 = √
, x2 = √
.
n→∞
npq
npq
(Здесь, как и ранее, q = 1 − p.)
На практике используют приближённую формулу:
k1 − np
k2 − np
Pn (k1 ; k2 ) = Φ(x2 ) − Φ(x1 ), где x1 = √
, x2 = √
,
npq
npq
(4.9)
(q = 1 − p).
Задача 4.6. В условиях задачи 4.5 определите вероятность того,
что до финиша добежали от 180 до 210 человек.
Решение. Как и задача 4.5, эта задача посвящена схеме Бернулли (см.
определение 4.1). Правда, воспользоваться локальной формулой МуавраЛапласа (4.6), находя для каждого k от 180 до 210 вероятность, проблематично. Поэтому воспользуемся интегральной формулой Лапласа (4.9).
Зная, что n = 250; p = 0, 8; q = 0, 2; k1 = 180, а k2 = 210, вычислим соответствующие значения аргумента для интегральной функции Лапласа.
180 − 250 · 0, 8
−20
x1 = √
⇒ x1 =
⇒ x1 = −3, 162;
6, 3246
250 · 0, 8 · 0, 2
10
210 − 250 · 0, 8
⇒ x2 =
⇒ x2 = 1, 581.
x2 = √
6, 3246
250 · 0, 8 · 0, 2
Подставляя найденные значения аргумента в формулу (4.9), воспользуемся таблицей значений интегральной функции Лапласа (прил. 2):
Φ(1, 1581)−Φ(−3, 162) = Φ(1, 1581)+Φ(3, 162) = 0, 3761+0, 4993 = 0, 8754.
Следовательно,
вероятность того, что до финиша добежали от 180 до 210
человек, равна 0, 8754.
Задача 4.7. Театр, вмещающий 800 человек, имеет два разных входа, каждым из которых может воспользоваться любой зритель с одинаковой вероятностью. Около каждого входа есть свой гардероб. Сколько
мест должен иметь гардероб театра, чтобы в дни аншлага с вероятностью 0,9 любой зритель имел возможность сдать свои вещи в тот
1
Теорема носит имя П. Лапласа, хотя первым её сформулировал А. де Муавр в работе «Аналитические этюды». П. Лаплас, уточнив интегральную теорему Муавра с целью выяснения величины
ошибки при её практическом использовании, опубликовал теорему в «Аналитической теории вероятностей» (см. Гнеденко Б. В. Из истории науки... С. 34).
66
гардероб, который находится при том входе, в который он вошёл в театр?
Решение. Так как общее число независимых испытаний в данном случае совпадает с числом зрителей, то n = 800.
Поскольку число входов равно двум, а в каждый из них любой из зрителей может войти с одной и той же вероятностью, то p = 0, 5. Поэтому
q = 0, 5.
Очевидно, что число зрителей, которые могут посетить театр, колеблется в диапазоне от k1 до k2 , где k1 − наименьшее число зрителей, пришедших
в один из дней в театр, а k2 − наибольшее число зрителей, посетивших театр в какой-либо из дней.
Оценивая ситуацию реально, можно предположить, что k1 = 0. Задача
состоит в том, чтобы найти k2 .
Воспользуемся приближённой формулой (4.9).
В нашем случае
np = 800 · 0, 5 ⇒ np = 400,
а
p
√
√
√
√
npq = 400 · 0, 5 ⇒ npq = 200 ⇒ npq ≈ 14, 14.
Подставим все данные в формулу
0 − 400
k2 − 400
−Φ
.
P800 (0; k2 ) = Φ
14, 14
14, 14
Из условия задачи
P800 (0; k2 ) = 0, 9,
получаем уравнение
k2 − 400
0 − 400
Φ
−Φ
= 0, 9.
14, 14
14, 14
Так как
0 − 400
Φ
= Φ(−28, 29),
14, 14
то, учитывая нечётность интегральной функции Лапласа, из таблицы ёе
значений (прил. 2) находим
Φ(28, 29) = 0, 5.
Подставляя это значение в составленное уравнение
k2 − 400
Φ
− (−0, 5) = 0, 9,
14, 14
Получаем новое уравнение
k2 − 400
Φ
= 0, 4.
14, 14
Из таблицы значений интегральной функции Лапласа (прил. 2), зная зна67
чение функции в точке x
Φ(x) = 0, 4,
найдём соответствующее значение1
x = 1, 28.
Следовательно,
k2 − 400
= 1, 28.
14, 14
Тогда
k2 = 1, 28 · 14, 4 + 400 ⇒ k2 = 418, 1.
Таким образом. можно сделать вывод о том, что
в гардеробе должно быть примерно 419 мест.
4.4
Вероятность отклонения относительной частоты события
от постоянной вероятности в независимых испытаниях
Теорема 4.5. Если в схеме n независимых испытаний событие A наm
ступает в каждом из них с вероятностью p, где 0 < p < 1, а
−
n
относительная частота события A, то для любого заданного числа ε > 0
r n
m
P
−p <ε ∼
.
= 2Φ ε
n
pq
(Здесь, как и ранее, q = 1 − p.)
Д о к а з а т е л ь с т в о. Преобразуем неравенство
m
− p < ε,
n
«подогнав» его под условия интегральной теоремы Лапласа (см. 4.4).
Раскрывая модуль, получим двойное неравенство
m
−ε <
− p < ε,
n
Затем, умножим все части неравенства на n:
−εn < m − np < εn.
√
Далее, разделим все части неравенства на npq:
εn
m − np
εn
−√
< √
<√
.
npq
npq
npq
Сократив числитель и знаменатель левой и правой дробей на
1
√
n:
На самом деле Φ(1, 28) = 0, 3997, но различие в 0, 0003 незначительно, поэтому им можно пренебречь.
68
√
√
ε n
ε n m − np
<√
,
−√ < √
pq
npq
npq
введём обозначения:
√
√
ε n
ε n
x1 = − √ ; x2 = √ .
pq
pq
√
√ √ r √ ε n m − np ε n
ε n
ε n
n
P −√ ≤ √
≤ √
=Φ √
− Φ −√
= 2Φ ε
.
pq
npq
pq
pq
pq
pq
Что и требовалось доказать.
Задача 4.8. Вероятность появления события в каждом из независимых испытаний равна 0,5. Сколько нужно провести испытаний n, чтобы
с вероятностью γ = 0, 7698 можно было ожидать, что относительная
частота появления события ε отклонится от его вероятности по абсолютной величине не более чем на 0,02.
Решение. Согласно условию задачи p = 0, 5, q = 0, 5. То есть, мы имеем дело со схемой Бернулли (см. определение 4.1).
Согласно теореме 4.5
r m
n
− p < ε ≈ 2Φ ε
.
P
n
pq
r n
По условию задачи ε = 0, 02, p = q = 0, 5, а 2Φ ε
= 0, 7698.
pq
√ r
n
n
0, 7698
То есть, Φ 0, 02 ·
=
⇒ Φ 0, 02 ·
= 0, 3849.
0, 5 · 0, 5
2
0, 5
Согласно таблицам интегральной функции Лапласа (прил. 2)
Φ(x) = 0, 3849, если x = 1, 2.
Таким образом,
√
√
√
√
n
1, 2 √
= 1, 2 ⇒ 2 n =
0, 02 ·
n ⇒ 2 n = 60 ⇒ n = 30 ⇒ n = 900.
0, 5
0, 02
для выполнения условий задачи нужно провести 900
испытаний.
Задача 4.9. Вероятность выхода устройства из строя во время
проведения эксперимента, целью которого является определение надежности устройства в работе, равна 0,2. Было проверено 625 устройств.
Чему равна вероятность, того, что абсолютная величина отклонения
относительной частоты выхода из строя устройств от вероятности
p=0,2 не превысит 0,02?
Решение. По условию задачи n = 625, p = 0, 2, ε = 0, 02.
Так как q = 1 − p, то q = 0, 8. Тогда аргумент интегральной функции
Следовательно,
69
Лапласа в теореме 4.5
r
r
r
r
25
n
625
n
n
= 0, 02 ·
⇒ε
= 0, 02 ·
⇒ε
= 1, 25.
ε
pq
0, 2 · 0, 8
pq
0, 4
pq
Из таблиц интегральной функции Лапласа (прил. 2) следует, что
Φ(1, 25) = 0, 3944.
Поэтому,
m искомая вероятность
m
P
− 0, 2 < 0, 02 ≈ 2 · 0, 3944 ⇒ P
− 0, 2 < 0, 02 ≈ 0, 7888.
625
625
вероятность, того, что абсолютная величина отклонения относительной частоты выхода из строя устройств
В итоге имеем, что
от вероятности p=0,2 не превысит 0,02 приблизительно равна 0,7888.
4.5
Наивероятнейшее число наступлений события
в схеме независимых испытаний
Пусть в схеме n независимых испытаний событие A наступает в каждом
из них с постоянной вероятностью p. Тогда имеет место следующее
Определение 4.4. Число k называется наивероятнейшим числом
наступления события A в схеме независимых испытаний, если вероятность того, что событие A наступит k раз, не меньше вероятности
остальных возможных исходов опыта.
Теорема 4.6. Пусть в схеме n независимых испытаний событие A
наступает в каждом из них с вероятностью p. Тогда для наивероятнейшего числа k наступлений события A справедливо двойное неравенство:
np − q ≤ k ≤ np + p (q = 1 − p).
(4.10)
Д о к а з а т е л ь с т в о. Предположим, что k − наивероятнейшее
число в схеме Бернулли (см. определение 4.1) при общем числе испытаний
n. Тогда, согласно определению 4.4, k удовлетворяет следующей системе
неравенств:
(
Pn (k) ≥ Pn (k − 1),
Pn (k) ≥ Pn (k + 1).
Согласно формуле Бернулли (4.1) имеем
n!
pk q n−k ;
Pn (k) =
k!(n − k)!
n!
Pn (k − 1) =
pk−1 q n−k+1 ;
(k − 1)!(n − k + 1)!
70
n!
pk+1 q n−k−1 ;
(k + 1)!(n − k − 1)!
Подставляя данные представления в систему, получаем

n!
n!
k n−k


≥
pk−1 q n−k+1 ,
 k!(n − k)! p q
(k − 1)!(n − k + 1)!
n!
n!



pk q n−k ≥
pk+1 q n−k−1 .
k!(n − k)!
(k + 1)!(n − k − 1)!
Сократив обе части первого неравенства системы на
n!
pk−1 q n−k ,
(k − 1)!(n − k)!
получим
p
q
≥
.
k
n−k+1
Далее, подставляя q = 1 − p и домножая обе части неравенства на
k(n − k + 1),
имеем
(n − k + 1)p ≥ k(1 − p) ⇒ np − pk + p ≥ k − pk.
В результате, после приведения подобных получаем, что
k ≤ np + p.
Проделаем аналогичные действия со вторым неравенством системы.
Для этого сократим обе части второго неравенства системы на
n!
pk q n−k−1 ,
k!(n − k − 1)!
и получим
q
p
≥
.
n−k
k+1
Далее, домножая обе части неравенства на
Pn (k + 1) =
(n − k)(k + 1),
имеем
q(k + 1)p ≥ p(n − k) ⇒ qk + pk ≥ pn − pk.
Прибавляя к обеим частям неравенства pk и вычитая q, получим
qk + pk ≥ pn − q ⇒ (p + q)k ≥ pn − q.
Так как p + q = 1, то в итоге имеем
k ≥ pn − q.
Таким образом, действительно имеет место двойное неравенство
np − q ≤ k ≤ np + p.
71
Задача 4.10. В результате каждого визита страхового агента договор заключается с вероятностью 0,1. Найти наивероятнейшее число
заключенных договоров после 25 визитов.
Решение. По условию задачи n = 25, p = 0, 1. Тогда q = 1 − 0, 1, то
есть, q = 0, 9.
Согласно теореме 4.6 25 · 0, 1 − 0, 9 ≤ k ≤ 25 · 0, 1 + 0, 1. После вычислений
имеем интервал 1, 6 ≤ k ≤ 2, 6. Так как искомое число является целым, то
им может быть только k = 2.
наивероятнейшее число заключенных договоров после
Следовательно,
25 визитов равно двум.
72
Дискретные случайные величины
5
Если не знаешь, как поступить,
Очень полезно кинуть монетку.
Иэн Бэнкс
5.1
Понятие случайной величины
Когда подбрасывается игральная кость, то появляются случайные числа
1, 2, 3, 4, 5, 6. При этом определить, какое именно появится число, заранее
невозможно.
Точно также невозможно определить, сколько человек зайдёт в течение
часа в ближайший магазин, или сколько вызовов в течение этого часа поступит на городскую станцию скорой помощи1 .
Но при всей случайности исходов, образующих полную группу этих
опытов-наблюдений, с ними связана одна закономерность. Каждый из этих
опытов определяет (одну или несколько) случайную величину, принимающую числовые значения, связанные с исходами, каждому из которых соответствует определённая вероятность.
Пусть Ω = {ω} − пространство элементарных событий некоторого опыта, а X = {x} − конечное (или сравнимое с множеством натуральных
чисел2 ) числовое множество.
Определение 5.1. Функция, отображающая пространство Ω в множество X, называется дискретной случайной величиной3 .
Определённая таким образом дискретная случайная величина обозначается X = X(ω).
Рассмотрим несколько примеров:
1. Опыт с подбрасыванием игральной кости. Пространство Ω определяют
события «выпало 1 очко», «выпали 2 очка», ..., «выпали 6 очков». Если
задать множество X, состоящее из первых 6 чисел натурального ряда, то
можно определить случайную величину X = X(ω) как «число очков, вы1
Конечно, хотелось бы, чтобы их вообще не было, но об этом можно только мечтать.
Такое множество называется cчётным множеством, то есть множеством, каждому элементу которого можно единственным образом поставить во взаимно однозначное соответствие натуральное
число.
3
Понятие случайной величины без введения термина впервые встречается в 1832 году в работе
С. Д. Пуассона «О вероятности средних результатов наблюдений» как «некоторой вещи, способной
принимать значения a1 , a2 , . . . an с соответствующими вероятностями» (см. Гнеденко Б. В. Из истории
науки... С. 42).
Понятие случайной величины в современном смысле в 1909 году ввёл К. Пирсон в своей работе
«О новом методе определения корреляции» (On a New Method of Determining Correlation) (см. Earliest
Known Uses of Some of the Words of Mathematics (V) [Электронный ресурс] : URL : http://jeff560.
tripod.com/v.html (дата обращения: 12.06.2016)).
2
73
павших при однократном подбрасывании кости».
2. Опыт с магазином. Событием ω является посещение магазина очередным
покупателем. Каждому такому событию можно поставить в соответствие
число покупателей, оказавшихся в магазине в данный час. Таким образом,
случайная величина Y = Y (ω) − «число покупателей в магазине в течение
часа».
3. Опыт с последовательным подбрасыванием n монет. Событиями являются выпадение герба или решётки. Можно определить несколько случайных величин на множестве этих событий: случайная величина Z = Z(ω) −
«число выпадений герба», случайная величина T = T (ω) − «число выпадений решётки», случайная величина V = V (ω) − «число серий выпадения
двух гербов подряд».
Далее возникает вопрос о способах задания дискретной случайной величины.
Если задавать случайную величину перечислением множества её значений, то может оказаться, что у разных случайных величин могут оказаться
одинаковые множества значений. Например, при подбрасывании одной монеты множество значений случайной величины X − «число выпадений
герба» состоит из двух чисел {0, 1}. Точно также, при рождении одного
ребёнка в родильном доме случайная величина Y − «число родившихся
мальчиков» тоже состоит из двух чисел {0, 1}. Но эти случайные величины
отличаются друг от друга, так как событиям из областей их определения
соответствуют разные вероятности. В случае с монетой вероятность каждого события равна 0, 5, а, согласно статистике, вероятность рождения мальчика 0, 515 (соответственно нерождения 0, 485).
Следовательно, для задания случайной величины недостаточно задать
только множество её значений. Необходимо также определить вероятности
событий, связанных с этими значениями.
5.2
5.2.1
Закон распределения дискретной случайной величины
Определение закона распределения дискретной случайной величины
Предположим, что X = X(ω) − дискретная случайная величина, единственными значениями которой являются числа
x1 , x2 , . . . , xn .
Так как каждое из этих значений является образом некоторого события:
x1 = X(ω1 ), x2 = X(ω2 ), . . . , xn = X(ωn ),
то вероятности P (ωi ) определяют вероятности1 P (ωi : X = xi ), которые
1
То есть вероятности событий, заключающихся в том, что случайная величина X принимает значение xi .
74
для краткости обозначим через
pi = P (X = xi ), (i = 1, n).
Поскольку для каждого ωi существует только одно значение xi = X(ωi ),
то события X = x1 , X = x2 , ..., X = xn образуют полную группу событий
опыта. Поэтому сумма вероятностей этих событий равна единице:
p1 + p2 + · · · + pn = 1.
(5.1)
Замечание 5.1. Если множество значений дискретной случайной величины X сравнимо с множеством натуральных чисел, то есть является
бесконечным множеством, то числовой ряд
∞
X
pn = p1 + p2 + · · · + pn + . . .
n=1
сходится, а его сумма равна единице.
Определение 5.2. Отображение, при котором каждому возможному значению дискретной случайной величины соответствует вероятность события, при котором случайная величина принимает это значение, называется законом распределения дискретной случайной
величины.
Так как закон распределения является числовой функцией, то его можно
задать в виде таблицы, или графика, или аналитически с помощью некоторой формулы. Рассмотрим первые два из этих способов.
5.2.2
Табличное задание закона распределения
При табличном задании значения случайной величины упорядочивают
по возрастанию, записывая в первой строке таблицы, а соответствующие
значения вероятностей располагают во второй её строке:
X x1 x2 . . .
p p 1 p2 . . .
xn−1 xn
pn−1 pn
(5.2)
Критерием правильности составления закона распределения является
условие (5.1).
Задача 5.1. Дан закон распределения дискретной случайной величины
δ
δ 2 5 8
11
p 0,46 ? 0,11 0,14
Найдите неизвестную вероятность.
Решение. Так как таблица представляет закон распределения дискретной случайной величины δ, то сумма вероятностей во второй строке должна
75
быть равна единице.
Пусть неизвестная вероятность равна p.
Тогда,
0, 46 + p + 0, 11 + 0, 14 = 1.
Следовательно, p = 1 − 0, 46 − 0, 11 − 0, 14 ⇒ p = 0, 29.
Задача 5.2. Делопроизводитель написал три письма и подписал три
конверта. Затем, произвольным образом, разложил письма по конвертам и отправил. Случайная величина X − число адресатов, получивших
свои письма. Составьте закон распределения X.
Решение. Разложить три письма по конвертам с адресами можно следующим образом:
положить в один из конвертов первое письмо, и положить в один из
оставшихся конвертов второе письмо и положить в один из оставшихся после этих действий конвертов третье письмо1 .
Так как положить первое письмо в конверт можно тремя способами и
положить второе письмо (после того, как в один из конвертов положено
первое) можно только двумя способами и положить третье письмо (после того, как в в двух конвертах уже лежат письма) можно только одним
способом, то общее число способов, согласно принципу произведения,
n = 3 · 2 · 1! ⇒ n = 6.
Случайная величина X может принимать четыре значения:
1) X = 0, если ни один из адресатов не получил своё письмо.
2) X = 1, если только один из адресатов получил своё письмо.
3) X = 2, если только два адресата получили свои письма.
4) X = 3, если все адресаты получили свои письма.
Рассмотрим каждое из этих событий отдельно:
Первое из событий X = 0 может наступить в двух случаях:
а) первый получит письмо, адресованное второму, второй − третьему, третий − первому;
б) первый получит письмо, адресованное третьему, второй − первому, третий − второму.
2
1
Поэтому, p({X=0} = ⇒ p({X=0} = .
6
3
Второе из событий X = 1 может наступить в трёх случаях:
а) первый получит письмо, адресованное ему, второй − третьему, третий
− второму;
б) первый получит письмо, адресованное третьему, второй − своё, третий
− первому;
1
Другое решение заключается в том, чтобы увидеть, что это задача на перестановки из трёх
элементов, а значит, n = 3! ⇒ n = 6.
76
в) первый получит письмо, адресованное второму, второй − первому, третий − своё.
3
1
Поэтому, p({X=1} = ⇒ p({X=1} = .
6
2
Третье из событий X = 2 не наступит никогда,
следовательно, p({X=2} = 0.
Так как четвёртое событие X = 3 может наступить только в одном слу1
чае, то p({X=1} = .
6
1
1
1
В силу того, что + + 0 + = 1, можно утверждать, что закон
3
2
6
распределения дискретной случайной величины X имеет следующий вид:
X
0 1 2 3
1 1
1
p
0
3 2
6
Задача 5.3. В магазине имеется 10 автомобилей определённой марки. Среди них 6 чёрного цвета, 3 серого и 1 белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей
этой марки, безразлично какого цвета. Случайная величина Y − число
случайно проданных автомобилей чёрного цвета. Составьте закон распределения Y .
Решение. Общее число выбранных автомобилей три из десяти, при
этом при выборе порядок не имеет значения, поэтому выбор реализуется с
помощью сочетаний:
10!
3
⇒ n = 120.
n = C10
⇒n=
3! · 7!
Установим значения, которые может принимать дискретная случайная
величина Y :
Число чёрных автомобилей среди купленных может быть Y = 0, или
Y = 1, или Y = 2, или Y = 3.
Определим соответствующие события и их вероятности:
1. Y = 0: A0 =куплены нуль чёрных автомобилей из 6 чёрных и
B0 =куплены три нечёрных автомобиля из четырёх нечёрных.
Найдём число благоприятных исходов, соответствующих Y = 0.
4!
m(A0 ) = C60 ⇒ m(A0 ) = 1; m(B0 ) = C43 ⇒ m(B0 ) =
⇒ m(B0 ) = 4.
3! · 1!
Согласно правилу произведения (см. теорему 1.2) число благоприятных
исходов
m({Y=0} = m(A0 ) · m(B0 ), ⇒ m({Y=0} = 1 · 4 ⇒ m({Y=0} = 4.
Следовательно, вероятность
77
4
1
⇒ p({Y=0} = .
120
30
2. Y = 1: A1 =куплены один чёрный автомобиль из 6 чёрных и
B1 =куплены два нечёрных автомобиля из четырёх нечёрных.
Найдём число благоприятных исходов, соответствующих Y = 1.
4!
m(A1 ) = C61 ⇒ m(A1 ) = 6; m(B1 ) = C42 ⇒ m(B1 ) =
⇒ m(B1 ) = 6.
2! · 2!
Согласно правилу произведения (см. теорему 1.2) число благоприятных
исходов
m({Y=1} = m(A1 ) · m(B1 ), ⇒ m({Y=1} = 6 · 6 ⇒ m({Y=1} = 36.
Следовательно, вероятность
36
3
p({Y=1} =
⇒ p({Y=1} = .
120
10
p({Y=0} =
3. Y = 2: A2 =куплены два чёрных автомобиля из 6 чёрных и
B2 =куплен один нечёрный автомобиль из четырёх нечёрных.
Найдём число благоприятных исходов, соответствующих Y = 2.
6!
⇒ m(A2 ) = 15;
m(A2 ) = C62 ⇒ m(A2 ) =
2! · 4!
m(B2 ) = C41 ⇒ m(B2 ) = 4.
Согласно правилу произведения (см. теорему 1.2) число благоприятных
исходов
m({Y=2} = m(A2 ) · m(B2 ), ⇒ m({Y=2} = 15 · 4 ⇒ m({Y=2} = 60.
Следовательно, вероятность
1
60
⇒ p({Y=2} = .
p({Y=2} =
120
2
4. Y = 3: A3 =куплены три чёрных автомобиля из 6 чёрных и
B3 =куплены нуль нечёрных автомобилей из четырёх нечёрных.
Найдём число благоприятных исходов, соответствующих Y = 3.
6!
m(A3 ) = C63 ⇒ m(A3 ) =
⇒ m(A3 ) = 20;
3! · 3!
m(B3 ) = C40 ⇒ m(B3 ) = 1.
Согласно правилу произведения (см. теорему 1.2) число благоприятных
исходов
m({Y=3} = m(A3 ) · m(B3 ), ⇒ m({Y=3} = 20 · 1 ⇒ m({Y=3} = 20.
Следовательно, вероятность
20
1
p({Y=3} =
⇒ p({Y=3} = .
120
6
1
3
1 1
Так как
+
+ + = 1, то можно утверждать, что закон распре30 10 2 6
78
деления дискретной случайной величины Y имеет следующий вид:
Y
0
1
p
30
1 2 3
3 1 1
10 2 6
Задача 5.4. Экзаменатор задаёт студенту, прогулявшему весь семестр, дополнительные вопросы. Вероятность того, что студент может ответить на заданный вопрос, равна 0, 8. Преподаватель прекращает экзамен, как только студент не отвечает на очередной вопрос.
Случайная величина Z − число дополнительно заданных вопросов.
1.Составьте закон распределения Z.
2. Найдите наивероятнейшее число заданных студенту дополнительных
вопросов.
Решение. Теоретически, в случае студента-всезнайки и неутомимого
преподавателя, случайная величина Z может принимать бесконечное число целочисленных значений, начиная от единицы.
Попробуем установить вероятности первых событий, а затем, закон их
изменения:
1. Z = 1: A1 =студент не ответил на первый вопрос.
p({Z=1}) = 1 − 0, 8 ⇒ p({Z=1}) = 0, 2.
2. Z = 2: A2 =студент ответил на первый вопрос и
B2 =не ответил на второй вопрос.
Так как A2 и B2 − независимые события, то
p({Z = 2}) = p({A2 }) · p({B2 }) ⇒
⇒ p({Z = 2}) = 0, 8 · (1 − 0, 8) ⇒ p({Z = 2}) = 0, 16.
3. Z = 3: A31 =студент ответил на первый вопрос и
A32 =студент ответил на второй вопрос и
B3 =не ответил на третий вопрос.
Так как A31 , A32 и B3 − независимые события, то
p({Z = 3}) = p({A31 }) · p({A32 }) · p({B3 }) ⇒
⇒ p({Z = 3} = (0, 8)2 · (1 − 0, 8) ⇒ p({Z = 3}) = 0, 128.
Можно догадаться, что
p({Z = 4} = (0, 8)3 · (1 − 0, 8) ⇒ p({Z = 4} = 0, 1024.
Вероятности соответствующих событий, начиная со второго события,
образуют бесконечно убывающую геометрическую прогрессию со знаменателем q = 0, 8 и первым членом b1 = 0, 2.
Таким образом, событию {Z = k} соответствует вероятность
0, 2 · (0, 8)k−1 .
Согласно замечанию 5.1, множество значений дискретной случайной
79
величины Z является счётным множеством, поэтому вероятности, соответствующие этим значениям, являются членами бесконечного ряда. Так как
они являются одновременно членами бесконечно убывающей геометрической прогрессии, то этот ряд сходится.
b1
сумму членов этого ряда
Найдём по известной формуле S =
1−q
0, 2
S=
⇒ S = 1.
1 − 0, 8
Так как S = 1, то можно утверждать, что закон распределения для дискретной случайной величины имеет вид
Y
1
2
3
...
p 0, 2 0, 16 0, 128 . . .
k
...
k−1
0, 2 · (0, 8)
...
Видя перед глазами закон распределения, легко ответить на второй
вопрос задачи.
Наивероятнейшее число заданных студенту дополнительных вопросов
равно одному, так как именно этому событию соответствует наибольшая
вероятность.
Замечание 5.2. С точки зрения теоретической механики закон распределения дискретной случайной величины X можно рассматривать как
расположение на прямой системы материальных «точек» x1 , x2 , . . . , каждой из которых соответствует личная «масса» pi . При этом общая «масса»
системы равна единице1 .
5.2.3
Графическое задание закона распределения
p
p3
pn
p2
pn−1
p1
x1
x2x3
xn−1 xn
График закона распределения в декартовой системе координат, на горизонтальной оси
которой откладываются значения x, а на вертикальной −
x вероятности, называется многоугольником распределения (рис.
5.1).
Рис. 5.1
Задача 5.5. В условиях задачи 5.1 постройте многоугольник распределения δ.
Решение. В системе координат x − p построим точки, взяв за их координаты соответствующие значения из полученного при решении задачи
1
Здесь i пробегает конечное или бесконечное подмножество множества натуральных чисел, а под
«точкой» xi понимается возможное значение случайной величины X.
80
5.1 закона распределения дискретной случайной величины δ. Построенные
точки соединим пунктирной линией (рис. 5.2).
p
0, 46
0, 29
0, 14
0, 11
x
2
5
8
11
Рис. 5.2
5.3
5.3.1
Функция распределения дискретной случайной величины
и её свойства
Определение функции распределения дискретной
случайной величины
Ещё одной геометрической иллюстрацией дискретной случайной величины является её функция распределения1 .
Определение 5.3. Функцией распределения случайной величины X называется функция, которая в каждой точке x числовой прямой
определяет вероятность события, в котором случайная величина принимает значение, меньшее, чем x. То есть2 ,
F (x) = P (X < x).
(5.3)
С точки зрения геометрии функция распределения определяет вероятность того, что случайная величина X в результате исхода попадёт на координатную прямую левее x (рис. 5.3).
Рис. 5.3
0
X x
x
Для дискретной случайной величины X, значения которой x1 , x2 , . . . , xn ,
функция распределения имеет вид3
X
F (x) =
P (X = xk )
(5.4)
xk <x
1
Точное определение функции распределения случайной величины по предположению Б.В. Гнеденко принадлежит А. М. Ляпунову, который дал его в своей работе «Об одном предложении теории
вероятностей» в 1900 году (см. Гнеденко Б. В. Из истории науки... С. 44).
2
Под выражением P (X < x) следует понимать вероятность события ω, в котором случайная величина принимает значение меньшее, чем x. Или в обозначениях: P (X < x) = P (ω : X < x).
3
Неравенство xk < x означает, что суммирование относится ко всем значениям xk , которые по своей
величине меньше x.
81
или в развёрнутом виде
F (x) = P (X = x1 ) + P (X = x2 ) + · · · + P (X = xk ), где xk < x.
Построим график функции распределения F (x) случайной величины X,
заданной табличным законом распределения (5.2).
При x ≤ x1 : F (x) = P (X < x) = 0.
При x1 < x ≤ x2 : F (x) = P (X < x) = P (X = x1 ) = p1 .
При x2 < x ≤ x3 : F (x) = P (X < x) = P (X = x1 ) + P (X = x2 ) = p1 + p2 .
.....................................................................
При xn−1 < x ≤ xn : F (x) = P (X < x) =
= P (X = x1 ) + P (X = x2 ) + · · · + P (X = xn−1 ) = p1 + p2 + · · · + pn−1 .
При x ≥ xn : F (x) = P (X < x) =
= P (X = x1 ) + P (X = x2 ) + · · · + P (X = xn−1 ) + P (X = xn ) =
= p1 + p2 + · · · + pn−1 + pn .
Функция распределения имеет неустранимые разрывы первого рода слева в тех точках, в которых дискретная случайная величина X принимает
возможные значения, указанные в таблице (5.2) закона распределения.
В интервалах между возможными значениями случайной величины функция F (x) является постоянной. Сумма скачков функции распределения
равна единице. График функции распределения дискретной случайной величины есть разрывная ступенчатая функция (рис. 5.4):
F (x)
1
p1 + p2 + p3 + · · · + pn−1
p1 + p2 + p3
p1 + p2
p1
Рис. 5.4
0
x1
x2
...
xx
n−1
3
x
xn
Задача 5.6. В условиях задачи 5.1 постройте график функции распределения δ.
Решение. Используя алгоритм построения, имеем:
При x ≤ 2: F (x) = P (δ < x) = 0.
При 2 < x ≤ 5: F (x) = P (δ < x) = P (δ = 2) = 0, 46.
При 5 < x ≤ 8: F (x) = P (δ < x) = P (δ = 2) + P (δ = 5) =
= 0, 46 + 0, 29 = 0, 75.
При 8 < x ≤ 11: F (x) = P (δ < x) = P (δ = 2) + P (δ = 5) + P (δ = 8) =
= 0, 46 + 0, 29 + 0, 11 = 0, 86.
При x ≥ 11: F (x) = P (δ < x) = P (δ = 2) + P (δ = 5) + P (δ = 8)+
82
+P (δ = 11) ⇒ F (x) = P (δ < x) = 1.

0,
если x ≤ 2,




 0, 46, если 2 < x ≤ 5,
0, 75, если 5 < x ≤ 8,
F (x) =


0, 86, если 8 < x ≤ 11,



1,
если x > 11.
Далее, остаётся построить график F (x) (рис. 5.5):
F (x)
1
0, 86
0, 75
0, 46
x
Рис. 5.5
0
2
5
8
11
Задача 5.7. На пути движения автомашины 4 светофора, каждый из
которых запрещает дальнейшее движение автомашины с вероятностью
0,5. Случайная величина H − число светофоров, пройденных машиной до
первой остановки. Составьте закон распределения H и постройте график функции распределения H.
Решение. Рассмотрим события, связанные с условием задачи, и определим их вероятности.
1. H = 0: A0 =автомобиль попал под запрещающий сигнал на первом
светофоре.
p({H = 0}) = p({A0 }) = 0, 5.
2. H = 1: A1 =автомобиль проехал первый светофор без остановки и
B1 =автомобиль попал под запрещающий сигнал на втором
светофоре.
Так как A2 и B2 − независимые события, то
p({H = 1}) = p({A1 }) · p({B1 }) ⇒
⇒ p({H = 1}) = (1 − 0, 5) · 0, 5 ⇒ p({H = 1}) = 0, 25.
3. H = 2: A2 =автомобиль проехал первый и второй светофоры
без остановки и
B2 =автомобиль попал под запрещающий сигнал
на третьем светофоре.
Так как A2 и B2 − независимые события, то
p({H = 2}) = p({A2 }) · p({B2 }) ⇒
83
⇒ p({H = 2} = (1 − 0, 5)2 · 0, 5 ⇒ p({H = 2}) = 0, 125.
4. H = 3: A3 =автомобиль проехал первый, второй и третий светофоры
без остановки и
B3 =автомобиль попал под запрещающий сигнал на четвёртом
светофоре.
Так как A3 и B3 − независимые события, то
p({H = 3}) = p({A3 }) · p({B3 }) ⇒
⇒ p({H = 3} = (1 − 0, 5)3 · 0, 5 ⇒ p({H = 3}) = 0, 0625.
5. H = 4: A4 =автомобиль проехал все четыре светофора без остановки.
p({H = 4}) = p({A4 }) ⇒
⇒ p({H = 4} = (1 − 0, 5)4 ⇒ p({H = 4}) = 0, 0625.
Так как 0, 5 + 0, 25 + 0, 125 + 0, 0625 + 0, 0625 = 1, то можно утверждать, что закон распределения дискретной случайной величины H имеет
следующий вид:
Y
0
1
2
3
4
.
p 0, 5 0, 25 0, 125 0, 0625 0, 0625
Далее, используя алгоритм построения (см. стр. 79) и опыт решения
задачи 5.7, имеем:
При x ≤ 0: F (x) = P (H < x) = 0.
При 0 < x ≤ 1: F (x) = P (H < x) = P (H = 0) = 0, 5.
При 1 < x ≤ 2: F (x) = P (H < x) = P (H = 0) + P (H = 1) =
= 0, 5 + 0, 25 = 0, 75.
При 2 < x ≤ 3: F (x) = P (H < x) = P (H = 0)+P (H = 1)+P (H = 2) =
= 0, 5 + 0, 25 + 0, 125 = 0, 875.
При 3 < x ≤ 4: F (x) = P (H < x) = P (H = 0) + P (H = 1)+
+P (H = 2) + P (H = 3) =
+0, 5 + 0, 25 + 0, 125 + 0, 0625 = 0, 9375.
При x ≥ 4: F (x) = P (H < x) = P (H = 0) + P (H = 1) + P (H = 2)+
+P (H = 3) + P (H = 4) = 1.
Собирая полученную информацию, имеем

0, если x ≤ 0,




0, 5, если 0 < x ≤ 1,



0, 75, если 1 < x ≤ 2,
F (x) =
0, 875, если 2 < x ≤ 3,





0, 9375, если 3 < x ≤ 4,


1,
если x > 4.
На основании расчётов строим график F (x) (рис. 5.6).
84
F (x)
1
0, 9375
0, 875
0, 75
0, 5
x
Рис. 5.6
5.3.2
0
1
2
3
4
Свойства функции распределения
Из определения 5.3 и рис. 5.2 можно вывести следующие свойства функции распределения:
Свойство 5.1. ∀ x 0 ≤ F (x) ≤ 1.
Это очевидно, так как F (x) определяется с помощью вероятности события.
Свойство 5.2. ∀ x1 , x2 : x1 < x2 ⇒ F (x1 ) ≤ F (x1 ).
z
A
}|
0
Рис. 5.7
|
B
{ z }| {
{z X
C
x1
x2
}
x
Воспользуемся рис. 5.7. Пусть событие C = {ω : X(ω) < x2 }. Представим его как сумму событий
A = {ω : X(ω) < x1 } и B = {ω : x1 ≤ X(ω) < x2 }: C = A + B.
Так как A и B − несовместные события, то из теоремы 3.1 о сложении
вероятностей несовместных событий следует, что P (C) = P (A) + P (B).
То есть P (X < x2 ) = P (X < x1 ) + P (x1 ≤ X < x2 ). Следовательно,
F (x2 ) = F (x1 ) + P (x1 ≤ X < x2 ).
Так как вероятность P (x1 ≤ X < x2 ) ≥ 0 по определению, то
F (x1 ) ≤ F (x2 ).
Свойство 5.3. lim F (x) = 0.
x→−∞
Если на рис. 5.7 «заставить» точку x стремиться влево, то видно, что
событие {ω : X(ω) < x}, состоящее в том, что случайная величина X
окажется левее, чем x, становится невозможным, а его вероятность − равной нулю.
Свойство 5.4. lim F (x) = 1.
x→∞
Точно также, перемещая точку x на рис. 5.7 вправо, можно убедиться,
что событие {ω : X(ω) < x} в пределе становится достоверным. А значит
его вероятность стремится к единице.
85
5.4
5.4.1
Числовые характеристики дискретной случайной величины
Математическое ожидание распределения дискретной
случайной величины
Богу всегда середина любезна,
и меру чтит божество.
Эсхилл. Эвмениды
С точки зрения теории вероятности закон распределения полностью
описывает случайную величину. Но получение всей содержащейся в нём
информации во-первых избыточно во многих случаях, а во-вторых требует
затрат на получение этой информации.
Для практических целей нужно иметь гораздо меньше информации,
чтобы получить представление о поведении изучаемой случайной величины.
Если представлять множество значений случайной величины как некоторый интервал, расположенный на числовой прямой, то нужно знать
«центр» этого интервала, то есть места, где расположена основная «масса
вероятности». А также нужно знать «радиус» этого интервала, как «меру
рассеивания» этой «массы вероятности» относительно «центра».
Пусть известен закон распределения дискретной случайной величины
X:
X x1 x2 . . . xn−1 xn
p p1 p2 . . . pn−1 pn
Определение 5.4. Математическим ожиданием1 дискретной
1
Термин математическое ожидание впервые был определён автором первого (и до начала XVIII
столетия единственного) руководства по теории вероятностей Х. Гюйгенсом в 1657 году в его работе
«О расчётах в азартной игре» (De ratiociniis in aleae ludo) (см. История математики с древнейших...
С. 89-90). В дальнейшем, после работ Д. Бернулли этот термин был забыт, а в рассмотрение был
введён предложенный в 1760 году Д. Бернулли термин моральное ожидание (см. Майстров Л. И.
Цит. соч. С. 136). Но далее П. Лаплас в своей работе «Опыт философии теории вероятностей»
(Essai philosophique sur les probabilites) 1814 года вернулся к определению Гюйгенса и определил
математическое ожидание как выгоду того, кто ожидает блага, равную произведению ожидаемой
суммы на вероятность её получения. (см. Вероятность и математическая статистика : Энциклопедия
/ Гл. ред. Ю. В. Прохоров. − М. : Большая Российская энциклопедия, 1999. С. 837).
Гюйгенс Христиан ван Зёйлихем (нидерл. Huygens Christiaan, 1629-1695) − нидерландский механик, физик, математик, астроном и изобретатель. Один из основоположников теоретической механики
и теории вероятностей. Внёс значительный вклад в оптику, молекулярную физику, астрономию,
геометрию, часовое дело. Открыл кольца Сатурна и Титан (спутник Сатурна). Первый иностранный
член Лондонского королевского общества (1663), член Французской академии наук с момента её
основания (1666) и её первый президент (1666-1681). (см. Википедия [Электронный ресурс] : URL
:
https://ru.wikipedia.org/wiki/\T2A\CYRG\T2A\cyryu\T2A\cyrishrt\T2A\cyrg\T2A\cyre\T2A\
cyrn\T2A\cyrs,_\T2A\CYRH\T2A\cyrr\T2A\cyri\T2A\cyrs\T2A\cyrt\T2A\cyri\T2A\cyra\T2A\cyrn
(дата обращения: 12.06.2016)).
Бернулли Даниил (Bernoulli Daniel, 1700-1782) − cын Иоганна Бернулли, швейцарский физик-универсал, механик и математик, один из создателей кинетической теории газов, гидродинамики и математической физики. Академик и иностранный почётный член
Петербургской академии наук, член Болонской, Берлинской и Парижской Академий наук,
86
случайной величины X называется скалярное произведение вектора
значений случайной величины на вектор соответствующих им вероятностей.
То есть
M (X) = x1 p1 + x2 p2 + · · · + xn−1 pn−1 + xn pn .
Или в сжатом виде:
M (X) =
n
X
(5.5)
x i pi .
i=1
Замечание 5.3. Заметим, что являясь характеристикой случайной величины, само математическое ожидание случайной величиной не является.
Задача 5.8. В условиях задачи 5.1 найдите математическое ожидание δ.
Решение. Согласно формуле 5.5,
M (X) = 2 · 0, 46 + 5 · 0, 29 + 8 · 0, 11 + 11 · 0, 14.
Выполнив вычисления, получаем M (X) = 4, 79.
Задача 5.9. В магазине продаются 5 отечественных и 3 импортных
холодильника. Случайная величина P − число импортных холодильников
из четырёх наудачу выбранных холодильников.
1. Составьте закон распределения случайной величины P .
2. Вычислите математическое ожидание случайной величины P .
Решение. Рассмотрим события, связанные с условием задачи.
Найдём общее число вариантов выбора 4-х холодильников из имеющихся 8. Так как мы не делаем между холодильниками различий, то выбор
реализуется с помощью сочетаний:
8!
n = C84 ⇒ n =
⇒ n = 70.
4! · 4!
Далее, рассмотрим благоприятные варианты выбора и вычислим соответствующие вероятности событий.
1. P = 0: A0 =выбрали 0 импортных холодильников из 3 импортных и
B0 =выбрали 4 отечественных холодильника из 5 отечественных.
Так как события A0 и B0 являются независимыми, то согласно правилу
произведения (см. теорему 1.2)
m({P = 0}) = m({A0 }) · m({B0 }).
член Лондонского королевского общества. (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRB\T2A\cyre\T2A\cyrr\T2A\cyrn\T2A\cyru\T2A\cyrl\
T2A\cyrl\T2A\cyri,_\T2A\CYRD\T2A\cyra\T2A\cyrn\T2A\cyri\T2A\cyri\T2A\cyrl (дата обращения:
12.06.2016)).
87
m({A0 }) = C30 ⇒ m({A0 }) = 1;
m({B0 }) = C54 ⇒ m({B0 }) = 5.
Следовательно, m({P = 0}) = 1 · 5 ⇒ m({P = 0}) = 5.
В итоге, из классического определения вероятности (см. определение
2.8) следует, что
m({P = 0})
5
1
p({P = 0}) =
⇒ p({P = 0}) =
⇒ p({P = 0}) = .
n
70
14
2. P = 1: A1 =выбрали 1 импортный холодильник из 3 импортных и
B1 =выбрали 3 отечественных холодильника из 5 отечественных.
Точно также, как и в пункте 1, определим p({P = 1}).
m({P = 1}) = m({A1 }) · m({B1 }).
m({A1 }) = C31 ⇒ m({A1 }) = 3;
m({B1 }) = C53 ⇒ m({B1 }) = 10.
Следовательно, m({P = 1}) = 3 · 10 ⇒ m({P = 1}) = 30.
В итоге, из классического определения вероятности (см. определение
2.8) получаем
m({P = 1})
30
3
p({P = 1}) =
⇒ p({P = 1}) =
⇒ p({P = 1}) = .
n
70
7
3. P = 2: A2 =выбрали 2 импортных холодильника из 3 импортных и
B2 =выбрали 2 отечественных холодильника из 5 отечественных.
Также, как и в первых пунктах, определим p({P = 2}).
m({P = 2}) = m({A2 }) · m({B2 }).
m({A2 }) = C32 ⇒ m({A2 }) = 3;
m({B2 }) = C52 ⇒ m({B2 }) = 10.
Следовательно, m({P = 2}) = 3 · 10 ⇒ m({P = 2}) = 30.
В итоге, имеем
m({P = 2})
30
3
p({P = 2}) =
⇒ p({P = 2}) =
⇒ p({P = 2}) = .
n
70
7
4. P = 3: A3 =выбрали 3 импортных холодильника из 3 импортных и
B3 =выбрали 1 отечественный холодильник из 5 отечественных.
Аналогично пунктам 1-3, определим p({P = 3}).
m({P = 3}) = m({A3 }) · m({B3 }).
88
m({A3 }) = C33 ⇒ m({A3 }) = 1;
m({B3 }) = C51 ⇒ m({B3 }) = 5.
Следовательно, m({P = 3}) = 1 · 5 ⇒ m({P = 3}) = 5.
В итоге, имеем
m({P = 3})
5
1
p({P = 3}) =
⇒ p({P = 3}) =
⇒ p({P = 3}) = .
n
70
14
1
3 3
1
Так как
+ + +
= 1, то можно утверждать, что закон распре14 7 7 14
деления дискретной случайной величины P имеет следующий вид:
P
0
1
p
14
1 2 3
3 3 1 .
7 7 14
Используя формулу (5.5), вычислим математическое ожидание дискретной случайной величины P :
1
3
3
1
1
M (P ) = 0 ·
+1· +2· +3·
= 1 · ⇒ M (P ) = 1, 5.
14
7
7
14
2
Задача 5.10. Из опыта сдачи экзамена некоторому преподавателю
предыдущими поколениями студентов установлено, что сдать ему экзамен на «отлично» можно с вероятностью 0, 3, на «хорошо» − с вероятностью 0, 4. Какова вероятность получить у этого преподавателя
другие оценки, если математическое ожидание случайной величины S,
связанной с распределением оценок у данного преподавателя при случайно выбранном билете, равно 3, 9.
Решение. Согласно Положению о высшей школе, S может принимать
значения из множества {2, 3, 4, 5}.
Допустим, что x и y − вероятности того, что сдающий может соответственно получить оценки «неудовлетворительно» и «удовлетворительно».
Составим предполагаемый закон распределения дискретной случайной
величины S:
S 2 3 4
5
p x y 0, 4 0, 3 .
Согласно условию (5.1), сумма вероятностей должна быть равна единице, поэтому
x + y + 0, 4 + 0, 3 = 1.
Кроме этого, согласно условию и формуле 5.5, имеем
2x + 3y + 4 · 0, 4 + 5 · 0, 3 = 3, 9.
89
Приведя подобные члены в каждом из уравнений, составим систему
x + y = 0, 3,
2x + 3y = 0, 8.
Решив систему, получим x = 0, 1, а y = 0, 2.
Следовательно, у данного преподавателя можно получить
«удовлетворительно» с вероятностью 0,2 и «неудовлетворительно» с вероятностью 0,1.
Замечание 5.4. В том случае, когда дискретная случайная величина X принимает бесконечное множество значений (см. замечание 5.1), её
математическое ожидание является суммой абсолютно сходящегося ряда:
M (X) =
∞
X
x i pi .
i=1
5.4.2
Вероятностный смысл математического ожидания
Предположим, что опыт состоит из n исходов, в которых дискретная
случайная величина X приняла k1 раз значение x1 , k2 раз значение x2 , . . . ,
ks раз значение xs . При этом
k1 + k2 + · · · + ks = n.
Тогда сумма всех значений, принятых случайной величиной X равна:
S = k1 x1 + k2 x2 + · · · + ks xs .
Определим среднее арифметическое X̄ всех значений, принятых случайной
величиной. С этой целью разделим S на число исходов опыта n:
X̄ =
k1 x1 + k2 x2 + · · · + ks xs
,
n
или
X̄ = x1
ks
k1
k
+ x2 2 + · · · + xs .
n
n
n
(5.6)
k
k
Так как 1 − относительная частота W1 значения x1 (см. 2.4), 2 −
n
n
относительная частота W2 значения x2 и так далее, то перепишем представление (5.6) в виде
X̄ = x1 W1 + x2 W2 + · · · + xs Ws .
(5.7)
Будем считать, что число исходов опыта n → ∞. Тогда, как следует
из замечания (после определения 5.4) относительная частота стремится к
вероятности появления события.
То есть W1 ≈ p1 , W2 ≈ p2 , . . . , Ws ≈ ps .
90
Заменим в представлении (5.7) относительные частоты соответствующими вероятностями:
X̄ ≈ x1 p1 + x2 p2 + · · · + xs ps .
Правая часть полученного приближённого равенства является математическим ожиданием случайной величины X.
Таким образом, X̄ ≈ M (X).
Следовательно, с точки зрения теории вероятности математическое ожидание приблизительно1 равно среднему арифметическому возможных значений дискретной случайной величины.
Замечание 5.5. О механическом смысле математического ожидания дискретной случайной величины. С точки зрения теоретической механики математическое ожидание дискретной случайной величины определяет центр «масс» системы материальных точек, расположенных на прямой, общая «масса» которых равна единице. При этом
«масса» каждой «точки» xi равна вероятности pi , соответствующей
этой «точке»2 .
5.4.3
Понятие индикатора события
При решении некоторых задач теории вероятности возникает необходимость выразить вероятность события с помощью математического ожидания. С этой целью вводится следующее
Определение 5.5. Индикатором события A называется случайная величина IA , равная единице, если в результате опыта событие A
произошло, и нулю − если событие A не произошло.
1, если A произошло,
IA =
(5.8)
0, если A не произошло.
Если вероятность наступления события A равна p, то закон распределения случайной величины IA имеет вид:
IA
0
1
.
P 1−p p
так как математическое ожидание индикатора события
M (IA ) = 0 · (1 − p) + 1 · p,
то индикатор события позволяет записать вероятность события A с помощью своего математического ожидания
P (A) = M (IA ).
1
Чем большим является число исходов опыта n, тем более точным является данное равенство.
Здесь i пробегает конечное или бесконечное подмножество множества натуральных чисел, а под
«точкой» xi понимается возможное значение случайной величины X.
2
91
5.4.4
Свойства математического ожидания
Свойство 5.5. Математическое ожидание постоянной величины
равно самой постоянной величине:
M (C) = C.
Рассмотрим постоянную величину C как дискретную случайную величину, которая принимает только одно значение C с вероятностью 1. Тогда
M (C) = C · 1 ⇒ M (C) = C.
Так как дискретную случайную величину можно рассматривать как nмерный вектор, то можно ввести следующее
Определение 5.6. Произведением постоянной C на дискретную случайную величину X называется случайная величина CX, возможные значения которой равны произведениям соответствующих возможных значений X на данную постоянную с вероятностями, а соответствующие вероятности совпадают.
Свойство 5.6. Постоянный множитель можно выносить за знак
математического ожидания:
M (CX) = CM (X).
Предположим, что случайная величина X имеет следующий закон распределения:
X x1 x2 . . .
p p1 p2 . . .
xn
pn
Согласно определению 5.6 составим закон распределения случайной величины CX:
CX Cx1 Cx2 . . .
p
p1
p2 . . .
Cxn
pn
Используя определение 5.4, найдем скалярное произведение векторов,
координатами которых являются возможные значения CX и соответствующие вероятности
Cx1 p1 + Cx2 p2 + · · · + Cxn pn = C(x1 p1 + x2 p2 + · · · + xn pn ) = CM (X) ⇒
⇒ M (CX) = CM (X).
Свойство 5.7. Математическое ожидание суммы двух случайных величин равно сумме их математических ожиданий:
M (X + Y ) = M (X) + M (Y ).
Предположим, что случайные величины X и Y имеют следующие законы распределения1 :
1
Для краткости, которая не вредит пониманию, каждая из случайных величин принимает только
два значения. В общем случае доказательство проводится аналогично.
92
X x1 x2
p p1 p2
Y y1 y2
p q 1 q2
Составим с помощью этих законов закон распределения случайной величины X + Y , принимающей значения
X +Y
x1 + y1 x1 + y2 x2 + y1 x2 + y2
Обозначив соответствующие вероятности через p11 , p12 , p21 и p22 , получим следующий закон распределения:
X +Y
p
x1 + y1 x1 + y2 x2 + y1 x2 + y2
p11
p12
p21
p22
Используя определение 5.4, найдем математическое ожидание
M (X + Y ) = (x1 + y1 )p11 + (x1 + y2 )p12 + (x2 + y1 )p21 + (x2 + y2 )p22 .
Раскрыв скобки в правой части полученного равенства и сгруппировав соответствующие вероятности, получим
M (X + Y ) = x1 (p11 + p12 ) + x2 (p21 + p22 ) + y1 (p21 + p22 ) + y2 (p12 + p22 ).
Событие X = x1 порождает несовместные события X + Y = x1 + y1
и X + Y = x1 + y2 . Сумма вероятностей этих событий равна вероятности
наступления события X = x1 , то есть
p11 + p12 = p1 .
Аналогично
p21 + p22 = p2 ; p11 + p21 = q1 ; p12 + p22 = q2 .
Заменив скобки в последнем представлении M (X + Y ), имеем
M (X + Y ) = x1 p1 + x2 p2 + y1 p21 + y2 p2 ⇒ M (X + Y ) = M (X) + M (Y ).
Чтобы сформулировать следующее свойство, понадобится следующее
Определение 5.7. Две случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какие
возможные значения может принимать другая величина.
Свойство 5.8. Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий1 :
M (XY ) = M (X) · M (Y ).
Замечание 5.6. Естественно, можно доказать, что свойства 5.7 и 5.8
имеют место для любого конечного числа случайных величин2 :
M (X1 + X2 + · · · + Xn ) = M (X1 ) + M (X2 ) + · · · + M (Xn ).
1
(5.9)
Доказательство этого свойства будет приведено в главе, связанной с изучением систем дискретных
величин.
2
С учётом взаимной независимости величин в случае их произведения.
93
M (X1 X2 . . . Xn ) = M (X1 ) · M (X2 ) . . . M (Xn ).
(5.10)
Замечание 5.7. Следует заметить, что хотя математическое ожидание
и является важнейшей характеристикой положения дискретной случайной
величины, в практических целях иногда используют другие числовые характеристики. Одной из таких характеристик положения является
5.4.5
Мода дискретной случайной величины
Определение 5.8. Модой1 дискретной случайной величины называется ёе наиболее вероятное значение. Обозначается мода следующим
образом: Mo (X).
Формально определение моды можно представить
Mo (X) = {xi : P (X = xi ) ≥ P (X = xn ) ∀ n 6= i, n ∈ N}. (5.11)
Из определения (5.8) вытекает классификация распределений дискретной
случайной величины.
Определение 5.9. Распределение дискретной случайной величины называется унимодальным, если наиболее вероятное значение дискретной величины является единственным. То есть
Mo (X) = {xi : P (X = xi ) > P (X = xn ) ∀ n 6= i, n ∈ N}.
Например, заданное следующим образом распределение
X −2 −0.5
1
2
3.5
5
p 0, 05 0, 1 0, 25 0, 4 0, 15 0, 05
является унимодальным, так как самая большая вероятность соответствует единственному возможному значению X = 2. При этом Mo (X) = 2.
Многоугольник распределения для данного унимодального распределения показан на рис. 5.8.
Определение 5.10. Распределение дискретной случайной величины
называется полимодальным, если наиболее вероятное значение дискретной величины не является единственным.
1
Понятие моды ввёл в 1895 году английский статистик К. Пирсон (cм. Википедия [Электронный
ресурс] : URL : https://en.wikipedia.org/wiki/Mode_(statistics) (дата обращения: 12.06.2016)).
Пирсон Карл (Чарльз) (англ. Karl (Carl) Pearson, 1857-1936) − английский математик, статистик,
биолог и философ; основатель математической статистики, один из основоположников биометрии.
Автор свыше 650 опубликованных научных работ. (см. URL:https://ru.wikipedia.org/wiki/\T2A\
CYRP\T2A\cyri\T2A\cyrr\T2A\cyrs\T2A\cyro\T2A\cyrn,_\T2A\CYRK\T2A\cyra\T2A\cyrr\T2A\cyrl).
94
p
0, 4
0, 25
0, 15
0, 1
0, 05
−2
−0.5
0
1
2
3.5
5
x
Рис. 5.8
Конкретным примером полимодального распределения является следующее распределение
X −2.5 −1
1
2
3.5
5
p 0, 05 0, 3 0, 15 0, 3 0, 15 0, 05
Здесь самые большие вероятности соответствуют двум возможным значениям X = −1 и X = 2. Поэтому существуют два1 значения моды
Mo (X) = −1 и Mo (X) = 2.
Многоугольник распределения для данного полимодального распределения выглядит так (рис. 5.9):
p
0, 3
0, 15
0, 1
0, 05
−2, 5
−1
0
1
2
3.5
5
x
Рис. 5.9
Третим примером в классификации является распределение в отношении модальности противоположное рассмотренным.
Определение 5.11. Распределение дискретной случайной величины
называется антимодальным, если оно имеет наименьшее вероятное
значение. То есть
min X = {xi : P (X = xi ) ≤ P (X = xn ) ∀ n 6= i, n ∈ N}.
В качестве примера рассмотрим следующее распределение
X −2 −0.5
1
2 3.5
5
p 0, 3 0, 1 0, 05 0, 1 0, 2 0, 25
1
Если сказать точнее, то такое распределение называется бимодальным распределением.
95
Примером многоугольника антимодального распределения может служить рис. 5.10.
p
0, 3
0, 25
0, 2
0, 1
0, 05
−2
−0.5
0
1
2
3.5
5
x
Рис. 5.10
Замечание 5.8. Так как мода является возможным числом, которое
встречается чаще всего в задании распределения, то на практике мода хорошо описывает типичные ситуации. Например, реакцию учеников класса
в ответ на объявление о том, что «заболел учитель, ведущий следующий
урок, а потому уроки отменяются»1 .
5.4.6
Дисперсия дискретной случайной величины
Математическое ожидание как характеристика случайной величины даёт много информации о ней, но, как видно из следующих примеров, этой
информации оказывается недостаточно.
Рассмотрим законы распределения двух случайных величин:
X −0, 1 0, 1
p 0, 5 0, 5
Y −100 100
p 0, 5 0, 5
Найдём математические ожидания каждой из случайных величин:
M (X) = −0, 1 · 0, 5 + 0, 1 · 0, 5 ⇒ M (X) = 0.
M (Y ) = −100 · 0, 5 + 100 · 0, 5 ⇒ M (Y ) = 0.
Случайные величины X и Y имеют одинаковые математические ожидания, но их возможные значения не равны. При этом, в одном случае возможные значения располагаются вблизи математического ожидания, а
в другом случае удалены от него.
Проблема заключается в отсутствии информации о рассеивании возможных значений случайных величин относительно математического ожидания.
Чтобы исследовать вопрос о рассеивании, рассмотрим отклонение случайной величины от её математического ожидания.
Определение 5.12. Отклонением называется разность между случайной величиной X и её математическим ожиданием M (X).
1
Следует признать, что эта реакция отнюдь не является реакцией печали.
96
Из определения следует, что отклонение X − M (X) является случайной
величиной, обладающей следующим свойством.
Теорема 5.1. Математическое ожидание отклонения случайной величины от её математического ожидания равно нулю:
M (X − M (X)) = 0.
Используя свойства 5.5 и 5.8 математического ожидания, имеем
M (X − M (X)) = M (X) − M (M (X)) = M (X) − M (X) = 0.
Из данной теоремы вытекает, что определять рассеивание возможных
значений случайной величины с помощью математического ожидания отклонения невозможно. Объяснить это можно тем, что одни отклонения являются положительными числами, а другие − отрицательными. Поэтому
их алгебраическая сумма обращается в нуль.
Вследствие этого возникают два варианта: исследовать математическое
ожидание модуля отклонения1 или квадрата отклонения. Практическое
применение получил второй вариант.
Определение 5.13. Дисперсией2 дискретной случайной величины называется математическое ожидание квадрата отклонения случайной величины от её математического ожидания:
D(X) = M (X − M (X))2 .
(5.12)
Замечание 5.9. Из определения следует, что дисперсия случайной
величины является неотрицательной константой.
При расчётах дисперсии её определение оказывается очень неудобным
в силу большого числа вычислений. Поэтому рассмотрим следующую теорему.
Теорема 5.2. Формула вычисления дисперсии Дисперсия равна
1
Так как модуль не является всюду дифференцируемой функцией, то при его исследовании возникает много проблем
2
Термин дисперсия происходит от лат. dispersio рассеяние (от глагола dispergere − рассыпать,
рассеивать, разбрасывать.
В 1895 году термин дисперсия определил К. Пирсон (см. Секей, Г. Парадоксы в теории вероятностей и математической статистике. Москва-Ижевск : Институт компьютерных исследований,
2003. С. 32). Вслед за К. Пирсоном его в 1918 году использовал в своей статье «Корреляция между
родственниками в пpедположении менделевской наследственности» (The Correlation Between Relatives
on the Supposition of Mendelian Inheritance) Р. Э. Фишер (см. Earliest Known Uses of Some of the
Words of Mathematics (V) [Электронный ресурс] : URL : http://jeff560.tripod.com/v.html (дата
обращения: 12.06.2016)).
Сэр Фишер Рональд Эйлмер (англ. Sir Fisher Ronald Aylmer, 1890-1962) − английский статистик, биолог-эволюционист и генетик, основоположник современной прикладной математической
статистики (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\
CYRF\T2A\cyri\T2A\cyrsh\T2A\cyre\T2A\cyrr,_\T2A\CYRR\T2A\cyro\T2A\cyrn\T2A\cyra\T2A\cyrl\
T2A\cyrsftsn\T2A\cyrd_\T2A\CYREREV\T2A\cyrishrt\T2A\cyrl\T2A\cyrm\T2A\cyre\T2A\cyrr (дата
обращения: 12.06.2016)).
97
разности между математическим ожиданием квадрата случайной величины и квадратом её математического ожидания:
D(X) = M X 2 − (M (X))2 .
(5.13)
Д о к а з а т е л ь с т в о. Используя свойства 5.5 и 5.8 математического ожидания, получаем
M (X − M (X))2 = M (X 2 ) − 2X · M (X) + (M (X)2 ) =
= M X 2 − 2M (X)M (X) + (M (X)2 =
= M X 2 − 2(M (X))2 + (M (X))2 = M X 2 − (M (X))2 .
Задача 5.11. В условиях задачи 5.1 найдите дисперсию δ.
Решение. Для того, чтобы вычислить дисперсию дискретной случайной величины δ с помощью формулы 5.13, дополним таблицу её закона
распределения строчкой квадратов её значений:
δ2 4
25
64 121
δ
2
5
8
11
p 0,46 0,29 0,11 0,14
Вычислим
M (δ 2 ) = 4 · 0, 46 + 25 · 0, 29 + 64 · 0, 11 + 121 · 0, 14 ⇒ M (δ 2 ) = 23, 07.
Далее, возведём в квадрат найденное при решении задачи 5.8 значение
математического ожидания δ:
(M (δ))2 = (4, 79)2 ⇒ (M (δ))2 = 22, 94.
Вычитая его из M (δ 2 ):
23, 07 − 22, 94 = 0, 13,
получаем значение дисперсии δ:
D(δ) = 0, 13.
Задача 5.12. В условиях задачи 5.8 найдите дисперсию P .
Решение. Аналогично решению задачи 5.11 дополним таблицу значений закона распределения случайной величины P строкой из квадратов её
значений:
P2
P
p
0 1 4 9
0 1 2 3
1 3 3 1 .
14 7 7 14
Вычислим
1
3
3
1
11
M (P 2 ) = 0 ·
+1· +4· +9·
⇒ M (P 2 ) = 2 .
14
7
7
14
14
98
Зная из решения задачи 5.8 значение M (P ) = 1, 5, найдём его квадрат:
(M (P ))2 = (1, 5)2 ⇒ (M (P ))2 = 2, 25.
Вычитая найденное значение из M (P 2 ):
11
1 15
2 −2 = ,
14
4 28
получаем значение дисперсии P :
D(P ) ≈ 0, 54.
Задача 5.13. Известно, что некоторая случайная величина может
принимать значения 0, 3 и 5. Известно, что математическое ожидание
равно 2, а дисперсия − 3. Найдите закон распределения случайной величины.
Решение. Предположим, что события, соответствующие указанным
значениям, наступают соответственно с вероятностями p1 , p2 и p3 .
Тогда таблица закона распределения данной случайной величины вместе
с дополнительной строкой квадратов её значений будет иметь следующий
вид:
P 2 0 9 25
P 0 3 5 .
p p1 p2 p3
Согласно условию (5.1), для вероятностей имеет место равенство:
p1 + p2 + p3 = 1.
Из условия задачи и формулы (5.5) для математического ожидания данной
случайной величины можно составить следующее равенство:
0 · p1 + 3 · p2 + 5 · p3 = 2.
Зная дисперсию случайной величины, с помощью формулы (5.13) можно
получить ещё одно равенство:
0 · p1 + 9 · p2 + 25 · p3 − 22 = 3.
Приведя подобные, составим следующую систему уравнений:

 p1 + p2 + p3 = 1
3p2 + 5p3 = 2

9p2 + 25p3 = 7.
Решив систему, находим
p1 = 0, 4; p2 = 0, 5; p3 = 0, 1.
Следовательно, закон распределения данной случайной величины имеет
такой вид:
P 0
3
5
.
p 0, 4 0, 5 0, 1
99
5.4.7
Свойства дисперсии
Свойство 5.9. Дисперсия постоянной величины C равна нулю:
D(C) = 0.
Подставляя X = C в определение дисперсии 5.13, имеем
D(C) = M (C − M (C))2 .
Поскольку математическое ожидание постоянной равно самой постоянной
(см. свойство 5.5), то, преобразуя правую часть полученного равенства,
имеем
M (C − M (C))2 = M (C − C)2 = M (0) = 0 ⇒ M (D) = 0.
Свойство 5.10. Постоянный множитель можно выносить за знак
дисперсии, предварительно возведя его в квадрат:
D(CX) = C 2 D(X).
Подставляя в определение дисперсии 5.13 вместо X случайную величину CX, получаем
D(CX) = M (CX − M (CX))2 .
Так как постоянный множитель можно выносить из-под знака математического ожидания, то преобразуем правую часть представления D(CX):
M (CX − CM (X))2 = M (C 2 (X − M (X))2 ) = C 2 M (X − M (X))2 ⇒
⇒ D(CX) = C 2 D(X).
Свойство 5.11. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин:
D(X + Y ) = D(X) + D(Y ).
Подставим в формулу вычисления дисперсии (5.13) вместо X случайную величину X + Y :
D(X + Y ) = M (X + Y )2 − (M (X + Y ))2 .
Далее, опираясь на свойства математического ожидания 5.7-5.8, преобразуем правую часть
равенства.
полученного
2
2
M (X + Y ) −(M (X +Y )) = M (X 2 +2XY +Y 2 )−(M (X)+M (Y ))2 =
= M (X 2 )+2M (X)·M (Y )+M (Y 2 )−(M (X))2 −2M (X)·M (Y )−(M (Y ))2 =
= (M (X 2 ) − (M (X))2 ) + (M (Y 2 ) − (M (Y ))2 ) ⇒ D(X + Y ) = D(X) + D(Y ).
Свойство 5.12. Дисперсия разности двух независимых случайных величин равна сумме дисперсий этих величин:
D(X − Y ) = D(X) + D(Y ).
Так как X − Y = X + (−1) · Y , то
D(X − Y ) = D(X + (−1) · Y ).
Далее с помощью свойств 5.11-5.12 имеем
D(X + (−1) · Y ) = D(X) + D((−1) · Y ) = D(X) + (−1)2 D(Y ) =
100
= D(X) + D(Y ) ⇒ D(X − Y ) = D(X) + D(Y ).
Замечание 5.10. Заметим, что свойство 5.11 имеет место для любого
конечного числа взаимно независимых случайных величин:
D(X1 + X2 + · · · + Xn ) = D(X1 ) + D(X2 ) + · · · + D(Xn ).
(5.14)
Замечание 5.11. О механическом смысле дисперсии дискретной случайной величины. С точки зрения теоретической механики дисперсия дискретной случайной величины определяет момент инерции относительно центра «масс» системы материальных точек, расположенных на прямой, общая «масса» которых равна единице. При этом «масса» каждой «точки» xi равна вероятности pi , соответствующей этой
«точке»1 . Иными словами, дисперсия характеризует степень разбросанности «точек» системы относительно центра «масс».
5.4.8
Среднее квадратическое отклонение
Так как дисперсия определяет квадрат отклонения случайной величины
от её среднего значения, то кроме неё вводят ещё одну характеристику.
Определение 5.14. Средним квадратическим отклонением случайной величины X называется квадратный корень из её дисперсии:
¸(X) =
p
D(X).
(5.15)
Задача 5.14. В условиях задачи 5.1 найдите среднее квадратическое
отклонение δ.
Решение. Так как при решении задачи 5.11 было найдено значение
дисперсии D(δ) = 0, 13, то, согласно формуле 5.15, имеем
p
¸(δ) = 0, 13 ⇒ ¸(δ) ≈ 0, 36.
Предположим, что известны средние квадратические отклонения двух
независимых случайных величин. О том, как выглядит среднее квадратическое отклонение их суммы, говорит следующая
Теорема 5.3. Среднее квадратическое отклонение суммы двух независимых случайных величин равно квадратному корню из суммы квадратов
среднеквадратических отклонений этих величин:
p
σ(X + Y ) = σ 2 (X) + σ 2 (Y ).
Д о к а з а т е л ь с т в о. Предположим, что X и Y две независимые
случайные величины, а их сумма Z = X + Y . Согласно свойству 5.11
1
Здесь i пробегает конечное или бесконечное подмножество множества натуральных чисел, а под
«точкой» xi понимается возможное значение случайной величины X.
101
D(Z) = D(X) + D(Y ).
Извлекая квадратный корень
p из обеих
p частей данного равенства, получаем
D(Z) = D(X) + D(Y ).
Из равенства 5.15 следует, что
D(X) = σ 2 (X), D(Y ) = σ 2 (Y ), а D(Z) = σ 2 (Z).
Поэтому
p
σ(Z) = σ 2 (X) + σ 2 (Y ).
Заменяя Z на сумму X + Y , убеждаемся в истинности теоремы1 .
Задача 5.15. Две случайные величины X и Y заданы своими законами
распределения:
Y −1 0
1
2
.
p 0, 2 0, 3 0, 4 0, 1
X 1
2
3
p 0, 5 0, 3 0, 2
1. Вычислите M (X − 2Y ) и D(X − 2Y ).
2. Вычислите M (2X + 3Y ) и D(2X + 3Y ).
Решение. Вычислим для каждой из случайных величин математическое ожидание и дисперсию.
Согласно формуле 5.5
M (X) = 1 · 0, 5 + 2 · 0, 3 + 3 · 0, 2 ⇒ M (X) = 1, 7;
M (Y ) = −1 · 0, 2 + 0 · 0, 3 + 1 · 0, 4 + 2 · 0, 1 ⇒ M (Y ) = 0, 4.
Для того, чтобы вычислить дисперсии, надстроим в каждой из таблиц
строки квадратов значений величин:
X2 1
4
9
X
1
2
3
p 0, 5 0, 3 0, 2
Y2 1
0
1
4
Y −1 0
1
2 .
p 0, 2 0, 3 0, 4 0, 1
Далее, вычислим M (X 2 ) и M (Y 2 ).
M (X 2 ) = 1 · 0, 5 + 4 · 0, 3 + 9 · 0, 2 ⇒ M (X 2 ) = 3, 5;
M (Y 2 ) = 1 · 0, 2 + 0 · 0, 3 + 1 · 0, 4 + 4 · 0, 1 ⇒ M (Y 2 ) = 1.
С помощью формулы (5.13) найдём дисперсии заданных случайных величин:
D(X) = 3, 5 − (1, 7)2 ⇒ D(X) = 0, 61;
D(Y ) = 1 − (0, 4)2 ⇒ D(Y ) = 0, 84.
Используя свойства математического ожидания случайных величин (см.
5.6 и 5.7), определим математические ожидания заданных линейных комбинаций случайных величин:
M (X − 2Y ) = M (X) − 2M (Y ) ⇒
1
Аналогично можно распространить это свойство на сумму конечного числа попарно независимых
случайных величин.
102
⇒ M (X − 2Y ) = 1, 7 − 2 · 0, 4 ⇒ M (X − 2Y ) = 0, 9;
M (2X + 3Y ) = 2M (X) + 3M (Y ) ⇒
⇒ M (2X + 3Y ) = 2 · 1, 7 + 3 · 0, 4 ⇒ M (2X + 3Y ) = 4, 6.
Так как X и Y − независимые случайные величины, то с помощью
свойств 5.10 и 5.11 вычислим дисперсии указанных линейных комбинаций
случайных величин:
D(X − 2Y ) = D(X) + 4M (Y ) ⇒
⇒ D(X − 2Y ) = 0, 61 + 4 · 0, 84 ⇒ D(X − 2Y ) = 3, 97;
D(2X + 3Y ) = 4D(X) + 9D(Y ) ⇒
⇒ D(2X + 3Y ) = 4 · 0, 61 + 9 · 0, 84 ⇒ D(2X + 3Y ) = 10.
В итоге, имеем
M (X − 2Y ) = 0, 9; D(X − 2Y ) = 3, 97;
M (2X + 3Y ) = 4, 6; D(2X + 3Y ) = 10.
Задача 5.16. Подбрасывают два игральных кубика. Случайная величина X − сумма выпавших очков. Найдите закон распределения, математическое ожидание и дисперсию.
Решение. Каждый кубик имеет 6 одинаковых граней. Так как каждый кубик подбрасывается независимо от другого, то согласно принципу
произведения, общее число вариантов выпадения двух цифр на кубиках
равно n = 6 · 6, то есть n = 36.
При этом сумма выпавших очков может принимать все целочисленные
значения от двух (если выпадет вариант 1-1), до 12 (если выпадет вариант
6-6).
1. X = 2 : A2 =на первой кости выпало 1 очко и B2 =на второй кости
выпало 1 очко.
1 1
1
P (X = 2) = P (A2 )P (B2 ) ⇒ P (X = 2) = · ⇒ P (X = 2) = .
6 6
36
2. X = 3 : A31 =на первой кости выпало 1 очко и B31 =на второй кости
выпало 2 очка или A32 =на первой кости выпало 2 очка и
B22 =на второй кости выпало 1 очко.
P (X = 3) = P (A31 )P (B31 ) + P (A32 )P (B32 ) ⇒
1 1 1 1
2
⇒ P (X = 3) = · + · ⇒ P (X = 3) = .
6 6 6 6
36
3. X = 4 : A41 =на первой кости выпало 1 очко и B41 =на второй кости
выпало 3 очка или A42 =на первой кости выпало 2 очка и
B42 =на второй кости выпало 2 очка или A43 =на первой кости
выпало 3 очка и B43 =на второй кости выпало 1 очко.
P (X = 4) = P (A31 )P (B31 ) + P (A32 )P (B32 ) ⇒
103
1 1 1 1
2
· + · ⇒ P (X = 3) = .
6 6 6 6
36
Продолжив разбор вариантов выпадения очков для каждого значения
суммы аналогичным образом, получим таблицу закона распределения для
изучаемой случайной величины X:
⇒ P (X = 4) =
X
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1 .
p
36 36 36 36 36 36 36 36 36 36 36
Складывая вероятности из второй строки:
1
2
3
4
5
6
5
4
3
2
1
+
+
+
+
+
+
+
+
+
+
= 1,
36 36 36 36 36 36 36 36 36 36 36
убеждаемся в правильности составления закона распределения.
Умножая скалярно вектор значений X на вектор вероятностей
1
2
3
4
5
6
5
2·
+3·
+4·
+5·
+6·
+7·
+8· +
36
36
36
36
36
36
36
4
3
2
1
252
+9 ·
+ 10 ·
+ 11 ·
+ 12 ·
=
= 7,
36
36
36
36
36
находим математическое ожидание M (X) = 7.
Далее, дополняя таблицу строкой квадратов значений случайной величины
X2
X
4 9 16 25 36 49 64 81 100 121 144
2 3 4 5 6 7 8 9 10 11 12 ,
1 2 3 4 5 6 5 4
3
2
1
p
36 36 36 36 36 36 36 36 36 36 36
вычисляем математическое ожидание квадрата случайной величины:
1
2
3
4
5
6
5
+9·
+ 16 ·
+ 25 ·
+ 36 ·
+ 49 ·
+ 64 · +
4·
36
36
36
36
36
36
36
4
3
2
1
1974
+81 ·
+ 100 ·
+ 121 ·
+ 144 ·
=
≈ 54, 83.
36
36
36
36
36
После применения формулы 5.13 находим дисперсию
D(X) = 54, 83 − 49 ⇒ D(X) ≈ 5, 83.
Замечание 5.12. Следует заметить, что эту задачу можно было бы
решить со значительно меньшими усилиями, если рассматривать искомую
случайную величину X как сумму двух случайных величин X1 и X2 , каждая из которых представляет число выпавших очков на соответствующем
кубике.
Так как кубики одинаковы, то X1 = X2 .
Поэтому, M (X1 ) = M (X2 ) и D(X1 ) = D(X2 ).
Так как вероятность выпадения одной грани вверх величина постоянная
104
1
и равная , то
6
1
1
1
1
1
1
M (X1 ) = M (X2 ) = 1 · + 2 · + 3 · + 4 · + 5 · + 6 · ⇒
6
6
6
6
6
6
⇒ M (X1 ) = M (X2 ) = 3, 5
Аналогично, вычисляем M (X12 ) = M (X22 )
1
1
1
1
1
1
1 · + 4 · + 9 · + 16 · + 25 · + 36 · ⇒
6
6
6
6
6
6
91
⇒ M (X12 ) = M (X22 ) =
≈ 15, 16.
6
Следовательно, D(X1 ) = D(X2 ) = 15, 16 − (3, 5)2 ⇒
⇒ D(X1 ) = D(X2 ) ≈ 2, 91.
Согласно свойствам математического ожидания и дисперсии (см. 5.7 и 5.11)
M (X1 + X2 ) = M (X1 ) + M (X2 ); D(X1 + X2 ) = D(X1 ) + D(X2 ).
Поэтому, M (X) = 2M (X1 ), D(X) = 2D(X1 ) ⇒
M (X) = 7; D(X) = 5, 82 .
5.5
Одинаково распределённые независимые случайные
величины
Предположим, что две независмые случайные величины X1 и X2 имеют
одинаковые распределения. Очевидно, что они имеют и одинаковые числовые характеристики. Рассмотрим среднее арифметическое этих величин.
Обозначив среднее арифметическое этих величин
X̄ =
X 1 + X2
,
2
введём также следующие обозначения:
M (X1 ) = M (X2 ) = a, D(X1 ) = D(X2 ) = D, σ(X1 ) = σ(X2 ) = σ.
С помощью этих обозначений рассмотрим связь между числовыми характеристиками среднего арифметического и соответствующими характеристиками каждой из величин.
Свойство 5.13. Математическое ожидание среднего арифметического двух одинаково распределённых независимых случайных величин равно
математическому ожиданию каждой из этих величин, то есть
M (X̄) = a.
Из свойств линейности математического ожидания (см. 5.6-5.7) следует
X1 + X2
M (X1 ) + M (X2 ) a + a
M
=
=
= a ⇒ M (X̄) = a.
2
2
2
105
Свойство 5.14. Дисперсия среднего арифметического двух одинаково
распределённых независимых случайных величин в два раза меньше дисперсии каждой из них:
D
D(X̄) = .
2
Из свойств дисперсии для независимых случайных величин (см. 5.105.11) следует
X1 + X2
D(X1 ) + D(X2 ) D + D
D
D
D
=
=
=
⇒
D(
X̄)
=
.
2
22
4
2
2
Свойство 5.15. Среднее квадратическое отклонение среднего арифметического
√ двух одинаково распределённых независимых случайных величин в 2 раз меньше среднего квадратического отклонения каждой из
них:
σ
σ(X̄) = √ .
2
Из определения 5.14 и свойства 5.14 имеем
r
√
p
D
D
σ
σ
= √ = √ ⇒ σ(X̄) = √ .
D(X) =
2
2
2
2
Замечание 5.13. Нетрудно заметить, что свойства 5.13-5.15 имеют
место для любого конечного числа независимых случайных величин.
Замечание 5.14. Из свойства 5.15 следует, что среднее арифметическое двух независимых случайных величин имеет меньшее рассеивание,
чем каждая из них.
В силу замечания 5.13 можно предположить, что для большого количества взаимно независимых случайных величин их среднее арифметическое
будет иметь значительно меньшее рассеивание, чем каждая из них. Этим и
объясняется, что на практике при проведении большого числа измерений
некоторой характеристики выбирают среднее арифметическое этих измерений.
Среди большого мира распределений вероятностей всевозможных дискретных случайных величин наибольший интерес на практике представляют рассмотренные ниже распределения.
5.6
5.6.1
Примеры распределений дискретных случайных величин
Биномиальное распределение вероятностей
Рассмотрим решение следующей задачи.
Задача 5.17. В городе 3 коммерческих банка. У каждого риск банкротства в течение года составляет 20%. Составьте ряд распределения
106
числа банков, которые могут обанкротиться в течение следующего года,
а также найдите математическое ожидание и дисперсию полученного
распределения.
Решение. Пусть случайная величина Y − число банков, которые могут обанкротиться в течение следующего года. По условию задачи Y может
принимать значения из множества {0, 1, 2, 3}.
Поскольку вероятность банкротства для каждого банка p = 0, 2 постоянна, то вероятность того, что каждый банк не обанкротится, q = 0, 8
(q = 1 − 0, 2), также постоянна, следовательно, вычисление вероятностей
банкротства для каждого банка определяется одной и той же формулой
Бернулли (при n = 3)
Pn (k) = Cnk pk q n−k .
Вычислим эти вероятности.
1. P (Y = 0) = C30 (0, 2)0 · (0, 8)3 ⇒ P (Y = 0) = 0, 512.
2. P (Y = 1) = C31 (0, 2)1 · (0, 8)2 ⇒ P (Y = 1) = 0, 384.
3. P (Y = 2) = C32 (0, 2)2 · (0, 8)1 ⇒ P (Y = 2) = 0, 096.
4. P (Y = 3) = C33 (0, 2)3 · (0, 8)0 ⇒ P (Y = 3) = 0, 008.
Так как сумма найденных вероятностей
0, 512 + 0, 384 + 0, 096 + 0, 008 = 1,
то закон распределения вероятностей для Y имеет следующий вид:
Y
0
1
2
3
.
p 0, 512 0, 384 0, 096 0, 008
Далее, согласно 5.5, вычислим математическое ожидание Y :
M (Y ) = 0 · 0, 512 + 1 · 0, 384 + 2 · 0, 096 + 3 · 0, 008 ⇒ M (Y ) = 0, 6.
Построим над таблицей строку квадратов значений Y и определим
M (Y 2 ):
Y2
0
1
4
9
Y
0
1
2
3 .
p 0, 512 0, 384 0, 096 0, 008
M (Y 2 ) = 0 · 0, 512 + 1 · 0, 384 + 4 · 0, 096 + 9 · 0, 008 ⇒ M (Y 2 ) = 0, 84.
Вычитая из полученного результата квадрат математического ожидания, находим:
D(Y ) = 0, 84 − (0, 6)2 ⇒ D(Y ) = 0, 48.
Анализируя решение этой задачи, можно сделать несколько выводов:
1. Математическое ожидание Y и её дисперсия были вычислены благода107
ря построению закона распределения вероятностей.
2. Закон распределения вероятностей был построен потому, что случайная
величина Y в условии задачи принимала всего четыре значения.
Возникает вполне естественный вопрос: как искать математическое
ожидание и дисперсию, описывающие основные характеристики случайной величины, если случайная величина принимает гораздо большее число
значений?
Так как схема Бернулли (см. определение 4.1) встречается достаточно
часто, то попробуем разобраться с характеристиками случайной величины,
вероятности значений которой связаны со схемой Бернулли, в общем случае.
Предположим, что в некотором опыте, состоящем из n независимых исходов, интересующее нас событие A наступает в каждом из этих исходов с
постоянной вероятностью p (соответственно не наступает с вероятностью
q = 1 − p).
Число исходов, в которых может наступить событие A, будем рассматривать как случайную величину X.
Из схемы Бернулли (см. определение 4.1) вытекает, что вероятность того, что событие A наступит k раз в данном опыте, определяется формулой
Бернулли
Pn (k) = Cnk pk q n−k .
Определение 5.15. Дискретная случайная величина X называется
распределённой по биномиальному закону, если вероятности событий
{ωk : X = k} определяются по формуле Бернулли.
Построим закон распределения этой величины. Для этого, как и Я. Бернулли1 , воспользуемся несимметричной монетой.
Пусть вероятность выпадения герба равна p, а вероятность выпадения
решётки q = 1 − p. В этом случае закон распределения случайной величины X − числа выпадений герба − будет иметь следующий вид
X 0 1
.
p q p
Если монету подбросить два раза, то вероятность того, что герб выпадет 0, 1, 2 раза будет соответственно равна q 2 , 2qp, p2 . Поэтому закон
распределения в этом случае примет вид
X 0 1
2
.
2
p q 2qp p2
1
См. Корбалан Ф., Санц Х. Укрощение случайности. Теория вероятностей. М. : Де Агостини, 2014.
С. 48.
108
В случае трёхкратного подбрасывания монеты вероятность того, что
герб выпадет 0, 1, 2, 3 раза будет соответственно равна q 3 , 3q 2 p, 3qp2 , p3 .
При этом закон распределения примет вид
X 0
1
2
3
.
3
2
2
p q 3q p 3qp p3
Выпишем для каждого из вышеприведённых законов распределения случайной величины X соответствующюю сумму вероятностей:
q + p = 1;
2
q + 2qp + p2 = (q + p)2 = 1;
q 3 + 3q 2 p + 3qp2 + p3 = (q + p)3 = 1.
В полученных выражениях легко увидеть знакомые каждому школьнику квадрат суммы и куб суммы. Очевидно, что продолжая подбрасывать
монету и записывать с помощью формулы Бернулли (4.1) соответствующие
вероятности, мы получим таблицу закона распределения в общем случае:
X 0
1
2
...
n
1 n−1
2 2 n−2
p q Cn pq
Cn p q
...
k
Cnk pk q n−k
...
...
n−1
Cnn−1 pn−1 q
n
.
pn
Из вышесказанного логично предположить1 , что сумма вероятностей
q n + Cn1 pq n−1 + Cn2 p2 q n−2 · · · + Cnk pk q n−k + Cnn−1 pn−1 q + pn = (q + p)n = 1.
Так как сумма вероятностей в итоге превратилась в бином Ньютона2 ,
(q + p)n , то именно по этой причине распределение назвали − биномиальным распределением.
Далее, нам нужно вычислить математическое ожидание X. Но решать
эту задачу «в лоб» с помощью формулы (5.5) проблематично, так как для
этого придётся залезть в дебри комбинаторики.
Поэтому подойдём к этой проблеме с другой стороны.
Представим, что случайная величина X − число появлений события A является суммой чисел появлений события A в отдельных испытаниях.
То есть если случайная величина X1 − число появлений A в первом
испытании; случайная величина X2 − число появлений A во втором испытании; . . . ; случайная величина Xn − число появлений A в n−м испытании,
то
X = X1 + X2 + · · · + Xn .
Так как каждое из слагаемых в последнем равенстве представляет число
1
Конечно, с точки зрения математики этот факт не мешало бы доказать с помощью метода математической индукции (но это мы оставим читателям).
2
Бином Ньютона − формула для разложения на отдельные слагаемые целой неотрицательной степени суммы двух переменных, имеющая вид
(a + b)n = Cn0 an + Cn1 an−1 b + Cn2 an−2 b2 + · · · + Cnk an−k bk + · · · + Cnn bn .
109
появлений события в одном испытании, то закон распределения вероятностей для каждого из них можно описать в виде следующей таблицы:
Xk = k 0 1
.
p
q p
Следовательно, M (Xk ) = 0 · q + 1 · p ⇒ M (Xk ) = p, (k = 1, n).
Согласно свойству 5.7 для математического ожидания
M (X) = M (X1 ) + M (X2 ) + · · · + M (Xn ).
Подставив вместо каждого слагаемого в равенстве p, получим
M (X) = np.
(5.16)
Применим этот подход для вычисления дисперсии биномиального распределения вероятностей.
Здесь нам придётся учесть что так как каждый исход в опыте не зависит от
от другого исхода, то рассматриваемые случайные величины Xk взаимно
независимы. Поэтому, согласно свойству 5.11
D(X) = D(X1 ) + D(X2 ) + · · · + D(Xn ).
Очевидно также, что
D(X1 ) = D(X2 ) = · · · = D(Xn ).
Для вычисления D(Xk ) добавим в последний закон распределения строку квадратов значений Xk :
Xk2 = k 2 0 1
Xk = k 0 1 .
p
q p
Найдём M (Xk2 ):
M (Xk2 ) = 0 · q + 1 · p ⇒ M (Xk2 ) = p, (k = 1, n).
Вычитая из этого представления квадрат математического ожидания Xk ,
имеем
D(Xk ) = p − p2 ⇒ D(Xk ) = p(1 − p) ⇒ D(Xk ) = pq (k = 1, n).
Подставляя последний результат в сумму для вычисления дисперсии X,
имеем
D(X) = npq.
(5.17)
Замечание 5.15. Если бы мы знали формулы (5.16) и (5.17) до решения задачи 5.17, то мы бы нашли математическое ожидание и дисперсию
для случайной величины Y гораздо быстрее. Теперь же остаётся только
проверить правильность тех вычислений.
110
В задаче 5.17 n = 3, p = 0, 2, q = 0, 8. Поэтому,
M (Y ) = 3·0, 2 ⇒ M (Y ) = 0, 6; D(Y ) = 3·0, 2·0, 8 ⇒ D(Y ) = 0, 48.
То есть ошибок ранее мы не допустили.
Замечание 5.16. В заключение заметим, что биномиальное распределение применяется там, где требуется оценка количества успехов в выборке,
состоящей из n наблюдений, например, при проведении выборочного контроля за качеством производственных изделий, при котором отбор изделий
для пробы производится по схеме случайной повторной выборки, То есть
когда проверенные изделия возвращаются в исходную партию. Тогда количество нестандартных изделий среди отобранных есть случайная величина
с биномиальным законом распределения вероятностей.
Кроме этого, биномиальное распределение связано с задачами о случайных блужданиях и перемешиваниях.
С ростом n биномиальное распределение стремится к непрерывному нормальному распределению вероятностей.
Если же при n → ∞ p → 0 таким образом, что произведение λ = np является величиной постоянной, биномиальное распределение вероятностей
превращается в пуассоновское распределение.
5.6.2
Распределение Пуассона
Определение 5.16. Дискретная случайная величина X называется распределённой по закону Пуассона1 , если вероятности событий
{ωk : X = k} определяются по формуле Пуассона:
Pn (k) =
λk
k!
e−λ .
(5.18)
В отличие от биномиального распределения распределение Пуассона является бесконечным, То есть случайная величина пробегает счётное множество значений.
Поэтому её закон распределения имеет следующий вид:
X
p
0
1
e−λ λe−λ
2
2
...
λ −λ
e
...
2
k
...
k
.
λ −λ
e
...
k!
Чтобы убедиться, что таблица истинна, вычислим сумму вероятностей
1
Распределение, названное пуассоновским, было рассмотрено в предельной форме С. Д. Пуассоном
в 1830 году в работе, посвященной соотношению рождаемости мальчиков и девочек (Memoire sur la
proportion des naissances des filles et des garcons), а затем в 1837 году в приближённой форме в работе
«Исследования о вероятности приговоров в уголовных и гражданских делах» ( the Recherches sur la
probabilite des jugements en matiere criminelle et matiere civil) (cм. Earliest Known Uses of Some of the
Words of Mathematics (P) [Электронный ресурс] : URL : http://jeff560.tripod.com/v.html (дата
обращения: 12.06.2016)).
111
λ2 −λ
λk −λ
e + λe + e · · · + e + . . . .
2!
k!
Вынеся e−λ , как общий множитель,
за скобки, имеем
2
λ λ
λk
−λ
e
1+ +
··· +
+ ... .
1! 2!
k!
Можно заметить, что числовой ряд в скобке является рядом Маклорена для функции eλ . Заменив скобку суммой ряда, получаем произведение
e−λ eλ = 1.
Таким образом, мы показали, что сумма вероятностей равна 1, а значит,
распределение построено правильно.
Используя формулу 5.5, вычислим математическое ожидание X:
λ2
λk
M (X) = 0 · e−λ + 1 · λe−λ + 2 · e−λ · · · + k · e−λ + . . . .
2!
k!
С помощью знака сокращённого суммирования перепишем правую часть
равенства в компактной форме и преобразуем
∞
X
λk −λ
λk −λ
λ2 −λ
−λ
−λ
k e .
0 · e + 1 · λe + 2 · e · · · + k · e + · · · =
2!
k!
k!
−λ
−λ
k=0
Так как при k = 0 первое слагаемое суммы обращается в нуль, то изменим
нижнее значение индекса суммирования на единицу:
∞
∞
∞
∞
X
X
λk −λ X λk −λ X
λk
λk
−λ
k e =
k e =
k
e =
e−λ .
k!
k!
k(k − 1)!
(k − 1)!
k=1
k−1
k=0
k
Представив λ = λ · λ
k=1
−λ
k=1
, вынесем λe за знак суммирования:
∞
X
λk−1
−λ
λe
.
(k − 1)!
k=1
Заменив переменную суммирования k − 1 = m ⇒ m = 0, имеем
∞
∞
X
X
λk−1
λm
−λ
−λ
λe
= λe
.
(k − 1)!
m!
m=0
k=1
∞
m
X
λ
Как мы видели выше, ряд
− ряд Маклорена для функции eλ .
m!
m=0
Следовательно, M (X) = λe−λ · eλ . Таким образом,
M (X) = λ.
(5.19)
Далее, дополнив таблицу распределения Пуассона строкой для квадратов значений случайной величины, определим M (X 2 ).
X2
X
p
0
0
e
−λ
1
1
−λ
λe
4
2
...
...
λ2 −λ
e
...
2
112
k2
k
λk −λ
e
k!
...
... .
...
Для этого представим скалярное произведение векторов строки квадратов
и вероятностей в компактном виде и преобразуем его:
∞
k
k
X
λ2 −λ
2 λ −λ
−λ
−λ
2 λ −λ
k
0 · e + 1 · λe + 4 · e · · · + k · e + · · · =
e =
2!
k!
k!
k=0
=
∞
X
k=1
∞
X λk−1
λ · λk−1 −λ
k
k
e =λ
e−λ .
k(k − 1)!
(k − 1)!
2
k=1
Представив k = (k − 1) + 1, перепишем последнюю сумму и разобъём её на
две:
!
∞
∞
∞
k−1
k−1
X
X
X
λ
λk−1 −λ
λ
(k − 1)
e = λe−λ
+
.
((k − 1) + 1)
λ
(k − 1)!
(k − 1)!
(k − 1)!
k=1
k=1
k=1
Заменив, как и выше, k − 1 = m ⇒ m = 0, преобразуем последнее
равенство к виду
!
∞
∞
m
m
X
X
λ
λ
λe−λ
m
+
.
m!
m!
m=0
m=0
Так как λe
−λ
∞
X
λm
λm
2
−λ
= λ (см. с. 109), а λe
= λ, то
m
m!
m!
m=0
m=0
∞
X
M (X 2 ) = λ2 + λ.
Поэтому, вычитая из этого результата квадрат математического ожидания M (X), получаем:
D(X) = λ.
(5.20)
Замечание 5.17. Следует заметить, что распределение вероятностей
Пуассона играет важную роль во многих задачах физики, теории связи,
теории надежности, теории массового обслуживания.
В заключение рассмотрим задачу, которая привела к понятию математического ожидания. Задача была впервые сформулирована в 1713 году
Н. Бернулли1 и в дальнейшем стала известна как Санкт-петербургский
парадокс2 .
В начале XVIII столетия в Санкт-Петербурге популярной была игра:
правильная монета подбрасывается до тех пор, пока не выпадет «решётка».
Если «решётка» выпадет при k-м бросании, то игрок получает из банка
2k рублей. То есть с каждым бросанием его выигрыш удваивается.
Первый вопрос звучал так: Сколько нужно заплатить игроку за уча1
См. Википедия [Электронный ресурс] : URL : https://isaran.ru/?q=ru/person&guid=
-58575804-D56F-F367-59CE-8763F90CD305(\T2A\cyrd\T2A\cyra\T2A\cyrt\T2A\cyra\T2A\cyro\
T2A\cyrb\T2A\cyrr\T2A\cyra\T2A\cyrshch\T2A\cyre\T2A\cyrn\T2A\cyri\T2A\cyrya:12.06.2016).
2
См. Корбалан Ф., Санц Х. Указ. соч. С. 43-45.
113
стие в игре, чтобы игра стала «безобидной» («безобидность» игры предполагает, что математическое ожидание чистого выигрыша должно
быть равно нулю)?
Решение. Пусть X − величина выигрыша игрока. Так как с каждым
бросанием его выигрыш удваивается, то X может принимать следующие
значения:
X 2 22 23 . . . 2k . . .
1
Учитывая что при k-м возможном значении X вероятность выигрыша k ,
2
составим закон распределения
X 2 22
1 1
p
2 22
23 . . .
1
...
23
2k . . .
1
...
2k
Вычисляя математическое ожидание
1
1
1
M (X) = 2 · 2 + 22 · 2 + · · · + 2k · k + · · · ⇒ M (X) = 1 + 1 + . . . ,
2
2
2
быстро убедились, что такая постановка задачи приводит к парадоксу: потери банка имеют бесконечное математическое ожидание.
Поэтому, исходя из ограниченности ресурсов, был сформулирован второй вопрос. Решить задачу, предполагая, что в банке 1000000 рублей и
действует соглашение о том, что в случае выпадания «решётки» при
k-м бросании монеты или позднее, если 2k > 1000000, то весь банк отдаётся игроку в качестве выигрыша.
Оценим 1000000 = 106 с помощью степеней двойки
524288 = 1019 < 106 < 1020 = 1048576.
Выделим частичную сумму 19 слагаемых1
1
1
1
1
1
2 · 2 + 22 · 2 + · · · + 219 · 19 +
+ 20 + . . . · 106 =
20
2
2
2
2
2
1 1
106
1
106
≈ 19 + 2 · 0, 954 = 20, 908.
19 + 1 + + + . . . · 20 = 19 +
·
2 4
2
1 − 12 220
Таким образом, M (X) ≈ 21. Следовательно, среднее значение выигрыша игрока 21 рубль. Отсюда можно сделать вывод о том, что
если вступительный взнос игрока будет равен 21 рублю,
то игра может стать выгодной для банка.
1
Так как с учётом соглашения больше 1000000 игрок не получит, то все последующие выигрыши
можно ограничить этой суммой, которая окажется общим множителем ряда, составленного из членов
геометрической прогрессии.
114
Непрерывные случайные величины
6
Теория вероятностей есть
в сущности не что иное, как
здравый смысл, сведенный
к исчислению.
Пьер Симон де Лаплас1
6.1
Определение непрерывной случайной величины
Понятие закона распределения (см. определение 5.2) имеет смысл только
в том случае, когда случайная величина принимает конечное или счётное
множество значений. Если же значения случайной величины представляют
«сплошное» множество точек на числовой прямой, то это понятие теряет
свой смысл.
В то же время определение функции распределения 5.3
F (x) = P (X < x)
как более общее понятие остаётся в силе.
Для того, чтобы ввести с помощью функции распределения новый класс
случайных величин, понадобится два понятия из мира математического
анализа:
Определение 6.1. Функция f (x) называется кусочно непрерывной на некотором множестве, если она непрерывна внутри множества за исключением конечного числа точек, а на границах множества
имеет односторонние пределы.
Определение 6.2. Функция f (x) называется кусочно дифференцируемой на некотором множестве, если её производная на этом
множестве имеет конечное число точек разрыва.
Так, например, функция f (x) = |x| является кусочно дифференцируемой функцией на отрезке [−1; 1].
Она непрерывна на отрезке [0; 1] (рис. 6.1), а её производная2
−1, если − 1 ≤ x < 0,
f 0 (x) =
1, если
0 < x ≤ 1.
является кусочно непрерывной, имея разрыв первого рода в точке x = 0
(рис. 6.2).
1
2
См. Вероятность и математическая статистика... С. 863.
В точках x = −1 и x = 1 речь идёт о соответствующих односторонних производных.
115
y
y
1
1
x
−1
x
−1
1
1
−1
Рис. 6.1
Рис. 6.2
Зная о том, что представляют собой кусочно непрерывные и конечно
дифференцируемые функции, можно ввести следующее
Определение 6.3. Случайная величина X называется непрерывной, если её функция распределения F (x) является непрерывной, кусочно дифференцируемой функцией, производная которой кусочно непрерывна в области определения.
Восстановим сформулированные в предыдущей главе свойства
функции распределения:
Свойство 5.1 ∀ x 0 ≤ F (x) ≤ 1.
Свойство 5.2 ∀ x1 , x2 : x1 < x2 ⇒ F (x1 ) ≤ F (x1 ).
Свойство 5.3 lim F (x) = 0.
x→−∞
Свойство 5.4 lim F (x) = 1.
x→∞
Эти свойства справедливы и для функции распределения непрерывной случайной величины.
Рассмотрим два следствия, вытекающие из этих свойств.
Следствие 6.1. Вероятность того, что случайная величина X примет значение из промежутка [a; b), равна приращению функции распределения на этом промежутке:
P (a ≤ X < b) = F (b) − F (a).
(6.1)
Это следствие вытекает из доказательства свойства 5.2, из которого следует, что
P (x1 ≤ X < x2 ) = F (x2 ) − F (x1 ).
(6.2)
Если в равенстве 6.2 обозначить x1 = a, а x2 = b, то получится требуемое
утверждение.
Это следствие справедливо и для дискретных случайных величин. Но
если случайная величина является непрерывной, то оказывается, что
P (a ≤ X < b) = P (a < X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b).
(6.3)
116
Эти равенства опираются на следующее следствие:
Следствие 6.2. Вероятность того, что непрерывная случайная величина X примет некоторое фиксированное значение x, равна нулю, то
есть
P (X = x) = 0.
Если предположить, что x − некоторое фиксированное число, совпадающее с x1 в формуле (6.2): x1 = x, а x2 = x + ∆x, то
P (x ≤ X < x + ∆x) = F (x + ∆x) − F (x).
Так как X − непрерывная случайная величина, то функция распределения
F (x) − непрерывная функция. Поэтому lim F (x + ∆x) = F (x). Следова∆x→0
тельно,
P (X = x) = lim P (x ≤ X < x + ∆x) = 0.
∆x→0
Из равенств (6.3) вытекает, что вероятность того, что непрерывная случайная величина принимает значения из данного промежутка, не зависит
от принадлежности концов промежутка самому промежутку.
Замечание 6.1. Следует заметить, что если P (X = x) = 0, то это совсем не означает, что событие, при котором X = x, является невозможным
событием.Так как непрерывная случайная X в результате опыта обязательно принимает какое-нибудь возможное значение, то этим значением может
оказаться и x.
Задача 6.1. Случайная величина X задана функцией распределения

при
x ≤ 1,
 0,
2
(x − 1) , при 1 < x ≤ 2,
F (x) =

1,
при
x > 2.
1) Постройте график функции F (x).
2) Найдите вероятности того, что в результате опыта случайная величина X примет значения, принадлежащие:
а) интервалу (1, 2; 1, 6);
б) отрезку [1, 7; 2, 3];
в) лучу {x : x > 1, 5};
г) лучу {x : x ≤ 1, 3}.
Решение. 1) Построим требуемый график (рис. 6.3).
F (x)
1
x
Рис. 6.3
1
2
117
2) С помощью формулы (6.1) вычислим требуемые вероятности:
а) P (1, 2 < X < 1, 6) = F (1, 6) − F (1, 2).
Так как 1, 2 ∈ (1; 2), то F (1, 2) = (1, 2 − 1)2 , то есть F (1, 2) = 0, 04.
Аналогично, F (1, 6) = (1, 6 − 1)2 ⇒ F (1, 6) = 0, 36.
Поэтому P (1, 2 < X < 1, 6) = 0, 36 − 0, 04 ⇒ P (1, 2 < X < 1, 6) = 0, 32.
б) Согласно формуле (6.1) P (1, 7 ≤ X ≤ 2, 3) = F (2, 3) − F (1, 7).
Так как 1, 7 ∈ (1; 2), то F (1, 7) = (1, 7 − 1)2 , то есть F (1, 7) = 0, 49.
В силу того, что 2, 3 > 2, F (2, 3) = 1.
Поэтому P (1, 7 ≤ X ≤ 2, 3) = 1 − 0, 49 ⇒ P (1, 7 ≤ X ≤ 2, 3) = 0, 51.
в) Представим луч {x : x > 1, 5} в виде бесконечного интервала (1, 5; ∞).
Тогда, согласно формуле (6.1) P (1, 5 < X < ∞) = F (∞) − F (1, 5).
Так как 1, 5 ∈ (1; 2), то F (1, 5) = (1, 5 − 1)2 , то есть F (1, 5) = 0, 25.
Поскольку F (∞) = 1,
то P (1, 5 < X < ∞) = 1 − 0, 25 ⇒ P (X > 1, 5) = 0, 75.
г) Как и в предыдущем задании, представим луч {x : x ≤ 1, 3} в виде
бесконечного множества (−∞; 1, 3].
Тогда, согласно той же формуле P (−∞ < X ≤ 1, 3) = F (1, 3) − F (−∞).
Так как 1, 3 ∈ (1; 2), то F (1, 3) = (1, 3 − 1)2 , то есть F (1, 3) = 0, 09.
Известно, что F (−∞) = 0.
Поэтому P (−∞ < X ≤ 1, 3) = 0, 09 − 0 ⇒ P (X ≤ 1, 3) = 0, 09.
Объединяя результаты а)-г), получаем
P (1, 2 < X < 1, 6) = 0, 32; P (1, 7 ≤ X ≤ 2, 3) = 0, 51;
P (X > 1, 5) = 0, 75;
P (X ≤ 1, 3) = 0, 09.
В начале главы непрерывная случайная величина X была определена с
помощью функции распределения F (x). Этот способ задания не является
единственным.
6.2
Плотность распределения вероятностей непрерывной
случайной величины и её свойства
В качестве закона распределения возможных значений случайной величины, имеющего смысл только для непрерывных случайных величин,
введём понятие плотности распределения вероятностей.
Определение 6.4. Плотностью распределения вероятностей
непрерывной случайной величины называется первая производная её
функции распределения, то есть
0
f (x) = F (x).
Замечание 6.2. В силу определения плотность распределения f (x)
иногда называют дифференциальной функцией, а функцию распределения
118
F (x) − интегральной функцией (так как она является для функции плотности первообразной функцией)1 .
Замечание 6.3. С точки зрения теории вероятностей термин плотность вероятности можно объяснить следующим образом: Предположим,
что отрезок [x; x + ∆x] является бесконечно малым. Из формулы (6.1) следует, что
P (x ≤ X ≤ x + ∆x) = F (x + ∆x) − F (x).
С помощью формулы Лагранжа имеем, что
0
F (x + ∆x) − F (x) ≈ F (x)∆x = f (x)∆x.
Поэтому,
P (x ≤ X ≤ x + ∆x) ≈ f (x)∆x.
Следовательно, вероятность того, что случайная величина принимает
значение, принадлежащее отрезку [x; x + ∆x], приближённо равна произведению плотности вероятности в точке x на длину интервала ∆x.
С точки зрения механики плотность вероятности можно определить
так: представьте, что вероятность того, что случайная величина принимает
значения на участке [x; x + ∆x), есть некоторая масса, равная 1.
При этом эта масса распределена произвольным образом на данном
участке2 . Тогда средняя плотность, с которой распределена эта масса на
участке, будет равна отношению
P (x ≤ X ≤ x + ∆x)
.
∆x
А так как (см. равенство (6.1))
P (x ≤ X ≤ x + ∆x) = F (x + ∆x) − F (x),
то средняя плотность равна
F (x + ∆x) − F (x))
.
∆x
«Заставив» ∆x → 0, получаем, что
F (x + ∆x) − F (x)
= F 0 (x) = f (x).
lim
∆x→0
∆x
Из этой аналогии массы и вероятности вытекает механический смысл
плотности вероятности.
Так как плотность вероятности является производной неубывающей
1
Из определения 6.4 становится ясно, почему функция распределения должна быть дифференцируемой в области определения.
2
Если мы распределим массу дискретным образом, то сумма вероятностей, которые будут соответствовать событиям, при которых случайная величина принимает значения именно в этих точках, будет
равна 1. Поэтому и выбранная масса равна 1.
119
функции F (x), то она обладает следующим свойством.
Свойство 6.1. Плотность распределения неотрицательная функция,
то есть
∀x ∈ (−∞; ∞) f (x) ≥ 0.
Поскольку F (x) является первообразной функцией для функции плотности f (x) на любом отрезке [a; b], то согласно формуле Ньютона-Лейбница
Zb
f (x)dx = F (b) − F (a).
a
Поэтому в силу (6.1) имеем
Zb
P (a ≤ X ≤ b) =
f (x)dx.
(6.4)
a
С точки зрения геометрии вероятность
y
P (a ≤ X ≤ b)
y = f (x)
совпадает с площадью криволинейной трапеции, ограниченной графиком функции плотноx сти y = f (x), осью OX и прямыми x = a и
a c b
x = b (рис. 6.4).
Если взять a = −∞, а b = ∞, то получим
Рис. 6.4
достоверное событие X ∈ (−∞; ∞).
Зная, что его вероятность равна единице, получаем
Z∞
Свойство 6.2.
f (x)dx = 1.
−∞
Задача 6.2. Функция плотности непрерывной случайной величины
X определена на всей числовой оси равенством
C
f (x) =
.
1 + 9x2
Определите значение параметра C.
Решение. Согласно свойству 6.2
Z∞
Cdx
= 1.
1 + 9x2
−∞
Используя свойство однородности несобственного интеграла, вынесем константу C за знак интеграла
Z∞
Z∞
Cdx
dx
=
C
.
1 + 9x2
1 + 9x2
−∞
−∞
120
Далее вычислим значение интеграла
Zb
Z∞
b
dx
dx
1
=
= lim
= lim
arctg 3x
a
1 + 9x2 a → −∞ 1 + 9x2 a → −∞ 3
−∞
b→
∞a
b→
∞
1 π π π
1
=
lim arctg 3b − lim arctg 3a =
− −
= .
a→∞
3 b→∞
3 2
2
3
π
Следовательно, C · = 1.
3
3
Таким образом, значение параметра C = .
π
Если в формуле (6.4) взять a = −∞, а b = x, то получим представление
функции распределения в интегральной форме1
Zx
F (x) =
f (t)dt.
(6.5)
−∞
Задача 6.3. Дана функция плотности

при
x ≤ 2,
 0,
f (x) =
2x − 4, при 2 < x ≤ 3,

0,
при
x > 3.
Определите интегральную функцию распределения F (x).
Решение. Так как область определения функции плотности является
объединением трёх интервалов
(−∞; ∞) = (−∞; 2] ∪ (2; 3] ∪ (3; ∞),
то придётся верхнему пределу x из интегрального представления функции
F (x) (6.5) «прогуляться» по всем этим интервалам.
1. Предположим что x ∈ (−∞; 2). В этом случае f (x) = 0. Тогда
Zx
Zx
f (t)dt =
0dt = 0.
−∞
−∞
2
2. Допустим что x ∈ (2; 3]. Следовательно ,
x
Zx
Z2
Zx
f (t)dt =
0dt + (2t − 4)dt = 0 + (t2 − 4t) =
−∞
−∞
2
2
2
2
2
= x − 4x − (2 − 4 · 2) = x − 4x + 4 = (x − 2)2 .
1
Переменная интегрирования x обозначена через t, чтобы можно было отличить её и верхний предел
интегрирования.
2
Второй интеграл можно было вычислить проще, если вынести общий множитель 2:
Zx
Zx
(t − 2)2 x
(2t − 4)dt = 2 (t − 2)dt = 2 ·
= (x − 2)2 .
2
2
2
2
121
3. Пусть x ∈ (3; ∞; ). В этом случае
Zx
Z2
Z3
Z∞
f (t)dt =
0dt + (2t − 4)dt + 0dt = 0 + 1 + 0 = 1.
−∞
−∞
2
3
Объединяя результаты пунктов
гральной функции распределения1

 0,
F (x) =
(x − 2)2 ,

1,
6.3
1.-3., получаем представление интепри
x ≤ 2,
при 2 < x ≤ 3,
при
x > 3.
Числовые характеристики непрерывной случайной
величины
По аналогии с дискретными случайными величинами введём понятия
числовых характеристик непрерывных случайных величин.
6.3.1
Математическое ожидание непрерывной случайной величины
Предположим, что непрерывная случайная величина X задана с помощью плотности распределения f (x). Допустим также, что все её возможные значения лежат на отрезке [a; b]. По аналогии с определением интеграла разобъём отрезок на n отрезков, имеющих длины ∆x1 , ∆x2 , . . . , ∆xn .
Выберем на каждом из интервалов произвольную точку x̄i , (i = 1, n). Далее, пользуясь тем, что число отрезков конечно, определим по аналогии
с математическим ожиданием дискретной случайной величины следующую сумму:
x̄1 P (a < X ≤ x1 ) + x̄2 P (x1 < X ≤ x2 ) + · · · + x̄n P (xn−1 < X ≤ xn ).
Из замечания 6.3 следует, что для каждого из выбранных интервалов вероятность
P (xi−1 < X ≤ xi ) ≈ f (xi−1 )∆xi , (i = 1, n).
Следовательно, сумму можно переписать в новом виде:
x̄1 f (a)∆x1 + x̄2 f (x1 )∆x2 + · · · + x̄n f (xn−1 )∆xn
или в компактном виде
n
X
x̄i f (xi−1 )∆xi .
i=1
1
С точки зрения определения интегральной функции распределения непрерывной случайной величины не мешает убедиться в том, что полученная функция действительно непрерывна. Для этого
нужно вычислить односторонние пределы в точках x = 2 и x = 3. Попробуйте эту проверку выполнить
самостоятельно.
122
Пусть λ = max{∆x1 , ∆x2 , . . . , ∆xn }. Если «заставить» λ стремиться к нуn
лю, то левые концы отрезков xi−1 → xi , а вместе с ними и x̄i → xi .
В результате получаем
Zb
n
X
lim
xi f (xi )∆xi = xf (x)dx.
λ→0
i=1
a
Из этого равенства и следует
Определение 6.5. Математическим ожиданием непрерывной
случайной величины X, возможные значения которой принадлежат
отрезку [a; b], называется определённый интеграл
Zb
M (X) =
xf (x)dx.
(6.6)
a
В том случае, когда возможные значения непрерывной случайной величины X заполняют всю числовую ось, математическое ожидание1
Z∞
xf (x)dx.
(6.7)
M (X) =
−∞
Определённое таким образом математическое ожидание непрерывной
случайной величины обладает теми же свойствами 5.5-5.8, что и математическое ожидание дискретной случайной величины (это объясняется
тем, что предельный переход сохраняет свойства линейности2 ).
Задача 6.4. Непрерывная случайная величина X задана своей функцией плотности
0,
если x ≤ 0,
f (x) =
−2x
2e , если x ≥ 0.
Определите математическое ожидание X.
Решение. Согласно формуле (6.7)
Z∞
Z0
Z∞
Zb
M (X) =
x·2e−2x dx =
x·0dx+ x·2e−2x dx = 0+2· lim xe−2x dx =
b→∞
−∞
−∞
0
0

b
Z
du = dx,
b
− 1 ·  lim xe−2x − e−2x dx =
=
2·
=
1
b→∞
0
2
dv = e−2x dx, v = − e−2x
2
0
u = x,
1



Z∞
|x|f (x)dx.
При этом предполагается, что существует интеграл
−∞
2
То есть предел суммы функций равен сумме их пределов (если они существуют), и константу
можно выносить из под знака предела.
123
b
1
1
1
−2x
= .
= 2 · − · 0 − − lim e
0
2
2 b→∞
2
Следовательно, M (X) = 0, 5.
Замечание 6.4. К характеристикам положения непрерывной случайной величины кроме математического ожидания относятся мода и медиана.
Определение 6.6. Модой Mo непрерывной случайной величины
называется её значение, при котором плотность распределения имеет
максимум.
Так, на рис. 6.4 Mo = c.
Задача 6.5. Непрерывная случайная величина X задана своей функцией плотности 

0,
если x ≤ 0,


3
x
f (x) =
x
−
, если 0 < x ≤ 3,

9

 0,
если x > 3.
Определите моду распределения случайной величины X.
Решение. Согласно определению 6.6 для того, чтобы найти моду, нужно определить, где находится точка максимума функции плотности. Из
условия задачи достаточно очевидно, что если такая точка есть, то она лежит на интервале (0; 3).
Первая производная на интервале (0; 3)
x2
0
f (x) = 1 − .
3
Стационарные точки производной являются решением уравнения
x2
1−
= 0.
3
√
√
√
Из двух точек x = − 3 и x = 3 нас интересует x = 3. Так как√в
этой точке производная меняет знак с плюса на минус1 , то точка x = 3
является точкой максимума функции плотности на рассматриваемом интервале. Следовательно, заданная случайная величина X имеет моду
√
Mo = 3.
Определение 6.7. Медианой2 Me непрерывной случайной вели1
Производная является√квадратичной функцией, график которой − парабола, ветви которой направлены вниз. В точке ( 3; 0) парабола пересекает ось абсцисс из положительной полуплоскости в
отрицательную.
2
Определение медианы впервые дал в 1843 году О. Курно в своей работе «Основы теории шансов
и вероятностей» (Exposition de la theorie des chanses et des probabilites) (cм. Курно О. Основы теории
шансов и вероятностей. М. : Наука, 1970. С. 76).
Курно Антуан Огюстен (фр. Cournot Antoine Augustin, 1801-1877) − французский экономист,
124
чины называется её значение, при котором имеет место равенство
P (X < Me ) = P (X > Me ).
(6.8)
Из определения 6.7 вытекает следствие о связи между медианой Me распределения непрерывной случайной величины и интегральной функцией
её распределения.
1
Следствие 6.3. F (Me ) = .
2
Истинность этого равенства вытекает из равенства (6.8).
Перепишем это равенство подробнее.
P (−∞ < X < Me ) = P (Me < X < ∞).
Из формулы (6.1) следует что
P (−∞ < X < Me ) = F (Me ), а P (Me < X < ∞) = 1 − F (Me ).
Подставляя правые части последних двух равенств в равенство (6.8),
получаем новое равенство
F (Me ) = 1 − F (Me ),
из которого и следует истинность следствия.
Замечание 6.5. Следует заметить, что это следствие можно получить
с помощью геометрии.
С точки зрения геометрии, медиана − это абсцисса точки, в которой площадь, ограниченная функцией плотности, делится пополам. А так как вся
площадь, ограниченная функцией плотности и осью абсцисс равна единице, то интегральная функция распределения в точке, соответствующей
медиане, равна
F (Me ) = P (X < Me ) = 0, 5.
На рис. 6.4 медиана совпадает с модой, поэтому Me = c.
Задача 6.6. Непрерывная случайная величина X задана своей функцией плотности 
если x ≤ 1,
 0,
2
f (x) =
−6x + 18x − 12, если 1 < x < 2,

0,
если x ≥ 2.
Определите медиану распределения случайной величины X.
Решение. Аналогично решению задачи 6.3 находим интегральную функцию распределения 
заданной случайной величины
если x ≤ 1,
 0,
3
2
F (x) =
−2x + 9x − 12x + 5, если 1 < x < 2,

1,
если x ≥ 2.
философ и математик. (cм. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/
wiki/\T2A\CYRK\T2A\cyru\T2A\cyrr\T2A\cyrn\T2A\cyro,_\T2A\CYRA\T2A\cyrn\T2A\cyrt\T2A\cyru\
T2A\cyra\T2A\cyrn_\T2A\CYRO\T2A\cyrg\T2A\cyryu\T2A\cyrs\T2A\cyrt\T2A\cyre\T2A\cyrn (дата
обращения: 12.06.2016)).
125
Далее, используя следствие 6.3, составим уравнение
1
−2x3 + 9x2 − 12x + 5 = .
2
Умножив обе части на 2 и вычтя единицу из обеих частей, получим уравнение с целыми коэффициентами
4x3 − 18x2 + 24x − 9 = 0.
Из курса элементарной алгебры известно что, если уравнение с целыми
коэфффициентами имеет рациональный корень, то числитель корня является делителем свободного члена, а знаменатель − делителем старшего
3
коэффициента. На интервале (1; 2) таким числом является x = .
2
Подставляя его вместо x в уравнение
3
2
3
27 81
3
3
4·
− 36 + 9 = 0,
− 18 ·
+ 24 · − 9 = − +
2
2
2
2
2
убеждаемся в том, что это число является корнем составленного уравнения1 .
Следовательно, медиана распределения Me = 1, 5 .
Замечание 6.6. Следует заметить, что график заданной функции
плотности (рис. 6.5) изображается симметрично расположенной параболой, абсцисса вершины которой определяет медиану и моду распределения
заданной функции.
y
0
Рис. 6.5
6.3.2
y = f (x)
x
1
3
2
2
Дисперсия непрерывной случайной величины
Дисперсия непрерывной случайной величины определяется точно также, как и дисперсия дискретной случайной величины.
Определение 6.8. Дисперсией непрерывной случайной величины называется математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
√
√
3− 3
3+ 3
Составленное уравнение имеет еще два корня:
и
. Но эти корни не могут быть
2
2
медианами распределения, так как плотность вероятности в соответствующих им точкам равна нулю.
1
126
Если возможные значения случайной величины X лежат на [a; b], то
Zb
D(X) =
(x − M (x))2 f (x)dx.
(6.9)
a
Если же возможные значения случайной величины X заполняют всю
числовую ось, то
Z∞
D(X) =
(x − M (x))2 f (x)dx.
(6.10)
−∞
Так как математическое ожидание непрерывной случайной величины
обладает теми же свойствами, что и для дискретной, то для вычисления
дисперсии используется формула (6.9)
D(X) = M X 2 − (M (X))2 ,
(6.11)
в которой
M X
2
Zb
=
x2 f (x)dx.
(6.12)
a
Естественно, что сохраняются и свойства дисперсии 5.9-5.12.
Точно так же, как и в случае с дискретной случайной величиной, определяется среднее квадратическое отклонение непрерывной случайной величины.
Определение 6.9. Средним квадратическим отклонением непрерывной случайной величины от её математического ожидания называется квадратный корень из дисперсии этой величины.
p
(6.13)
σ(X) = D(X).
Задача 6.7. Случайная величина X задана интегральной функцией
распределения

x ≤ 0,
 0, при
3
F (x) =
x , при 0 < x ≤ 1,

1, при
x > 1.
1)
2)
3)
4)
5)
Найдите функцию плотности f (x).
Постройте график f (x);
найдите математическое ожидание M (X);
найдите дисперсию D(X);
найдите среднее квадратическое отклонение σ(X).
127
0
Решение. 1) Согласно определению 6.4 f (x) = F (x). Поэтому


при
x ≤ 0,
 0,
f (x) =
3x2 , при 0 < x ≤ 1,

 0,
при
x > 1.
2) График функции плотности на рис. 6.6 имеет следующий вид.
f (x)
3
x
0
1
Рис. 6.6
3) Так как случайная величина X определена на всей числовой прямой, то
согласно формуле (6.7) её математическое ожидание
Z∞
Z∞
Z0
Z1
M (X) =
xf (x)dx =
x · 0dx + x · 3x2 dx + x · 0dx =
−∞
−∞
Z1
=0+3
0
3
x3 dx + 0 = x4
4
1
0
1
3
= (1 − 0) = 0, 75.
4
0
4) Перед тем, как вычислить дисперсию согласно формуле (6.9), найдём
Z∞
Z0
Z1
Z∞
M X2 =
x2 f (x)dx =
x2 · 0dx + x2 · 3x2 dx + x2 · 0dx =
−∞
−∞
Z1
=0+3
0
3
x4 dx + 0 = x5
5
1
0
1
3
= (1 − 0) = 0, 6.
5
0
Так как M (X) = 0, 75, то его квадрат (M (X))2 = 0, 5625. Следовательно,
D(X) = 0, 6 − 0, 5625 ⇒ D(X) = 0, 0375.
5) Подставляя найденное значение дисперсии в формулу (6.13), найдём
среднее квадратическое отклонение
p
σ(X) = 0, 0375 ⇒ σ(X) = 0, 19.
Объединяя результаты 3)-5), получаем
M (X) = 0, 75; D(X) = 0, 0375; σ(X) = 0, 19.
Рассмотрим наиболее популярные в технических приложениях распределения вероятностей непрерывной случайной величины.
128
6.4
6.4.1
Равномерное распределение
Определение и график функции плотности
равномерного распределения
Определение 6.10. Распределение вероятностей непрерывной случайной величины называется равномерным1 , если функция плотности вероятностей определяется следующим
образом


0,
если
x ≤ a,

 1
f (x) =
, если a < x < b,

b
−
a

 0,
если
x ≥ b.
График (рис. 6.7) функции плотности равномерного распределения выглядит следующим образом.
f (x)
1
b−a
x
a
0
b
Рис. 6.7
6.4.2
Интегральная функция равномерного распределения
Используя представление интегральной функции распределения (6.5),
аналогично решению задачи 6.3 построим интегральную функцию равномерного распределения непрерывной случайной величины X.
Область определения функции плотности является объединением трёх
интервалов
(−∞; ∞) = (−∞; a] ∪ (a; b) ∪ [(b; ∞),
1. Предположим что x ∈ (−∞; a]. В этом случае f (x) = 0. Тогда
Zx
Zx
f (t)dt =
0dt = 0.
−∞
−∞
2. Допустим что x ∈ (a; b). Следовательно,
x
Zx
Za
Zx
t
x−a
dt
=0+
=
.
f (t)dt =
0dt +
b−a
b−a
b−a
−∞
−∞
a
a
1
Равномерное распределение было впервые рассмотрено в 1767 году Т. Байесом в его работе «Очерки
к решению проблемы доктрины шансов» (Essay towards solving a Problem in the Doctrine of Chances),
а затем в 1809 году К. Ф. Гауссом в работе «Теория движения небесных тел» (Theory of the Motion
of Heavenly Bodies moving around the Sun in Conic Sections) (cм. Earliest Known Uses of Some of the
Words of Mathematics (U) [Электронный ресурс] : URL : http://jeff560.tripod.com/u.html (дата
обращения: 12.06.2016)).
129
3. Пусть x ∈ [b; ∞; ). Поэтому
Zx
Za
Zb
f (t)dt =
0dt +
−∞
−∞
dt
+
b−a
a
Z∞
0dt = 0 + 1 + 0 = 1.
b
Объединяя результаты пунктов 1-3, получаем представление интегральной1 функции равномерного распределения непрерывной случайной величины X

если
x ≤ a,

 0,
x−a
, если a < x < b,
(6.14)
F (x) =

 b−a
1,
если
x ≥ b.
Построим график (рис. 6.8) интегральной функции равномерного распределения.
F (x)
1
x
a
0
b
Рис. 6.8
Далее определим числовые характеристики равномерного распределения.
6.4.3
Математическое ожидание равномерного распределения
Так как график функции плотности вероятностей непрерывной равномерно распределённой случайной величины X симметричен относительно
середины интервала (a; b), то математическое ожидание2
M (X) =
6.4.4
a+b
2
.
(6.15)
Дисперсия равномерного распределения
Для вычисления дисперсии равномерного распределения воспользуемся
формулой (6.11). Вычислим сначала
Z∞
Za
Zb 2
Z∞
x dx
M (X 2 ) =
x2 f (x)dx =
x2 · 0dx +
+ x2 · 0dx =
b−a
−∞
−∞
a
1
b
Как и в задаче 6.3, не мешает убедиться в том, что полученная функция действительно непрерывна.
Для этого нужно вычислить односторонние пределы в точках x = a и x = b. Попробуйте эту проверку
выполнить самостоятельно.
2
Конечно, математическое ожидание можно найти и с помощью самой функции плотности по
формуле (6.7).
130
b
1
b 3 − a3
b2 + ba + a3
3
=
x =
=
.
3(b − a) a 3(b − a)
3
Далее вычислим разность
2
b2 + ba + a3
a+b
2
2
M (X ) − M (X) =
−
=
3
2
b2 − 2ba + a2
4b2 + 4ba + 4a2 − 3a2 − 6ab − 3b2
=
.
=
12
12
«Сворачивая» числитель последней дроби с помощью формулы квадрат
разности, получаем формулу вычисления дисперсии равномерного распределения
(b − a)2
D(X) =
.
(6.16)
12
6.4.5
Среднее квадратическое отклонение равномерного распределения
Зная дисперсию равномерного распределения, можно с помощью формулы (6.13) вычислить среднее квадратическое отклонение данного распределения. Извлекая квадратный корень из дисперсии, получаем
σ(X) =
b−a
√ .
2 3
(6.17)
Замечание 6.7. Из формул (6.15)-(6.17) видно что, зная параметры
равномерного распределения a и b, можно получить все числовые характеристики распределения.
Но можно и наоборот, зная, например, математическое ожидание M (X)
и среднее квадратическое отклонение σ(X), решить обратную задачу определения параметров распределения.
Для этого достаточно составить и решить следующую систему уравнений

a+b


= M (X),

2
b−a


 √ = σ(X).
2 3
Рассмотрим решение задач, связанных с равномерным распределением.
Задача 6.8. Цена деления шкалы вольтметра 0, 2 V. Показания вольтметра округляют до ближайшего целого деления. Найдите вероятность
того, что допущенная ошибка превысит 0, 04 V.
Решение. Предположим, что случайная величина X есть ошибка округления, которая распределена равномерно между целыми показаниями шкалы вольтметра.
131
Ошибка округления превысит 0, 04, если истинные показания вольтметра окажутся в диапазоне (0, 04; 0, 2 − 0, 04). Следовательно, нужно определить вероятность того, что случайная величина будет принимать значения
из этого интервала.
Так как интегральная функция равномерного распределения определяется представлением (6.14), (в котором a = 0, а b = 0, 2) то, опираясь на
формулу вычисления вероятности (6.1) попадания значений случайной величины в заданный интервал, имеем
0, 16 − 0 0, 04 − 0
P (0, 04 < X < 0, 16) =
−
⇒ P (0, 04 < X < 0, 16) = 0, 6.
0, 2 − 0
0, 2 − 0
вероятность того, что допущенная
Таким образом, ошибка превысит 0, 04 V равна 0, 6.
Задача 6.9. В некотором городе трамвай ходит по расписанию с
интервалом 10 минут. Какова вероятность того, что пассажир, подошедший к остановке, будет ожидать трамвай более двух минут?
Решение. Пусть случайная величина Y определяет время ожидания
трамвая. Пассажир будет ожидать трамвай более двух минут, если он подойдет к остановке в течение первых восьми минут после ухода очередного
трамвая, то есть в интервале времени (0; 8).
Поскольку случайная величина Y в данном случае распределена по равномерному закону с параметрами a = 0 и b = 10, то, используя формулы
(6.14) и (6.1), получаем
8−0
0−0
P (0 < X < 8) =
−
⇒ P (0 < X < 8) = 0, 8.
10 − 0 10 − 0
В заключение отметим, что в реальных условиях равномерное распределение вероятностей случайной величины может встречаться при анализе ошибок округления при проведении числовых расчетов (такая ошибка,
как правило, оказывается равномерно распределенной на интервале от −5
до +5 единиц округляемого десятичного знака) или при определении времени ожидания обслуживания при точно периодическом через каждые Т
единиц времени включении обслуживающего устройства, когда заявка на
обслуживание поступает случайно в этом интервале.
132
6.5
6.5.1
Нормальное распределение
Определение и график функции плотности
нормального распределения
Определение 6.11. Распределение вероятностей непрерывной случайной величины называется нормальным1 или распределением Гаусса,
если функция плотности вероятностей определяется следующим образом
(x − a)2
−
1
2σ 2
f (x) = √
e
(6.18)
σ 2π
Чтобы построить график функции плотности нормального распределения нужно вспомнить элементы исследования функции из математического анализа.
Очевидно, что область определения Df = (−∞; ∞).
Рассмотрим поведение функции на границах области определения, вычислив следующие пределы:
(x − a)2
(x − a)2
−
−
2σ 2
2σ 2
1
1
lim √ e
= 0; lim √ e
= 0.
x→−∞ σ 2π
x→∞ σ 2π
Так как в бесконечности функция стремится к нулю, то график функции
имеет горизонтальную асимптоту y = 0, совпадающую с осью абсцисс.
Далее вычислим первую производную функции и найдём с её помощью
интервалы возрастания (убывания) и точки экстремума2 .

0
(x − a)2
(x − a)2
−
−
2σ 2 
2σ 2
1
2(x − a)
1 


√ e
√
=
−
e
·
.

2σ 2

σ 2π 
σ 2π
(x − a)2
−
2σ 2
x−a
0
Следовательно,
f (x) = − √ e
.
σ 3 2π
Приравнивая производную нулю, вычислим стационарную точку первой
производной
1
Впервые идея нормального распределения появляется во втором издании «Доктрины шансов»
(The Doctrine of Chances) А. де Муавра, изданном в 1738 году, долгое время оставаясь малоизвестным фактом. В 1809 в работе «Теория движения небесных тел» (Theoria motus corporum coelestium
in sectionibus conicis solem ambientium) К. Гаусс дал первое определение нормального закона распределения (см. Википедия [Электронный ресурс] : URL : https://en.wikipedia.org/wiki/Normal_
distribution#History (дата обращения: 12.06.2016)).
2
Если они, конечно, есть.
133
f 0 (x) = 0 ⇒ x − a = 0 ⇒ x = a.
Так как знаменатель дроби и множитель-экспонента положительны, то
знаки первой производной определяются линейным числителем x − a.
f 0 (x) +
f (x)
−
x
a
Рис. 6.9
Из рис. 6.9 видно, что на интервале от минус бесконечности до a функция
возрастает, а на интервале от a до плюс бесконечности она убывает. Поэтому в точке x = a функция имеет максимум1 , который равен
1
f (a) = √ .
σ 2π
Для исследования функции на выпуклость нам понадобится вторая производная.

0
(x − a)2
−
2σ 2 
1 


− √ (x − a)e
 =

σ 3 2π 

(x − a)2
(x − a)2
−
−
2σ 2
2σ 2 
1 
2(x − a)


e
− √ e
− (x − a)
=
2
2σ

σ 3 2π 

=−
1
√
σ 3 2π
−
(x − a)2
1−
e
σ2
(x − a)2
2σ 2
.
Таким образом,
(x − a)2
−
2σ 2
1
(x − a)2
00
f (x) = − √
1−
e
.
σ2
σ 3 2π
Найдем стационарные точки второй производной. Вторая производная обращается в нуль только тогда, когда в нуль обращается скобкасомножитель.
(x − a)2
1−
= 0 ⇒ (x − a)2 − σ 2 = 0 ⇒ (x − a − σ)(x − a + σ) = 0.
2
σ
Следовательно, вторая производная имеет две стационарные точки
1
То, что эта функция имеет максимум, можно было догадаться из положительности экспоненты и
стоящей перед ней дроби. А то, что этот максимум будет в точке x = a, можно было определить из
симметрии функции относительно этой точки ((−(x − a))2 = (x − a)2 ).
К сожалению, исследование на выпуклость графика так просто провести не удастся.
134
x1 = a − σ и x2 = a + σ,
симметрично расположенные относительно точки максимума x = a.
Так как первый и третий сомножители на знак второй производной не
влияют, то её знаки полностью определяются квадратным трёхчленом, стоящим в скобках и представляющим разность квадратов (а также знаком
«минус» в представлении второй производной). Графиком этого трёхчлена
является парабола, ветви которой направлены вверх. Исходя из этого, мы
имеем следующее чередование знаков второй производной (рис. 6.10).
f 00 (x) +
f (x)
−
+
x1
Рис. 6.10
x
x2
Таким образом, график функции плотности нормального распределения имеет две точки перегиба, отделяющие интервалы выпуклости вниз от
интервала выпуклости вверх.
Значения функции в точках перегиба равны
1
1
f (a − σ) = √
; f (a + σ) = √
.
σ 2eπ
σ 2eπ
Теперь мы имеем достаточно информации, чтобы построить схематический
график функции плотности вероятностей нормального распределения.
1
√
σ 2π
σ
f (x)
√1
2eπ
x
Рис. 6.11
x1
a
x2
Из рис. 6.11 очевидно, что мода нормального распределения Mo = a
(см. определение 6.6). А так как график функции плотности симметричен
относительно прямой x = a, то площадь криволинейной трапеции слева
от прямой x = a равна площади криволинейной трапеции справа от этой
прямой. В силу этого согласно формуле (6.4)
P (X < a) = P (X > a).
Поэтому из определения 6.7 следует, что медиана нормального распределения
Me = a.
135
Поскольку в неотрицательности функции f (x) сомневаться не приходится, то осталось убедиться (см. свойство 6.2) в том, что
Z∞
f (x)dx = 1.
−∞
Подставив функцию плотности в интеграл, выполним следующие преобразования:
(x − a)2
t2
∞
∞
−
−
Z
Z
x−a
2σ 2
2
1
1
= t,
√
=√
dx =
e
e dt.
σ
σ 2π
2π
dx = σdt
−∞
−∞
Так как функция, стоящая под интегралом чётная, а пределы интегрирования симметричны относительно начала координат, то1
t2
t2
Z∞ −
Z∞ −
2
2
2
1
√
e dt = √
e dt.
2π
2π
−∞
0
Интеграл2
Z∞
e
0
t2
−
2
dt =
√
Z∞
2
t2
∞
r
−
√
√ Z −z 2
√ π
2
t
π
e d √
= 2 e
dz = 2
=
.
2
2
2
0
0
Подставляя полученное значение вместо интеграла в предыдущую строчку,
убеждаемся в том, что
1
√
σ 2π
6.5.2
Z∞
e
(x − a)2
−
2σ 2
dx = 1.
(6.19)
−∞
Нормированное нормальное распределение
Так как параметры a и σ нормального распределения тесно связаны
с метрическими единицами, используемыми в исследовании, и с масштабом изображения, то это оказывает большое влияние на общность любого
проводимого исследования. Чтобы этого избежать, прибегают к процессу
1
См., например, Бидерман В. И. Математика: элементы математического анализа. Хабаровск : Издво Тихоокеан. гос. ун-та, 2013. С. 146.
Z∞ −z 2
2
Интеграл e
dz называется интегралом Эйлера-Пуассона. Впервые был вычислен Л. Эйлером
0
в 1729 году. Позднее С. Д. Пуассон нашёл более простой способ его вычисления. Более подробно см.
Зорич В. А. Математический анализ. Ч. II. М. : Наука, 1984. С. 424.
136
нормирования1 .
Определение 6.12. Нормальное распределение вероятностей непрерывной случайной величины называется нормированным, если параметры распределения фиксируют следующим образом:
a = 0, σ = 1.
В этом случае функция плотности приобретает более компактный вид
функции Гаусса, с которой мы уже встречались ранее2 ,
−
x2
2
1
fN (x) = √ e
,
(6.20)
2π
а само нормированное нормальное распределение часто обозначается N (x; 0; 1).
График функции плотности нормированного произведения симметричен
относительно оси OY и выглядит так (рис. 6.12):
√1
2π
fN (x)
√1
2eπ
x
Рис. 6.12
−1
1
Нормирование необходимо для того, чтобы закономерности нормального распределения привязать к универсальным единицам измерения случайной величины − среднеквадратическим (стандартным) отклонениям.
После нормирования случайное значение оказывается не просто наблюдаемой величиной (размер исследуемой величины, например), а отклонением
от средней арифметической (которая равна нулю), измеряемым в среднеквадратических отклонениях, что приводит к так называемому правилу
трёх сигм, которое мы рассмотрим ниже.
6.5.3
Интегральная функция нормального распределения
С помощью представления (6.5) определим интегральную функцию нормированного нормального распределения вероятностей
1
Эта ситуация имеет аналогию в школьной программе, когда классическую теорему Пифагора,
тесно связанную с квадратами единиц измерения, заменяют на безразмерные синус и косинус, разделив
на квадрат длины гипотенузы обе части известного равенства.
2
См. «Схема Бернулли» (с. 54).
137
1
FN (x) = √
2π
t2
Zx −
2
e dt.
(6.21)
−∞
Очевидно, что при x → −∞ FN (x) → 0. А при x → ∞ из равенства (6.19)
вытекает что FN (x) → 1. Таким образом, прямые y = 0 и y = 1 являются
горизонтальными асимптотами графика FN (x).
Из рис. 6.12 очевидно, что медиана Me = 0. Поэтому для нормирован1
ного нормального распределения FN (0) = (см. следствие 6.3).
2
Чтобы определить значения функции FN (x) выполним следующее преобразование
t2
t2
t2
0
x
x
Z −
Z −
Z −
2
2
2
e dt + e dt.
e dt =
−∞
−∞
0
Подставляя полученное разложение в формулу (6.21), имеем
1
FN (x) = √
2π
Z0
−
e
t2
2
−∞
1
dt + √
2π
Zx
−
e
t2
2
dt.
0
Присмотревшись внимательно, можно увидеть, что второй интеграл в
полученной сумме представляет интегральную функцию Лапласа1
t2
x
−
Z
2
Φ(x) = e dt.
0
Первый же интеграл суммы с точки зрения геометрии определяет площадь криволинейной трапеции, расположенной слева от оси ординат на
рис. 6.12. А так как эта площадь передставляет в силу симметрии половину площади всей криволинейной трапеции на этом рис., то
t2
0
Z −
2
1
e dt = .
2
−∞
Поэтому
1
+ Φ(x).
2
Используя таблицу значений интегральной функции Лапласа (прил. 2),
FN (x) =
1
См. «Схема Бернулли» (с. 54).
138
построим схематический график интегральной функции нормированного
распределения нормальной случайной величины (рис. 6.13).
FN (x)
a
1
2
x
Рис. 6.13
Рассмотрим интегральную функцию ненормированного нормального распределения
(t − a)2
x
Z −
2σ 2
1
F (x) = √
dt.
e
σ 2π
−∞
t−a
Выполнив замену
= z, получим dt = σdz. При этом нижний предел
σ
x−a
. Соинтегрирования не изменится, а верхний примет новое значение
σ
ответственно интегральная функция распределения примет новый вид
z2
x−a
Zσ −
2
1
e
dz.
F (x) = √
2π
−∞
Далее с помощью интегральной функции Лапласа её можно переписать в
виде
1
x−a
F (x) = + Φ
.
2
σ
При построении графика F (x) (рис. 6.14) с помощью графика на рис.
6.13 нужно учесть, что новый график не только сместится на a вдоль оси
1
абсцисс, но и деформируется1 за счёт коэффициента .
σ
F (x)
1
1
2
Рис. 6.14
a
1
x
Отразить на графике смещение по отношению к графику интегральной функции нормированного
1
нормального распределения, связанное с коэффициентом , без введения масштаба достаточно сложσ
но, поэтому построение более точного графика при конкретных σ оставляем читателям в качестве
самостоятельной работы.
139
Далее определим числовые характеристики нормального распределения.
6.5.4
Математическое ожидание нормального распределения
Используя формулу (6.7), докажем теорему.
Теорема 6.1. Математическое ожидание нормально распределённой
непрерывной случайной величины равно параметру a.
Д о к а з а т е л ь с т в о. Вычислим значение интеграла
(x − a)2
x−a
∞
−
Z
= t;
2
2σ
1
σ
√
xe
dx = x = σt + a; =
σ 2π
−∞
dx = σdt


t2
t2
t2
−
Z∞ −
Z∞
Z∞ −
2
2
2 
1
1 


= √
(σt + a)e σdt = √ σ
te dt + a
e dt .

σ 2π
2π 
−∞
−∞
−∞
Первый интеграл в скобке является интегралом от нечётной функции с
симметричными пределами интегрирования, поэтому он равен нулю1 .
Второй интеграл в скобке√есть интеграл Эйлера-Пуассона (см. сноску
на с. 133), поэтому он равен 2π.
Таким образом, после сокращения значения интеграла Пуассона-Эйлера
со знаменателем дроби перед скобками, получаем, что математическое
ожидание нормально распределённой случайной величины
M (X) = a.
6.5.5
(6.22)
Дисперсия нормального распределения
Используя формулу вычисления дисперсии (6.10), докажем следующую
теорему.
Теорема 6.2. Дисперсия нормально распределённой непрерывной случайной величины равна σ 2 .
Д о к а з а т е л ь с т в о. С помощью аналогичной техники замены
переменной в интеграле, полагая M (X) = a, вычислим интеграл
(x − a)2
t2
x
−
a
−
−
Z∞
Z∞
= t;
2
2σ
2
1
1
σ
√
dx = x = σt + a; = √
(x − a)2 e
σ 2 t2 e σdt.
σ 2π
σ 2π
−∞
−∞
dx = σdt
1
См., например, Бидерман В. И. Указ. соч. С. 145.
140
После вынесения σ 3 за знак интеграла представим подынтегральную функцию в виде произведения сомножителей
t2
t2
−
−
2
2
t2 e
= t · te .
Так как
2
1 2
1
t
tdt = d(t ) = · 2d
,
2
2
2
воспользуемся далее формулой интегрирования по частям
t2
u = t;
du = dt;
∞
−
Z
2
2
σ2
t
t2 =
√
t2 e dt =
−
−
2π
2
2
−∞
dv = te dt; v = −e



t2
t2
∞
−
 Z∞ − 2 
2
σ2 



e dt.
= √ −t · e
− −


2π 
−∞
Подстановка1
t2
−
2
t·e
∞
−∞
∞
− −
=
= lim b2 − lim a2 =
a→−∞ 2
b→∞ 2
∞
∞
−∞
e
e
1
1
1
1
= lim b2 − lim
=
+
= 0 + 0 = 0.
a2
a→−∞
b→∞
∞
∞
2
2
be
ae
Интеграл, стоящий в скобках,
√ является уже знакомым интегралом Пуассона-Эйлера и поэтому равен 2π.
Умножив дробь, стоящую перед скобками, на значение интеграла Пуассона-Эйлера, убеждаемся в истинности утверждения теоремы о том, что
дисперсия нормально распределённой случайной величины
b
a
∞
D(X) = σ 2 .
6.5.6
(6.23)
Среднее квадратическое отклонение нормального
распределения
Зная дисперсию нормального распределения, можно с помощью формулы (6.13) вычислить среднее квадратическое отклонение данного распределения. Извлекая квадратный корень из дисперсии, получаем
σ(X) = σ.
1
(6.24)
Здесь при вычислении пределов используется правило Лопиталя − Бернулли (см., например, Бидерман В. И. Указ. соч. С. 81).
141
Замечание 6.8. Из формул (6.22)-(6.24) видно, что, зная параметры
нормального распределения a и σ, мы одновременно знаем его числовые
характеристики. Так, например, вид функции плотности
(x + 1)2
−
72
1
f (x) = √ e
6 2π
позволяет сказать1 , что математическое ожидание M (X) = −1, среднее
квадратическое отклонение σ(X) = 6, а дисперсия D(X) = 36.
6.5.7
Вероятность попадания нормально распределённой
случайной величины в заданный интервал
Предположим что непрерывная случайная величина X распределена по
нормальному закону с параметрами a и σ, а Φ(x) − интегральная функция
Лапласа. При этих условиях справедлива следующая
Теорема 6.3. Вероятность попадания нормально распределённой случайной величины X в заданный интервал (α; β) определяется равенством
α−a
β−a
−Φ
.
(6.25)
P (α < X < β) = Φ
σ
σ
Д о к а з а т е л ь с т в о. Согласно предположениям распределение
случайной величины X имеет своей функцией плотности вероятностей
(x − a)2
−
2σ 2
1
f (x) = √ e
.
σ 2π
Тогда из формулы (6.4) следует, что
(x − a)2
β
−
Z
2σ 2
1
√
e
P (α < X < β) =
dx.
σ 2π
α
Используя стандартную замену
x−a
, x = σt + a, dx = σdt,
t=
σ
введём новые пределы интегрирования
α−a
β−a
tн =
, tв =
.
σ
σ
и, сократив σ, подставим в представление для вероятности
t2
β−a
Zσ − 2
2σ
1
P (α < X < β) = √
e
dt.
2π
α−a
σ
1
В формуле (6.18) x − a = x + 1 = x − (−1), а 2σ 2 = 72 = 2 · 36 = 2 · 62 .
142
Далее, используя аддитивность отрезка интегрирования, представим интеграл в виде суммы
t2
t2
t2
β−a
β−a
Zσ − 2
Z0 − 2
Zσ − 2
2σ
2σ
2σ
dt =
dt +
dt.
e
e
e
α−a
σ
Так как
α−a
σ
0
ZR
Zr
ϕ(t)dt = −
r
ϕ(t)dt,
R
то, поменяв пределы интегрирования в первом слагаемом местами, получим
t2
t2
t2
β−a
β−a
α−a
Zσ − 2
Zσ − 2
Zσ − 2
2σ
2σ
2σ
e
e
dt =
dt −
dt. .
e
α−a
σ
0
0
Учитывая, что каждый из интегралов в правой части является значением
интегральной функции Лапласа в точке соответствующего верхнего предела интеграла, имеем требуемое равенство
β−a
α−a
P (α < X < β) = Φ
−Φ
.
σ
σ
6.5.8
Вероятность отклонения нормально распределённой
случайной величины от её центра рассеивания
Пусть центр рассеивания нормально распределённой случайной величины X равен a, а её среднее квадратическое отклонение равно σ. Тогда
отклонение случайной величины от её центра рассеивания меньше чем на
δ можно записать в виде неравенства1
|X − a| < δ.
Сформулируем и докажем следующую теорему
Теорема 6.4. Вероятность отклонения случайной величины X от её
центра рассеивания a меньше чем на δ равна удвоенному значению интегральной функции Лапласа от отношения δ к среднеквадратическому
отклонению σ.
То есть
δ
P (|X − a| < δ) = 2Φ
.
(6.26)
σ
1
Здесь δ > 0.
143
Д о к а з а т е л ь с т в о. Неравенство, определяющее отклонение,
более подробно можно переписать, сняв знак модуля,
a − δ < X < a + δ.
Полагая в условиях предыдущей теоремы 6.3 α = a − δ, а β = a + δ,
воспользуемся равенством (6.25)
a+δ−a
a−δ−a
P (a − δ < X < a + δ) = Φ
−Φ
.
σ
σ
Далее, приведя подобные, имеем
δ
δ
P (a − δ < X < a + δ) = Φ
−Φ − .
σ
σ
Учитывая, что функция Φ(x) является нечётной и поэтому Φ(−x)=-Φ(x),
получаем требуемое утверждение
δ
P (a − δ < X < a + δ) = 2Φ
.
σ
6.5.9
Правило трёх сигм
Исследование вероятности попадания значений нормально распределённой случайной величины в определённый интервал зависит от характеристики рассеивания случайной величины. Это связано как с единицами
измерения данной величины, так и с тем, что одни случайные величины
теснее группируются вокруг среднего значения, а другие более разбросаны.
Универсальной характеристикой рассеивания является величина среднего квадратического отклонения σ.
Посмотрим, как будет выглядеть вероятность отклонения значений случайной величины от среднего значения a, если измерять это отклонение «в
сигмах».
Пусть в равенстве (6.26) отклонение δ = tσ (здесь t − коэффициент
кратности). Тогда равенство (6.26) можно будем переписать так
P (|X − a| < tσ) = 2Φ(t).
(6.27)
Далее, выбирая поочередно t равным 1, 2, 3, выясним, как располагаются значения нормально распределённой случайной величины относительно
своего среднего значения.
Пусть t = 1. Тогда
P (|X − a| < σ) = 2Φ(1).
Из таблицы значений интегральной функции Лапласа (прил. 2) известно,
что Φ(1) = 0, 3413. Поэтому
P (|X − a| < σ) = 2 · 0, 3413 ⇒ P (|X − a| < σ) = 0, 6826.
144
То есть 68,26% значений нормально распределённой случайной величины
располагаются от её математического ожидания на расстоянии, меньшем
чем «сигма».
Предположим, что t = 2. Подставив его в формулу (6.27), находим
P (|X − a| < 2σ) = 2Φ(2).
Из таблицы значений интегральной функции Лапласа (прил. 2) можно найти Φ(2) = 0, 4772. Поэтому
P (|X − a| < 2σ) = 2 · 0, 4772 ⇒ P (|X − a| < 2σ) = 0, 9544.
То есть 95,44% значений нормально распределённой случайной величины
располагаются от её математического ожидания на расстоянии, меньшем
чем два «сигма».
Выберем t = 3. В этом случае
P (|X − a| < 3σ) = 2Φ(3).
Из таблицы значений интегральной функции Лапласа (прил. 2) мы знаем,
что Φ(3) = 0, 49865. Следовательно,
P (|X − a| < 3σ) = 2 · 0, 49865 ⇒ P (|X − a| < 3σ) = 0, 9973.
То есть 99,73% значений нормально распределённой случайной величины
располагаются от её математического ожидания на расстоянии, меньшем
чем три «сигма».
Это означает, что только 0,27% значений случайной величины отклоняются от её математического ожидания на расстояние, большее чем три
«сигма».
События со столь малой вероятностью считаются практически невозможными. Поэтому в практических исследованиях при неизвестном распределении случайной величины, если случайная величина отклоняется от
среднего значения не более чем на три среднеквадратических отклонения,
считают, что есть основания предполагать, что случайная величина распределена по нормальному закону. Иначе, это предположение отвергают.
В заключение сформулируем следующее правило трёх сигм:
Если случайная величина распределена по нормальному закону, то модуль
её отклонения от математического ожидания не превышает утроенного среднего квадратического отклонения.
6.5.10
Примеры решения задач, связанных с нормальным распределением
Задача 6.10. Длина X некоторой детали представляет собой случайную величину, распределенную по нормальному закону распределения, и
имеет среднее значение 20 мм и среднее квадратическое отклонение −
0,2 мм.
Найдите:
145
а) выражение плотности распределения;
б) вероятность того, что длина детали будет заключена между
19,7 и 20,3 мм;
в) вероятность того, что величина отклонения не превышает 0,1 мм;
г) какой процент составляют детали, отклонение которых от среднего
значения не превышает 0,1 мм;
д) каким должно быть задано отклонение, чтобы процент деталей,
отклонение которых от среднего не превышает заданного, повысился
до 54%;
е) интервал, симметричный относительно среднего значения, в котором
будет находиться X с вероятностью 0,95.
Решение
Из условия задачи для всех вопросов общими являются a = 20, σ = 0, 2.
а) Прежде чем подставить значения a = 20 и σ = 0, 2 в функцию плотности вероятностей нормального распределения (см. 6.18), вычислим
2σ 2 = 2 · (0, 2)2 ⇒ 2σ 2 = 0, 08.
Подставляя данные и найденное значения в представление (6.18), имеем
(x − 20)2
−
0, 08
1
√ e
f (x) =
.
0, 2 · 2π
б) Из условия задачи согласно формуле (6.25) β = 20, 3, α = 19, 7. Поэтому
после подстановки в формулу (6.25) имеем
20, 3 − 20
19, 7 − 20
0, 3
0, 3
Φ
−Φ
=Φ
−Φ −
=
0, 2
0, 2
0, 2
0, 2
3
= 2Φ
= 2Φ(1, 5) = 2 · 0, 4332 = 0, 8664.
2
(Значение Φ(1, 5) = 0, 4332 взято в таблице значений интегральной функции Лапласа (прил. 2)).
в) Из условия задачи согласно формуле (6.26) δ = 0, 1. Таким образом,
после подстановки в формулу (6.26) имеем
0, 1
P (|X − 20| < 0, 1) = 2Φ
= 2Φ(0, 5) = 2 · 0, 1915 = 0, 383.
0, 2
(Значение Φ(0, 5) = 0, 1915 взято в таблице значений интегральной функции Лапласа (прил. 2)).
г) Из ответа на вопрос в) известно, что вероятность при отклонении меньше
0,1 мм равна 0,383. Следовательно, из 100 деталей в среднем 38,3 детали
будут иметь такое же отклонение. Поэтому 38% деталей имеют подобное
отклонение.
146
д) Так как процент отклонения составляет 54%, то из формулы (6.26) вытекает следующее уравнение
P (|X − 20| < δ) = 0, 54.
Сравнивая правую часть полученного уравнения
справой части формулы
δ
(6.26)
P (|X − 20| < δ) = 2Φ
,
0, 2
получаем новое уравнение
δ
2Φ
= 0, 54.
0, 2
Откуда следует, что
δ
Φ
= 0, 27.
0, 2
Просматривая в таблице значения интегральной функции Лапласа (прил.
2), находим, что 0, 27 = Φ(0, 74). Поэтому
δ
= 0, 74 ⇒ δ = 0, 74 · 0, 2 ⇒ δ = 0, 148.
0, 2
Следовательно, для повышения до 54 процентов числа деталей, для которых отклонение от среднего не превышало заданного, необходимо, чтобы
отклонение равнялось бы 0,148 мм.
e) Так как интервал, в котором будут находится значения нормально распределённой случайной величины X, симметричен относительно среднего
значения a = 20, то его можно описать с помощью двойного неравенства
20 − δ < X < 20 + δ
или с помощью неравенства с модулем
|X − 20| < δ.
Дальнейшее решение совпадает с ответом на вопрос д) при условии замены
числа 0,54 на 0,95. Поэтому составляем
уравнение
δ
2Φ
= 0, 95.
0, 2
Из которого следует, что
δ
= 0, 475.
Φ
0, 2
С помощью таблицы значений интегральной функции Лапласа (прил. 2),
находим, что 0, 475 = Φ(1, 96). Поэтому
δ
= 1, 96 ⇒ δ = 1, 96 · 0, 2 ⇒ δ = 0, 392.
0, 2
В итоге, искомый интервал определяется так
(20 − 0, 392; 20 + 0, 392).
Следовательно, интервал (19, 608; 20, 392), в котором будет находится
147
X, симметричен относительно среднего значения.
Задача 6.11. Автомат изготавливает детали, которые отделом
технического контроля считаются стандартными, если отклонение X
от контрольного размера не превышает 0,8 мм. Каково наиболее вероятное число стандартных деталей среди изготовленных 150 деталей, если
случайная величина X распределена по нормальному закону с σ = 0, 4 мм?
Решение. Полагая в формуле (6.26) δ = 0, 8 и σ = 0, 4, вычислим вероятность отклонения X от контрольного размера a
0, 8
P (|X − a| < 0, 8) = 2Φ
⇒ P (|X − a| < 0, 8) = 2Φ(2).
0, 4
Из таблицы значений интегральной функции Лапласа (прил. 2) следует,
что Φ(2) = 0, 4772. Поэтому
P (|X − a| < 0, 8) = 2 · 0, 4772 ⇒ P (|X − a| < 0, 8) = 0, 9544.
Округлив это число до сотых, будем считать P = 0, 95. Так как q = 1−P ,
то q = 0, 05.
Из схемы Бернулли (см. определение 4.1) известно, что наивероятнейшее число наступлений события
nP − q ≤ m ≤ nP + P .
По условию n = 150. Подставляя данные в двойное неравенство
150 · 0, 95 − 0, 05 ≤ m ≤ 150 · 0, 95 + 0, 95,
после арифметических вычислений получаем
142, 45 ≤ m ≤ 143, 45.
Следовательно,
наиболее вероятное число стандартных деталей среди
изготовленных 150 деталей равно 143.
Задача 6.12. Рост взрослого человека является случайной величиной, распределённой по нормальному закону. Согласно статистике среднее значение роста взрослого шведа − 178 см, а среднее квадратическое
отклонение − 6 см. Определите вероятность того, что хотя бы один из
встреченных пяти взрослых шведов имеет рост от 175 см до 185 см.
Решение. Из условия задачи согласно формуле (6.25) a = 178, σ = 6,
β = 185, α = 175.
Подставим
данные значения
в указанную
формулу
185 − 178
175 − 178
7
3
Φ
−Φ
=Φ
−Φ −
=
6
6
6
6
= Φ(1, 16) + Φ(0, 5) = 0, 3770 + 0, 1915 = 0, 5685.
(Значения Φ(1, 16) = 0, 3770 и Φ(0, 5) = 0, 1915 взяты в таблице значений
интегральной функции Лапласа (прил. 2). Учтено так же, что
148
Φ(−x) = −Φ(x).)
Следовательно, вероятность того, что рост взрослого шведа меньше
175 см и больше 185 см, q = 1 − 0, 5685. То есть q = 0, 4315.
Вычислим вероятность Q того, что ни один из встреченных пяти взрослых
шведов не имеет рост от 175 см до 185 см.
Q = q 5 ⇒ Q = (0, 4315)5 ⇒ Q = 0, 015.
Так как данное событие является противоположным искомому, то нужная
вероятность
P = 1 − Q ⇒ 1 − 0, 015 ⇒ Q = 0, 985.
вероятность того, что хотя бы один из встреченных
Таким образом, пяти взрослых шведов имеет рост от 175 см до 185 см
равна 0,985.
Задача 6.13. Браковка шариков для подшипников происходит следующим образом: если шарик не проходит в отверстие диаметром d1 ,
но проходит в отверстие диаметром d2 (d1 < d2 ), то он считается
стандартным. Если хотя бы одно из этих условий не выполнено, шарик отправляется в брак. Диаметр шарика d является случайной величиной X, распределённой по нормальному закону с характеристиками
d1 + d2
d2 − d1
M (X) =
и σ(X) =
. Определите вероятность того, что
2
4
случайно выбранный шарик будет забракован.
Решение. Из условия задачи согласно формуле (6.25)
d1 + d2
d2 − d1
a=
,σ=
, β = d2 , α = d1 .
2
4
С помощью формулы (6.25) вычислим вероятность стандартности шарика
d2 − a
d1 − a
P (d1 < X < d2 ) = Φ
−Φ
.
σ
σ
Так как
d1 + d2
d2 − d1
d2 − a = d2 −
=
, то
2
2
d2 − a d2 − d1 d2 − d1
=
:
= 2.
σ
2
4
Аналогично, вычислив
d1 + d2
d1 − d2
d1 − a = d1 −
=
,
2
2
найдём
d1 − a d1 − d2 d2 − d1
=
:
= −2.
σ
2
4
Подставляя найденные значения аргументов в правую часть формулы для
149
вероятности, имеем
Φ(2) − Φ(−2) = 2Φ(2) = 2 · 0, 4772 = 0, 9544.
Следовательно, P (d1 < X < d2 ) = 0, 9544.
Так как нас интересует противоположное событие, то его вероятность P
определяется вычитанием из единицы полученного значения.
Поэтому P = 1 − 0, 9544 ⇒ P = 0, 0456.
В итоге, имеем
6.5.11
вероятность того, что случайно выбранный шарик
будет забракован, равна 0,0456.
О роли нормального закона в теории вероятностей и её приложениях
Нормальный закон распределения, или закон Гаусса, является наиболее часто встречающимся на практике законом распределения. Объяснение этому даёт следующая теорема, которую сформулируем без доказательства.
Теорема 6.5. Центральная предельная теорема Если случайная
величина X представляет собой сумму очень большого числа взаимно
независимых случайных величин, влияние каждой из которых на всю
сумму ничтожно мало, то X имеет распределение, близкое к нормальному1 .
1
Формулировка А. М. Ляпунова.
История доказательства центральной предельной теоремы связана с работами большого числа
математиков, среди которых можно выделить П. С. Лапласа, А. Муавра, П. Л. Чебышёва, А. А. Маркова, А. М. Ляпунова, Т. Линдеберга и С. Н. Бернштейна (и представляет отдельную увлекательную
историю, далеко выходящую за рамки данного курса).
Чебышёв Пафнутий Львович (1821-1894) − русский математик и механик, основоположник петербургской математической школы, академик Петербургской академии наук и
24 иностранных академий. Автор фундаментальных результатов в теории чисел и теории вероятностей, создатель общей теории ортогональных многочленов и теории равномерных приближений. Основал математическую теорию синтеза механизмов и разработал ряд
практически важных концепций механизмов (см. Википедия [Электронный ресурс] : URL :
https://ru.wikipedia.org/wiki/\T2A\CYRCH\T2A\cyre\T2A\cyrb\T2A\cyrery\T2A\cyrsh\T2A\
cyryo\T2A\cyrv,_\T2A\CYRP\T2A\cyra\T2A\cyrf\T2A\cyrn\T2A\cyru\T2A\cyrt\T2A\cyri\T2A\
cyrishrt_\T2A\CYRL\T2A\cyrsftsn\T2A\cyrv\T2A\cyro\T2A\cyrv\T2A\cyri\T2A\cyrch (дата обращения: 12.06.2016)).
Марков Андрей Андреевич (1856-1922) − русский математик, академик, внёсший большой вклад
в теорию вероятностей, математический анализ и теорию чисел (см. Википедия [Электронный ресурс]
: URL : https://ru.wikipedia.org/wiki/\T2A\CYRM\T2A\cyra\T2A\cyrr\T2A\cyrk\T2A\cyro\T2A\
cyrv,_\T2A\CYRA\T2A\cyrn\T2A\cyrd\T2A\cyrr\T2A\cyre\T2A\cyrishrt_\T2A\CYRA\T2A\cyrn\T2A\
cyrd\T2A\cyrr\T2A\cyre\T2A\cyre\T2A\cyrv\T2A\cyri\T2A\cyrch_(\T2A\cyrs\T2A\cyrt\T2A\cyra\
T2A\cyrr\T2A\cyrsh\T2A\cyri\T2A\cyrishrt) (дата обращения: 12.06.2016)).
Ляпунов Александр Михайлович (1857−1918) − русский математик и механик. Основные работы
в области дифференциальных уравнений, гидродинамики, теории вероятностей. А. М. Ляпунов −
создатель теории устойчивости равновесия и движения механических систем с конечным числом
параметров. Академик Петербургской Академии наук, член-корреспондент Парижской академии
наук, член Национальной академии деи Линчеи (Италия) и ряда других академий наук и научных
150
Так, например, отклонение выходного параметра X (при известных допущениях) любого прибора от номинала можно представить в виде суммы
n элементарных отклонений , связанных с отдельными причинами типа:
X1 − отклонение, вызванное влиянием температуры;
X2 − отклонение, вызванное влиянием влажности воздуха;
X3 − отклонение, вызванное ошибкой ввода какого-нибудь параметра;
X4 − отклонение, вызванное недостаточной чистотой материала изделия;
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
и так далее.
Число n этих отклонений велико, как и число n причин, вызывающих
суммарное отклонение X. При этом каждое из отдельных слагаемых X1 ,
X2 , . . . , Xn не оказывает влияния на рассеяние суммы, отличного от влияния других слагаемых (иначе были бы приняты меры для устранения этого
влияния).
Нормальное распределение распространено в технических приложениях:
ошибки измерения параметров, ошибки выполнения команд, ошибки ввода
различных величин в техническое устройство распределены по нормальному закону.
Нормальный закон имеет широкое применение в биологии: вес, размер
и другие параметры представителей растительного и животного мира во
многих случаях имеют нормальное распределение, так как их разброс связан с суммарным воздействием многих факторов, каждый из которых не
имеет доминирующего влияния1 .
И, наконец, в самой математике как предельный закон он связан со
множеством распределений случайной величины и поэтому без него невозобществ (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRL\
T2A\cyrya\T2A\cyrp\T2A\cyru\T2A\cyrn\T2A\cyro\T2A\cyrv,_\T2A\CYRA\T2A\cyrl\T2A\cyre\T2A\
cyrk\T2A\cyrs\T2A\cyra\T2A\cyrn\T2A\cyrd\T2A\cyrr_\T2A\CYRM\T2A\cyri\T2A\cyrh\T2A\cyra\
T2A\cyrishrt\T2A\cyrl\T2A\cyro\T2A\cyrv\T2A\cyri\T2A\cyrch (дата обращения: 12.06.2016)).
Бернштейн Сергей Натанович (1880−1968) − советский математик. Решил 19-ю проблему Гильберта. Автор первой аксиоматики в теории вероятностей. Создатель конструктивной теории функций. Академик АН СССР и Парижской академии наук. Член Немецкого
и Французского союзов математиков. (см. Википедия [Электронный ресурс] : URL : https:
//ru.wikipedia.org/wiki/\T2A\CYRB\T2A\cyre\T2A\cyrr\T2A\cyrn\T2A\cyrsh\T2A\cyrt\T2A\cyre\
T2A\cyrishrt\T2A\cyrn,_\T2A\CYRS\T2A\cyre\T2A\cyrr\T2A\cyrg\T2A\cyre\T2A\cyrishrt_\T2A\
CYRN\T2A\cyra\T2A\cyrt\T2A\cyra\T2A\cyrn\T2A\cyro\T2A\cyrv\T2A\cyri\T2A\cyrch (дата обращения: 12.06.2016)).
Линдеберг Ярл Вальдемар (швед. Lindeberg Jarl Waldemar, 1876−1932) − финский математик.
Основные работы в области теории вероятностей и математической статистики. Его именем назван
один из вариантов центральной предельной теоремы, а также соответствующее условие Линдеберга
(см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRL\T2A\cyri\
T2A\cyrn\T2A\cyrd\T2A\cyre\T2A\cyrb\T2A\cyre\T2A\cyrr\T2A\cyrg,_\T2A\CYRYA\T2A\cyrr\T2A\
cyrl\T2A\CYRV\T2A\cyra\T2A\cyrl\T2A\cyrsftsn\T2A\cyrd\T2A\cyre\T2A\cyrm\T2A\cyra\T2A\cyrr
(дата обращения: 12.06.2016)).
1
Естественно, и в мире людей: в медицине, социологии, экономике нормальный закон находит свои
приложения.
151
можны ни математическая статистика, ни теоретическая физика.
6.6
Показательное распределение
6.6.1
Определение и график функции плотности
показательного распределения
Определение 6.13. Распределение вероятностей непрерывной случайной величины называется показательным1 или экспоненциальным с
параметром λ > 0, если функция плотности вероятностей определяется
следующим образом
0,
если x < 0,
f (x) =
(6.28)
−λx
λe
, если x ≥ 0.
f (x)
Так как e > 1, а λ > 0, то функция плотности показательного распределения монотонно убывает на бесконечном интервале [0; ∞). Схематиx ческий график функции имеет следующий вид (рис. 6.15):
λ
0
Рис. 6.15
6.6.2
Интегральная функция показательного распределения
Так как область определения функции плотности
Df = (−∞; 0) ∪ [0; ∞),
то следует рассмотреть два случая.
Пусть x «движется» только по отрицательной части оси абсцисс. Очевидно, что в этом случае в каждой точке интегральная функция будет
равна нулю.
Если x находится в правой полуплоскости, то с помощью представления
(6.5) определим интегральную функцию показательного распределения вероятностей
1
Первыми работами, в которых исследовалось показательное распределение можно считать работы
Л. Больцмана «Исследования о равновесии живой силы между движущимися материальными точками» (Studien über das Gleichgewicht der lebendigen Kraft zwischen bewegten materiellen Punkten), (1868
год) и В. Витворта «Выбор и шанс» (Choice and Chance) (1886 год) (см. The Exponential distribution.
c. 3.)
Больцман Людвиг (нем. Boltzmann Ludwig Eduard, 1844-1906) − австрийский физик-теоретик, основатель статистической механики и молекулярно-кинетической теории (см. Википедия [Электронный
ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRB\T2A\cyro\T2A\cyrl\T2A\cyrsftsn\T2A\
cyrc\T2A\cyrm\T2A\cyra\T2A\cyrn,_\T2A\CYRL\T2A\cyryu\T2A\cyrd\T2A\cyrv\T2A\cyri\T2A\cyrg
(дата обращения: 12.06.2016)).
152
Zx
F (x) =
f (t) dt.
−∞
Учитывая область определения функции плотности, имеем
Zx
Z0
Zx
−λt
f (t) dt =
dt + λe dt.
−∞
−∞
0
Рассмотрим каждое из слагаемых в отдельности.
Очевидно, что первый из интегралов равен нулю. А второй интеграл
x
Zx
−λx
1 −λt
−λ·0
−λx
−λt
=− e −e
=1−e .
e
λe dt = λ −
λ
0
0
Следовательно, функция
F (x) =
0,
если x < 0,
−λx
1 − e , если x ≥ 0.
(6.29)
является интегральной функцией показательного распределения.
Далее построим схематический график интегральной функции.
Так как
−λx
lim (1 − e ) = 1,
x→∞
то график имеет правую горизонтальную асимптоту y = 1.
Поскольку F 0 (x) = f (x), учтём, что f (x) > 0. Поэтому интегральная
функция возрастает в правой полуплоскости. Для исследования характера
выпуклости графика, определим вторую производную функции F (x).
Так как она одновременно является первой производной для функции
плотности, имеем
−λx
0
−λx
λe
= −λ2 e .
В силу отрицательности второй производной график интегральной функции является выпуклым вверх в правой полуплоскости и имеет следующий
вид (рис. 6.16):
F (x)
1
x
0
Рис. 6.16
153
6.6.3
Математическое ожидание показательного распределения
Используя формулу (6.7), докажем следующую теорему.
Теорема 6.6. Математическое ожидание непрерывной случайной ве1
личины, распределённой по показательному закону, равно .
λ
Д о к а з а т е л ь с т в о. Предположим, что X − непрерывная случайная величина, распределённая по показательному закону. Тогда
Z∞
M (X) =
xf (x) dx.
−∞
В силу «кусочного» задания функции
Z0
Z∞
Z∞
−λx
xf (x) dx =
x · 0dx + x · λe dx.
−∞
−∞
0
Первый интеграл в сумме равен нулю, а для вычисления второго понадобится формула интегрирования по частям:
Z∞
Zb
−λx
−λx
λ · xe dx = λ · lim xe dx =
b→∞
0
0



Zb
du = dx,
b
1
−λx
−λx
1 −λx = λ · − ·  lim xe
− e dx =
=
−λx
b→∞
dv = e dx, v = − e
λ
0
λ
0
u = x,





b

1
1
−λx
 = 1 .
= λ · − · 0 − − lim e
λ
λ b→∞
λ
0
Таким образом1 , в случае показательного распределения случайной величины X её математическое ожидание
M (X) =
1
λ
.
(6.30)
Задача 6.14. Время ремонта и обслуживания автомобиля является
случайной величиной, которая удовлетворительно описывается показательным законом распределения. По итогам работы за год в автопарке
было отмечено, что на ремонт и обслуживание каждого из дежурных автомобилей после одной поездки тратилось в среднем 8 минут. Найдите
вероятность того, что после очередной поездки это время не превысит
При вычислении предела от подстановки было использовано правило д 0 Лопиталя-Бернулли
(см. Бидерман В. И. Указ. соч. С. 81):
b
∞
−λx
b
(b)0
1
1
−λ·0
lim xe
= lim λb − 0 · e
=
= lim λb 0 = lim
= 0.
λb =
b→∞
b→∞ e
b→∞ e
b→∞ λ · e
∞
∞
0
1
154
16 минут.
Решение. Пусть случайная величина T − время работы и обслуживания дежурного автомобиля после очередной поездки. Согласно условию
M (X) = 8. Поэтому из формулы (6.30) следует, что
1
λ = или λ = 0, 125.
8
Следовательно, интегральная функция распределения (см. представление
(6.29) имеет следующий вид: 0,
если t < 0,
F (t) =
−0,125t
1−e
, если t ≥ 0.
Так как
P (T ≤ 16) = P (−∞ < T ≤ 16), то P (T ≤ 16) = F (16)
(см. формулу (6.1 и пункт г решения задачи 6.1).
Поэтому после вычислений
−0,125·16
−2
1−e
= 1 − e = 1 − 0, 135 = 0, 865
получаем, что
вероятность того, что после очередной поездки
время на ремонт и обслуживание не превысит 16
минут, равна 0, 865.
6.6.4
Медиана показательного распределения
Теорема 6.7. Медиана непрерывной случайной величины, распределённой
ln 2
по показательному закону, равна
.
λ
Д о к а з а т е л ь с т в о. Для доказательства этого утверждения
воспользуемся следствием 6.3. Для этого с помощью представления интегральной функции (6.29) составим уравнение
1
−λx
1−e = .
2
Вычитая единицу из обеих частей и умножив затем обе части на минус 1,
получим
1
−λx
e = .
2
Прологарифмировав обе части полученного уравнения по основанию e,
имеем1
λ · x = ln 2.
После деления обеих частей равенства на λ, убеждаемся в истинности теоремы.
1
ln
1
= ln 2−1 = − ln 2.
2
155
Следовательно, медиана показательного распределения
Me (X) =
6.6.5
ln 2
λ
.
(6.31)
Дисперсия показательного распределения
Используя формулу вычисления дисперсии (6.10), докажем следующую
теорему.
Теорема 6.8. Дисперсия непрерывной случайной величины, распре1
делённой по показательному закону, равна 2 .
λ
Д о к а з а т е л ь с т в о. Вычислим M (X 2 ). Согласно формуле
Z∞
(6.7)
M (X 2 ) =
x2 f (x) dx.
−∞
Учитывая «кусочный» характер задания функции плотности, представим искомый интеграл в виде суммы
Z∞
x2 f (x) dx =
−∞
Z0
x2 · 0 dx + λ ·
−∞
Z∞
x2 e
−λx
dx.
(6.32)
0
Так как первый из интегралов равен нулю, то проблемой является только
второй интеграл. Вычислим его с помощью формулы интегрирования по
частям:
Z∞
Zb
−λx
−λx
x2 e dx = lim x2 e dx =
b→∞
0
0



b
Zb
du = 2xdx,
1
−λx
1 −λx = lim − · x2 e
−2 · xe−λx dx =
=
−λx
b→∞
dv = e dx, v = − e
λ
0
λ
0


Zb
u = x,
du = dx,
1 
1 −λx =
= − · 0 − 2 · lim
xe−λx dx =
−λx
b→∞
dv = e dx, v = − e
λ
λ
0






b
b
Zb
1 −λx 
2
1
2
2
−λx
−λx
− e dx = − 2 · 0 − lim −
e
= 3.
= · − · xe
b→∞
λ
λ
λ
λ
λ
u = x2 ,
0
0
0
Подставляя последний результат1 в равенство (6.32), получаем
При вычислении предела от первой подстановки было использовано правило д 0 Лопиталя − Бернулли (см. Бидерман В. И. Указ. соч. С. 81):
b
∞
−λ·0
b2
(b2 )0
2(b)0
2
2
2 −λx
=
lim x e
= lim λb − 0 · e
=
= lim λb 0 = lim
= 0.
0 = lim
2
λb
λb
b→∞
b→∞ e
b→∞ e
b→∞ λ · (e )
b→∞ λ · e
∞
∞
0
1
156
2
.
λ2
Подставляя полученную дробь, а также значение математического
ожидания (см. равенство (6.30) в формулу (6.10)
2
2
1
D(X) = 2 −
,
λ
λ
убеждаемся в истинности доказываемой теоремы.
M (X 2 ) =
D(X) =
6.6.6
1
λ2
.
(6.33)
Среднее квадратическое отклонение показательного распределения
Зная дисперсию показательного распределения, можно с помощью формулы (6.13) вычислить среднее квадратическое отклонение данного распределения. Извлекая квадратный корень из дисперсии, получаем
σ(X) =
1
.
(6.34)
λ
Замечание 6.9. Из формул (6.30), (6.33), (6.34) видно, что показательное распределение является однопараметрическим распределением, так как
зависит только от одного параметра λ. Зная его, мы одновременно знаем
все числовые характеристики показательного распределения.
6.6.7
Вероятность попадания показательно распределённой
случайной величины в заданный интервал
Предположим, что непрерывная случайная величина X распределена
по показательному закону с параметром λ. Тогда имеет место следующая
Теорема 6.9. Вероятность попадания показательно распределённой
случайной величины X в интервал (α; β), расположенный на неотрицательной полуоси, определяется равенством
P (α < X < β) = e
−αλ
−βλ
−e
.
(6.35)
Д о к а з а т е л ь с т в о. В силу предположений о распределении
случайной величины X на неотрицательной полуоси интегральная функция распределения выглядит согласно формуле (6.29)
−λx
F (x) = 1 − e .
Тогда из формулы (6.4) следует, что
−λβ
−λα
P (α < X < β) = F (β)−F (α) ⇒ P (α < X < β) = 1−e − 1 − e
⇒
⇒ P (α < X < β) = e
Что и требовалось доказать.
157
−αλ
−βλ
−e
.
6.6.8
Понятие о роли показательного распределения в теории надёжности
В связи с возрастающими потребностями развития всевозможных технических систем в начале ХХ столетия возникла теория надёжности технических систем, математической основой которой, в первую очередь, явилась
теория вероятностей.
Связано это с тем, что центральным понятием теории надёжности является понятие отказ, связанное с нарушением работосопособного состояния
объекта. Несмотря на то, что факт отказа объекта − событие детерминированное, однако неполнота сведений об объекте и протекающих в нём и
в окружающей природе процессах приводят к вероятностному характеру
отказов. Поскольку время появления отказа − cлучайная величина, то
изучение этого события в теории надёжности ведётся методами теории вероятностей1 .
Так как любой объект изучения состоит из отдельных элементов, то
имеет смысл ввести следующие определения.
Определение 6.14. Элементом называется любой агрегат, не подлежащий техническому расчленению.
Определение 6.15. Математической надёжностью элемента
называется вероятность события, в котором при заданных условиях элемент будет работать безотказно в течение времени t. Вероятность этого события обозначается P (t). Иногда её называют законом надёжности
элемента.
Определение 6.16. Математической ненадёжностью элемента называется вероятность противоположного события, в котором при
заданных условиях элемент выйдет из строя, то есть откажет, в течение времени t. Вероятность этого события обозначается
Q(t) = 1 − P (t),
(6.36)
Предположим, что непрерывная случайная величина T определяет время безотказной работы элемента. Тогда ненадёжность элемента Q(t) совпадает с интегральной функцией F (t) распределения случайной величины
T:
Q(t) = P (T < t) = F (t).
Следовательно в силу противоположности событий
P (t) = 1 − F (t),
(6.37)
Ненадёжность Q(t) обладает всеми свойствами интегральной функции
распределения (рис. 6.17):
1
А также математической статистики и теории случайных процессов.
158
Q(0) = 0;
∀ t1 ≥ 0, t2 ≥ 0 t1 < t2 ⇒ Q(t1 ) ≤ Q(t2 );
lim Q(t) = 1.
t→∞
Надёжность P (t) обладает противоположными свойствами (рис. 6.18):
P (0) = 1;
∀ t1 ≥ 0, t2 ≥ 0 t1 < t2 ⇒ P (t1 ) ≥ P (t2 );
lim P (t) = 0.
t→∞
F (t)
P (t)
1
1
0
t
0
Рис. 6.17
t
Рис. 6.18
Наряду с интегральной функцией распределения на практике большое
применение имеет функция плотности распределения1
f (t) = F 0 (t) или f (t) = Q0 (t) или f (t) = −P 0 (t).
(6.38)
Дифференциал интегральной функции распределения
dF (t) = f (t)dt
определяет вероятность того, что время работы T принимает значения на
интервале [t; t + dt], то есть вероятность того, что элемент, который начал
работать в момент t = 0, откажет на участке времени [t; t + dt].
В приближённых расчётах плотность f (t) определяется формулой
f (t) ≈
∆n(t)
N ∆t
,
(6.39)
где ∆t − длина участка времени;
∆n(t) − число элементов, отказавших на участке времени;
N − общее число испытываемых элементов.
В теории надёжности с плотностью f (t) связана другая характеристика.
Определение 6.17. Интенсивностью отказов называется отношение плотности распределения времени безотказной работы элемента
к его надёжности, то есть
λ(t) =
f (t)
P (t)
.
(6.40)
С точки зрения физики интенсивность отказов определяет среднее число
отказов в единицу времени, приходящееся на один исправно работающий
1
Эту функцию иногда называют плотностью отказов или частотой отказов
159
элемент. Объяснить это можно с помощью формул (6.40) и (6.39).
Так как
f (t)
∆n(t)
λ(t) =
≈
,
P (t) N ∆tP (t)
а
N · P (t) ≈ n(t),
то
∆n(t)
λ(t) ≈
.
n(t)∆t
С точки зрения теории вероятности величина λ(t)dt определяет условную вероятность отказа элемента на интервале времени (t; t + ∆t) при
условии, что до момента t элемент работал безотказно.
Чтобы это объяснить, рассмотрим следующие события:
Предположим, что событие A − элемент исправно работал до момента t, а
событие B − элемент отказал на интервале времени (t; t + ∆t). Произведение событий A и B заключается в том, что элемент исправно работал до
момента t И после этого отказал на интервале времени (t; t+∆t). Согласно
теореме об умножении вероятностей 3.4 зависимых событий
P (AB) = P (A)PA (B).
(6.41)
Но так как P (A) = P (t), а P (AB) = f (t)dt (см. с. 156), то, разделив обе
части равенства (6.41) на P (A), согласно формуле (6.40) получим
f (t)dt
P (AB)
⇒ PA (B) =
= λ(t).
PA (B) =
P (A)
P (t)
Далее, выразим связь между надёжностью P (t) и интенсивностью отказов
λ(t), исключив из рассмотрения плотность распределения времени безотказной работы элемента f (t).
Используя формулы (6.38) и (6.40), получим
f (t)
P 0 (t)
λ(t) =
⇒ λ(t) = −
⇒ λ(t) = −(ln P (t))0 .
P (t)
P (t)
Проинтегрировав последнее равенство, находим
Zt
ln P (t) = − λ(τ )dτ.
0
Далее, пропотенцировав обе части полученного равенства по e, имеем
−
P (t) = e
Rt
0
λ(τ )dτ
.
(6.42)
В тех случаях, когда происходят внезапные отказы элементов, или исследуется распределение времени между соседними отказами и временем
восстановления, интенсивность отказов превращается в константу λ(t) =
160
λ.
Соответственно, надёжность элемента имеет вид
P (t) = e−λt (t ≥ 0),
(6.43)
а функция плотности распределения времени безотказной работы
f (t) = λe−λt (t ≥ 0)
показывает, что соответствующее распределение случайной величины T −
времени безотказной работы элемента − является показательным распределением.
Поскольку λ(t) в общем случае зависит от t, не удивительно, что показательное распределение является частным случаем таких распределений,
как
распределение Вейбулла (при1 α = 1)
α
f (t) = λαtα−1 e−λt
и
гамма-распределение (при2 α = 1)
λ(λt)α−1 e−λt
f (t) =
.
Γ(α)
Роль показательного распределения в теории надёжности связана также
с его характеристическим свойством.
Теорема 6.10. При заданной интенсивности отказов λ вероятность
безотказной работы элемента на интервале с длительностью t не зависит от времени предыдущей работы до начала данного интервала, а
зависит только от длительности интервала.
Д о к а з а т е л ь с т в о. Рассмотрим следующие события:
A − элемент безотказно работает на интервале (0, to );
B − элемент безотказно работает на интервале (to , to + t);
AB − элемент безотказно работает на интервале (0, to + t).
Согласно формуле (6.43) определим вероятности этих событий:
P (A) = e−λto ; P (B) = e−λt ;
P (AB) = e−λ(to +t) = e−λto e−λt .
1
Здесь α − показатель формы распределения.
Γ(α) − гамма-функция, − функция, которая расширяет понятие факториала на множества
Z∞
нецелых действительных и комплексных чисел и имеет следующий вид: Γ(α) =
tα−1 e−t dt (здесь
2
0
α ∈ C : Re(α) > 0). Гамма-функция была введена Л. Эйлером в 1730 году, а её обозначение и
современный вид определены А. М. Лежандром в 1814 году. (В рассматриваемом случае Γ(1) = 1.)
Лежандр Адриен Мари (фр. Adrien-Marie Legendre, 1752-1833) − французский математик, член
Парижской Академии наук. Основные работы связаны с геометрией, теорией чисел и математическим
анализом (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRL\
T2A\cyre\T2A\cyrzh\T2A\cyra\T2A\cyrn\T2A\cyrd\T2A\cyrr,_\T2A\CYRA\T2A\cyrd\T2A\cyrr\T2A\
cyri\T2A\cyre\T2A\cyrn_\T2A\CYRM\T2A\cyra\T2A\cyrr\T2A\cyri (дата обращения: 12.06.2016)).
161
Далее найдём условную вероятность того, что элемент будет безотказно
работать на интервале (to , to + t) при условии, что он безотказно отработал
на предыдущем интервале (0, to ):
P (AB)
e−λto e−λt
PA (B) =
⇒ PA (B) =
⇒ PA (B) = e−λt .
−λt
P (A)
e o
Так как полученная условная вероятность зависит только от t и не
зависит от to , то время работы to элемента на предыдущем интервале не
влияет на вероятность его работы на следующем интервале. Таким образом, условная вероятность на самом деле является безусловной. Следовательно, время работы элемента на раннем этапе не влияет на вероятность
его работы в последствии. Что и требовалось доказать1 .
Задача 6.15. Два независимо работающих элемента проходят испытания. Длительность работы каждого из элементов имеет показательное распределение,
соответственно равное
0,
если t < 0,
0,
если t < 0,
f1 (t) =
f2 (t) =
−0,03t
−0,04t
0, 03e
, если t ≥ 0.
0, 04e
, если t ≥ 0.
Найдите вероятность того, что за время t = 4 часа:
1) оба элемента выйдут из строя;
2) оба элемента не выйдут из строя;
3) только один элемент выйдет из строя;
4) хотя бы один элемент выйдет из строя.
Решение. Из формул (6.28) и (6.29) следует, что при t ≥ 0 вероятности
выхода из строя для каждого из элементов соответственно равны
F1 (t) = 1 − e−0,03t и F2 (t) = 1 − e−0,04t .
Подставив поочерёдно из условия задачи в каждое из представлений время
t = 4 и выполнив вычисления
1 − e−0,03·4 = 1 − e−0,12 = 1 − 0, 887 = 0, 113;
1 − e−0,04·4 = 1 − e−0,16 = 1 − 0, 852 = 0, 148,
получим вероятности выхода из строя за 4 часа для каждого из элементов:
F1 (4) = 0, 113 и F2 (4) = 0, 148.
(6.44)
Зная эти вероятности, можно ответить на заданные вопросы.
1) Оба элемента выйдут из строя тогда и только тогда, когда выйдет из
строя первый элемент И выйдет из строя второй элемент.
Так как элементы работают независимо друг от друга, то по теореме
3.5 об умножении вероятностей независимых событий2
1
Содержание этого параграфа полностью взято из следующих источников: Вентцель Е. С. Исследование операций. М. : Советское радио, 1972. 552 с. и Острейковский В. А. Теория надёжности. М. :
Высш. шк., 2003. 462 с.
2
Или согласно замечанию 3.6.
162
P1 = 0, 113 · 0, 148 ⇒ P1 = 0, 017.
2) Оба элемента не выйдут из строя тогда и только тогда, когда не выйдет
из строя первый элемент И не выйдет из строя второй элемент.
Согласно формуле (6.37) вероятности безотказной работы более четырёх
часов для элементов соответственно равны
P1 (4) = 1 − 0, 113 ⇒ P1 (4) = 0, 887;
P2 (4) = 1 − 0, 148 ⇒ P2 (4) = 0, 852.
Следовательно, из той же теоремы 3.5 об умножении вероятностей независимых событий1
P2 = 0, 887 · 0, 852 ⇒ P2 = 0, 756.
3) Только один элемент выйдет из строя тогда и только тогда, когда из
строя выйдет первый элемент И не выйдет из строя второй элемент ИЛИ
не выйдет из строя первый элемент И выйдет из строя второй элемент.
С помощью формулы полной вероятности2 (см. теорему 3.6), используя
решения предыдущих пунктов, имеем
P3 = F1 (4) · P2 (4) + P1 (4) · F2 (4) ⇒
⇒ P3 = 0, 113 · 0, 852 + 0, 887 · 0, 148 ⇒ P3 = 0, 228.
4) Так как событие «хотя бы один элемент выйдет» противоположно событию «ни один элемент не выйдет из строя», вероятность которого P2
известна, то
P4 = 1 − P2 ⇒ P4 = 1 − 0, 756 ⇒ P4 = 0, 244.
Объединяя полученные результаты, получаем
P1 = 0, 017; P2 = 0, 756; P3 = 0, 228; P4 = 0, 244.
6.7
Понятие о моментах
Решая задачу, связанную с проблемой моментов в математическом анализе3 , П. Л. Чебышёв обнаружил связь между основными понятиями теоретической механики − центром масс, распределением масс системы материальных точек относительно центра масс, моментами инерции −
и основными понятиями теории случайных величин − математическим
ожиданием и дисперсией.
Рассмотрим основные понятия этой связи.
Определение 6.18. Начальным моментом k-го порядка случайной величины называется математическое ожидание k-й степени
1
Или согласно замечанию 3.6.
Или следуя замечанию 3.6.
3
Работа называлась «О предельных величинах интегралов» и была опубликована в Journal de
Liouville в 1874 году (см. Чебышёв П. Л. Полн. собр. соч. Математический анализ. Том III. М.-Л. :
Изд-во Акад. наук СССР, 1948. С. 63-65, С. 396-403).
2
163
этой величины:
αk (X) = M (X k ).
(6.45)
Таким образом, определённая ранее характеристика положения случайной величины − математическое ожидание (см. определение 6.5) − является одновременно первым начальным моментом.
Так как отклонение случайной величины от её математического ожидания само является случайной величиной, то оно имеет собственное имя.
Определение 6.19. Центрированной случайной величиной называется отклонение случайной величины от её математического ожидания:
X̊=X-M(X).
(6.46)
Как было показано ранее, математическое ожидание центрированной
случайной величины равно нулю:
M (X̊) = 0.
С помощью нового понятия введём следующее
Определение 6.20. Центральным моментом k-го порядка случайной величины называется начальный момент этого же порядка соответствующей центрированной случайной величины:
k
(6.47)
µk (X) = M X̊ = M (X − M (X))k .
Так, для дискретной случайной величины1
n
X
µk (X) =
(xi − M (X))k pi ,
i=1
а для непрерывной случайной величины
Z∞
µk (X) =
(x − M (X))k f (x)dx.
−∞
Как было показано при определении дисперсии дискретной случайной
величины, первый центральный момент случайной величины в силу равенства нулю интереса не представляет.
Интерес представляет второй центральный момент, который совпадает с дисперсией случайной величины
В случае дискретной случайной величины
1
Или µk (X) =
∞
X
(xi − M (X))k pi , если случайная величина может принимать счётное множество
i=1
значений.
164
n
X
µ2 (X) =
(xi − M (X))2 pi = D(X),
i=1
а для непрерывной случайной величины
Z∞
µ2 (X) =
(x − M (X))2 f (x)dx = D(X).
−∞
Как уже говорилось выше (см. замечания 5.5 и 5.11), с точки зрения
теоретической механики математическое ожидание случайной величины, как характеристика положения, является аналогом центра
масс системы материальных точек на числовой прямой, а второй центральный момент, являясь характеристикой рассеивания возможных значений случайной величины относительно её математического ожидания, служит аналогом момента инерции распределения
масс относительно центра масс на числовой прямой.
Математическое ожидание и дисперсия случайной величины являются важными числовыми характеристиками для случайной величины, но
иногда возникает необходимость в более точном её описании. Для этого
используют центральные моменты третьего и четвёртого порядков.
Очень важную роль для описания распределения случайной величины
играет мера его асимметричности или скошенности.
Так как для симметричных распределений случайной величины все
центральные моменты нечётного порядка равны нулю, поэтому для меры
асимметричности достаточно выбрать любой из них. Для описания этой
меры введём следующее1
Определение 6.21. Коэффициентом асимметрии случайной
величины называется отношение третьего центрального момента этой
величины к кубу её среднего квадратического отклонения2 :
µ3 (X)
.
(6.48)
σ 3 (X)
На рис. 6.19 и 6.20 изображены две асимметричные кривые с положиSk(X) =
f (x)
f (x)
Sk > 0
Sk < 0
x
Рис. 6.19
1
2
x
Рис. 6.20
Обозначение Sk происходит от английского слова skew − косой, скошенный.
Деление на σ 3 (X) необходимо для того, чтобы сделать характеристику безразмерной.
165
тельным и отрицательным коэффициентами скошенности.
В качестве примеров рассмотрим задачи на вычисление коэффициентов
асимметрии для равномерного и показательного распределения.
Задача 6.16. Определите коэффициент асимметрии равномерно распределённой непрерывной случайной величины X.
Решение. Так как равномерное распределение является симметричным
распределением (см. рис. 6.7), а числитель формулы (6.48) является центральным моментом третьего нечётного порядка, то для равномерного
распределения коэффициент асимметрии
Sk(X) = 0.
Задача 6.17. Определите коэффициент асимметрии случайной величины X, имеющей показательное распределение с параметром λ
0,
если x < 0,
f (x) =
−λx
λe , если x ≥ 0.
Решение. Для решения этой задачи нам понадобится формула вычисления центрального момента третьего порядка µ3 , аналогичная формуле
вычисления дисперсии (см. (6.11)).
Согласно формуле (6.47)
µ3 = M (X − M (X))3 .
С помощью школьной формулы куб разности1 преобразуем правую часть
третьего центральногомомента
2
3
3
3
2
M (X − M (X)) = M X − 3X · M (X) + 3X · (M (X)) − (M (X)) .
Далее с помощью свойств линейности математического ожидания (см.
свойства 5.5-5.7) раскроем скобки в правой части полученного выражения
и перегруппируем
слагаемые
2
3
3
2
M X − 3X · M (X) + 3X · (M (X)) − (M (X)) =
2
3
= M X 3 − 3M X 2 · M (X)
+
3M
(X)
·
(M
(X))
−
(M
(X))
=
= M X 3 − 3M (X) · M X 2 − (M (X))2 − (M (X))3 .
Так как выражение в скобках в заключительной части преобразования есть
дисперсия D(X) (см. формулу
(см. (6.11)),
то в итоге получаем
3
3
M (X − M (X)) = M X − 3M (X) · D(X) − (M (X))3 .
Используя вычисленные ранее математическое ожидание и дисперсию
показательного распределения (см. формулы (6.30) и (6.33), имеем
1 1
1
M (X − M (X))3 = M X 3 − 3 · · 2 − 3 ⇒
λ λ
λ
4
⇒ M (X − M (X))3 = M X 3 − 3 .
λ
1
(a − b)3 = a3 − 3a2 b + 3ab2 − b3 .
166
Согласно формуле1 (6.7)
M X
3
Z∞
=
x3 · λe
−λx
dx.
0
При интегрировании по частям нам постоянно нужен будет предел2
−λx
lim xk · e = 0.
x→∞
Z∞
0
Zb
du = 3x2 dx,
x3 · λe dx = lim x3 · λe dx =
1 −λx
b→∞
dv = e−λx dx, v = − e
λ
0


b
Zb
1
1
−λx
−λx
= λ · lim − · x3 · e
−3 · −
· x2 · e dx.
b→∞
λ
λ
−λx
u = x3 ,
−λx
0
=
0
Согласно вышеуказанному пределу первое слагаемое в скобке стремится к
нулю, и после сокращения на λ нам предстоит найти
Zb
u = x2 ,
du = 2xdx,
−λx
2
3 · lim x · e dx =
1 −λx =
b→∞
dv = e−λx dx, v = − e
λ
0


b
b
Z
1
1
−λx
−λx
= 3 · lim − · x2 · e
· x · e dx.
−2 · −
b→∞
λ
λ
0
0
Как и выше, первое слагаемое в скобке стремится к нулю, а нам надо вычислить
Zb
u = x,
du = dx,
6
−λx
· lim x · e dx =
1 −λx =
λ b→∞
dv = e−λx dx, v = − e
λ
0


b Zb
1
1
6
−λx
−λx
− −
· e dx.
= · lim − · x · e
λ b→∞
λ
λ
0
0
Аналогично, освобождаясь от первого слагаемого в скобке, вычислим


b
Zb
6
1
1
6
6
6
−λx
−λx
− · e
=
·
lim
·
lim
·
0
−
−
.
e
dx
=
=
λ2 b→∞
λ2 b→∞
λ
λ2
λ
λ3
0
0
Вспоминая о третьем центральном моменте, получаем
6
4
2
M (X − M (X))3 = 3 − 3 ⇒ M (X − M (X))3 = 3 .
λ
λ
λ
1
Нижний предел поднят до нуля, так как функция плотности показательного распределения на
отрицательной части оси абсцисс равна нулю.
∞
k!
1
bk
(bk )0
2
lim λb =
= lim λb 0 = · · · = lim k λb =
= 0.
b→∞ e
b→∞ (e )
b→∞ λ · e
∞
∞
167
Разделив третий центральный момент на куб среднего квадратического отклонения (см. формулы (6.34) и (6.48), получаем коэффициент
асимметрии распределённой по показательному закону случайной величины X
Sk(X) = 2.
В некоторых случаях характеристикой распределения непрерывной случайной величины является мера пикообразности её вершины, которая сравнивается с пикообразностью вершины нормального распределения, для которого эта мера равна нулю.
Определение 6.22. Эксцессом случайной величины называется
отношение четвёртого центрального момента этой величины к четвёртой степени её среднего квадратического отклонения, уменьшенное на
3:
µ4 (X)
E(X) = 4
− 3.
(6.49)
σ (X)
На рис. 6.21 изображеf (x)
E(X) > 0
ны кривые распределений с
разными эксцессами: кривая
нормального распределения с
E(X) = 0
E(X)=0, кривая с более острой вершиной, чем у норE(X) < 0
мального распределения, имеющая положительный эксx цесс, и кривая с пологой вершиной, имеющая отрицательРис. 6.21
ный эксцесс.
Задача 6.18. Непрерывная случайная величина X имеет распределение с плотностью
−x2
f (x) = Ae .
Определите эксцесс E(X).
Решение. Используя свойство 6.2, вычислим коэффициент A. Для этого нужно будет решить уравнение
Z∞
−x2
Ae dx = 1.
−∞
Вынося константу за знак интеграла, имеем
Z∞ 2
−x
A
e dx = 1.
−∞
168
Интеграл в левой части является интегралом Эйлера-Пуассона1
Z∞ 2
√
−x
e dx = π.
−∞
Поэтому
1
A=√ .
π
Следовательно, плотность распределения случайной величины X описывается функцией
1 −x2
f (x) = √ e .
π
Далее для решения задачи нам понадобится формула вычисления центрального момента четвёртого порядка µ4 , аналогичная формуле вычисления дисперсии (см. (6.11)).
Согласно формуле (6.47)
µ4 = M (X − M (X))4 .
С помощью бинома Ньютона2 преобразуем правую часть четвёртого центрального момента
M (X − M (X))4 =
2
3
4
4
3
2
= M X − 4X · M (X) + 6X · (M (X)) − 4X (M (X)) + (M (X)) .
Далее с помощью свойств линейности математического ожидания (см.
свойства 5.5-5.7) раскроем скобки в правой части полученного выражения
и перегруппируем слагаемые
M X 4 − 4M X 3 · M (X) + 6M X 2 · (M (X))2 − 4M (X) · (M (X))3 + (M (X))4 =
= M X 4 − 4M X 3 · M (X) + 6M X 2 · (M (X))2 − 6 (M (X))4 + 3 (M (X))4 =
= M X 4 − 4M X 3 · M (X) + 6 (M (X))2 M X 2 − (M (X))2 + 3 (M (X))4 .
Так как выражение в скобках в заключительной части преобразования есть
дисперсия D(X) (см. формулу (см. (6.11)), то в итоге получаем
M (X − M (X))4 = M X 4 −4M X 3 ·M (X)+6 (M (X))2 D(X)+3 (M (X))4 .
Функция плотности является чётной функцией с графиком, симметричным относительно оси ординат (рис. 6.22), поэтому её математическое
ожидание M (X) = 0. По этой же причине и начальный момент третьего
порядка M (X 3 ) = 0.
1
2
См. Зорич В. А. Указ. соч. С. 424.
(a − b)4 = a4 − 4a3 b + 6a2 b2 − 4ab3 + b4 .
169
f (x)
1
√
π
√1
eπ
− √1
Рис. 6.22
2
x
1
√
2
Следовательно,
M X − M (X))4 = M X 4 .
Но прежде, чем заняться его вычислением, нам придётся вычислить начальный момент второго порядка M (X 2 ), который пригодится при вычислении искомого центрального момента. А так M (X 2 ) в нашем случае
совпадает с дисперсией, то он пригодится при вычислении среднего квадратического отклонения σ(X).
Далее при интегрировании мы будем использовать символьное выражение1
∞
−x2
xk e
xk
−02
−
0
·
e
= 0.
2
x→∞ ex
= lim
0
Согласно формуле (6.7)
1
M (X 2 ) = √
π
Z∞
−x2
2
x ·e
dx.
−∞
Так как под интегралом находится чётная функция, то согласно свойствам
интеграла от такой функции в симметричных пределах2
Z∞
Z∞
2
2
1
−x
−x2
√
x2 · e dx = √
x2 · e dx.
π
π
−∞
0
Далее, используя формулу интегрирования по частям и вышеуказанное
символьное выражение, получим3
1
Здесь и далее k − целое число. Для вычисления предела, как и в сноске на с. 164, нужно применить
несколько раз правило Лопиталя − Бернулли.
2
См., например, Бидерман В. И. Указ. соч. С. 146.
√
Z∞ 2
−x
π
3
Заметим, что интеграл в скобке есть интеграл Пуассона-Эйлера
e dx =
.
2
0
170
2
√
π

2
x −x2
= √ − e
2
π
Z∞
du = dx,
x · e dx =
1 −x2 =
dv = xe dx, v = − e
2
0

∞
√ √
Z∞ 2
1
1
1
π
2
π
2
−x
+
=
e dx = √
0+ ·
=√ ·
2
2 2
2
π
π 4
0
u = x,
−x2
2
−x2
0
Таким образом,
1
√
π
Z∞
−x2
x2 · e
dx =
1
1
⇒ M (X 2 ) = .
2
2
(6.50)
−∞
Теперь можно вычислить и M (X 4 ). Согласно формуле (6.7)
Z∞
1
−x2
M (X 4 ) = √
x4 · e dx.
π
−∞
Как и выше, под интегралом чётная функция, а пределы интегрирования
симметричны. Поэтому
Z∞
Z∞
1
2
−x2
−x2
√
x4 · e dx = √
x4 · e dx.
π
π
−∞
0
Снова используя формулу интегрирования по частям, получим1
Z∞
u = x,
du = dx,
2
−x2
√
x4 · e dx =
.
−x2
π
dv = x3 e dx,
?
0
Теперь нам придётся взять паузу, чтобы вычислить2 функцию v.
Z
Z
Z
2
2
1
1
3 −x
2 −x
2
2
v = x e dx =
x e d(x ) = t = x =
te−t dt =
2
2
Z
1
u = t,
du = dt,
=
−te−t − (−) e−t dt =
−t
−x2 =
dv = e dx, v = −e
2
t + 1 −t
x2 + 1 −x2
1
−t
−t
=
−te − e
=−
e =−
e .
2
2
2
Продолжая прерванные для нахождения v вычисления, имеем3
1
Здесь использовано представление x4 = x · x3 .
1 2
x d(x2 ).
2
3
Во второй строке преобразований, в скобке, первый интеграл вычислен выше (см. формулу (6.50)).
2
Здесь использовано представление x3 dx = x2 · xdx =
171
Z∞

∞
2

Z∞
1
−x2
+
(x2 + 1)e dx =
2
x + 1 −x2
2
e
dx = √ −x
2
π
0
0
0


√
√ Z∞
Z∞ 2
1
2 1
π
π
−x2
−x
2
0 + x e dx + e dx = √
+
=1
=√ ·
2
2
π 2
π
2
√
π
−x2
x4 · e
0
1
√
π
Z∞
x4 · e
0
−x2
dx = 1 ⇒ M (X 4 ) = 1 ⇒ M X − M (X))4 = 1.
−∞
Так как M (X 2 ) = D(X), то из равенства (6.50) среднее квадратическое
отклонение
p
1
σ(X) = D(X) ⇒ σ(X) = √ .
2
Далее с помощью формулы вычисления эксцесса (6.49) имеем
1
E(X) = 4 − 3 ⇒ E(X) = 1.
√1
2
В итоге, эксцесс заданной в условии задачи случайной величины X
E(X) = 1.
Замечание 6.10. То, что
эксцесс данной случайной величины X больше эксцесса нормально распределённой
случайной величины можно потвердить графически,
сравнивая графики функций
плотности заданной случай√1
eπ
ной величины и случайной
x
1
1
−1 − √
√ 1
величины, имеющей норми2
2
рованное нормальное распреРис. 6.23
деление (рис. 6.23).
Рассматривая рис. 6.21 − 6.23, эксцесс случайной величины можно определить как коэффициент островершинности случайной величины.
1
√
π
1
√
2π
f (x)
172
Закон больших чисел
7
Иногда нужно пытаться снова и снова, Чтобы
получить желаемый результат. Чем больше
пытаешься, тем скорее получится. Или, в сущности, иногда просто надо не сдаваться.
Джоджо Мойес
В начале XVIII столетия в развитии теории вероятностей как математической науки наступает момент, когда приходит осознание того, что
«частота появления какого-либо случайного события при неограничивающемся числе независимых наблюдений, производимых в одинаковых условиях, сближается с его вероятностью»1
Приходит понимание того, что «само понятие математической вероятности было бы бесплодно, если бы не находило своего осуществления в виде
частоты появления какого-либо результата при многократном повторении
однородных условий».
Этим пониманием мир обязан Якобу Бернулли, открывшему общий
принцип, согласно которому при большом числе случайных величин их
средний результат перестаёт быть случайным и может быть предсказан с большой степенью определённости. Этот принцип получил название
закон больших чисел2 .
В более узком смысле под законом больших чисел понимают группу теорем, в каждой из которых при заданных условиях устанавливается
закономерность приближения средних характеристик большого числа испытаний к некоторым определённым постоянным.
В основе доказательств этих теорем лежат два неравенства.
7.1
Неравенство Маркова
Теорема 7.1. Неравенство Маркова. Если случайная величина X принимает только неотрицательные значения и имеет конечное математическое ожидание M (X), то для любого положительного числа ε верно
неравенство
M (X)
P (X > ε) ≤
.
(7.1)
ε
1
См. Бернулли Я. Указ. соч. С. 4.
Впервые этот термин использовал Д. Пуассон при работе над обобщением теоремы Бернулли в
исследовании «Recherches sur la probabilité des jugements en matiére criminelle et en matiére civill» (русское название работы «Исследования о вероятности приговоров в уголовных и гражданских делах»)
в 1837 году (см. Бернулли Я. Указ. соч. С. 14).
2
173
Д о к а з а т е л ь с т в о. В определении 5.5 было введено понятие
индикатора IA случайного события A. Используем его для доказательства
данного неравенства.
Событие, при котором случайная величина X ≤ ε, обозначим A, а противоположное ему событие Ā заключается в том, что случайная величина
X > ε. Достаточно очевидно, что сумма индикаторов противоположных
событий
IA + IĀ = 1.
Представим модуль случайной величины
X = X · IA + X · IĀ .
Так как первое слагаемое X · IA неотрицательно, то имеем неравенство
X > X · IĀ .
Поскольку X > ε, то верно двойное неравенство
X > X · IĀ > ε · IĀ .
Из монотонности математического ожидания следует истинность следующего неравенства
M (X) > M (ε · IĀ ).
Согласно биномиальному закону распределения математическое ожидание
M (IĀ ) = P (Ā),
поэтому имеет место следующее неравенство
M (X) > ε · P (Ā).
А так как P (Ā) = P (X > ε), то имеем
M (X) > εP (X > ε).
Далее, разделив обе части последнего неравенства на положительное число ε, убеждаемся в истинности доказываемого неравенства
M (X)
P (X > ε) ≤
.
ε
Следствие 7.1. Так как события X ≤ ε и X > ε − противоположные,
то неравенство (7.1) эквивалентно неравенству
P (X ≤ ε) ≥ 1 −
M (X)
.
(7.2)
ε
Задача 7.1. Согласно мировой статистике, в наши дни средний срок
службы автомобиля до того как машина попадёт на свалку, в глобальном
масштабе, составляет 12 лет1 . Оцените вероятность того, выбранный в автосалоне автомобиль прослужит не более 25 лет.
Решение. Предположим, что случайная величина X − срок службы
1
[Электронный ресурс] : URL : http://www.1gai.ru/publ/514593-dolgovechnost-i-srok-sluzhby\
-avtomobilya.html@1gai.ru (дата обращения: 12.06.2016).
174
автомобиля до утилизации. Согласно условию её математическое ожидание
M (X) = 12, а длина предполагаемого интервала службы ε = 25. Подставляя эту информацию в неравенство (7.2) получаем
12
P (X ≤ 25) ≥ 1 −
⇒ P (X ≤ 25) ≥ 0, 52.
25
Таким образом (хоть это и грубая оценка), получаем, что
вероятность того, что автомобиль прослужит
не более 25 лет, составляет не менее 52 процентов.
Задача 7.2. В течение трёх семестров установлено, что в среднем студент Вася опаздывает на лекции не более чем на две минуты. Оцените
вероятность того, что в четвёртом семестре Вася будет опаздывать на лекции более чем на 5 минут.
Решение. Предположим, что случайная величина Y − время опоздания Васи на лекцию. Из условия известно, что математическое ожидание
M (Y ) = 2, а длина предполагаемого времени опоздания ε = 5. Подставляя
эти данные в неравенство (7.1) получаем
2
P (X > 5) ≤ ⇒ P (X > 5) ≤ 0, 4.
5
Следовательно,
вероятность того, что Вася будет опаздывать на лекции
в четвёртом семестре более чем на 5 минут, составляет
менее 40 процентов1 .
Если ввести ограничение не только на математическое ожидание случайной величины X, но и на её дисперсию, то можно получить
7.2
Неравенство Бьенеме − Чебышёва
Полученное И. Ж. Бьенеме в 1853 году и переоткрытое П. Л. Чебышёвым1 неравенство утверждает, что случайная величина как правило при1
В советской и последующей российской математической литературе неравенство называется
неравенством Чебышёва. История неравенства тесно связана с открытием Бьенеме метода моментов
(или метода математических ожиданий). Сам Чебышёв в августе 1873 года назвал этот метод
методом Бьенеме. Поскольку данное неравенство было впервые сформулировано Бьенеме в работе,
посвящённой этому методу, а вклад Чебышёва в развитие метода по мнению академика А. А. Маркова
(старшего) превосходит вклад открывателя, то логично назвать неравенство неравенством Бьенеме
− Чебышёва (см. Бернулли Я. Указ. соч. С. 15).
Бьенеме Иренэ-Жюль (Irénée-Jules Bienaymé, 1796-1878) − французский статистик, член Французской академии наук. (см. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/
\T2A\CYRB\T2A\cyrsftsn\T2A\cyre\T2A\cyrn\T2A\cyre\T2A\cyrm\T2A\cyre,_\T2A\CYRI\T2A\cyrr\
T2A\cyre\T2A\cyrn\T2A\cyre-\T2A\CYRZH\T2A\cyryu\T2A\cyrl\T2A\cyrsftsn
(дата
обращения:
12.06.2016)).
Следует отметить, что в работах Чебышёва и Маркова Бьенеме пишется как Биенэмэ (возможно,
в период борьбы с косомополитизмом в СССР в конце 40-х годов XX столетия неравенство «потеряло»
175
нимает значения, близкие к значению математического ожидания. Если
сформулировать более точно, оно оценивает вероятность того, что случайная величина примет значение, далекое от своего среднего.
Теорема 7.2. Неравенство Бьенеме − Чебышёва. Если случайная
величина X имеет конечную дисперсию D(X), то для любого положительного числа ε верно неравенство
P (|X − M (X)| > ε) ≤
D(X)
ε2
.
(7.3)
Д о к а з а т е л ь с т в о. Предположим, что случайная величина
X̄ = (X − M (X))2 , а положительное число ε̄ = ε2 . Подставляя X̄ и ε̄ в
неравенство Маркова (7.1), получаем
M (X − M (X))2
2
2
.
P (X − M (X)) > ε ≤
ε2
(7.4)
Так как неравенство (X − M (X))2 > ε2 эквивалентно неравенству
|X − M (X)| > ε,
2
а M (X − M (X)) есть дисперсия D(X), то из неравенства (7.4) следует
истинность доказываемого неравенства (7.3).
Аналогично следствию 7.1 неравенство
P (|X − M (X)| ≤ ε) ≥ 1 −
D(X)
ε2
(7.5)
равносильно неравенству (7.3).
Ранее, изучая нормальный закон распределения непрерывной случайной величин, мы сформулировали правило трёх сигм для нормального
закона. Неравенство 7.3 позволяет сформулировать в виде следствия это
правило для всех распределений случайной величины, имеющих конечную
дисперсию.
Следствие 7.2. Если случайная величина X имеет конечную дисперсию D(X), то справедливо неравенство1
p
1
P |X − M (X)| ≥ 3 D(X)ε ≤ .
(7.6)
9
Задача 7.3. В некотором населённом пункте среднесуточное потребление энергии составляет 25000 кВт·час. В среднем зафиксированные за
фамилию Бьенеме).
D(X)
1
D(X)
1
= .
p
2 =
9D(X)
9
3 D(X)
176
последний месяц отклонения не превышали 300 кВт·час. Оцените с вероятностью более 0,9 электропотребление в этом населённом пункте в ближайшие сутки.
Решение. Предположим, что случайная величина X − количество
электроэнергии, израсходованной в этом населённом пункте в ближайшие
сутки. Согласно условию среднее квадратическое отклонение σ можно считать равным 300. Поэтому дисперсия D(X) = 3002 . Неизвестную величину
интервала отклонения обозначим за ε. Подставляя эти числа в неравенство
(7.5), получаем
3002
P (|X − M (X)| ≤ ε) ≥ 1 − 2 .
ε
Так как по условию нужна оценка вероятности более 0,9, то составляем
следующее неравенство
3002
1 − 2 > 0, 9.
ε
Решим это неравенство.
300 p
3002
300
<
0,
1
⇒
< 0, 1 ⇒ ε >
⇒ ε > 949, 37.
2
ε
ε
0, 316
Округляя последний результат до десятков, можно считать, что
в данном населённом пункте в ближайшие сутки с вероятностью
более чем 0, 9 будет израсходовано 25000 ± 950 кВт·час.
Замечание 7.1. Заметим, что неравенства Маркова (7.1)-(7.2) и Бьенеме − Чебышёва (7.3)-(7.5), являясь универсальными неравенствами, не
зависящими от конкретных распределений, дают приближённые грубые
оценки. Более точные оценки можно получить только определив тип соответствующего распределения при условии известных для этого распределения оценок. В качестве примера рассмотрим следующую задачу.
Задача 7.4. Вероятность изготовления на отлаженном токарном станке детали равна 0,95. Оцените с помощью неравенства Бьенеме − Чебышёва вероятность того, что среди изготовленных 500 деталей число бракованных деталей окажется в пределах от 15 до 35. Сравните полученную
оценку с вероятностью данного события, вычисленной по формуле Муавра
− Лапласа.
Решение. В данной задаче случайная величина X − число бракованных деталей − распределена по биномиальному закону. Так как вероятность изготовления бракованной детали q = 1 − p, то в данном случае
q = 1 − 0, 95, то есть q = 0, 05. Для рассматриваемой величины математическое ожидание вычисляется по формуле M (X) = np. Поэтому
M (X) = 500 · 0, 05, следовательно, M (X) = 25. Дисперсия в этом случае
вычисляется с помощью формулы D(X) = npq. Подставляя данные, имеем
177
D(X) = 500 · 0, 05 · 0, 95 ⇒ D(X) = 23, 75.
Вероятность того, что X удовлетворяет двойному неравенству, преобразуем следующим образом
P (15 ≤ X ≤ 35) = P (15 − 25 ≤ X − 25 ≤ 35 − 25) =
= P (−10 ≤ X − 25 ≤ 10) = P (|X − 25| ≤ 10).
Подставляя в неравенство (7.5) вычисленные параметры, имеем
23, 75
P (|X − 25| ≤ 10) ≥ 1 −
⇒ P (|X − 25| ≤ 10) ≥ 0, 7625.
102
Таким образом, вероятность того, что среди изготовленных 500 деталей
число бракованных деталей окажется в пределах от 15 до 35, не меньше,
чем 0,7625.
Оценим вероятность этого события с помощью формулы Муавра − Лап√
ласа. В условиях этой формулы δ = 10, σ = 23, 75, то есть σ = 4, 87.
Следовательно,
10
P (|X − 25| ≤ 10) = 2Φ
⇒ P (|X − 25| ≤ 10) = 2Φ (2, 053) ⇒
4, 87
⇒ P (|X − 25| ≤ 10) = 2 · 0, 4798 ⇒ P (|X − 25| ≤ 10) = 0, 9596.
Как отмечено в замечании 7.1, оценка по формуле Муавра − Лапласа
точнее более грубой оценки, полученной с помощью неравенства Бьенеме
− Чебышёва1 .
7.3
Теорема Чебышёва
Неравенства Маркова и Бьенеме − Чебышёва являются на языке математики леммами2 , то есть необходимыми ступеньками к закону больших
чисел как к ряду теорем, первой из которых является
Теорема 7.3. Теорема Чебышёва3 . Если существует положительная константа C, ограничивающая дисперсии n попарно независимых
случайных величин X1 , X2 , . . . , Xn , то при неограниченном увеличении n
средняя арифметическая случайных величин сходится по вероятности к
средней арифметической их математических ожиданий M (X1 ), M (X2 ),
. . . , M (Xn ), то есть
lim P
n→∞
X1 + X2 + · · · + X n
n
−
M (X1 ) + M (X2 ) + · · · + M (Xn )
n
≤ε
= 1.
(7.7)
1
Следует заметить, что оценка с помощью неравенства Бьенеме − Чебышёва имеет преимущество
в скорости её получения, для неё не нужно искать значения интегральной функции Лапласа.
2
Лемма − (греч. ληµµα − предположение) − вспомогательное утверждение, позволяющее доказывать другие утверждения.
3
Неравенство и теорема были доказаны П. Л. Чебышёвым в 1867 году, в работе «О средних величинах».
178
Д о к а з а т е л ь с т в о. По условию задачи для дисперсий данных
случайных величин справедливы неравенства
D(X1 ) ≤ C, D(X2 ) ≤ C, . . . , D(Xn ) ≤ C.
(7.8)
Определим новую случайную величину
X1 + X2 + · · · + X n
.
X=
n
Из линейности математического ожидания следует, что
X1 + X2 + · · · + Xn
M (X1 ) + M (X2 ) + · · · + M (Xn )
M (X) = M
=
.
n
n
Так как рассматриваемые случайные величины являются независимыми, то из свойств дисперсии известно, что
X1 + X2 + · · · + Xn
D(X1 ) + D(X2 ) + · · · + D(Xn )
D(X) = D
.
=
n
n2
Учитывая ограничения (7.8), имеем неравенство
n
z
}|
{
D(X1 ) + D(X2 ) + · · · + D(Xn ) C + C + · · · + C
nC
C
≤
=
=
,
n2
n2
n2
n
из которого следует верхняя оценка дисперсии
D(X) ≤
C
.
n
(7.9)
Совершив в неравенстве (7.5) замену случайной величины
X 1 + X2 + · · · + Xn
X=
,
n
получим следующее неравенство
P
X1 + X2 + · · · + X n
n
−
M (X1 ) + M (X2 ) + · · · + M (Xn )
n
≤ε
≥1−
D(X)
ε2
(7.10)
С помощью (7.9) получаем нижнюю оценку правой части неравенства
(7.10)
C
D(X)
n =1− C .
1−
≥
1
−
ε2
ε2
nε2
Учитывая её, перепишем неравенство (7.10)
P
X1 + X2 + · · · + Xn
n
−
M (X1 ) + M (X2 ) + · · · + M (Xn )
n
≤ε
≥1−
C
.
nε2
(7.11)
C
стремится к нулю, а вероятность
nε2
по определению не может быть больше единицы, убеждаемся в истинности
Так как с увеличением n дробь
179
.
равенства (7.7).
Следствие 7.3. Так как события |X| ≤ ε и |X| > ε являются противоположными, то истинным является и неравенство
P
X1 + X 2 + · · · + X n
n
−
M (X1 ) + M (X2 ) + · · · + M (Xn )
n
>ε
≤
C
,
nε2
(7.12)
из которого следует другая формулировка теоремы (7.3):
Если существует положительная константа C, ограничивающая дисперсии n попарно независимых случайных величин X1 , X2 , . . . , Xn , то при
неограниченном увеличении n отклонение средней арифметической случайных величин от средней арифметической их математических ожиданий M (X1 ), M (X2 ), . . . , M (Xn ) маловероятно, то есть
lim P
n→∞
X1 + X 2 + · · · + Xn
n
−
M (X1 ) + M (X2 ) + · · · + M (Xn )
n
>ε
= 0.
(7.13)
Обобщая утверждения теоремы Чебышёва (7.3) и следствия (7.3), можно утверждать, что среднее арифметическое большого числа случайных
слагаемых стабилизируется с ростом этого числа. Как бы сильно каждая случайная величина не отклонялась от своего среднего значения, при
суммировании эти отклонения взаимно гасятся, так что среднее арифметическое приближается к постоянной величине.
Следствие 7.4. С точки зрения математической статистики теорема
Чебышёва (7.3) представляет наибольший интерес в случае, когда все случайные величины X1 , X2 , . . . , Xn имеют равные математические ожидания
M (X1 ) = M (X2 ) = · · · = M (Xn ) = M (X̄)
и равные дисперсии
D(X1 ) = D(X2 ) = · · · = D(Xn ) = D(X̄)
В этом случае в качестве оценки неизвестного исследователю математического ожидания используют выборочное среднее арифметическое1
X1 + X2 + · · · + Xn
X̄ =
.
n
Теорема Чебышёва (7.3) является математическим фундаментом применяемого в математической статистике выборочного метода, который позволяет по небольшой случайной выборке2 делать вывод о всём множестве
изучаемых элементов.
Задача 7.5. Для определения среднего дохода налогоплательщиков
некоторого населённого пункта была проведена проверка 200 жителей этого населённого пункта, выбранных случайным образом. Оцените вероятность того, что среднегодовой доход жителей этого населённого пункта
1
Это возможно, например, при измерениях некоторой физической величины.
Под выборкой понимается некоторое подмножество элементов, извлекаемое для исследования из
всего множества элементов, которое предполагается бесконечным.
2
180
отклонится от среднего арифметического годовых доходов выбранных 200
жителей не более, чем на 1000 рублей, если из статистики предыдущих лет
известно, что среднее квадратическое отклонение годового дохода в данном пункте не превышает 3000 рублей.
Решение. Пусть Xi − случайная величина, характеризующая годовой
доход жителя, имеющего номер i в данной выборке1 . Так как в каждом
случае i дисперсия D(Xi ) ≤ C = 30002 , то можно воспользоваться неравенством (7.11)
P
X1 + X2 + · · · + X200 M (X1 ) + M (X2 ) + · · · + M (X200 )
30002
−
≤ 1000 > 1−
.
200
200
200 · 10002
Сократив дробь и вычтя её из единицы, можно утверждать, что
вероятность того, что среднегодовой доход жителей этого населённого
пункта отклонится от среднего арифметического годовых доходов выбранных 200 жителей не более, чем на 1000 рублей больше, чем 0, 955.
Задача 7.6. Сколько необходимо провести замеров длины данной детали, чтобы с вероятностью не менее чем 0, 9 утверждать, что отклонение
по абсолютной величине средней арифметической этих замеров от фактической длины детали F не превышает 0, 5 при условии, что среднее квадратическое отклонение каждого из замеров не превышает 2.
Решение. Предположим, что Xi − случайная величина, определяющая
i-й замер2 . Так как в каждом случае i дисперсия D(Xi ) ≤ C = 22 , то как
и в предыдущей задаче 7.5 воспользуемся неравенством (7.11)
22
X1 + X 2 + · · · + X n
− F ≤ 0, 5 ≥ 1 −
.
P
n
n · (0, 5)2
По условию задачи правая часть неравенства
4
1−
≥ 0, 9.
0, 25n
Решив полученное неравенство относительно n
16
16
1 − 0, 9 ≥
⇒n≥
⇒ n ≥ 160,
n
0, 1
получаем, что
в условиях задачи нужно провести не менее 160 замеров.
Теорема Чебышёва (7.3) позволяет получить доказательство теоремы
Бернулли, положившей начало исследованиям закона больших чисел.
1
2
Здесь i пробегает множество значений от 1 до 200.
Здесь i пробегает множество значений от 1 до n.
181
7.4
Теорема Бернулли
Теорема Бернулли1 рассматривает связь между статистической вероятностью события2 , найденной в условиях практики, и его теоретической
вероятностью3 .
Теорема 7.4. Теорема Бернулли. Если m − число наступлений события A в n попарно независимых испытаниях, а p − вероятность наступления события A в каждом из испытаний, то для любого положительного числа ε верны неравенства
m
pq
−p >ε ≤
(7.14)
P
n
nε2
и
pq
P
−p ≤ε >1−
.
(7.15)
n
nε2
Д о к а з а т е л ь с т в о. Число наступлений события A в n попарно независимых испытаниях можно считать случайной величиной, распределённой по биномиальному закону, и воспринимать её как сумму n
попарно независимых случайных величин
m = X1 + X2 + · · · + Xn ,
которые можно рассматривать как индикаторные функции события A
1, если A произошло в i-м испытании;
Xi = IA =
0, если A не произошло в i-м испытании.
Так как для каждой величины-индикатора4 математическое ожидание
M (Xi ) = p, а дисперсия D(Xi ) = p(1−p), то, полагая C = pq (где q = 1−p)
и учитывая следствие 7.4 и неравенство (7.12), убеждаемся в истинности
доказываемого неравенства.
Задача 7.7. Оцените вероятность того, что при подбрасывании двух
игральных костей 400 раз одновременно относительная частота выпадения
двух «шестёрок» будет отличаться от вероятности этого события более чем
на 0, 01.
Решение. Так выпадение «шестёрки» на одной кости не зависит от её
выпадения на другой, то вероятность выпадения двух «шестёрок» на двух
костях одновременно согласно теореме о произведении вероятностей незаm
1
Теорема была получена Я. Бернулли в 1668 году, но опубликована она была в 1713 году.
С точки зрения статистического определения вероятности: вероятность события A − предел отношения количества наступлений события A к количеству всех опытов при безграничном увеличении числа опытов. Это отношение ещё называют относительной частотой события.
3
Следует помнить, что в теории вероятностей исследуются вероятности событий, которые ещё не
наступили.
4
См. свойства биномиального распределения или определение индикаторных функций.
2
182
1 1
1
висимых событий1 будет равна p = · , то есть p = . Соответственно
6 6
36
вероятность того, что при подбрасывании выпадет менее двух «шестёрок»,
1
35
будет равна q = 1 − , то есть q = 1 − .
36
36
По условию задачи n = 400, а величина отклонения ε = 0, 01. Подставляя эти данные в неравенство (7.14)
1 35
·
1
m
35
36 ,
> 0, 01 ≤
−
P
400 36
400 · (0, 01)2
после арифметических вычислений получаем, что
вероятность того, что при подбрасывании двух игральных костей 400 раз
одновременно относительная частота выпадения двух «шестёрок» будет
отличаться от вероятности этого события более чем на 0, 01, не будет
превышать 0, 675.
Задача 7.8. Вероятность того, что деталь окажется стандартной, составляет 0, 95. Сколько деталей необходимо проверить, чтобы с вероятностью 0, 8 можно было бы утверждать, что абсолютная величина отклонения относительной частоты появления стандартных деталей от вероятности их появления не будет превышать 0, 01?
Решение. Согласно условию задачи p = 0, 95. Так как q = 1 − p, то
q = 0, 05. Предел отклонения ε = 0, 9. Подставляя эти данные в неравенство (7.15), имеем
m
0, 95 · 0, 05
− 0, 95 < 0, 01 ≥ 1 −
.
P
n
n(0, 01)2
Поскольку вероятность утверждения по условию 0, 8, то для правой части
полученного неравенства верна оценка
0, 475
1−
≥ 0, 8.
0, 0001n
Решив полученное неравенство относительно n
4750
4750
1 − 0, 8 ≥
⇒n≥
⇒ n ≥ 23750,
n
0, 2
получаем, что
в условиях задачи нужно проверить не менее 23750 деталей.
1
Или принципу произведения.
183
7.5
Сходимость по вероятности
С законом больших чисел связано важное понятие, обобщающее понятие сходимости последовательности, известное из математического анализа. Вспомним определение сходимости для последовательности чисел.
Определение 7.1. Числовая последовательность {an } сходится к
числу a, если для любого сколь угодно малого положительного числа δ
существует номер N = N (δ), такой что для всех n > N |an − a| < δ.
Поскольку теория вероятностей имеет дело с последовательностями случайных величин, то и сходимость этих последовательностей может быть
описана только с помощью вероятностных оценок. Поэтому для последовательностей случайных величин определение сходимости выглядит так:
Определение 7.2. Последовательность случайных величин {Xn } сходится по вероятности к случайной величине X, если для любого
сколь угодно малого положительного числа ε и любого сколь угодно малого положительного числа δ существует номер N = N (δ, ε), такой что
для всех n > N
P (|Xn − X| < δ) ≥ 1 − ε или P (|Xn − X| ≥ δ) < ε.
Обозначается сходимость по вероятности следующим образом:
p
Xn −→ X.
Поэтому все утверждения, связанные с законом больших чисел, не
только в словесной формулировке, но и в символьной могут выглядеть
иначе. Так, например, теорема Чебышёва 7.3 наряду со своей словесной
формулировкой может иметь в качестве символьной
X1 + X2 + · · · + Xn p M (X1 ) + M (X2 ) + · · · + M (Xn )
−→
.
n
n
Замечание 7.2. В рамках данного курса невозможно рассказать о всех
теоремах закона больших чисел1 . Можно только отметить, что в этих
исследованиях наряду с Я. Бернулли и П. Л. Чебышёвым большую роль
сыграли исследования А. Муавра, П. С. Лапласа, Д. Пуассона, А. А. Маркова, Э. Бореля, А. Я. Хинчина, А. Н. Колмогорова, Б.В.Гнеденко2 .
1
Различие и многобразие теорем связаны с ограничениями на случайные величины, входящие в
последовательности. В одних из них рассматриваются замена независимости случайных величин на
некоррелированность, в других ограничения на дисперсии заменяется другими условиями.Связано это
с задачами, возникающими в научных, технических и экономических приложениях.
2
Борель Феликс Эдуар Жюстен Эмиль (фр. Félix Edouard Justin Émile Borel, 1871-1956) −
французский математик. Основные работы в области геометрии, теории множеств, функционального
анализа и теории вероятностей (cм. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.
org/wiki/\T2A\CYRB\T2A\cyro\T2A\cyrr\T2A\cyre\T2A\cyrl\T2A\cyrsftsn,_\T2A\CYREREV\T2A\
cyrm\T2A\cyri\T2A\cyrl\T2A\cyrsftsn,
https://en.wikipedia.org/wiki/Pierre-Simon_Laplace
(дата обращения: 12.06.2016)).
Хинчин Александр Яковлевич (1894-1959) − советский математик. Основные работы в области
теории функций действительного переменного, теории вероятностей, статистической физики, теории
184
В заключение приведём два примера из разных областей, доказывающие
на практике истинность теоретических выводов закона больших чисел.
Первый пример1 связан с именами французского натуралиста XVIII века Ж. Бюффона и английского математика К. Пирсона. Первый из них
подбрасывал монету 4040 раз, при этом он наблюдал 2048 раз выпадение
«герба» и вычислил относительную частоту выпадений «герба» − 0,507.
Второй провёл опыт с подбрасыванием дважды: сначала он подбросил
монету 12000 раз и наблюдал выпадение «герба» 6019 раз, вычислив относительную частоту выпадений «герба» − 0,5016. Затем при подбрасывании
монеты 24000 раз он наблюдал выпадение «герба» 12012 раз, вычислив относительную частоту выпадений «герба» − 0,5005.
Таким образом, то, что мы знаем из теории о том, что вероятность выпадения «герба» при подбрасывании одной монеты равна 0,5, имеет доказанное подтверждение и не требует от нас проверки.
Второй пример известен из социологии2 . Во время одного из социологических опросов некоторый вопрос был задан группе людей из 500 человек.
При этом на него дали отрицательный ответ 54,9% опрошенных. Затем
опросили ещё 1000 человек, и отрицательный ответ социологи получили
от 53,9% опрошенных. Далее были опрошены ещё 5000 человек, которые
дали 55,4% отрицательных ответов. И, наконец, при опросе 30000 человек
отрицательный ответ дали 55,5% опрошенных. Таким образом, практика и
здесь подтверждает, что для того чтобы узнать, что примерно 54-56% всех
людей по данному вопросу настроены отрицательно, не нужно опрашивать
всех людей или 30000 человек, а достаточно опросить не более 500 человек.
Практическая и теоретическая ценность закона больших чисел заключается в том, что он является математическим фундаментом теории
математической статистики, без которого невозможно было бы серьёзно
относится к её выводам и уж тем более к практическим рекомендациям,
которые востребованы в различного рода приложениях в науке, технике и
экономике.
чисел (cм. Википедия [Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRH\
T2A\cyri\T2A\cyrn\T2A\cyrch\T2A\cyri\T2A\cyrn,_\T2A\CYRA\T2A\cyrl\T2A\cyre\T2A\cyrk\T2A\
cyrs\T2A\cyra\T2A\cyrn\T2A\cyrd\T2A\cyrr_\T2A\CYRYA\T2A\cyrk\T2A\cyro\T2A\cyrv\T2A\cyrl\
T2A\cyre\T2A\cyrv\T2A\cyri\T2A\cyrch (дата обращения: 12.06.2016)).
Гнеденко Борис Владимирович (1912-1995) − советский математик, специалист по теории вероятностей, математической статистике, вероятностным и статистическим методам (cм. Википедия
[Электронный ресурс] : URL : https://ru.wikipedia.org/wiki/\T2A\CYRG\T2A\cyrn\T2A\cyre\T2A\
cyrd\T2A\cyre\T2A\cyrn\T2A\cyrk\T2A\cyro,_\T2A\CYRB\T2A\cyro\T2A\cyrr\T2A\cyri\T2A\cyrs_
\T2A\CYRV\T2A\cyrl\T2A\cyra\T2A\cyrd\T2A\cyri\T2A\cyrm\T2A\cyri\T2A\cyrr\T2A\cyro\T2A\
cyrv\T2A\cyri\T2A\cyrch, (дата обращения: 12.06.2016)).
1
Помимо того, что этот пример подтверждает на практике выводы закона больших чисел, он
является подтверждением фантастической работоспособности Ж. Бюффона и К. Пирсона.
2
См. Миронов Б. Н., Степанов З. В. Историк и математика (Математические методы в историческом
исследовании). Л. : Наука, 1976. С. 10.
185
Двумерные случайные величины
8
Всякое случается на свете. И все,
что случается, случается. И все
случайности, которые, случившись,
случаются, становятся причиной
других случайностей.
Адамс Дуглас1
8.1
Понятие двумерной случайной величины
Функция распределения одной случайной величины не может описать
все многообразие природных и, в том числе, экономических процессов и
явлений. Для описания этих процессов используются многомерные случайные величины.
В качестве примеров случайных величин разной размерности рассмотрим следующие примеры:
1. Успеваемость студента, окончившего курс обучения в вузе, характеризуется системой n случайных величин X1 , X2 , . . . , Xn − оценок студента
во вкладыше к его диплому.
2. Станок-автомат штампует цилиндрические валики, диаметр валика X и
высота Y которых образуют систему двух случайных величин (X, Y ).
3. Состояние погоды в данной географической точке и в данный момент
времени описывается некоторым набором параметров: температура воздуха, атмосферное давление, направление и скорость ветра, наличие, вид и
интенсивность атмосферных осадков. Эти параметры можно изучать по
отдельности, но для синоптиков имеет огромное значение изучение параметров погоды в их совокупности и взаимодействии. Следовательно, объектом изучения является многомерная случайная величина.
В рамках данного курса мы ограничимся изучением двумерных дискретных случайных величин. Для изучения двумерных непрерывных случайных величин, а также случайных величин большей размерности следует
обратиться к литературе из библиографического списка.
Определение 8.1. Совокупность (X, Y ) двух случайных величин X
и Y называется двумерной случайной величиной или двумерным
случайным вектором.
1
Дуглас Н. А. Автостопом по Галактике. Кн. 5. В основном безвредна (см. [Электронный ресурс] : URL : http://royallib.com/read/adams_duglas/v_osnovnom_bezvredna.html#0(дата обращения: 12.06.2016)).
186
8.2
8.2.1
Дискретные двумерные случайные величины
Закон распределения дискретной двумерной случайной величины
Определение 8.2. Двумерная случайная величина (X, Y ) называется
дискретной двумерной случайной величиной, если случайные величины X и Y являются дискретными случайными величинами.
Предположим, что случайная величина X принимает значения x1 , x2 , x3 ,
а случайная величина Y − значения y1 , y2 . В этом случае двумерная случайная величина (X, Y ) принимает пары значений (xi , yj ), где i = 1, 2,
j = 1, 2, 3. Также, как и в одномерном случае, распределение двумерной
дискретной случайной величины естественно описывается с помощью таблицы:
X\Y
x1
x2
y1 y2 y3
p11 p12 p13
p21 p22 p23
Каждое из чисел pij определяет вероятность события, в котором случайные величины X и Y примут соответствующие значения:
pij = P (X = xi , Y = yj ).
Если мы сложим соответственно вероятности первой строки
p11 + p12 + p13 = p1x
и второй строки
p21 + p22 + p23 = p2x ,
то мы получим возможность составить закон распределения случайной величины X:
X x1 x2
pX p1x p2x
Аналогично мы можем составить закон распределения случайной величины X. Для этого нам нужно будет просуммировать соответствующие
столбцы таблицы двумерного распределения.
p11 + p21 = p1y , p12 + p22 = p2y , p13 + p23 = p3y .
В результате мы получим
Y
pY
y1 y2 y3
p1y p2y p3y
Естественно, каждая из таблиц описывает закон распределения соответствующей случайной величины при условии, что сумма вероятностей в
каждой из таблиц равна 1.
187
То есть
2 X
3
X
pij = (p11 +p12 +p13 )+(p21 +p22 +p23 ) = p1x +p2x =
i=1 j=1
3 X
2
X
2
X
pix = 1. (8.1)
i=1
pij = (p11 +p21 )+(p12 +p22 )+(p13 +p23 ) = p1y +p2y +p3y =
j=1 i=1
3
X
pjy = 1.
j=1
(8.2)
Достаточно часто все законы распределения как двумерной случайной
величины (X, Y ), так и её составляющих X и Y , объединяют в одной таблице, дополняя её нижней строкой Py и правым столбцом Px :
X\Y
x1
x2
Py
y1 y 2 y3 Px
p11 p12 p13 p1x
p21 p22 p23 p2x
p1y p2y p3y 1
Замечание 8.1. Заметим, что в общем случае закон распределения
двумерной случайной величины (X, Y ) изображается безразмерным, так
как каждая из её составляющих X и Y может принимать счётное число
значений:
X\Y
x1
x2
...
xi
...
Py
y1
p11
p21
...
pi1
...
p1y
y2
p12
p22
...
pi2
...
p2y
...
...
...
...
...
...
...
yj
p1j
p2j
...
pij
...
pjy
...
...
...
...
...
...
...
Px
p1x
p2x
...
pix
...
1
Единица в правой нижней клетке таблицы распределения подтверждает,
что
X
pij = 1.
i, j
Задача 8.1. Известен закон распределения двумерной случайной величины (X, Y )
X\Y
1
2
1
2
3
0, 2 0, 1 0, 1
0, 1 0, 3 0, 2
Требуется:
1. Построить законы распределения случайных величин X и Y .
188
2. Определить вероятность события X < Y .
3. Построить закон распределения случайной величины Z = X + Y .
Решение
1.1. Случайная величина X принимает два значения X = 1 и X = 2.
Первое значение она принимает в трёх случаях:
при Y = 1 с вероятностью 0, 2; при Y = 2 с вероятностью 0, 1 и при Y = 3
с вероятностью 0, 1.
Так как эти случаи несовместны, то
P (X = 1) = P (X = 1, Y = 1) + P (X = 1, Y = 2) + P (X = 1, Y = 3).
Следовательно, P (X = 1) = 0, 2 + 0, 1 + 0, 1 ⇒ P (X = 1) = 0, 4.
Аналогично
P (X = 2) = P (X = 2, Y = 1) + P (X = 2, Y = 2) + P (X = 2, Y = 3).
Поэтому P (X = 2) = 0, 1 + 0, 3 + 0, 2 ⇒ P (X = 2) = 0, 6.
Так как P (X = 1) + P (X = 2) = 1, то закон распределения случайной
величины X выглядит так:
X 1
2
p 0, 4 0, 6
1.2. Случайная величина Y принимает три значения Y = 1, Y = 2 и Y = 3.
Первое значение она принимает в двух случаях: при X = 1 с вероятностью
0, 2 и при X = 2 с вероятностью 0, 1.
Так как эти случаи несовместны, то
P (Y = 1) = P (X = 1, Y = 1) + P (X = 2, Y = 1).
Следовательно, P (Y = 1) = 0, 2 + 0, 1 ⇒ P (Y = 1) = 0, 3.
Аналогично
P (Y = 2) = P (X = 1, Y = 2) + P (X = 2, Y = 2).
P (Y = 3) = P (X = 1, Y = 3) + P (X = 2, Y = 3).
Выполнив вычисления, имеем:
P (Y = 2) = 0, 1 + 0, 3 ⇒ P (Y = 2) = 0, 4.
P (Y = 3) = 0, 1 + 0, 2 ⇒ P (Y = 3) = 0, 3.
Так как P (Y = 1) + P (Y = 2) + P (Y = 3) = 1, то закон распределения
случайной величины Y выглядит так:
Y
1
2
3
p 0, 3 0, 4 0, 3
2. Событие X < Y наступает в случае трёх несовместных исходов:
(X = 1, Y = 2) или (X = 1, Y = 3) или (X = 2, Y = 3).
Поэтому вероятность
P (X < Y ) = 0, 1 + 0, 1 + 0, 2 ⇒ P (X < Y ) = 0, 4.
3. Случайная величина Z = X + Y принимает значения 2, 3, 4 и 5.
189
При этом Z = 2, если X = 1 и Y = 1, с вероятностью P (X = 1, Y = 1) =
0, 2.
Z = 3 в двух несовместных случаях: (X = 1, Y = 2) и (X = 2, Y = 1).
Поэтому P (Z = 3) = 0, 1 + 0, 1 ⇒ P (Z = 3) = 0, 2.
Z = 4 также в двух несовместных случаях:
(X = 1, Y = 3) и (X = 2, Y = 2).
В силу этого, P (Z = 4) = 0, 1 + 0, 3 ⇒ P (Z = 4) = 0, 4.
И, наконец, Z = 5, если X = 2 и Y = 3, с вероятностью
P (X = 2, Y = 3) = 0, 2.
Так как сумма вычисленных вероятностей
P (Z = 2) + P (Z = 3) + P (Z = 4) + P (Z = 5) = 1,
то закон распределения случайной величины Z выглядит так:
Z 2
3
4
5
p 0, 2 0, 2 0, 4 0, 2
Задача 8.2. Из статистики рождаемости в США1 известно, что в 1901
году вероятность обнаружить пару однополых близнецов среди всех пар
родившихся близнецов составляла 69%. Вычислить вероятности всех вариантов рождения пар близнецов, если вероятность рождения мальчика
равна 0,52.
Решение
Пусть X − случайная величина, определяющая число мальчиков, родившихся первыми в паре, а Y − случайная величина, определяющая число
мальчиков, родившихся вторыми в паре. Каждая из случайных величин
принимает значение 0, если родилась девочка, и значение 1, если родился
мальчик.
Обозначим через
pij = P (X = i, Y = j), (i, j = 0, 1).
Построим предполагаемый закон распределения
X\Y
0
1
0
1
p00 p01
p10 p11
Так как рождение двух девочек в паре и рождение двух мальчиков
являются несовместными событиями, то согласно условию
p00 + p11 = 0, 69.
Это же касается и разнополых близнецов. Поэтому согласно условию
p00 + p10 = 0, 52.
1
См. Маккьюсик В. Генетика человека. Пер. с англ. М. : Мир, 1967. С. 119-120.
190
p00 + p01 = 0, 52.
C учётом того, что сумма всех вероятностей в таблице равна 1, имеем
следующую систему уравнений

p00 + p11 = 0, 69,



p00 + p10 = 0, 52,
p + p01 = 0, 52,


 00
p00 + p01 + p10 + p11 = 1.
Вычтем из четвёртого равенства первое и сложим равенство-разность со
вторым и третьим равенством. Из полученного равенства-суммы
2p00 + 2 · 0, 31 = 1, 35
находим p00 = 0, 36. Подставляя значение p00 в каждое из первых трёх
уравнений, имеем p11 = 0, 33; p01 = p10 = 0, 155.
Таким образом, получаем, что
вероятность рождения двух девочек-близнецов составляла 36%;
вероятность рождения двух мальчиков-близнецов − 33%;
вероятность рождения пары девочка-мальчик- − 15, 5%;
вероятность рождения пары мальчик-девочка − 15, 5%.
8.2.2
Функция распределения дискретной двумерной случайной величины
Точно также, как и в случае одномерных случайных величин, геометрическим изображением двумерных случайных величин является функция
распределения.
Определение 8.3. Функцией распределения двумерной случайной величины (X, Y ) называется функция от двух переменных, значения которой в каждой точке (x, y) равны вероятности совместного
выполнения двух неравенств X < x и Y < y.
То есть
∀(x, y) ∈ R2 F (x, y) = P (X < x, Y < y).
(8.3)
Задача 8.3. Закон распределения двумерной случайной величины
(X, Y ) задан следующей таблицей:
X\Y
0
1
−1
0
1
0, 2 0, 25 0, 05
0, 1 0, 3 0, 1
Определите функцию распределения FX, Y (x, y).
Решение. Для определения функции распределения FX, Y (x, y) разобъём оси Ox и Oy на интервалы, границы которых определяют возможные
значения случайных величин X и Y .
191
Такими интервалами для оси Ox будут
(−∞, 0], (0, 1], (1, ∞).
А для оси OY −
(−∞, −1], (−1, 0], (0, 1], (1, ∞).
Из закона распределения видно, что случайная точка (X, Y ) может попасть в область, где x ≤ 0 или y ≤ −1, с вероятностью 0.
Вероятность попадания (X, Y ) в прямоугольник, в котором
(0 < x ≤ 1, −1 < y ≤ 0)
складывается из суммы вероятностей попадания случайной точки в области, в которых (x ≤ 0, y ≤ −1) и вероятности события, в котором X = 0 и
Y = −1.
Вероятность попадания (X, Y ) в прямоугольник, в котором
(0 < x ≤ 1, 0 < y ≤ 1)
складывается из суммы вероятностей попадания случайной точки в области, в которых (x ≤ 0, y ≤ −1), (x ≤ 0, −1 < y ≤ 0) и вероятности
события, в котором X = 0 и Y = 0.
Вероятность попадания (X, Y ) в полуполосы (0 < x ≤ 1, y > 1) и
(x > 1, −1 < y ≤ 0) определяется соответственно суммами вероятностей
попадания в области, расположенные левее и ниже, и складывается из чисел
0, 2 + 0, 25 + 0, 05 = 0, 5 и 0, 2 + 0, 1 = 0, 3.
Вероятность попадания (X, Y ) в полуполосу (x > 1, 0 < y ≤ 1) определяется суммой четырёх слагаемых, расположенных в левом верхнем квадранте таблицы закона распределения
0, 2 + 0, 25 + 0, 1 + 0, 3 = 0, 85.
И, наконец, вероятность попадания (X, Y ) в область (x > 1, y > 1)
равна 1.
Таким образом, таблица для функции распределения FX, Y (x, y) имеет
следующий вид:
FX, Y (x, y) y ≤ −1 −1 < y ≤ 0 0 < y ≤ 1 y > 1
x≤0
0
0
0
0
0<x≤1
0
0, 2
0, 45
0, 5
x>1
0
0, 3
0, 85
1
С точки зрения геометрии функция распределения FX, Y (x, y) определяет вероятность попадания случайной точки (X, Y ) в бесконечный квадрант, правой верхней вершиной которого является точка (x, y) (рис. 8.1).
192
y
M (x, y)
y
x
x
Рис. 8.1
Задача 8.4. Пусть x1 , x2 и y1 − заданные числа. Зная функцию
FX, Y (x, y), вычислить вероятность попадания случайной точки (X, Y ) в
множество {(x, y) : x1 ≤ x < x2 ; y < y1 } и построить геометрическое
изображение.
Решение. Так как искомая вероятность
P (x1 ≤ X < x2 , Y < y1 ) = P (X < x2 , Y < y1 ) − P (X < x1 , Y < y1 ),
то согласно формуле (8.3)
P (x1 ≤ X < x2 , Y < y1 ) = FX, Y (x2 , y1 ) − FX, Y (x1 , y1 ).
Построим геометрическое изображение. Изображением вероятности
P (X < x2 , Y < y1 ) в точке (x2 , y1 ) является серый квадрант (рис.8.2).
y
M (x2 , y1 )
y1
x
x2
Рис. 8.2
А изображением вычитаемой вероятности является чёрный квадрант (рис.
8.3).
y
y1
N (x1 , y1 )
x
x1
Рис. 8.3
Накладывая второй квадрант на первый, в качестве геометрического решения задачи, получаем вертикальную серую полосу (рис. 8.4).
y
y1
N (x1 , y1 ) M (x2 , y1 )
x2
Рис. 8.4
x
Таким образом, вероятность попадания случайной точки (X, Y ) в вертикальную полуполосу {(x, y) : x1 ≤ x < x2 ; y < y1 } равна вычисленной
193
выше разности значений функции распределения.
Задача 8.5. Пусть x1 , y1 и y2 − заданные числа. Зная функцию
FX, Y (x, y), вычислить вероятность попадания случайной точки (X, Y ) в
множество {(x, y) : x < x1 ; y1 ≤ y < y2 } и построить геометрическое изображение.
Решение. Очевидно, что данная задача решается по образцу предыдущей задачи.
P (X < x1 , y1 ≤ Y < y2 ) = FX, Y (x1 y2 ) − FX, Y (x1 , y1 ).
А геометрическим образом решения является горизонтальная серая полуполоса (рис. 8.5).
y
M (x , y )
y2
1
2
N (x1 , y1 )
x1
Рис. 8.5
x
Задача 8.6. Пусть x1 , x2 , y1 и y2 − заданные числа. Зная функцию
FX, Y (x, y), вычислить вероятность попадания случайной точки (X, Y ) в
множество {(x, y) : x1 ≤ x < x2 ; y1 ≤ y < y2 } и построить геометрическое
изображение.
Решение. По аналогии с решением задач 8.4 и 8.5 имеем
P (x1 ≤ X < x2 , y1 ≤ Y < y2 ) =
= (FX, Y (x2 , y2 ) − FX, Y (x1 , y2 )) + (FX, Y (x2 , y1 ) − FX, Y (x1 , y1 )).
Достаточно очевидно, что представленная сумма разностей значений
функции распределения определяет чёрный прямоугольник, образованный
пересечением серых вертикальной и горизонтальной полуполос (рис. 8.6).
y
y2
x2
Рис. 8.6
x
Задача 8.7. Подбрасываются две монеты. Пусть случайная величина
X определяет число выпадений «герба» при подбрасывании первой монеты, а случайная величина Y − число выпадений «герба» при подбрасывании второй монеты.
Требуется:
1. Построить закон двумерного распределения X, Y .
2. Определить функцию распределения FX, Y (x, y).
3. Построить её схематическое изображение в трёхмерной системе коорди194
нат.
Решение. Каждая из случайных величин принимает значение 0 при
выпадении «решётки» и 1 при выпадении «герба».
Пространство Ω элементарных событий данного опыта состоит из четырёх исходов
Ω = {( РР), ( РГ), ( ГР), ( ГГ)}.
Следовательно, двумерная случайная величина X, Y принимает четыре
значения
{(0, 0), (0, 1), (1, 0), (1, 1)}.
Так как подбрасывание одной монеты не зависит от подбрасывания другой монеты, то согласно теореме о произведении независимых событий
1 1 1
P (X = i, Y = j) = P (X = i) · P (Y = j) = · = .
2 2 4
Поэтому закон распределения случайной величины X, Y имеет следующий вид:
X\Y
0
1
0
1
4
1
4
1
1
4
1
4
Для построения функции распределения FX, Y (x, y) разобъём оси Ox и
Oy на интервалы, границы которых определяют возможные значения случайных величин X и Y .
Такими интервалами для каждой из осей будут
(−∞, 0]), (0, 1], (1, ∞).
Из закона распределения видно, что случайная точка (X, Y ) может попасть в область где x ≤ 0 или y ≤ 0 с вероятностью 0.
Вероятность попадания (X, Y ) в прямоугольник, в котором
(0 < x ≤ 1, 0 < y ≤ 1)
складывается из суммы вероятностей попадания случайной точки в области, в которых (x ≤ 1, y ≤ 1), и вероятности события, в котором X = 0 и
Y = 0.
Вероятность попадания (X, Y ) в полуполосы (0 < x ≤ 1, y > 1) и
(x > 1, 0 < y ≤ 1) определяется суммами вероятностей попадания в области, расположенные левее и ниже, и складывается из чисел
1 1 1
0+ + = .
4 4 2
И, наконец, вероятность попадания (X, Y ) в область (x > 1, y > 1)
равна 1.
195
Следовательно, таблица для функции распределения FX, Y (x, y) выглядит следующим образом:
FX, Y (x, y) y ≤ 0 0 < y ≤ 1 y > 1
x≤0
0
0
0
1
1
0<x≤1
0
4
2
1
x>1
0
1
2
Перенося значения таблицы в трёхмерную систему координат, получаем
схематическое изображение функции FX, Y (x, y) распределения двумерной
случайной величины (рис. 8.7).
F (x, y)
y
1
1
2
1
4
1
x
1
Рис. 8.7
В качестве обобщения рассмотрим свойства функции распределения
дискретной двумерной случайной величины.
Свойство 8.1. ∀ x, y ) ≤ FX, Y (x, y) ≤ 1.
Истинность этого свойства вытекает из определения 8.3 функции распределения.
Свойство 8.2. Функция FX, Y (x, y) является монотонно неубывающей
функцией по каждому аргументу.
То есть
∀ y, x1 , x2 : x1 < x2 ⇒ FX, Y (x1 , y) ≤ FX, Y (x2 , y).
(8.4)
∀ x, y1 , y2 : y1 < y2 ⇒ FX, Y (x, y1 ) ≤ FX, Y (x, y2 ).
(8.5)
Докажем утверждение (8.4). Предположим, что x1 < x2 . Согласно данному предположению и равенству (8.3) имеем
FX, Y (x1 , y) = P (X < x1 , y) ≤ P (X < x1 , y) + P (x1 ≤ X < x2 , y) =
= P (X < x2 , y) = FX, Y (x2 , y).
Утверждение (8.5) доказывается аналогично.
Свойство 8.3. ∀ x, y FX, Y (−∞, y) = 0; FX, Y (x, −∞) = 0.
196
Так как каждое из событий X < x < −∞ и Y < y < −∞ невозможно,
то
FX, Y (−∞, y) = P (X < x, Y < y) = 0;
FX, Y (x, −∞) = P (X < x, Y < y) = 0.
Свойство 8.4. Пусть F1 (x) = P (X < x), а F2 (y) = P (Y < y).
Тогда справедливы следующие равенства
∀ x lim FX, Y (x, y) = F1 (x);
y→+∞
∀ y lim FX, Y (x, y) = F2 (y).
x→+∞
Рассмотрим первое из равенств. Так как событие Y < +∞ является
достоверным событием, то
∀ x lim FX, Y (x, y) = P (X < x) = F1 (x).
y→+∞
Аналогично доказывается второе равенство.
Из этих равенств вытекает очевидное
Следствие 8.1. FX, Y (+∞, +∞) = 1.
Задача 8.8. Задана функция распределения FX, Y (x, y) двумерной случайной величины (X, Y ).
FX, Y (x, y) y ≤ 0 0 < y ≤ 1 1 < y ≤ 2 y > 2
x≤1
0
0
0
0
1<x≤2
0
0, 1
0, 15
0, 25
2<x≤3
0
0, 15
0, 3
0, 55
3<x≤4
0
0, 2
0, 4
0, 7
x>4
0
0, 2
0, 6
1
1. Определите функции распределения FX (x) и FY (y) одномерных составляющих заданной двумерной случайной величины.
2. Постройте законы распределения X и Y .
Решение 1. Согласно свойству 8.4
∀ x lim FX, Y (x, y) = FX (x);
y→+∞
∀ y lim FX, Y (x, y) = FY (y).
x→+∞
Поэтому последний столбец заданной таблицы и последняя её строка определяют соответственно функции распределения FX (x) и FY (y) одномерных
составляющихзаданной двумерной случайной величины.

0, если x ≤ 1,


0, если y ≤ 0,




 0, 25 если 1 < x ≤ 2,

0, 2 если 0 < y ≤ 1,
FX (x) =
0, 55 если 2 < x ≤ 3, FY (y) =
0, 6 если 1 < y ≤ 2,





0, 7 если 3 < x ≤ 4,



1 если y > 2.
1 если x > 4,
2. Из построенных функций распределения FX (x) и FY (y) видно, что пер197
вая из функций имеет неустранимые разрывы первого рода в точках x = 1;
x = 2; x = 3 и x = 4, а вторая − в точках y = 0; y = 1; y = 2.
Поэтому соответствующие законы распределения X и Y будут иметь
следующий вид:
X
1
2
3
4
px 0, 25 0, 3 0, 15 0, 3
8.3
Y
0
1
2
py 0, 2 0, 4 0, 4
Понятие независимости случайных величин
Из определения 8.2 cледует, что, зная закон распределения двумерной
случайной величины (X, Y ), можно найти законы распределения её компонент X и Y .
А можно ли сделать наоборот: зная законы распределения случайных
величин X и Y , найти закон распределения системы случайных величин
(X, Y )?
Рассмотрим следующий пример.
Дискретные случайные величины X и Y заданы следующим образом:
X −1 1
p 0, 6 0, 4
Y −1 1
p 0, 6 0, 4
Составим два закона распределения двумерных случайных величин
(X1 , Y1 ) и (X2 , Y2 ):
X1 \Y1 −1 1 Px
−1
0, 6 0 0, 6
1
0 0, 4 0, 4
Py
0, 6 0, 4 1
X2 \Y2
−1
1
Py
−1 1 Px
0, 3 0, 3 0, 6
0, 3 0, 1 0, 4
0, 6 0, 4 1
Распределения соответствующих случайных координат в данных двумерных распределениях совпадают. Но сами двумерные величины (X1 , Y1 )
и (X2 , Y2 ) отличны друга от друга, так как вероятности pij для одного закона распределения отличаются от соответствующих pij для другого закона
распределения.
Следовательно, ответ на поставленный вопрос отрицательный: Знание
законов распределения случайных величин X и Y , являющихся координатами двумерной системы случайных величин (X, Y ) в общем случае не
позволяет определить закон распределения двумерной величины.
Тем не менее существует частный случай, позволяющий при знании
законов распределения случайных компонент определить закон распреде-
198
ления всей системы. Случай этот связан с понятием независимости случайных величин.
Определение 8.4. Две случайные величины X и Y называются независимыми, если независимы все связанные с ними события, такие как:
X < x; Y < y; X = xi ; Y = yj (и подобные им).
Отношение независимости случайных величин является отношением
симметричности, поэтому если случайная величина X не зависит от случайной величины Y , то и случайная величина Y не зависит от X.
Так как каждая дискретная случайная величина определяется своим законом распределения, то сформулируем эквивалентное определение независимости случайных величин.
Определение 8.5. Две случайные величины X и Y называются независимыми, если закон распределения каждой из них не зависит от того, какие возможные значения принимает другая величина.
Сформулируем теорему.
Теорема 8.1. Критерий независимости случайных величин
Случайные величины X и Y являются независимыми тогда и только тогда, когда функция распределения двумерной случайной величины
(X, Y ) равна произведению функций распределения её составляющих:
FX, Y (x, y) = FX (x) · FY (y).
(8.6)
Д о к а з а т е л ь с т в о. Предположим, что случайные величины
X и Y являются независимыми. Тогда связанные с ними события X < x
и Y < y также являются независимыми. Поэтому, опираясь на теорему о
произведении вероятностей независимых событий, имеем:
FX, Y (x, y) = P (X < x, Y < y) = P (X < x) · P (Y < y) = FX (x) · FY (y).
Развернув полученное равенство в противоположную сторону, получим
доказательство достаточного условия теоремы:
FX, Y (x, y) = FX (x) · FY (y) = P (X < x) · P (Y < y) = P (X < x, Y < y).
То есть вероятность одновременного наступления событий X < x и Y <
y равна произведению вероятностей этих событий.
Для дискретных случайных величин из теоремы 8.1 вытекает следующее
практическое
Следствие 8.2. В случае независимости случайных компонент X и
Y двумерной дискретной случайной величины (X, Y ) каждый элемент
pij матрицы её распределения равен произведению вероятностей pix и pjy
соответствующих событий X = xi и Y = yj .
То есть
pij = P (X = xi , Y = yj ) = P (X = xi ) · P (Y = yj ) = pix pjy .
Задача 8.9. Двумерная случайная величина (X, Y ) задана своим за199
коном распределения
X\Y
1
2
−1
0
1
0, 18 0, 12 0, 3
0, 12 0, 08 0, 2
Определите, зависимы или независимы случайные величины X и Y .
Решение. Дополним заданную таблицу распределениями случайных
величин X и Y .
Для этого, сложив вероятности в каждой из двух строк
0, 18 + 0, 12 + 0, 3 = 0, 6;
0, 12 + 0, 08 + 0, 2 = 0, 4,
построим правый дополнительный столбец вероятностей, соответствующих
значениям случайной величины X:
X\Y
1
2
−1
0
1 Px
0, 18 0, 12 0, 3 0, 6
0, 12 0, 08 0, 2 0, 4
Аналогично, сложив соответствующие вероятности в каждом из трёх столбцов заданной таблицы
0, 18 + 0, 12 = 0, 3;
0, 12 + 0, 08 = 0, 2;
0, 3 + 0, 2 = 0, 5,
построим нижнюю дополнительную строку вероятностей, соответствующих значениям случайной величины Y :
X\Y
1
2
Py
−1
0
1 Px
0, 18 0, 12 0, 3 0, 6
0, 12 0, 08 0, 2 0, 4
0, 3 0, 2 0, 5 1
Далее, опираясь на следствие 8.2, умножая поочередно вероятности pix
на вероятности pjy , проверим совпадают ли все полученные произведения
с соответствующими вероятностями pij заданной таблицы распределения.
0, 6 · 0, 3 = 0, 18; 0, 6 · 0, 2 = 0, 12; 0, 6 · 0, 5 = 0, 3;
0, 4 · 0, 3 = 0, 12; 0, 4 · 0, 2 = 0, 08; 0, 4 · 0, 5 = 0, 2.
Так как все найденные произведения совпадают с соответствующими элементами заданной таблицы, то можно утверждать, что
Случайные величины X и Y являются независимыми .
Рассматривая ранее свойства математического ожидания дискретных
200
случайных величин, мы пропустили одно важное свойство, которое сформулируем в виде теоремы1 .
Теорема 8.2. Математическое ожидание произведения двух независимых дискретных случайных величин равно произведению математических ожиданий этих величин.
То есть, если X и Y − независимые дискретные случайные величины, то
M (X · Y ) = M (X) · M (Y ).
(8.7)
Д о к а з а т е л ь с т в о. Предположим, что случайная величина X
принимает значения xi с вероятностью pi каждое, а случайная величина Y
принимает значения yj с вероятностью2 pj .
Так как X и Y − независимые случайные величины, то
P (X = xi , Y = yj ) = P (X = xi ) · P (X = yj ).
Учитывая это, имеем
n X
m
X
M (X · Y ) =
xi yj P (X = xi , Y = yj ) =
=
n
X
i=1
!i=1
xi P (X = xi )
·
j=1
m
X
!
yj P (Y = yj )
= M (X) · M (Y ).
j=1
В качестве иллюстрации теоремы 8.2 рассмотрим два примера.
Пример 1. Монета подбрасывается дважды. Случайная величина X −
число выпадений «герба» при первом подбрасывании монеты, а случайная
величина Y − число выпадений «герба» при втором подбрасывании. Каждая из случайных величин принимает два значения: 0 и 1 с одной и той же
1
вероятностью p = . Поэтому
2
1
M (X) = M (Y ) = .
2
Очевидно, что X и Y не зависят друг от друга. Поэтому согласно теореме 8.2
1
1 1
M (XY ) = M (X)M (Y ) ⇒ M (XY ) = · ⇒ M (XY ) = .
2 2
4
Замечание 8.2. Математическое ожидание произведения XY можно
установить непосредственно, вычислив его по определению.
Так как случайная величина XY принимает значение 1, если «герб»
выпал при каждом подбрасывании, и значение 0 − в остальных случаях,
то её закон распределения имеет следующий вид:
1
Рассматриваемое свойство имеет место и для непрерывных случайных величин, но его доказательство следует искать в произведениях библиографического списка литературы.
2
Здесь i = 1, . . . , n; j = 1, . . . , m (мы не рассматриваем случай счетного набора значений случайных
величин, так как в этом случае пришлось бы обращаться к свойствам сходимости числовых рядов, что
удлиняет доказательство, но не влияет на результат.).
201
XY
p
0 1
3 1
4 4
Поэтому
3
1
1
M (XY ) = 0 · + 1 · ⇒ M (XY ) = .
4
4
4
Пример 2. Монета подбрасывается один раз. Случайная величина X
− число выпадений «герба» при подбрасывании монеты − принимает значения 1, если выпал «герб», и 0, если выпала «решётка», с одной и той же
1
вероятностью p = .
2
Случайную величину Y определим так: Y = 1−X. При таком определе1
нии Y также принимает значения 0 и 1 с постоянной вероятностью p = .
2
Поэтому, как и в первом примере
1
M (X) = M (Y ) = .
2
Случайная величина XY по определению может принимать только одно
значение 0, а значит,
1 1
M (XY ) = 0 6= M (X) · M (Y ) = · .
2 2
Таким образом, можно сделать формальный вывод о том, что X и Y −
зависимые случайные величины.
8.4
Условное распределение вероятностей
Одной из задач применения теории вероятностей к задачам практики
является изучение прогноза возможного значения случайной величины Y
по выводам наблюдений над другой случайной величиной X. Прогноз в
этих случаях определяется не по результатам данного момента исследования, а по глобальным данным, которые представляет информационный
центр1 . Примерами таких прогнозов могут быть метеопрогнозы, прогнозы
стоимости ценных бумаг, влияние результатов погрешности измерений на
результаты расчётов и так далее.
Во всех подобных случаях прогноз имеет вероятностный характер, поскольку связан с вопросами вида: при наблюдении значения x случайной
величины X какова вероятность того, что случайная величина Y будет
лежать в определённых границах, или чему равно среднее значение Y (и
тому подобными вопросами).
Решение этой задачи связано с условным законом распределения одной
1
В частности, такими центрами могут быть метеоцентры, финансовые биржи, центры технической
и научной информации.
202
из случайных величин.
Определение 8.6. Условным законом распределения одной из
случайных величин системы (X, Y ) называется её закон распределения,
вычисленный при условии, что другая случайная величина приняла определённое значение (или попала в некоторый интервал).
В случае системы двух дискретных случайных величин можно вычислить условные законы распределения c помощью условных вероятностей,
определяющих вероятность того, что случайная величина X примет значение xi при условии, что случайная величина Y примет значение yj (или,
наоборот, случайная величина Y примет значение yj при условии, что случайная величина X примет значение xi ).
Ранее, при изучении алгебры событий мы определили условную вероятность события B при условии, что событие A произошло:
PB (A) =
P (AB)
.
P (A)
(8.8)
Предположим, что двумерная случайная величина (X, Y ) имеет следующий закон распределения:
X\Y
x1
x2
y1 y2 y3
p11 p12 p13
p21 p22 p23
С помощью формулы (8.8) определим условную вероятность того, что
случайная величина Y примет значение yj при условии, что X = xi :
Pyj |xi =
p(X = xi , Y = yj )
p(X = xi )
(8.9)
и условную вероятность того, что случайная величина X примет значение
xi при условии, что Y = yj :
Pxi |yj =
p(X = xi , Y = yj )
p(Y = yj )
.
(8.10)
(В каждой из формул1 (8.9) и (8.10) i = 1, 2; j = 1, 2, 3)
Условные вероятности (8.9) образуют условные законы распределения
случайной величины Y при условии X = xi . То, что это действительно
закон распределения, подтверждает сумма вероятностей, соответствующих
1
Разумеется, аналогично замечанию 8.1 можно рассматривать общий случай, когда
i = 1, 2, . . . , n, . . . , а j = 1, 2, . . . , m, . . . .
203
значениям Y при условии X = xi . С учётом равенства (8.1) имеем1
3
3
X
X
p(X = xi , Y = yj )
Pyj |xi =
=
p(X
=
x
)
i
j=1
j=1
3
1 X
1
=
p(X = xi , Y = yj ) =
· pix = 1.
pix j=1
pix
Аналогично
2
X
Pxi |yj = 1.
i=1
Задача 8.10. Закон распределения двумерной случайной величины
(X, Y ) задан следующей таблицей:
X\Y
0
1
2
−1
0
0, 3 0, 1
0, 15 0, 3
0, 1 0, 05
1.
2.
3.
4.
Определите PY =0|X=1 .
Определите PX=1|Y =−1 .
Определите PY =−1|X≤1 .
Постройте условный закон распределения случайной величины Y
при условии X = 1.
5. Постройте условный закон распределения случайной величины X
при условии Y = 0.
Решение
p(X = 1, Y = 0)
1. Согласно формуле (8.9) PY =0|X=1 =
.
p(X = 1)
Вычислим знаменатель
p(X = 1) = p(X = 1, Y = −1) + p(X = 1, Y = 0) ⇒
⇒ p(X = 1) = 0, 15 + 0, 3 ⇒ p(X = 1) = 0, 45.
Так как
p(X = 1, Y = 0) = 0, 3,
то искомая условная вероятность
0, 3
2
PY =0|X=1 =
⇒ PY =0|X=1 = .
0, 45
3
p(X = 1, Y = −1)
2. Аналогично, но согласно формуле (8.10) PX=1|Y =0 =
.
p(Y = −1)
Знаменатель дроби
p(Y = −1) = p(X = 0, Y = −1)+p(X = 1, Y = −1)+p(X = 2, Y = −1) ⇒
1
Учитывая замечание 8.1 (то есть случай бесконечного числа значений, принимаемых случайными величинами), суммы конечного числа слагаемых вероятностей превратятся в бесконечные ряды,
каждый из которых будет сходиться к единице.
204
⇒ p(Y = −1) = 0, 3 + 0, 15 + 0, 1 ⇒ p(Y = −1) = 0, 55.
Учитывая, что
p(X = 1, Y = −1) = 0, 15,
получаем искомую условную вероятность
0, 15
3
PX=1|Y =−1 =
⇒ PX=1|Y =−1 = .
0, 55
11
3. Согласно формуле (8.9) условная вероятность
p(X ≤ 1|Y = −1)
PY =−1|X≤1 =
.
p(X ≤ 1)
Вычислим знаменатель дроби. Так как X ≤ 1 в двух несовместных случаях: X = 0 и X = 1, то
p(X ≤ 1) = p(X = 0) + p(X = 1).
Определим первое слагаемое
p(X = 0) = p(X = 0, Y = −1) + p(X = 0, Y = 0) ⇒
⇒ p(X = 0) = 0, 3 + 0, 1 ⇒ p(X = 0) = 0, 4.
Из первого пункта решения известно, что p(X = 1) = 0, 45.
Следовательно,
p(X ≤ 1) = 0, 4 + 0, 45 ⇒ p(X ≤ 1) = 0, 85.
Далее вычислим
p(X ≤ 1|Y = −1) = p(X = 0|Y = −1) + P (X = 1|Y = −1).
Из условия задачи
p(X ≤ 1|Y = −1) = 0, 3 + 0, 15 ⇒ p(X ≤ 1|Y = −1) = 0, 45.
Выполнив деление, получаем искомую условную вероятность
9
0, 45
⇒ PY =−1|X≤1 = .
PY =−1|X≤1 =
0, 85
17
2
4. Из первого пункта решения PY =0|X=1 = .
3
Чтобы построить условный закон распределения случайной величины Y
при условии X = 1, нужно вычислить условную вероятность PY =−1|X=1 .
Из условия задачи PX=1|Y =−1 = 0, 15.
Поэтому, подставив в формулу (8.9) это число и знаменатель из первого
пункта решения, получаем
0, 15
1
PY =−1|X=1 =
⇒ PY =−1|X=1 = .
0, 45
3
2 1
Так как + = 1, то искомый условный закон распределения имеет
3 3
следующий вид:
Y |X = 1 −1 0
1 2
P
3 3
205
5. Чтобы построить условный закон распределения случайной величины X
при условии Y = 0, воспользуемся формулой (8.10).
Сначала вычислим вероятность
p(Y = 0) = p(X = 0, Y = 0) + p(X = 1, Y = 0) + p(X = 2, Y = 0).
Подставляя значения из заданной таблицы, имеем
p(Y = 0) = 0, 1 + 0, 3 + 0, 05 ⇒ p(Y = 0) = 0, 45.
Далее вычислим соответствующие условные вероятности:
0, 1
2
PX=0|Y =0 =
⇒ PX=0|Y =0 = .
0, 45
9
0, 3
2
PX=1|Y =0 =
⇒ PX=1|Y =0 = .
0, 45
3
0, 05
1
⇒ PX=2|Y =0 = .
PX=2|Y =0 =
0, 45
9
2 2 1
Так как + + = 1, то искомый условный закон распределения имеет
9 3 9
следующий вид:
X|Y = 0 0 1 2
2 2 1
P
9 3 9
8.5
Условное математическое ожидание
Как в случае распределения вероятностей случайной величины, так и
в случае условного распределения вероятностей важной характеристикой
соответствующего закона распределения является математическое ожидание, которое в данном случае является условным математическим ожиданием. Сформулируем два аналогичных определения.
Определение 8.7. Условным математическим ожиданием дискретной случайной величины Y при X = x называется скалярное произведение значений случайной величины Y на их условные вероятности1 :
m
X
M (Y |X = x) =
yj Pyj |x .
(8.11)
j=1
Определение 8.8. Условным математическим ожиданием дискретной случайной величины X при Y = y называется скалярное произведение значений случайной величины X на их условные вероятности2 :
n
X
M (X|Y = y) =
yj Pxi |y .
(8.12)
i=1
1
2
Здесь x − определённое возможное значение X.
Здесь y − определённое возможное значение Y .
206
В качестве примеров вычислим условные математические ожидания
для соответствующих условных законов распределения, построенных при
решении задачи 8.10.
Задача 8.11. Дан условный закон распределения случайной величины
Y при X = 1
Y |X = 1 −1 0
1 2
P
3 3
. Вычислить условное математическое ожидание случайной величины Y
при X = 1.
Решение. Согласно формуле (8.11) вычислим условное математическое
ожидание
1
2
1
M (Y |X = 1) = −1 · + 0 · ⇒ M (Y |X = 1) = − .
3
3
3
1
M (Y |X = 1) = − .
3
Задача 8.12. Дан условный закон распределения случайной величины
X при Y = 0
X|Y = 0 0 1 2
2 2 1
P
9 3 9
вычислить условное математическое ожидание случайной величины X при
Y = 0.
Решение. Согласно формуле (8.12) вычислим условное математическое
ожидание
2
2
1
8
M (X|Y = 0) = 0 · + 1 · + 2 · ⇒ M (X|Y = 0) = .
9
3
9
9
8
M (X|Y = 0) = .
9
8.6
Функции, уравнения и линии регрессии
Одной из характеристик изучения системы случайных величин (X, Y )
являются функции регрессии.
Определение 8.9. Отображение ϕ, при котором каждому значению
x случайной величины X ставится в соответствие условное математическое ожидание M (Y |X = x), называется функцией регрессии Y на
X и обозначается
M (Y |X = x) = ϕ(x).
(8.13)
207
Определение 8.10. Отображение ψ, при котором каждому значению y случайной величины Y ставится в соответствие условное математическое ожидание M (X|Y = y), называется функцией регрессии
X на Y и обозначается
M (X|Y = y) = ψ(y).
(8.14)
Определение 8.11. Уравнение y = ϕ(x) называется уравнением
регрессии Y на X, а уравнение x = ψ(y) называется уравнением регрессии X на Y .
Определение 8.12. Линия на плоскости, соответствующая уравнению регрессии, называется линией регрессии.
Линия регрессии Y на X показывает1 , как в среднем зависит Y от X.
Рассмотрим два противоположных случая зависимости случайных величин X и Y .
Пример 1. Предположим, что X и Y − независимые случайные величины, имеющие соответственно математические ожидания M (X) = a и
M (Y ) = b.
В силу определений 8.9-8.11 функции регрессии Y на X и X на Y в силу
равенств M (Y |X = x) = M (Y ) и M (X|Y = y) = M (X) примут соответственно вид M (Y ) = ϕ(x) и M (X) = ψ(y). Поэтому в силу предположения
соответствующие уравнения регрессии будут выглядеть так: ϕ(x) = b и
ψ(y) = a.
В силу этого соответствующие линии регрессии Y на X и X на Y на
координатной плоскости будут представлены перпендикулярными прямыми (рис. 8.8).
y
b
Рис. 8.8
0
a
x
Пример 2. Предположим, что X и Y связаны линейной зависимостью2
Y = aX + b.
Так как математическое ожидание от постоянной есть сама постоянная,
то
M (ax + b) = ax + b.
Поэтому M (Y |X = x) = ax + b. Следовательно, функция регрессии Y на
X примет вид
1
2
Естественно, линия регрессии X на Y показывает, как в среднем зависит X от Y .
Здесь a 6= 0.
208
ϕ(x) = ax + b.
Из уравнения линейной зависимости следует, что
b
Y
X= − .
a
a
В силу этого
Y
b
b
Y
M
−
= − .
a
a
a
a
Следовательно,
y b
M (X|Y = Y ) = − .
a a
Таким образом, функция регрессии X на Y имеет вид
y b
ψ(y) = − .
a a
А значит уравнение регрессии X на Y представимо в виде
y b
x= − .
a a
Выражая и из него y через x, получаем уравнение регрессии Y на X:
y = ax + b.
В результате можно сделать вывод о том, что в случае линейной зависимости случайных величин X и Y линии регрессии Y на X и X на Y
являются одной и той же прямой на координатной плоскости.
Задача 8.13. Для системы случайных величин (X, Y ), заданной в задаче 8.10, построить функции регрессии Y на X и X на Y .
Решение
1. Случайная величина X принимает значения x = 0, 1, 2. Из решения
1
задачи 8.11 известно, что M (Y |X = 1) = − .
3
Вычислим M (Y |X = 0). Для этого определим сначала
p(X = 0) = p(X = 0, Y = −1) + p(X = 0, Y = 0) ⇒
⇒ p(X = 0) = 0, 3 + 0, 1 ⇒ p(X = 0) = 0, 4.
Используя формулу (8.9), вычислим условные вероятности
0, 3
3
PY =−1|X=0 =
⇒ PY =−1|X=0 = .
0, 4
4
0, 1
1
PY =0|X=0 =
⇒ PY =0|X=0 = .
0, 4
4
С помощью формулы (8.11) найдём условное математическое ожидание
3
1
3
M (Y |X = 0) = −1 · + 0 · ⇒ M (Y |X = 0) = − .
4
4
4
Далее аналогично вычислим M (Y |X = 2).
p(X = 2) = p(X = 2, Y = −1) + p(X = 2, Y = 0) ⇒
⇒ p(X = 2) = 0, 1 + 0, 05 ⇒ p(X = 2) = 0, 15.
209
Используя формулу (8.9), вычислим условные вероятности
0, 1
2
PY =−1|X=2 =
⇒ PY =−1|X=2 = .
0, 15
3
1
0, 05
⇒ PY =0|X=2 = .
PY =0|X=2 =
0, 15
3
С помощью формулы (8.11) найдём условное математическое ожидание
2
1
2
M (Y |X = 2) = −1 · + 0 · ⇒ M (Y |X = 2) = − .
3
3
3
Зная все условные математические ожидания, составим таблично заданную функцию регрессии Y на X
X
0
1
2
1
3
2
M (Y |X = x) − − −
3
4
3
Имея данную таблицу, построим схематически линию регрессии Y на x
(рис. 8.9).
M (Y |X = x)
0
Рис. 8.9
1
− 13
− 23
− 34
2
x
2. Случайная величина Y принимает значения y = −1, 0. Из решения за8
дачи 8.12 известно, что M (X|Y = 0) = .
9
Вычислим M (X|Y = −1). Для этого определим сначала
p(Y = −1) = p(X = 0, Y = −1)+p(X = 1, Y = −1)+p(X = 2, Y = −1) ⇒
⇒ p(Y = −1) = 0, 3 + 0, 15 + 0, 1 ⇒ p(Y = −1) = 0, 55.
Используя формулу (8.10), вычислим условные вероятности
0, 3
6
PX=0|Y =−1 =
⇒ PX=0|Y =−1 = .
0, 55
11
0, 15
3
⇒ PX=1|Y =−1 = .
PX=1|Y =−1 =
0, 55
11
0, 1
2
PX=2|Y =−1 =
⇒ PX=2|Y =−1 = .
0, 55
11
С помощью формулы (8.12) найдём условное математическое ожидание
6
3
2
7
M (X|Y = −1) = 0 ·
+1·
+2·
⇒ M (X|Y = −1) = .
11
11
11
11
Зная все условные математические ожидания, составим таблично заданную функцию регрессии X на Y
210
−1 0
7 8
M (X|Y = y)
11 9
Y
Имея данную таблицу, построим схематически линию регрессии X на y
(рис. 8.10).
M (X|Y = y)
8
9
7
11
−1
0
y
Рис. 8.10
8.7
Общая характеристика зависимости случайных величин
Допустим, что изучаемый объект имеет два параметра X и Y , между
которыми существует некоторая связь. Как правило целью изучения объекта является исследование характера этой связи.
В детерминированном мире математического анализа при исследовании любого объекта предполагается однозначная взаимосвязь1 причины
X и следствия Y , исследуемая с помощью функциональной зависимости,
при которой каждому значению параметра X ставится в соответствие
единственное значение параметра Y .
В теории вероятностей связь между случайными величинами X и Y
определяется более общим видом зависимости − вероятностной или стохастической зависимостью, которая имеет множество оттенков от «слабой» вероятностной зависимости до «сильной» вероятностной зависимости.
Так если допустить, что на случайные величины X и Y влияют одни те
же случайные факторы, например T1 и T2 , то X и Y окажутся в функциональной зависимости, которая определит «сильную» вероятностную зависимость.
Примером такой зависимости может служить связь между случайной
величиной X − числом найденных опечаток в собственной работе и случайной величиной Y − временем, потраченным на их устранение. Очевидно,
что связь2 эта прямо пропорциональная вида Y = aX.
С другой стороны, в случае полной независимости случайных величин
мы сталкиваемся с противоположным полюсом спектра вероятностной за1
Так, например, любое начальное состояние системы X(0) однозначно определяет состояние системы X(t) в любой другой момент времени t.
2
В качестве общих факторов, влияющих на величины, можно рассматривать, например, фактор
важности работы; освещенность помещения; время, оставшееся до момента сдачи статьи рецензенту и
другие подобные причины.
211
висимости1 .
В качестве примера такой независимости можно привести поговорку,
которую обычно цитируют при ответе невпопад: в огороде бузина, а в Киеве дядька2 .
Между этими полюсами мира случайных связей лежит весь спектр характеристик вероятностной зависимости.
Например, предположим, что на случайную величину X влияют случайные факторы T1 и T2 , а на случайную величину Y помимо T1 и T2
оказывает влияние третий случайный фактор T3 . Тогда в силу влияния
общих факторов значения X и Y в каждом исходе опыта конечно будут
взаимосвязаны между собой, но при этом связь эта уже не будет функциональной. Она будет иметь вероятностный случайный характер, изменяясь
от одного исхода к другому. При этом может оказаться, что каждому значению случайной величины X будут соответствовать множество значений
случайной величины Y .
Сформулируем следующее
Определение 8.13. Отображение, при котором каждому значению
одной случайной величины соответствует множество значений другой
случайной величины, для каждого из которых неизвестно, какое же из
этих значений примет случайная величина, называется вероятностной или стохастической зависимостью.
Иными словами, зависимость, при которой изменение значений одной
случайной величины ведёт к изменению закона распределения другой случайной величины, является вероятностной или стохастической зависимостью.
Поскольку исследование подобной зависимости представляет значительные сложности, то на практике рассматривают частный случай этой
зависимости.
Определение 8.14. Отображение, при котором каждому значению
одной случайной величины соответствует среднее значение другой случайной величины называется корреляционной зависимостью.
Примером корреляционной зависимости является связь между случайной величиной X − временем на подготовку к экзамену, и оценкой на этом
экзамене3 .
1
Если воспринимать полную независимость случайных величин как предел «слабой» вероятностной
зависимости
2
В качестве случайной величины X здесь можно рассматривать рост бузины в огороде, а в качестве
случайной величины Y − количество проживающих в Киеве братьев ваших родителей. Очень сложно
указать хоть один общий фактор, влияющий одновременно на эти величины.
3
Затратив одинаковое время на подготовку к двум разным экзаменам, нельзя утверждать, что
оценки, полученные на экзаменах, совпадут. С одной стороны, опыт сдачи большого числа экзаменов
говорит, что чем больше тратишь времени на подготовку, тем выше оценка. С другой стороны, боль-
212
Другим примером корреляционной связи являются функции регрессии
(см. определения 8.9-8.10).
Далее с помощью вывода линейного уравнения регрессии рассмотрим
связанные с ним числовые характеристики степени зависимости случайных
величин .
8.8
Вывод уравнения линейной регрессии
В качестве приближения истинного закона регрессии на практике чаще всего используют линейное приближение в виде линейного уравнения
регрессии. А в качестве критерия наилучшего приближения используют
метод наименьших квадратов1 .
Предположим, что искомое уравнение регрессии Y на X имеет вид
y = kx + b.
В качестве случайной величины ∆ выберем отклонение точек истинной
линии регрессии от прямой регрессии, определяемой искомым уравнением.
Каждое значение выбранной случайной величины определяет отклонение
конкретной точки (xi , yj ) от искомой прямой:
δij = yj − (kxi + b).
(8.15)
С точки зрения метода наименьших квадратов наилучшим уравнением (а
значит и наилучшей прямой) является то уравнение, для коэффициентов
которого математическое ожидание квадрата отклонения ∆ принимает
минимальное значение. Таким образом, задача сводится к определению
точки минимума функции двух переменных
X
Φ(k, b) =
δij2 pij ,
ij
где pij = P (X = xi , Y = yj ).
Подставив представление (8.15) в функцию Φ(k, b)
X
Φ(k, b) =
(yj − kxi − b)2 pij ,
(8.16)
ij
вычислим частные производные
X
∂Φ
= −2
xi (yj − kxi − b)pij
∂k
ij
и
X
∂Φ
= −2
(yj − kxi − b)pij .
∂b
ij
шое количество случайных факторов вынуждают сделать вывод о том, что количество потраченного
времени влияет на оценку только в среднем.
1
См. Бидерман В. И. Указ. соч. С. 187.
213
Функция Φ(k, b) представляет неотрицательную функцию, у которой
единственный экстремум является её минимумом. Поскольку точка минимума находится в стационарной точке функции, то для её определения
составим систему
X

xi (yj − kxi − b)pij = 0,


ij
X

(yj − kxi − b)pij = 0.


ij
Раскрыв скобки и вынеся искомые параметры за знаки суммирования, получим систему
наименьших квадратов
! уравнений метода
!
 нормальных
X
X
X

2


x
p
k
+
x
p
b
=
xi yj pij ,
i ij

i ij

ij
ij
ij
!
!
X
X
X



x
p
k
+
p
b
=
yj pij .

i ij
ij

ij
ij
ij
С помощью обозначений
X
X X
X
xi pij =
xi
pij =
xi pix = M (X);
ij
i
X
X
j
x2i pij
i
= M (X 2 );
X ij X
X
yj pij =
yj
pij =
yj pjy = M (Y );
ij
j
i
X
а также равенства
j
xi yj pij = M (XY ),
ij
X
pij = 1
ij
(см. замечание 8.1) упростим систему
M (X 2 )k + M (X)b = M (XY ),
M (X)k +
b = M (Y ).
Умножив второе равенство на M (X), вычтем полученное произведение из
первого равенства
M (X 2 ) − (M (X))2 k = M (XY ) − M (X)M (Y ).
Заметив, что разность в левой скобке представляет дисперсию D(X), перепишем полученное равенство
D(X)k = M (XY ) − M (X)M (Y ).
Для правой части равенства введём новое
Определение 8.15. Характеристика
K(X, Y ) = M (XY ) − M (X)M (Y )
214
называется ковариацией пары случайных величин (X, Y ).
Заменяя в последнем равенстве значение ковариации на её обозначение,
получаем
D(X)k = K(X, Y ).
1
Таким образом ,
K(X, Y )
k=
,
(8.17)
D(X)
а
K(X, Y )
b = M (Y ) −
M (X).
(8.18)
D(X)
Подставляя найденные значения k и b в искомое уравнение регресии,
имеем уравнение линейной регрессии Y на X в следующей форме:
y − M (Y ) =
K(X, Y )
D(X)
(x − M (X)).
(8.19)
Далее введём ещё одну характеристику для случайных величин X и Y .
Определение 8.16. Характеристика
K(X, Y )
r(X, Y ) = p
D(X)D(Y )
называется коэффициентом корреляции пары случайных величин
(X, Y ).
p
p
Так как каждый из корней D(X) и D(Y ) представляет соответствующее среднее квадратическое отклонение σx и σy , то перепишем коэффициент корреляции в следующем виде:
K(X, Y )
r(X, Y ) =
.
σx σy
Поскольку
p
D(Y )
1
1
1
σy
p
p
p
=p
=p
=
· ,
D(X)
D(X) D(X)
D(X) D(X) D(Y ) σx σy σx
коэффициент в уравнении (8.19 можно представить так:
K(X, Y )
σy
= r(X, Y ) .
D(X)
σx
Поэтому окончательной формой уравнения линейной регрессии Y на X
будет уравнение
y − M (Y ) = r(X, Y )
1
σy
σx
(x − M (X)).
Так как X − случайная величина, то очевидно, что D(X) 6= 0.
215
(8.20)
А соответствующее уравнение линейной регрессии X на Y по аналогии
примет такой вид:
σx
y − M (X) = r(X, Y )
(y − M (Y )).
(8.21)
σy
Замечание 8.3. Если значения k и b (см. равенства 8.17-8.18) подставить в функцию Φ(k, b) (см. представление фунуции (8.18)), то мы получим
минимальное значение функции
Φ(k, b) = σy2 (1 − r2 ).
Число σy2 (1−r2 ) называют остаточной дисперсией случайной величины
Y относительно случайной величины X.
Эта характеристика определяет величину ошибки, допущенной при замене Y линейной функцией ϕ(X) = kX + b.
Если коэффициент корреляции r = ±1, то остаточная дисперсия обращается в нуль, что означает: при r = ±1 представление Y в виде линейной
функции от X не является ошибкой. В этом случае X и Y связаны линейной зависимостью.
Естественно и σx2 (1 − r2 ) в этом случае обращается в нуль, а прямые
регрессии, заданные уравнениями (8.19) и (8.20), совпадают.
8.9
Свойства ковариации
Чтобы понять, каким образом ковариация связана с характеристикой
связи двух случайных величин, рассмотрим следующую теорему.
Теорема 8.3. Ковариация системы двух случайных величин равна математическому ожиданию произведения отклонений этих величин от
их математических ожиданий.
В формальном виде это выглядит так, если X и Y составляющие системы (X, Y ), то
K(X, Y ) = M ((X − M (X))(Y − M (Y )).
(8.22)
Д о к а з а т е л ь с т в о. Из определения 8.15 выпишем представление
ковариации и преобразуем его, предварительно отняв и прибавив произведение M (X)M (Y ):
M (XY )−M (X)M (Y ) = M (XY )−M (X)M (Y )−M (X)M (Y )+M (X)M (Y ).
Так как константу можно вносить под знак математического ожидания1 ,
то внесём соответственно M (Y ) и M (X) под знак математического ожидания:
M (X)M (Y ) = M (XM (Y )) ; M (X)M (Y ) = M (M (X)Y ) .
1
Следует помнить, что M (X) и M (Y ) являются константами.
216
Продолжая преобразования, воспользуемся тем, что сумма математических ожиданий случайных величин равна математическому ожиданию от
суммы этих величин
M (XY ) − M (XM (Y )) − M (M (X)Y ) + M (X)M (Y ) =
= M (XY − XM (Y ) − M (X)Y + M (X)M (Y )) =
= M (X (Y − M (Y )) − (Y − M (Y )) M (X)) =
= M ((X − M (X)) (Y − M (Y ))).
Замечание 8.4. Следует заметить, что исторически в большинстве
учебников по теории вероятностей за определение ковариации принимается равенство (8.22). При этом вместо термина ковариация используется
другой термин корреляционный момент, что также имеет историческое
объяснение.
На начальном этапе возникновения теории вероятностей по аналогии
были использованы методы теории моментов из теоретической механики, на языке которой дисперсии
D(X) = M (X − M (X))2 и D(Y ) = M (Y − M (Y ))2 ,
а также ковариация
K(X, Y ) = M ((X − M (X)) (Y − M (Y )))
называются центральными моментами второго порядка1 .
Так, например, аналогом дисперсии с точки зрения теоретической механики является момент инерции материальной точки относительно некоторой оси, а аналогом ковариации − момент инерции материальной точки
относительно некоторого центра.
Из свойств математического ожидания и дисперсии случайных величин
вытекают следующие свойства.
Свойство 8.5. Симметричность ковариации
Для любых случайных величин X и Y
K(X, Y ) = K(Y, X).
Свойство 8.6. Аддитивность ковариации
Для любых случайных величин X, Y , T и Z
K(X + T, Y ) = K(X, Y ) + K(T, Y );
K(X, Y + Z) = K(X, Y ) + K(X, Z).
Свойство 8.7. Однородность ковариации
Для любых случайных величин X и Y , а также для любой константы C
K(CX, Y ) = CK(X, Y );
K(X, CY ) = CK(X, Y ).
Свойство 8.8. Для любых независимых случайных величин X и Y
K(X, Y ) = 0.
1
А математические ожидания отклонений случайных величин от их математического ожидания
M (X − M (X)) и M (Y − M (Y )) называются центральными моментами первого порядка.
217
Из этого свойства вытекает
Следствие 8.3. Для любых случайных величин X и Y , а также для
любой константы C
K(X + C, Y ) = K(X, Y );
K(X, Y + C) = K(X, Y ).
Свойство 8.9. Для любой случайной величины X
K(X, X) = D(X).
Свойство 8.10. Дисперсия суммы случайных величин
Для любых случайных величин X и Y
D(X + Y ) = D(X) + D(Y ) + 2K(X, Y ).
На основании свойств 8.8 и 8.10 получаем
Следствие 8.4. Для любых независимых случайных величин X и Y
D(X + Y ) = D(X) + D(Y ).
Теоретическое упражнение 8.1. Опираясь на определения и свойства математического ожидания и дисперсии случайных величин, докажите свойства 8.5-8.10 самостоятельно.
Так как следующее свойство не является очевидным, то приведём его с
доказательством.
Свойство 8.11. Для любых случайных величин X и Y
|K(X, Y )| ≤ σx σy .
Д о к а з а т е л ь с т в о. Рассмотрим случайные величины
Xc = X − M (X) и Yc = Y − M (Y ).
Для этих величин математические ожидания
M (Xc ) = M (Yc ) = 0,
а дисперсии
D(Xc ) = D (X − M (X))2 = D(X) = σx2 ;
D(Yc ) = D (Y − M (Y ))2 = D(Y ) = σy2 .
Для заданных случайных величин X и Y ковариация
K(X, Y ) = M ((X − M (X)) (Y − M (Y ))) = M (Xc Yc ).
Построим для любого действительного t новую случайную величину
Z(t) = Xc + tYc .
Из свойств математического ожидания следует, что M (Z(t)) = 0.
Поэтому дисперсия
D(Z(t)) = M (Z 2 (t)).
Учитывая всё вышеизложенное, имеем
M (Z 2 (t)) = M (Xc2 ) + 2tM (Xc Yc ) + t2 M (Yc2 ) = σx2 + 2tK(X, Y ) + t2 σy2 .
Так как дисперсия отрицательной не бывает, то квадратный трёхчлен
t2 σy2 + 2tK(X, Y ) + σx2 ≥ 0
для всех значений t.
218
Следовательно, его дискриминант
4K 2 (X, Y ) − 4σx2 σx2 ≤ 0.
Полученное неравенство эквивалентно неравенству
K 2 (X, Y ) ≤ σx2 σx2 .
Извлекая квадратный корень из обеих частей последнего неравенства1 ,
убеждаемся в истинности доказываемого свойства.
С помощью ковариации введём понятие, характеризующее связь случайных величин.
Определение 8.17. Случайные величины называются коррелированными, если ковариация этих величин отлична от нуля, и некоррелированными, если ковариация между ними равна нулю.
Из этого определения вытекает
Следствие 8.5. О зависимости коррелированных случайных
величин Любые две коррелированные случайные величины являются зависимыми2 .
Если предположить независимость коррелированных величин, то согласно свойству 8.8 получим равенство нулю ковариации этих величин,
что будет противоречить условию следствия и определению.
Определение ковариации обладает недостатком, создающим большие
неудобства при исследовании степени коррелированности сравниваемых величин. Этим недостатком является зависимость ковариации от масштаба
размерностей этих величин, присутствующих в определении.
В то же время введённый в определении 8.16 коэффициент корреляции
r(X, Y ) свободен от этого недостатка. Поэтому именно он используется в
качестве характеристики степени коррелированности случайных величин.
8.10
Свойства коэффициента корреляции
Из определения 8.16 и свойств 8.5-8.8 ковариации вытекают аналогичные свойства для коэффициента корреляции.
Свойство 8.12. Симметричность коэффициента корреляции
Для любых случайных величин X и Y
r(X, Y ) = r(Y, X).
Свойство 8.13. Аддитивность коэффициента корреляции
Для любых случайных величин X, Y , T и Z
r(X + T, Y ) = r(X, Y ) + r(T, Y );
√
Из элементарной математики известно, что r2 = |r|.
2
Рассмотренная в следующем параграфе задача показывает, что обратное утверждение в общем
случае неверно: зависимые величины могут быть некоррелированными.
1
219
r(X, Y + Z) = K(X, Y ) + r(X, Z).
Свойство 8.14. Однородность коэффициента корреляции
Для любых случайных величин X и Y , а также для любой константы C
r(CX, Y ) = ±r(X, Y );
r(X, CY ) = ±r(X, Y ).
Свойство 8.15. Для любых независимых случайных величин X и Y
r(X, Y ) = 0.
Из этого свойства вытекает
Следствие 8.6. Для любых случайных величин X и Y , а также для
любой константы C
r(X + C, Y ) = r(X, Y );
r(X, Y + C) = r(X, Y ).
Из свойства 8.11 вытекает
Свойство 8.16. Для любых случайных величин X и Y
|r(X, Y )| ≤ 1.
Из уравнений регрессии (8.20) и (8.22) и данного свойства можно прийти
к следующему следствию
Следствие 8.7. Если коэффициент корреляции |r(X, Y )| = 1, то случайные величины X и Y связаны линейной зависимостью.
То есть
|r(X, Y )| = 1 ⇔ Y = kX + b.
Следует также заметить, что1
r(X, Y ) < 0 ⇔ k < 0;
r(X, Y ) = 0 ⇔ k = 0.
r(X, Y ) > 0 ⇔ k > 0.
На графических диаграммах по рассеиванию случайных величин X и
Y можно определить знак коэффициента корреляции:
y
y
y
x
Рис. 8.11
x
Рис. 8.12
x
Рис. 8.13
На первом графике (рис. 8.11) коэффициент корреляции больше нуля,
так как видно, что увеличение X ведёт к увеличению Y .
На центральном графике (рис. 8.12) коэффициент корреляции меньше
1
Иначе это выглядит так: sgn(r)=sgn(k) (здесь sgn(·) − знак числа).
220
нуля поскольку на изображении видно, что увеличение X влияет на уменьшение Y .
На третьем графике (рис. 8.13) не видно, как может изменение X повлиять на изменение Y . Следовательно, коэффициент корреляции практически равен нулю.
Задача 8.14. Закон распределения двумерной случайной величины
(X, Y ) задан следующей таблицей:
X\Y
1
2
3
0
1
3
0, 1 0, 3 0
0
0 0, 2
0, 3 0 0, 1
Определите, являются ли случайные величины X и Y
1) зависимыми;
2) коррелированными.
Решение. Найдём законы распределения для каждой из рассматриваемых случайных величин.
Складывая соответствующие вероятности в каждой строке заданной
таблицы, построим
X 1
2
3
Px 0, 4 0, 2 0, 4
Далее складывая соответствующие вероятности в каждом столбце заданной таблицы, построим
Y
0
1
3
Py 0, 4 0, 3 0, 3
Ответим вначале на первый вопрос.
Так как p11 = P (X = 1, Y = 0) = 0, 1 6= P1x · P1y = 0, 4 · 0, 4, то согласно
следствию 8.2 случайные величины X и Y являются зависимыми.
Для ответа на второй вопрос вычислим несколько характеристик данных величин.
M (X) = 1 · 0, 4 + 2 · 0, 2 + 3 · 0, 4 ⇒ M (X) = 2;
M (Y ) = 0 · 0, 4 + 1 · 0, 3 + 3 · 0, 3 ⇒ M (Y ) = 1, 2;
M (XY ) = 1 · 0 · 0, 1 + 1 · 1 · 0, 3 + 1 · 3 · 0+
+2 · 0 · 0, 1 + 2 · 1 · 0, 3 + 2 · 3 · 0+
+3 · 0 · 0, 1 + 3 · 1 · 0, 3 + 3 · 3 · 0 ⇒ M (XY ) = 2, 4;
M (X)M (Y ) = 2 · 1, 2 ⇒ M (X)M (Y ) = 2, 4.
Согласно определению 8.15
K(X, Y ) = M (XY ) − M (X)M (Y ) ⇒ K(X, Y ) = 0.
221
Сравнивая полученный результат с определением 8.17, можно сделать
вывод о том, что сравниваемые величины X и Y не являются коррелированными.
Задача 8.15. Закон распределения двумерной случайной величины
(X, Y ) задан следующей таблицей:
X\Y
1
2
3
0
1
3
0, 1 0 0, 2
0 0, 3 0
0, 1 0, 3 0
Вычислите коэффициент корреляции и определите характер зависимости между случайными величинами X и Y .
Решение. Найдём законы распределения для каждой из рассматриваемых случайных величин.
Складывая соответствующие вероятности в каждой строке заданной
таблицы, построим
X 1
2
3
Px 0, 3 0, 3 0, 4
Далее складывая соответствующие вероятности в каждом столбце заданной таблицы, построим
Y
0
1
3
Py 0, 2 0, 6 0, 2
Вычислим следующие характеристики заданных величин.
M (X) = 1 · 0, 3 + 2 · 0, 3 + 3 · 0, 4 ⇒ M (X) = 2, 1;
M (Y ) = 0 · 0, 2 + 1 · 0, 6 + 3 · 0, 2 ⇒ M (Y ) = 1, 2;
D(X) = 12 · 0, 3 + 22 · 0, 3 + 32 · 0, 4 − (2, 1)2 ⇒ D(X) = 0, 69;
p
σx = 0, 69 ⇒ σx = 0, 831;
2
D(Y ) = 0 · 0, 2 + 12 · 0, 6 + 32 · 0, 2 − (1, 2)2 ⇒ D(Y ) = 0, 96;
p
σy = 0, 96 ⇒ σy = 0, 98;
M (XY ) = 1 · 0 · 0, 1 + 1 · 1 · 0 + 1 · 3 · 0, 2+
+2 · 0 · 0 + 2 · 1 · 0, 3 + 2 · 3 · 0+
+3 · 0 · 0, 1 + 3 · 1 · 0, 3 + 3 · 3 · 0 ⇒ M (XY ) = 2, 1;
M (X)M (Y ) = 2, 1 · 1, 2 ⇒ M (X)M (Y ) = 2, 52.
Согласно определению 8.15
K(X, Y ) = 2, 1 − 2, 52 ⇒ K(X, Y ) = −0, 42.
Из определения 8.16 cледует, что
0, 42
r(X, Y ) = −
⇒ r(X, Y ) = −0, 517.
0, 831 · 0, 98
222
Так как r(X, Y ) < 0, то между случайными величинами X и Y существует отрицательная линейная зависимость.
В заключение главы рассмотрим
8.11
Понятие корреляции случайных событий
Для следующего определения нам понадобится определение индикатора
события A (см. определение 5.5.
Рассмотрим совместное распределение индикаторов IA и IB для связанных между собой случайных событий A и B и сформулируем
Определение 8.18. Коэффициентом корреляции случайных событий A и B называется коэффициент корреляции их индикаторов IA
и IB . То есть
r(A, B) = r(IA , IB ).
Задача 8.16. Обычно ключ от кабинета у меня лежит в правом или в
левом кармане. Поиски ключа я начинаю с кармана, выбранного случайно
с одинаковой вероятностью для каждого. Но почему-то ключ в 90% случаев
оказывается в другом кармане. Найдите коэффициент корреляции между
событиями A: «я начал поиск с правого кармана» и B: «ключ лежит в
правом кармане».
Решение. Для построения закона распределения системы индикаторов
(IA , IB ) вычислим вероятности предполагаемых совместных событий.
Так как события A и B не зависят друг от друга, то вероятности совместных событий можно вычислить с помощью теоремы о произведении
вероятностей независимых событий.
Пусть событие Ā − «я начал поиск с левого кармана кармана», а событие
B̄ − «ключ лежит в левом кармане».
P (IA = 0, IB = 0) = P (Ā) · P (B̄) = 0, 5 · 0, 1 ⇒ P (IA = 0, IB = 0) = 0, 05;
P (IA = 1, IB = 0) = P (A) · P (B̄) = 0, 5 · 0, 9 ⇒ P (IA = 1, IB = 0) = 0, 45;
P (IA = 0, IB = 1) = P (Ā) · P (B) = 0, 5 · 0, 1 ⇒ P (IA = 0, IB = 1) = 0, 05;
P (IA = 1, IB = 1) = P (A) · P (B) = 0, 5 · 0, 9 ⇒ P (IA = 1, IB = 0) = 0, 45.
Зная вероятности, построим закон распределения системы индикаторов
(IA , IB )
IA \IB
0
1
0
0, 05 0, 45
1
0, 45 0, 05
Составим законы распределения для каждого из индикаторов
IA 0
1
P 0, 5 0, 5
IB 0
1
P 0, 5 0, 5
223
Вычислим числовые характеристики распределений.
Так как каждая из величин распределена по биномиальному закону, то
M (IA ) = M (IB ) = 1 · 0, 5 ⇒ M (IA ) = M (IB ) = 0, 5;
D(IA ) = D(IB ) = 1 · 0, 5 · 0, 5 ⇒ D(IA ) = D(IB ) = 0, 25;
σIA = σIB = 0, 5;
M (IA IB ) = 0 · 0 · 0, 05 + 0 · 1 · 0, 45 + 1 · 0 · 0, 45 + 1 · 1 · 0, 05 ⇒ M (IA IB ) = 0, 05;
K(IA , IB ) = 0, 05 − 0, 5 · 0, 5 ⇒ K(IA , IB ) = −0, 2;
0, 2
r(IA , IB ) = −
⇒ r(IA , IB ) = −0, 8.
0, 25
Таким образом, согласно определению 8.18 коэффициент корреляции
событий r(A, B) = −0, 8.
То есть поиск ключа в одном из карманов сильно коррелирует с его
нахождением в другом кармане1 .
1
Эта задача взята из электронного пособия Аракчеев С.А. Теория вероятностей. Часть III, с. 8 (см.
[Электронный ресурс] : URL : http://vm.stu.ru/Task/Arakcheev%20-%20Probability(add).pdf (дата
обращения: 12.06.2016)).
224
Заключение
Закрывая эту книгу1 , следует отметить, что «Элементы теории вероятностей» представляют только введение в эту красивую науку, позволяющее
получить первое представление о её терминологии, проблемах, методах решения предложенных задач.
Зная терминологию теории вероятностей, можно открыть дверь в математическую статистику, которая также является разделом математики.
Если давать определение предмета математической статистики, то можно сказать, что математическая статистика изучает методы сбора, систематизации, обработки и использования статистических данных для
получения научно обоснованных выводов и принятия на их основе решений.
И на этом пути сбора, систематизации и обработки невозможно обойтись без азбуки теории вероятностей2 .
Мир приложений математической статистики огромен: организация транспортных потоков, теория надёжности машин и механизмов, теория математической связи (она же теория информации), прогнозирование погоды
и любое другое прогнозирование3 , а также доказательная медицина и великое множество других приложений.
А там, где теория вероятностей и математическая статистика не могут
помочь, на помощь приходит теория случайных процессов, в основе которой также лежит теория вероятностей.
Но для того, чтобы её помощь оказалась результативной, понадобится
более глубокое знакомство с теорией вероятностей.
И в завершение заключения4 небольшой диалог:
− Чем вы собираетесь заниматься? − Писать планы и программы.
− А что такое планы и программы? − Это алгоритм + данные.
− А что такое данные? − Это способ представления информации.
− А что такое информация? − Это мера уменьшения неопределённости.
− А можно всем этим заниматься, не зная теории вероятностей?
− Нет.
1
Будем надеяться после того, как вы разобрались с основными определениями и теоремами и разобрались в методике решения рассмотренных задач.
2
Безусловно подкреплённой аппаратом алгебры, геометрии, математического анализа и, конечно,
арифметики.
3
Если, конечно, это не прогноз на кофейной гуще.
4
Согласитесь, что заключение заключения есть грубая тавтология, а завершение заключения звучит
нежнее.
225
Библиографический список
1. Александрова, Н. В. История математических терминов, понятий,
обозначений : словарь-справочник / Н. В. Александрова. − М. : ЛКИ,
2008. − 248 с.
2. Бернулли, Я. О законе больших чисел / Я. Бернулли. − М. : Наука, 1986.
− 176 с.
3. Бидерман, В. И. Математика: элементы математического анализа
/ В. И. Бидерман. − Хабаровск : Изд-во Тихоокеан. гос. ун-та, 2013. −
197 с.
4. Бородин, А. Н. Элементарный курс теории вероятностей и математической статистики/А. Н. Бородин. − СПб. : Лань, 2004. − 256 с.
5. Бэнкс, Иэн. Улица отчаяния / Иэн Бэнкс. − М. : Эксмо, 2014. − C. 81.
6. Вентцель, Е. С. Исследование операций / Е. С. Вентцель. − М. : Советское радио, 1972. − 552 c.
7. Вентцель, Е. С. Теория вероятностей и её инженерные приложения
/ Е. С. Вентцель, Л. А. Овчаров. − М.: Наука, 1988. − 480 с.
8. Гëте, И. В. Фауст / И. В. Гëте. : пер. с нем. − М. : Художественная
литература, 1969. − С. 98.
9. Глейзер, Г. И. История математики в школе: IX-X кл. Пособие для учителей / Г. И. Глейзер. − М. : Просвещение, 1983. − 351 с.
10. Гмурман, В. Е. Руководство к решению задач по теории вероятностей
и математической статистике / В. Е. Гмурман. − М. : Высш.шк., 1975.
− 333 с.
11. Гмурман, В. Е. Теория вероятностей и математическая статистика
/ В. Е. Гмурман. − М. : Высш.шк., 1997. − 479 с.
12. Гнеденко, Б. В. Из истории науки о случайном / Б. В. Гнеденко. −
М. : Знание, 1981. − 64 с.
13. Гнеденко, Б. В. Курс теории вероятностей / Б. В. Гнеденко. −
М. : Наука, 1988. − 448 с.
14. Зорич, В. А. Математический анализ : учебник. Ч. II / В. А. Зорич. −
М. : Наука, 1984. − 640 с.
15. История математики с древнейших времен до начала XIX столетия :
в 3 т. Т. 2 / под ред. А. П. Юшкевича. − М. : Наука, 1970. − 300 с.
16. Канеман, Д. Думай медленно... решай быстро / Д. Канеман. − М. : Аст,
2014. − 653 c.
17. Корбалан, Ф. Укрощение случайности. Теория вероятностей / Ф. Корбалан, Х. Санц. − М. : Де Агостини, 2014. − 160 с.
18. Курно, О. Основы теории шансов и вероятностей / О. Курно. − М. :
Наука, 1970. − 384 с.
226
19. Лебедева, А. В. Ars combinatoria и музыкальная практика XVIII века :
автореф. дис. ... канд. искусствоведения / Рос. акад. музыки им. Гнесиных. − М., 2002. - 21 с.
20. Майстров, Л. И. Теория вероятностей. Исторический очерк /
Л. И. Майстров. − М. : Наука, 1967. − 320 c.
21. Маккьюсик, В. Генетика человека : пер. с англ. − М. : Мир, 1967. −
200 c.
22. Миронов, Б. Н. Историк и математика (Математические методы в историческом исследовании) / Б. Н. Миронов, З. В. Степанов. − Л. :
Наука, − 1976. − 184 c.
23. Мойес, Д. Один плюс один / Д. Мойес. − М. : Иностранка, 2014. −
480 c.
24. Мостеллер, Ф. Пятьдесят занимательных вероятностных задач с решениями / Ф. Мостеллер. − М. : Наука, 1975. − 112 c.
25. Ниворожкина, Л.И. Математическая статистика с элементами теории
вероятностей в задачах с решениями / Л. И. Ниворожкина, С. А. Морозова. − М. : ИКЦ «МарТ» ; Ростов-н/Д : Издательский центр «МарТ»,
2005. − 608 c.
26. Острейковский, В. А. Теория надёжности / В. А. Острейковский. −
М. : Высш. шк., 2003. − 463 c.
27. Секей, Г. Парадоксы в теории вероятностей и математической статистике / Г. Секей. − Москва-Ижевск : Институт компьютерных исследований, 2003. − 272 c.
28. Фëдорова, T. Л. Этимологический словарь русского языка/T. Л. Фëдорова, О. А. Щеглова. − М. : Ладком, 2012. − 608 c.
29. Хинчин, А. Я. Учение Мизеса о вероятностях и принципы физической
статистики / А. Я. Хинчин // Успехи физических наук. − 1929. − Т. IX
− Вып. 2 − С. 141-166.
30. Чебышёв, П. Л. Полное собрание сочинений. Математический анализ.
Том III / П. Л. Чебышёв. − М.-Л. : Издательство Академии наук СССР,
1948. − 414 с.
31. Штейнгауз, Г. Задачи и размышления / Г. Штейнгауз. − М. : Мир,
1974. − 400 с.
32. Эсхил, Трагедии / Эсхил − М. : Художественная литература, 1971. −
С. 344.
33. The Exponential distribution. Theory, Methods and Applications / N. Balakrishan, Asit. P. Basu. − Gordon and Breach Publishers, 1995. − 641 p.
34. Вероятность и математическая статистика : энциклопедия / гл. ред.
Ю. В. Прохоров. − М. : Большая Российская энциклопедия, 1999.
910 с.
227
Приложение 1
Функция Гаусса
x
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
1,30
ϕ(x)
0,3989
0,3984
0,3970
0,3945
0,3910
0,3867
0,3814
0,3752
0,3683
0,3605
0,3521
0,3429
0,3332
0,3230
0,3123
0,3011
0,2897
0,2780
0,2661
0,2541
0,2420
0,2299
0,2179
0.2059
0,1942
0,1826
0,1714
x
1,35
1,40
1,45
1,50
1,55
1,60
1,65
1,70
1,75
1,80
1,85
1,90
1,95
2,00
2,05
2,10
2,15
2,20
2,25
2,30
2,35
2,40
2,45
2,50
2,55
2,60
2,65
ϕ(x)
0,1604
0,1497
0,1394
0,1295
0,1200
0,1109
0,1023
0,0940
0,0863
0,0790
0,0721
0,0656
0,0596
0,0540
0,0488
0,0440
0,0396
0,0355
0,0317
0,0283
0,0252
0,0224
0,0198
0,0175
0,0154
0,0136
0,0119
228
x
2,70
2,75
2,80
2,85
2,90
2,95
3,00
3,05
3,10
3,15
3,20
3,25
3,30
3,35
3,40
3,45
3,50
3,55
3,60
3,65
3,70
3,75
3,80
3,85
3,90
3,95
4,00
ϕ(x)
0,0104
0,0091
0,0079
0,0069
0,0060
0,0051
0,0044
0,0038
0,0033
0,0028
0,0024
0,0020
0,0017
0,0015
0,0012
0,0010
0,0009
0,0007
0,0006
0,0005
0,0004
0,0004
0,0003
0,0002
0,0002
0,0002
0,0001
Приложение 2
Интегральная функция Лапласа
x
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
Φ(x)
0,0000
0,0040
0,0389
0,0596
0,0793
0,0987
0,1179
0,1368
0,1554
0,1736
0,1915
0,2088
0,2257
0,2422
0,2580
0,2734
0,2881
0,3023
0,3159
0,3289
0,3413
x
1,10
1,15
1,20
1,25
1,30
1,35
1,40
1,45
1,50
1,55
1,60
1,65
1,70
1,75
1,80
1,85
1,90
1,96
2,00
2,05
2,10
Φ(x)
0,3643
0,3749
0,3849
0,3944
0,4032
0,4115
0,4192
0,4265
0,4332
0,4394
0,4452
0,4505
0,4554
0,4599
0,4641
0,4678
0,4713
0,4750
0,4772
0,4798
0,4821
229
x
Φ(x)
2,25 0,4878
2,30 0,4893
2,35 0,4907
2,40 0,4918
2,45 0,4929
2,50 0,4938
2,55 0,4947
2,60 0,4953
2,65 0,4960
2,70 0,4965
2,75 0,4970
2,80 0,4974
2,85 0,4978
2,90 0,4981
2,95 0,4985
3,00 0,49865
3,2 0,49931
3,4 0,49966
3,6 0,499984
3,8 0,499993
4,0 0.499997
Предметный указатель
Асимметрия, 166
Вероятностный смысл математического ожидания, 91
Вероятность события, 23
Гипотезы, 49
Дискретная случайная величина, 73
Дисперсия, 97, 127
Дополнение множества, 10
Зависимость корреляционная, 213
Зависимость стохастическая,213
Задача о встрече, 32
Игла Бюффона, 33
Закон распределения, 75
Интегральная теорема Лапласа, 66
Исходы, 11
Индикатор события, 91
Ковариация, 215
Комбинаторика, 8
Коэффициент корреляции, 216, 224
Линия регрессии, 209
Локальная теорема МуавраЛапласа, 64
Локальная формула Лапласа, 64
Математическое ожидание, 87, 122
Медиана, 125
Многоугольник распределения, 80
Мода, 94, 124
Момент начальный, 164
Момент центральный, 165
Наивероятнейшее число, 70
Независимые случайные
величины, 200
Нормированное нормальное
распределение, 137
Объединение множеств, 8
Относительная частота, 29
Операции над множествами, 8
Определение вероятности
геометрическое, 31
Определение вероятности
классическое, 24
Определение вероятности
статистическое, 29
Опыт, 11
Пересечение множеств, 9
Перестановки, 15
Перестановки с повторениями, 16
Плотность распределения, 118
Полная группа, 23
Правило произведения, 12
Правило суммы, 11
Произведение множеств, 10
Пространство исходов, 22
Пустое множество, 10
Размещения без повторения,15
Размещения с повторением, 18
Разность множеств, 10
Распределение биномиальное,108
Распределение нормальное, 133
Распределение показательное, 152
Распределение Пуассона,111
Распределение равномерное, 129
Распределение условное, 203
Событие, 11
Событие достоверное, 21
Событие невозможное, 21
Событие случайное, 21
Событие составное, 21
Событие элементарное, 21
События независимые, 43
События несовместные, 22
События противоположные, 23
Cобытия равновозможные, 22
Сочетания без повторения, 17
Среднее квадратическое
230
отклонение,101, 127
Формула Байеса, 54
Среднее число появления
Формула Бернулли, 57
события, 30
Формула полной вероятности, 49
Сумма множеств, 9
Формула Пуассона, 61
Схема Бернулли, 57
Функция Гаусса, 63
Универсальное множество, 10 Функция дифференциальная, 118
Уравнение регрессии, 209
Функция интегральная Лапласа, 65
Теорема гипотез, 53
Функция интегральная, 119
Условная вероятность, 40
Функция распределения, 81, 192
Теоремы сложения
Функция регрессии, 208
вероятностей, 37, 39
Эксцесс, 168
Теоремы умножения
вероятностей, 40, 43
231
Учебное издание
Бидерман Вениамин Исаакович
Элементы
теории вероятностей
Учебное пособие
Компьютерная вёрстка В. И. Бидермана
Дизайн обложки Е. И. Саморядовой
Печатается с авторского оригинала-макета
Подписано в печать 06.02.17. Формат 60х84 1/16.
Бумага писчая. Гарнитура «Таймс». Печать цифровая.
Усл. печ. л. 13, 60. Тираж 100 экз. Заказ 11.
Издательство Тихоокеанского государственного университета.
680035, Хабаровск, ул. Тихоокеанская, 136.
Отдел оперативной полиграфии
издательства Тихоокеанского государственного университета.
680035, Хабаровск, ул. Тихоокеанская, 136.
Download