Загрузил Полина Антошина

Minko Statisticheskiy analiz v MS Excel

Реклама
ПРОФЕССИОНАЛЬНАЯ РАБОТА
СТАТИСТИЧЕСКИЙ
АНАЛИЗ
В MS EXCEL
ПРОФЕССИОНАЛЬНАЯ РАБОТА
А.А.МИНЬКО
СТАТИСТИЧЕСКИЙ
АНАЛИЗ
В MS EXCEL
Москва • СанктПетербург • Киев
2004
ÁÁÊ 32.973.26-018.2.75
M62
ÓÄÊ 681.3.07
Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà”
Çàâ. ðåäàêöèåé À.Â. Ñëåïöîâ
Ïî îáùèì âîïðîñàì îáðàùàéòåñü â èçäàòåëüñòâî “Äèàëåêòèêà” ïî àäðåñó:
info@dialektika.com, http://www.dialektika.com
Ìèíüêî, À.À.
M62 Ñòàòèñòè÷åñêèé àíàëèç â MS Excel. : — Ì. : Èçäàòåëüñêèé äîì “Âèëüÿìñ”,
2004. — 448 ñ. : èë. — Ïàðàë. òèò. àíãë.
ISBN 5-8459-0692-X (ðóñ.)
Êíèãà ïðåäíàçíà÷åíà äëÿ âñåõ, êòî èñïîëüçóåò ìåòîäû ñòàòèñòè÷åñêîãî
àíàëèçà â ñâîåé ðàáîòå. Îíà íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî ïðèìåíÿþòñÿ íà ïðàêòèêå è êîòîðûå ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé
åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ìåòîäû ïðåäñòàâëåíû â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî ïðîñòî ðåàëèçîâàòü ïðàêòè÷åñêèå ðàáîòíèêè, êîòîðûì
íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ.
Äëÿ ñòóäåíòîâ, àñïèðàíòîâ, ïðåïîäàâàòåëåé è ïðàêòè÷åñêèõ ðàáîòíèêîâ,
çàíèìàþùèõñÿ âîïðîñàìè àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ.
ÁÁÊ 32.973.26-018.2.75
Âñå íàçâàíèÿ ïðîãðàììíûõ ïðîäóêòîâ ÿâëÿþòñÿ çàðåãèñòðèðîâàííûìè òîðãîâûìè
ìàðêàìè ñîîòâåòñòâóþùèõ ôèðì.
Íèêàêàÿ ÷àñòü íàñòîÿùåãî èçäàíèÿ íè â êàêèõ öåëÿõ íå ìîæåò áûòü âîñïðîèçâåäåíà
â êàêîé áû òî íè áûëî ôîðìå è êàêèìè áû òî íè áûëî ñðåäñòâàìè, áóäü òî ýëåêòðîííûå
èëè ìåõàíè÷åñêèå, âêëþ÷àÿ ôîòîêîïèðîâàíèå è çàïèñü íà ìàãíèòíûé íîñèòåëü, åñëè íà
ýòî íåò ïèñüìåííîãî ðàçðåøåíèÿ èçäàòåëüñòâà “Äèàëåêòèêà”.
Copyright © 2004 by Dialektika Computer Publishing.
All rights reserved including the right of reproduction in whole or in part in any form.
ISBN 5-8459-0692-X (ðóñ.)
© Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà”, 2004
Оглавление
ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
19
Глава 1. Основные понятия теории вероятностей
20
Глава 2. Основные статистические методы
49
Глава 3. Анализ статистических зависимостей
78
ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА
101
Глава 4. Статистические функции
102
Глава 5. Надстройка Пакет анализа
146
Глава 6. Дополнительные возможности Excel для проведения
статистического анализа
193
Глава 7. Моделирование случайных величин
229
ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК
249
Глава 8. Предварительный анализ
250
Глава 9. Подбор распределения
286
Глава 10. Интервальное оценивание параметров распределения
307
Глава 11. Проверка гипотез о параметрах распределений
335
Глава 12. Сравнение одномерных выборок
349
ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ
381
Глава 13. Корреляционный анализ
382
Глава 14. Сравнение зависимых выборок
400
Глава 15. Регрессионный анализ
417
Литература
427
Предметный указатель
429
Содержание
Предисловие
15
ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
19
Глава 1. Основные понятия теории вероятностей
20
1.1. Понятия случайного события и случайной величины
1.1.1. Вероятности
1.1.2. Алгебра случайных событий
1.1.3. Условные вероятности
1.2. Распределения случайных величин
1.2.1. Дискретные случайные величины
1.2.2. Непрерывные случайные величины
1.2.3. Числовые характеристики случайных величин
1.2.4. Вероятностные неравенства
1.2.5. Двумерные распределения
1.3. Функции от случайных величин
1.3.1. Линейное преобразование случайных величин
1.3.2. Суммы случайных величин
1.3.3. Центральная предельная теорема
1.4. Примеры дискретных распределений
1.4.1. Равномерное дискретное распределение
1.4.2. Распределение Бернулли
1.4.3. Биномиальное распределение
1.4.4. Распределение Пуассона
1.4.5. Геометрическое распределение
1.4.6. Гипергеометрическое распределение
1.4.7. Отрицательное биномиальное распределение
(распределение Паскаля)
1.5. Примеры непрерывных распределений
1.5.1. Равномерное непрерывное распределение
1.5.2. Треугольное распределение
1.5.3. Показательное (экспоненциальное) распределение
1.5.4. Нормальное распределение
1.5.5. Распределение “хи/квадрат”
1.5.6. Распределение Стьюдента
1.5.7. F/распределение
1.5.8. Логарифмически нормальное распределение
1.5.9. Бета/распределение
1.5.10. Гамма/распределение
Содержание
20
21
22
22
23
23
25
25
27
28
29
30
30
31
32
32
32
33
34
34
35
35
36
36
37
37
38
39
40
41
42
43
44
6
1.5.11. Распределение Вейбулла–Гнеденко
1.5.12. Распределения Пирсона
Глава 2. Основные статистические методы
2.1. Точечное оценивание параметров распределения
2.1.1. Несмещенность оценки
2.1.2. Эффективность оценки
2.1.3. Состоятельность оценки
2.2. Интервальное оценивание параметров распределения
2.3. Выборочные статистики и интервальные оценки
2.3.1. Статистика для оценивания математического ожидания
2.3.2. Статистика для оценивания дисперсии
2.3.3. Статистики для оценивания моментов
2.3.4. Статистики для оценивания коэффициентов асимметрии
и эксцесса
2.3.5. Статистика для оценивания медианы
2.3.6. Оценки параметров нормального распределения
2.3.7. Оценка параметра р распределения Бернулли
2.3.8. Оценка параметра λ распределения Пуассона
2.3.9. Порядковые статистики
2.4. Проверка статистических гипотез
2.4.1. Критерии проверки гипотез о значениях параметров
генеральной совокупности
2.4.2. Критерии сравнения значений параметров генеральных
совокупностей
2.4.3. Критерии проверки гипотез о принадлежности
распределения выборки классу распределений
Глава 3. Анализ статистических зависимостей
3.1. Общая модель статистических зависимостей
3.2. Задачи статистического анализа зависимостей
3.3. Корреляционный анализ
3.3.1. Анализ зависимостей между количественными переменными
3.3.2. Анализ зависимостей между порядковыми переменными
3.3.3. Анализ зависимостей между классификационными
переменными
3.4. Регрессионный анализ
3.4.1. Выбор функции регрессии
3.4.2. Построение функции регрессии
3.4.3. Проверка адекватности функции регрессии
3.4.4. Статистические характеристики параметров
функции регрессии
3.4.5. Прогнозирование
3.5. Дисперсионный анализ
3.5.1. Статистическая модель
7
Содержание
44
45
49
49
50
51
51
52
54
54
56
58
58
59
59
61
63
65
65
68
70
75
78
78
79
81
81
83
86
88
88
90
91
92
93
94
94
3.5.2. Однофакторный дисперсионный анализ
3.5.3. Двухфакторный дисперсионный анализ
95
97
ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА
101
Глава 4. Статистические функции
102
4.1. Функции для определения экстремальных значений выборки
4.1.1. Функции МАКС, МАКСА, МИН, МИНА
4.1.2. Функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ
4.2. Функции для работы с порядковыми статистиками
4.2.1. Функция КВАРТИЛЬ
4.2.2. Функция ПЕРСЕНТИЛЬ
4.2.3. Функция МЕДИАНА
4.2.4. Функция ПРОЦЕНТРАНГ
4.2.5. Функция РАНГ
4.3. Функции для вычисления средних
4.3.1. Функция СРГАМ
4.3.2. Функция СРГЕОМ
4.3.3. Функции СРЗНАЧ и СРЗНАЧА
4.3.4. Функция УРЕЗСРЕДНЕЕ
4.4. Функции для вычисления геометрических характеристик
распределения
4.4.1. Функция СКОС
4.4.2. Функция ЭКСЦЕСС
4.5. Функции для вычисления выборочной дисперсии и отклонения
4.5.1. Функции ДИСП и ДИСПА
4.5.2. Функции ДИСПР и ДИСПРА
4.5.3. Функция КВАДРОТКЛ
4.5.4. Функции СТАНДОТКЛОН и СТАНДОТКЛОНА
4.5.5. Функции СТАНДОТКЛОНП и СТАНДОТКЛОНПА
4.5.6. Функция СРОТКЛ
4.6. Функции для вычисления значений функций распределения
4.6.1. Функция FРАСП
4.6.2. Функция БЕТАРАСП
4.6.3. Функция БИНОМРАСП
4.6.4. Функция ВЕЙБУЛЛ
4.6.5. Функция ГАММАРАСП
4.6.6. Функция ГИПЕРГЕОМЕТ
4.6.7. Функция ЛОГНОРМРАСП
4.6.8. Функция НОРМРАСП
4.6.9. Функция НОРМСТРАСП
4.6.10. Функция ОТРБИНОМРАСП
4.6.11. Функция ПУАССОН
4.6.12. Функция СТЬЮДРАСП
4.6.13. Функция ХИ2РАСП
4.6.14. Функция ЭКСПРАСП
Содержание
102
103
103
104
104
105
106
106
107
109
109
109
109
110
110
110
111
111
112
112
112
112
113
113
113
114
114
115
115
116
116
117
117
117
117
118
118
119
119
8
4.7. Функции, обратные к функциям распределения
4.7.1. Функция FРАСПОБР
4.7.2. Функция БЕТАОБР
4.7.3. Функция ГАММАОБР
4.7.4. Функция ЛОГНОРМОБР
4.7.5. Функция НОРМОБР
4.7.6. Функция НОРМСТОБР
4.7.7. Функция СТЬЮДРАСПОБР
4.7.8. Функция ХИ2ОБР
4.7.9. Функция КРИТБИНОМ
4.8. Функции для проверки статистических критериев
4.8.1. Функция ZТЕСТ
4.8.2. Функция ТТЕСТ
4.8.3. Функция ФТЕСТ
4.8.4. Функция ХИ2ТЕСТ
4.9. Функции для построения уравнения регрессии и прогнозирования
4.9.1. Функция ЛИНЕЙН
4.9.2. Функции НАКЛОН и ОТРЕЗОК
4.9.3. Функция СТОШYX
4.9.4. Функция ПРЕДСКАЗ
4.9.5. Функция ТЕНДЕНЦИЯ
4.9.6. Функция ЛГРФПРИБЛ
4.9.7. Функция РОСТ
4.10. Функции для вычисления ковариации и коэффициента корреляции
4.10.1. Функция КОВАР
4.10.2. Функция КОРРЕЛ
4.10.3. Функция ПИРСОН
4.10.4. Функция КВПИРСОН
4.10.5. Функции ФИШЕР и ФИШЕРОБР
4.11. Дополнительные функции
4.11.1. Функция ВЕРОЯТНОСТЬ
4.11.2. Функция ДОВЕРИТ
4.11.3. Функция МОДА
4.11.4. Функция ЧАСТОТА
4.12. Вспомогательные функции
4.12.1. Функция ГАММАНЛОГ
4.12.2. Функция НОРМАЛИЗАЦИЯ
4.12.3. Функция ПЕРЕСТ
4.12.4. Функции СЧЁТ и СЧЁТЗ
4.13. Функции для генерирования равномерно распределенных
случайных чисел
4.13.1. Функция СЛЧИС
4.13.2. Функция СЛУЧМЕЖДУ
9
Содержание
119
120
121
121
121
122
122
122
122
123
123
124
124
126
127
128
129
131
132
133
133
134
135
136
136
137
137
138
139
139
140
140
141
141
142
142
142
143
143
143
144
144
Глава 5. Надстройка Пакет анализа
146
5.1. Описательная статистика
5.1.1. Опции диалогового окна Описательная статистика
5.2. Гистограмма
5.2.1. Опции диалогового окна Гистограмма
5.3. Генерация случайных чисел
5.3.1. Опции диалогового окна Генерация случайных чисел
5.4. Выборка
5.4.1. Опции диалогового окна Выборка
5.5. Ранг и персентиль
5.6. Двухвыборочный z/тест для средних
5.7. Двухвыборочный t/тест с одинаковыми дисперсиями
5.8. Двухвыборочный t/тест с различными дисперсиями
5.9. Парный двухвыборочный t/тест для средних
5.10. Двухвыборочный F/тест для дисперсий
5.11. Однофакторный дисперсионный анализ
5.12. Двухфакторный дисперсионный анализ с повторениями
5.13. Двухфакторный дисперсионный анализ без повторений
5.14. Корреляция
5.15. Ковариация
5.16. Регрессия
5.17. Скользящее среднее
5.18. Экспоненциальное сглаживание
5.19. Анализ Фурье
Глава 6. Дополнительные возможности Excel для проведения
статистического анализа
149
151
151
152
154
155
160
160
161
161
165
167
169
172
173
175
177
179
180
181
187
188
189
193
6.1. Массивы и формулы массивов
6.1.1. Редактирование формул массивов
6.1.2. Массивы констант
6.1.3. Поименованные массивы и диапазоны
6.1.4. Примеры использования формул массивов
6.1.5. Матричные вычисления
6.1.6. Функции суммирования
6.2. Диаграммы
6.2.1. Линии тренда
6.2.2. Планки погрешностей
6.2.3. Построение гистограмм и функций распределения
дискретных случайных величин
6.2.4. Гистограммы с перекрытием
6.3. Надстройка Поиск решения
6.3.1. Задачи оптимизации и средство Поиск решения
6.3.2. Задачи, решаемые средством Поиск решения
6.3.3. Примеры применения средства Поиск решения
Содержание
193
196
196
197
200
203
204
206
207
210
212
215
217
218
224
225
10
Глава 7. Моделирование случайных величин
7.1. Средства Excel для генерирования случайных чисел
7.2. Метод обратных функций моделирования случайных величин
7.3. Метод суперпозиций
7.4. Метод отбора
7.5. Моделирование многомерных случайных величин
7.5.1. Моделирование зависимых случайных величин с известным
коэффициентом корреляции
229
229
234
238
242
244
245
ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК
249
Глава 8. Предварительный анализ
250
8.1. Цензурирование
8.1.1. Цензурирования на основе построения доверительных
интервалов
8.1.2. Непараметрическое цензурирование
8.1.3. Винзоризация выборки
8.2. Преобразование данных
8.2.1. Преобразование квадратного корня
8.2.2. Логарифмическое преобразование
8.2.3. Стандартизирующее преобразование
8.3. Построение гистограмм, полигонов и эмпирических функций
распределения
8.3.1. Построение гистограммы и эмпирической функции
распределения для дискретных случайных величин
8.3.2. Построение гистограммы и полигона для непрерывных
распределений
8.4. Вычисление точечных оценок параметров распределения
8.4.1. Точечные оценки дискретного распределения
8.4.2. Вычисление моды для непрерывных распределений
Глава 9. Подбор распределения
9.1. Предварительное определение класса распределения
9.1.1. Построение пробит/графиков
9.2. Подбор функции распределения на основе числовых характеристик
выборки
9.2.1. Критерии отклонения распределения от нормального
9.2.2. Критерий отклонения от распределения Пуассона
2
9.3. Критерий χ
2
9.3.1. Критерий χ для дискретных распределений
2
9.3.2. Критерий χ для непрерывных распределений
9.4. Критерий Колмогорова
Глава 10. Интервальное оценивание параметров распределения
10.1. Общие доверительные интервалы для математического ожидания
10.1.1. Общая модель при известной дисперсии
11
Содержание
250
251
257
258
263
263
265
267
267
268
273
278
283
285
286
286
288
291
293
296
297
297
299
304
307
307
307
10.1.2. Одномодальное симметричное распределение при известной
дисперсии
10.1.3. Общая модель с неизвестной дисперсией
10.2. Общий доверительный интервал для дисперсии
10.3. Интервальные оценки параметров нормального распределения
10.3.1. Интервальные оценки для неизвестного математического
ожидания при известной дисперсии
10.3.2. Интервальные оценки для неизвестного математического
ожидания при неизвестной дисперсии
10.3.3. Интервальные оценки для неизвестной дисперсии при
известном математическом ожидании
10.3.4. Интервальные оценки для неизвестной дисперсии при
неизвестном математическом ожидании
10.4. Оценка параметров логарифмически нормального распределения
10.5. Оценка параметра показательного распределения
10.6. Оценка параметров гамма/распределения
10.6.1. Оценка параметра λ при известном параметре α
10.6.2. Оценка параметра α при известном параметре λ
10.6.3. Совместная оценка параметров α и λ
10.7. Оценка параметров равномерного распределения
10.7.1. Оценка границы равномерного распределения
10.7.2. Оценка обеих границ равномерного распределения
10.8. Оценки параметра распределения Бернулли
10.8.1. Оценивание вероятности р по одному эксперименту
10.8.2. Оценивание вероятности р по нескольким экспериментам
10.8.3. Применение преобразования арксинуса
10.9. Оценка параметра распределения Пуассона
10.10. Оценки параметра геометрического распределения
10.11. Доверительные интервалы для квантилей
Глава 11. Проверка гипотез о параметрах распределений
308
308
310
312
312
313
315
315
317
318
319
320
321
322
323
323
324
324
325
327
328
329
331
333
335
11.1. Критерии проверки гипотез о параметрах нормального распределения
11.1.1. Критерий проверки значения математического ожидания
нормальной совокупности
11.1.2. Критерий проверки значения дисперсии нормальной
совокупности
11.2. Проверка гипотезы о значении параметра показательного
распределения
11.3. Проверка гипотезы о значении параметра биномиального
распределения
11.3.1. Использование биномиального распределения
11.3.2. Асимптотический критерий
11.4. Критерии проверки гипотез о значении медианы
11.4.1. Критерий знаков
11.4.2. Критерий знаковых рангов Уилкоксона
Содержание
335
335
337
339
341
341
343
343
344
346
12
Глава 12. Сравнение одномерных выборок
12.1. Сравнение выборочных распределений
12.1.1. Непараметрический критерий медианы
12.1.2. Критерий Уилкоксона–Манна–Уитни
12.1.3. Критерий Краскала–Уоллиса
12.1.4. Критерий серий Вальда–Вольфовица
2
12.1.5. Критерий χ
12.1.6. Критерий Смирнова
12.2. Доверительные интервалы для параметров распределений
12.2.1. Доверительный интервал для разности средних нормальных
совокупностей (равные дисперсии)
12.2.2. Доверительный интервал для разности средних нормальных
совокупностей (разные дисперсии)
12.2.3. Доверительный интервал для отношения дисперсий
нормальных совокупностей
12.2.4. Доверительный интервал для разности двух биномиальных
вероятностей
12.3. Проверка гипотез о параметрах распределений
12.3.1. Проверка гипотез о математических ожиданиях
нормальных распределений
12.3.2. Проверка гипотез о дисперсиях нормальных распределений
12.3.3. Непараметрический критерий Ансари–Бредли проверки
гипотезы о равенстве дисперсий
12.3.4. Проверка гипотез о равенстве биномиальных вероятностей
349
349
350
355
357
359
360
362
364
364
365
366
367
368
368
374
378
380
ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ
381
Глава 13. Корреляционный анализ
382
13.1. Критерии независимости
13.1.1. Критерий независимости на основе преобразования Фишера
13.1.2. Критерий независимости для двумерных нормальных
совокупностей
13.1.3. Критерий независимости на основе рангового коэффициента
корреляции Спирмена
13.1.4. Критерий независимости на основе рангового коэффициента
корреляции Кендалла
13.1.5. Критерий независимости для многомерных выборок
13.1.6. Критерий независимости на основе таблиц сопряженности
13.2. Оценивание коэффициента корреляции
13.2.1. Доверительные интервалы для коэффициента корреляции
13.2.2. Доверительные интервалы для коэффициента корреляции
нормальной совокупности
13.3. Критерии проверки гипотез о значениях коэффициента
корреляции
13.3.1. Критерий проверки значения коэффициента корреляции
13
Содержание
382
383
384
385
386
389
390
393
393
394
396
396
13.3.2. Критерий проверки равенства двух коэффициентов
корреляции
13.3.3. Критерий проверки равенства нескольких коэффициентов
корреляции
Глава 14. Сравнение зависимых выборок
397
399
400
14.1. Доверительные интервалы для разности математических
ожиданий нормальных совокупностей
14.1.1. Доверительный интервал для разности математических
ожиданий
14.1.2. Доверительный интервал для математических ожиданий
нескольких совокупностей
14.2. Критерии проверки гипотез о равенстве математических ожиданий
14.2.1. Парный критерий Стьюдента
14.2.2. Непараметрический критерий знаков
14.2.3. Непараметрический критерий Уилкоксона
14.3. Дисперсионный анализ для зависимых выборок
14.3.1. Двухфакторный дисперсионный анализ
14.3.2. Двухфакторный дисперсионный анализ Фридмана
14.3.3. Критерий множественных сравнений Шеффе для зависимых
выборок
Глава 15. Регрессионный анализ
400
400
401
403
404
405
407
408
409
411
415
417
15.1. Построение функции регрессии
15.2. Адекватность уравнения регрессии
15.3. Доверительные интервалы и проверка гипотез для коэффициентов
функции регрессии
15.4. Доверительный интервал для значения прогноза
418
420
422
423
Литература
427
Предметный указатель
429
Содержание
14
Предисловие
Ñ
åãîäíÿ â ðàçëè÷íûõ ñôåðàõ îáùåñòâåííîé æèçíè ê ñòàòèñòè÷åñêèì ìåòîäàì
ïðîÿâëÿåòñÿ ïîâûøåííûé èíòåðåñ êàê ê îäíîìó èç âàæíåéøèõ àíàëèòè÷åñêèõ èíñòðóìåíòîâ äëÿ ïîääåðæêè ïðîöåññîâ ïðèíÿòèÿ ðåøåíèé. Ñòàòèñòèêîé
ïîëüçóþòñÿ âñå: îò áèçíåñìåíîâ, ñòðåìÿùèõñÿ îïòèìèçèðîâàòü ïðèáûëü îò èíâåñòèöèé, äî ïîëèòèêîâ, æåëàþùèõ ïðåäñêàçàòü èñõîä âûáîðîâ, èëè ñîöèîëîãîâ,
îöåíèâàþùèõ äîâåðèå èçáèðàòåëåé ê ýòèì ïîëèòèêàì, íå ãîâîðÿ óæå î òðàäèöèîííûõ îáëàñòÿõ ïðèìåíåíèÿ ìàòåìàòè÷åñêîé ñòàòèñòèêè — íàóêå, òåõíèêå, ýêîíîìèêå. Î÷åâèäíî, ÷òî, êàê ïðàâèëî, ñòàòèñòè÷åñêèìè ìåòîäàìè â ñâîåé äåÿòåëüíîñòè ïîëüçóþòñÿ íå ïðîôåññèîíàëû-ñòàòèñòèêè (ãäå íàáðàòü ñòîëüêî
ïðîôåññèîíàëîâ!), à “îáû÷íûå” ïðîôåññèîíàëû â ñâîåé îáëàñòè, êîòîðûå, âîçìîæíî, êîãäà-òî “ïðîõîäèëè” â ñâîèõ óíèâåðñèòåòàõ êóðñ ìàòåìàòè÷åñêîé ñòàòèñòèêè, íî “ýòî áûëî òàê äàâíî, ÷òî ñòàëî íåïðàâäîé”.
Ìîé äîñòàòî÷íî áîëüøîé îïûò ïðèìåíåíèÿ ñòàòèñòè÷åñêèõ ìåòîäîâ â ñîâìåñòíîé ðàáîòå ñ áèîëîãàìè, ìåäèêàìè è â ïîñëåäíèå ãîäû ñ ýêîíîìèñòàìè ïîêàçûâàåò, ÷òî ðàñïðîñòðàíåííîå ìíåíèå î ñòàòèñòèêå êàê îá îäíîé èç ðàçíîâèäíîñòåé ëæè èäåò îò íåïðàâîìåðíîãî ïðèìåíåíèÿ òåõ èëè èíûõ ñòàòèñòè÷åñêèõ
ìåòîäîâ â êîíêðåòíûõ ñèòóàöèÿõ. Äàæå îáùåóïîòðåáèòåëüíûé è “áåçîïàñíûé”
êðèòåðèé Ñòüþäåíòà, ïðèìåíåííûé áåçäóìíî, íàïðèìåð, ê âûáîðêàì èç äèñêðåòíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, ìîæåò â íåêîòîðûõ ñëó÷àÿõ ïîêàçàòü óäèâèòåëüíûå ðåçóëüòàòû. Ñ äðóãîé ñòîðîíû, ïî÷òè âî âñåé ëèòåðàòóðå ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå, âêëþ÷àÿ ïðàêòè÷åñêèå ðóêîâîäñòâà, ìàòåðèàë èçëàãàåòñÿ
òàêèì îáðàçîì, ÷òî ñíà÷àëà èäåò “òåîðèÿ”, íàïðèìåð îñíîâû ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, à çàòåì â êà÷åñòâå èëëþñòðàöèè ê “òåîðèè” ïðåäëàãàåòñÿ
íåñêîëüêî ïðàêòè÷åñêèõ ìåòîäîâ.  òàêîì ñëó÷àå ïðàêòèêó âåñüìà ñëîæíî âûáðàòü íåîáõîäèìûå ìåòîäû ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà, ñðàâíèòü ýòè
ìåòîäû è òåì áîëåå îáîñíîâàòü èõ ïðèìåíåíèå. (Ðåäêèì èñêëþ÷åíèåì â îáùåì
ðÿäó òàêîé ñòàòèñòè÷åñêîé ëèòåðàòóðû ÿâëÿåòñÿ êíèãà Äæ. Ïîëëàðäà Ñïðàâî÷íèê ïî âû÷èñëèòåëüíûì ìåòîäàì ñòàòèñòèêè, â êîòîðîé ïðåäñòàâëåíû ïðàêòè÷åñêèå ìåòîäû ñòàòèñòèêè è îïèñàíèå îáëàñòè ïðèìåíèìîñòè êàæäîãî èç íèõ.)
Ýòà êíèãà çàäóìûâàëàñü è íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî èñïîëüçóþòñÿ íà ïðàêòèêå è ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà
ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Òàêèì îáðàçîì, îòäåëüíî îïèñàíû ìåòîäû äëÿ àíàëèçà îäíîìåðíûõ
âûáîðîê, îòäåëüíî — äëÿ çàâèñèìûõ íàáëþäåíèé è ò.ä. Ìåòîäû ïðåäñòàâëåíû
â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî
ïðîñòî ðåàëèçîâàòü ïðàêòèêè (íåîáÿçàòåëüíî ïðîôåññèîíàëû-ñòàòèñòèêè), êîòîðûì
íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ.
 ýòîé ñâÿçè íåîáõîäèìî îòìåòèòü âûáîð ýëåêòðîííîé òàáëèöû Excel êàê ñðåäñòâà ðåàëèçàöèè ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà. Ñóùåñòâóåò ìíîæåñòâî ñïåöèàëèçèðîâàííûõ ïðîãðàììíûõ ñðåäñòâ äëÿ ñòàòèñòè÷åñêèõ ðàñ÷åòîâ: îòå÷åñòâåííûå
STADIA, ÑÈÃÀÌÄ, ÎËÈÌÏ:ÑòàòÝêñïåðò èëè çàðóáåæíûå STATGRAPHICS,
STATISTICA, SPSS è îáùåìàòåìàòè÷åñêèå ïàêåòû (íàïðèìåð, Mathcad, Mathlab,
Maple), êîòîðûå òàêæå èìåþò âñòðîåííûå ñòàòèñòè÷åñêèå ñðåäñòâà. Íî íàèáîëüøåå ðàñïðîñòðàíåíèå êàê ñðåäñòâî ïðîâåäåíèÿ ðàçëè÷íûõ ðàñ÷åòîâ, â òîì ÷èñëå
è ñòàòèñòè÷åñêèõ, â íàñòîÿùåå âðåìÿ ïîëó÷èëè ýëåêòðîííûå òàáëèöû, ñðåäè êîòîðûõ áåçóñëîâíûì ëèäåðîì ÿâëÿåòñÿ Microsoft Excel. Ýòà ýëåêòðîííàÿ òàáëèöà
âõîäèò â ïàêåò Microsoft Office, êîòîðûé óñòàíîâëåí ïðàêòè÷åñêè íà êàæäîì
êîìïüþòåðå. Microsoft Excel èìååò äîñòàòî÷íîå êîëè÷åñòâî âñòðîåííûõ ñòàòèñòè÷åñêèõ ñðåäñòâ, âêëþ÷àÿ íàäñòðîéêó Пакет анализа è ïîðÿäêà 80 ñòàòèñòè÷åñêèõ
ôóíêöèé. Ýòî îáóñëîâèëî âûáîð Excel â êà÷åñòâå îñíîâíîãî ñðåäñòâà äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Íåñìîòðÿ íà òî ÷òî â êíèãå âñå ïðèìåðû ðåàëèçîâàíû â Excel 2002, îíè áåç ñóùåñòâåííûõ èçìåíåíèé ìîãóò áûòü ïåðåíåñåíû íà
äðóãèå âåðñèè Excel, íà÷èíàÿ ñ Excel 97 è çàêàí÷èâàÿ Excel 2003.
Õîòÿ êíèãà çàäóìûâàëàñü òîëüêî êàê ñáîðíèê ñòàòèñòè÷åñêèõ ìåòîäîâ, îêàçàëîñü íåâîçìîæíûì îáîéòèñü áåç ââîäíîé ÷àñòè, ïîñâÿùåííîé îñíîâàì òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, è ñïåöèàëüíîé ÷àñòè, îïèñûâàþùåé
ñòàòèñòè÷åñêèå âîçìîæíîñòè Excel. Ïîýòîìó êíèãà ñîñòîèò èç ÷åòûðåõ ÷àñòåé.
 ÷àñòè I, Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Âåñü ìàòåðèàë ýòîé ÷àñòè ïðåäñòàâëåí êîíñïåêòèâíî;
çäåñü ïðèâåäåíû âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå ïîçâîëÿò ÷èòàòåëþ âïîëíå îñîçíàííî è ïðîäóêòèâíî ïðèìåíÿòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ ÷àñòÿõ êíèãè.
Êîíå÷íî, ýòà ÷àñòü ñîâñåì íå ïðåäíàçíà÷åíà äëÿ òîãî, ÷òîáû ïî íåé èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî), êàê òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. Åå ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íîå ïîñîáèå, ê êîòîðîìó ðàíî èëè
ïîçäíî áóäåò âûíóæäåí îáðàòèòüñÿ êàê ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, òàê è ñïåöèàëèñò-ñòàòèñòèê (ó ëþáîãî
ñïåöèàëèñòà ðàíî èëè ïîçäíî âîçíèêàåò íåîáõîäèìîñòü âåðíóòüñÿ ê “èñòîêàì” —
áàçîâûì ïîíÿòèÿì). Êðîìå òîãî, ìàòåðèàë ýòîé ÷àñòè èñïîëüçóåòñÿ â ÷àñòè II
äëÿ ññûëîê ïðè îïèñàíèè ñòàòèñòè÷åñêèõ ñðåäñòâ Excel.
 ÷àñòè II, Ñðåäñòâà Excel äëÿ ñòàòèñòè÷åñêîãî àíàëèçà, îïèñàíû âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ïðåäïîëàãàåòñÿ, ÷òî ÷èòàòåëü
çíàêîì ñ îñíîâàìè ðàáîòû â ýòîé ýëåêòðîííîé òàáëèöå õîòÿ áû â ñëåäóþùåì îáúåìå: îí ìîæåò ââîäèòü è ðåäàêòèðîâàòü äàííûå, ñîçäàâàòü ôîðìóëû, èñïîëüçîâàòü
ôóíêöèè, ñòðîèòü äèàãðàììû è ãðàôèêè, ôîðìàòèðîâàòü ðàáî÷èé ëèñò è ò.ï. Ýòî
áàçîâûå íàâûêè ðàáîòû ñ Excel, êîòîðûå èçâåñòíû êàæäîìó, êòî ïðîñëóøàë êóðñ
èíôîðìàòèêè è âû÷èñëèòåëüíîé òåõíèêè (è ïðè ýòîì, êîíå÷íî, óñâîèë íåîáõîäèìûå çíàíèÿ) â ëþáîì âóçå ëþáîãî ïðîôèëÿ.  ýòîé ÷àñòè äîñòàòî÷íî ïîëíî îïèñàíû ñòàòèñòè÷åñêèå ôóíêöèè è ñðåäñòâà, ïðåäîñòàâëÿåìûå íàäñòðîéêîé Пакет
анализа. Ê ñîæàëåíèþ, ñïðàâî÷íàÿ ñèñòåìà Excel íàñòîëüêî íåïîëíî è íåâíÿòíî
(è äàæå ñ îøèáêàìè!) ïðåäñòàâëÿåò ýòè ôóíêöèè è ñðåäñòâà, ÷òî íåîáõîäèìîñòü èõ
ïîëíîãî îïèñàíèÿ î÷åâèäíà. (Ñëåäóåò îòìåòèòü, ÷òî â Excel 2003 ñïðàâî÷íàÿ ñèñòåìà íàïèñàíà áîëåå ïðîôåññèîíàëüíî, ïðè ýòîì èñïðàâëåíû íåêîòîðûå îøèáêè.)
Êðîìå ñòàòèñòè÷åñêèõ ôóíêöèé è ñðåäñòâ ïàêåòà àíàëèçà, â äàííîé ÷àñòè ðàññìîòðåíû îáùèå ñðåäñòâà è íàäñòðîéêè Excel, êîòîðûå “íå çàÿâëåíû” êàê èìåþùèå
íåïîñðåäñòâåííîå îòíîøåíèå ê ñòàòèñòè÷åñêèì ìåòîäàì, íî êîòîðûå òàêæå ìîæíî
èñïîëüçîâàòü â ñòàòèñòè÷åñêîì àíàëèçå. Ýòî ôîðìóëû ìàññèâîâ, ñïåöèàëüíîãî âèäà
16
Предисловие
äèàãðàììû è ãðàôèêè, à òàêæå íàäñòðîéêà Поиск решения.  êîíöå ÷àñòè îïèñàíû
ñïîñîáû ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí â Excel.
 ÷àñòè III, Àíàëèç îäíîìåðíûõ âûáîðîê, ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê, ðàññìîòðåíû âîïðîñû ïðåäâàðèòåëüíîé îáðàáîòêè äàííûõ è ïîäáîðà ðàñïðåäåëåíèé ïî
èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì, à òàêæå ïðèâåäåíû ìåòîäû èíòåðâàëüíîãî
îöåíèâàíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ
ýòèõ ïàðàìåòðîâ. Ïîñëåäíÿÿ ãëàâà ÷àñòè ïîñâÿùåíà ñðàâíåíèþ ðàñïðåäåëåíèé
íåñêîëüêèõ îäíîìåðíûõ âûáîðîê.
 ÷àñòè IV, Ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé, îïèñàíû ìåòîäû àíàëèçà
ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, êîòîðûå âêëþ÷àþò â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ. Çäåñü ðàññìîòðåíû ìåòîäû êîððåëÿöèîííîãî àíàëèçà, ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè, à òàêæå ïîêàçàíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ
ðàñïðåäåëåíèé çàâèñèìûõ êîìïîíåíòîâ ìíîãîìåðíûõ âûáîðîê. Â ïîñëåäíåé ãëàâå
îïèñàí ðÿä çàäà÷, ñâÿçàííûõ ñ ïîñòðîåíèåì ðåãðåññèé, íà÷èíàÿ ñ îáùåé âû÷èñëèòåëüíîé ñõåìû îïðåäåëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè è çàêàí÷èâàÿ
êðèòåðèÿìè ïðîâåðêè àäåêâàòíîñòè ïîñòðîåííîãî óðàâíåíèÿ ðåãðåññèè. Õîòÿ ÷èñëî
ðàññìîòðåííûõ â ýòîé ÷àñòè ìåòîäîâ äîñòàòî÷íî âåëèêî è ñàìè ìåòîäû âåñüìà ãðîìîçäêè, ÷àñòü ïîëó÷èëàñü íà óäèâëåíèå íåáîëüøîé. “Âèíîé” ýòîìó Excel, â êîòîðîé åñòü ïðàêòè÷åñêè âñå ñðåäñòâà, íåîáõîäèìûå äëÿ ðåàëèçàöèè äàííûõ ìåòîäîâ.
 êîíöå êíèãè ïðèâåäåí íåáîëüøîé ñïèñîê ëèòåðàòóðû, íà êîòîðóþ åñòü
ññûëêè â òåêñòå èëè êîòîðàÿ ìîæåò äîïîëíèòü îïðåäåëåííûå òåìû, îñâåùåííûå
íåäîñòàòî÷íî ïîëíî.
ß áóäó ïðèçíàòåëåí âñåì, êòî ïîäåëèòñÿ ñâîèìè ñîîáðàæåíèÿìè ïî óëó÷øåíèþ ñîäåðæàíèÿ êíèãè è ñòèëÿ èçëîæåíèÿ ìàòåðèàëà, à òàêæå óêàæåò íà âîçìîæíûå îøèáêè (ê ñîæàëåíèþ, â êíèãàõ, ñîäåðæàùèõ áîëåå ñòà ôîðìóë, âåðîÿòíîñòü îøèáîê âñåãäà îòëè÷íà îò íóëÿ). Ìîé àäðåñ ýëåêòðîííîé ïî÷òû —
aminko@dialektika.com.
À.À. Ìèíüêî
Предисловие
17
От издательства “Диалектика”
Âû, ÷èòàòåëü ýòîé êíèãè, è åñòü ãëàâíûé åå êðèòèê. Ìû öåíèì âàøå ìíåíèå
è õîòèì çíàòü, ÷òî áûëî ñäåëàíî íàìè ïðàâèëüíî, ÷òî ìîæíî áûëî ñäåëàòü ëó÷øå è ÷òî åùå âû õîòåëè áû óâèäåòü èçäàííûì íàìè. Íàì èíòåðåñíî óñëûøàòü
è ëþáûå äðóãèå çàìå÷àíèÿ, êîòîðûå âàì õîòåëîñü áû âûñêàçàòü â íàø àäðåñ.
Ìû æäåì âàøèõ êîììåíòàðèåâ è íàäååìñÿ íà íèõ. Âû ìîæåòå ïðèñëàòü íàì
áóìàæíîå èëè ýëåêòðîííîå ïèñüìî ëèáî ïðîñòî ïîñåòèòü íàø Web-ñåðâåð è îñòàâèòü ñâîè çàìå÷àíèÿ òàì. Îäíèì ñëîâîì, ëþáûì óäîáíûì äëÿ âàñ ñïîñîáîì äàéòå íàì çíàòü, íðàâèòñÿ ëè âàì ýòà êíèãà, à òàêæå âûñêàæèòå ñâîå ìíåíèå î òîì,
êàê ñäåëàòü íàøè êíèãè áîëåå èíòåðåñíûìè äëÿ âàñ.
Ïîñûëàÿ ïèñüìî èëè ñîîáùåíèå, íå çàáóäüòå óêàçàòü íàçâàíèå êíèãè è åå àâòîðîâ, à òàêæå âàø îáðàòíûé àäðåñ. Ìû âíèìàòåëüíî îçíàêîìèìñÿ ñ âàøèì
ìíåíèåì è îáÿçàòåëüíî ó÷òåì åãî ïðè îòáîðå è ïîäãîòîâêå ê èçäàíèþ ïîñëåäóþùèõ êíèã. Íàøè êîîðäèíàòû:
E-mail:
info@dialektika.com
WWW:
http://www.dialektika.com
Èíôîðìàöèÿ äëÿ ïèñåì èç:
18
Ðîññèè:
115419, Ìîñêâà, à/ÿ 783
Óêðàèíû:
03150, Êèåâ, à/ÿ 152
Предисловие
Часть I
Основные понятия
теории вероятностей
и математической
статистики
В этой части...
Ãëàâà 1. Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé
Ãëàâà 2. Îñíîâíûå ñòàòèñòè÷åñêèå ìåòîäû
Ãëàâà 3. Àíàëèç ñòàòèñòè÷åñêèõ çàâèñèìîñòåé
Â
ãëàâå 1 ýòîé ÷àñòè ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé. Ìàòåðèàë ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðåäñòàâëåí â äâóõ
ãëàâàõ: â ãëàâå 2 ïðèâîäÿòñÿ îáùèå ñâåäåíèÿ ïî ñòàòèñòèêå (áîëüøàÿ ÷àñòü ýòîé
ãëàâû ïîñâÿùåíà èíòåðâàëüíîìó îöåíèâàíèþ è ïðîâåðêå ãèïîòåç), â ãëàâå 3 îïèñûâàåòñÿ ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé. Âåñü ìàòåðèàë ïðåäñòàâëåí êîíñïåêòèâíî è ïðåäíàçíà÷åí ñêîðåå äëÿ òîãî, ÷òîáû “îñâåæèòü” â ïàìÿòè ÷èòàòåëÿ
òåîðèþ âåðîÿòíîñòåé è ìàòåìàòè÷åñêóþ ñòàòèñòèêó, íî, êîíå÷íî, ñîâñåì íå äëÿ
òîãî, ÷òîáû ïî ýòèì ãëàâàì èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî). Âìåñòå ñ òåì
ëþáîé ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, íàéäåò çäåñü âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû
è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå äàäóò åìó âîçìîæíîñòü âïîëíå îñîçíàííî
è ïðîäóêòèâíî ïðèìåíèòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ
÷àñòÿõ êíèãè. Ñïåöèàëèñò-ñòàòèñòèê ìîæåò èñïîëüçîâàòü ìàòåðèàë ýòîé ÷àñòè
â êà÷åñòâå ñïðàâî÷íîãî ïîñîáèÿ.
Глава
1
Основные понятия теории
вероятностей
Â
äàííîé ãëàâå ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé, íåîáõîäèìûå äëÿ èçëîæåíèÿ îñíîâ ìàòåìàòè÷åñêîé ñòàòèñòèêè â ïîñëåäóþùèõ ãëàâàõ. Çíà÷èòåëüíàÿ ÷àñòü ãëàâû ïîñâÿùåíà ïðèìåðàì âåðîÿòíîñòíûõ ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî
àíàëèçà, â òîì ÷èñëå ïðèâåäåíî ïîëíîå îïèñàíèå ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ýòó ÷àñòü ãëàâû ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íûé ìàòåðèàë ïî âåðîÿòíîñòíûì ðàñïðåäåëåíèÿì.
1.1. Понятия случайного события и случайной
величины
Ñðåäè îñíîâíûõ ïîíÿòèé òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè
ïîíÿòèÿ îïûò (ýêñïåðèìåíò) è ñîáûòèå ÿâëÿþòñÿ ôóíäàìåíòàëüíûìè. Áóäåì
íàçûâàòü îïûòîì íàáëþäåíèå êàêîãî-ëèáî ÿâëåíèÿ ïðè âûïîëíåíèè íåêîòîðîãî
êîìïëåêñà óñëîâèé, êîòîðûé äîëæåí êàæäûé ðàç ñòðîãî âûïîëíÿòüñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Íàáëþäåíèå òîãî æå ÿâëåíèÿ ïðè äðóãîì êîìïëåêñå
óñëîâèé áóäåò óæå äðóãèì îïûòîì. Ðåçóëüòàò ñëó÷àéíîãî îïûòà íå èçâåñòåí äî
åãî îêîí÷àíèÿ. Äàëåå áóäåì èìåòü äåëî òîëüêî ñî ñëó÷àéíûì îïûòîì.
Ðåçóëüòàòû ñëó÷àéíîãî îïûòà ìîæíî îõàðàêòåðèçîâàòü êà÷åñòâåííî è êîëè÷åñòâåííî. Êà÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â ðåãèñòðàöèè êàêîãî-ëèáî
ôàêòà. Ëþáîé òàêîé ôàêò íàçûâàåòñÿ ñëó÷àéíûì ñîáûòèåì. Ïðè ýòîì ãîâîðÿò,
÷òî “ñîáûòèå ïðîèçîøëî (ïîÿâèëîñü)” èëè “ñîáûòèå íå ïðîèçîøëî (íå ïîÿâèëîñü)” â ðåçóëüòàòå ñëó÷àéíîãî îïûòà.
Ïðèìåðàìè ñîáûòèé ìîãóò ñëóæèòü âûïàäåíèå ðåøêè ïðè áðîñàíèè ìîíåòû
èëè öèôðû “3” ïðè áðîñàíèè èãðàëüíîé êîñòè, îòêàç ïðèáîðà â çàäàííîì èíòåðâàëå âðåìåíè, ïîïàäàíèå èëè ïðîìàõ ïðè âûñòðåëå, ïîëó÷åíèå m ïîïàäàíèé ïðè
n âûñòðåëàõ è ò.ä. Èòàê, ñëó÷àéíûì ñîáûòèåì (èëè ïðîñòî “ñîáûòèåì”) íàçûâàåòñÿ
âñÿêèé ôàêò, êîòîðûé â ðåçóëüòàòå îïûòà ìîæåò ïðîèçîéòè èëè íå ïðîèçîéòè.
Êîëè÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â îïðåäåëåíèè çíà÷åíèé íåêîòîðûõ âåëè÷èí, ïîëó÷åííûõ â ðåçóëüòàòå îïûòà. Âåëè÷èíû, êîòîðûå ìîãóò ïðèíèìàòü â ðåçóëüòàòå îïûòà ðàçëè÷íûå çíà÷åíèÿ, ïðè÷åì äî îïûòà íåâîçìîæíî
ïðåäâèäåòü, êàêèìè èìåííî îíè áóäóò, íàçûâàþòñÿ ñëó÷àéíûìè âåëè÷èíàìè.
Ïðèìåðàìè ñëó÷àéíûõ âåëè÷èí ìîãóò ñëóæèòü êàê ðåçóëüòàòû, òàê è îøèáêè
èçìåðåíèé, âðåìÿ áåçîòêàçíîé ðàáîòû ïðèáîðà èëè ñèñòåìû, ðîñò è âåñ íàóãàä
âûáðàííîãî ÷åëîâåêà, ÷èñëî ïîïàäàíèé ïðè n âûñòðåëàõ è ò.ä.
20
Часть I. Основные понятия теории вероятностей и математической статистики
Ñ êàæäîé ñëó÷àéíîé âåëè÷èíîé ìîæíî ñâÿçàòü ðàçëè÷íûå ñëó÷àéíûå ñîáûòèÿ.
Òèïè÷íûì ñîáûòèåì, ñâÿçàííûì ñî ñëó÷àéíîé âåëè÷èíîé, ÿâëÿåòñÿ ñîáûòèå, ñîñòîÿùåå â òîì, ÷òî ýòà ñëó÷àéíàÿ âåëè÷èíà ïðèìåò â ðåçóëüòàòå îïûòà êàêîå-ëèáî
çíà÷åíèå, ïðèíàäëåæàùåå çàäàííîìó ÷èñëîâîìó ìíîæåñòâó. Êðàòêî òàêîå ñîáûòèå
íàçûâàåòñÿ ïîïàäàíèåì ñëó÷àéíîé âåëè÷èíû â äàííîå ìíîæåñòâî çíà÷åíèé.
1.1.1. Вероятности
Åñòåñòâåííî ñðàâíèâàòü ñîáûòèÿ ïî òîìó, êàê ÷àñòî êàæäîå èç íèõ ïîÿâëÿåòñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Åñëè ïðè ïîâòîðåíèè îïûòà îäíî ñîáûòèå ïîÿâëÿåòñÿ ÷àùå, ÷åì äðóãîå, òî ãîâîðÿò, ÷òî ïåðâîå ñîáûòèå âåðîÿòíåå âòîðîãî.
Ïðè ýòîì ÿñíî, ÷òî äëÿ ñðàâíåíèÿ ñîáûòèé íåîáõîäèìî ïðåäïîëîæèòü, ÷òî äàííûé îïûò ìîæíî ïðîâîäèòü ñêîëüêî óãîäíî ðàç ïðè ñîáëþäåíèè îäíîãî è òîãî
æå êîìïëåêñà óñëîâèé.
×àñòîòîé ïîÿâëåíèÿ ñîáûòèÿ À íàçûâàåòñÿ îòíîøåíèå ÷èñëà åãî ïîÿâëåíèé
ê ÷èñëó âñåõ ïðîâåäåííûõ îïûòîâ. Òàêèì îáðàçîì, åñëè â n îïûòàõ ñîáûòèå À
ïîÿâèëîñü m ðàç, òî ÷àñòîòà åãî ïîÿâëåíèÿ â äàííîé ñåðèè îïûòîâ ðàâíà m/n.
Âàæíûì ýêñïåðèìåíòàëüíî óñòàíîâëåííûì ôàêòîì ÿâëÿåòñÿ ñâîéñòâî óñòîé÷èâîñòè ÷àñòîò. Ïðè óâåëè÷åíèè ÷èñëà îïûòîâ ÷àñòîòû ñîáûòèé êîëåáëþòñÿ îêîëî
íåêîòîðûõ ÷èñåë, íå çàâèñÿùèõ íè îò êîëè÷åñòâà, íè îò ñåðèè îïûòîâ, ïðè÷åì
÷àñòîòû íåîãðàíè÷åííî ïðèáëèæàþòñÿ ê ýòèì ÷èñëàì, êîãäà ÷èñëî îïûòîâ ñòðåìèòñÿ ê áåñêîíå÷íîñòè. ( òåîðèè âåðîÿòíîñòåé ýòîò ôàêò íàçûâàåòñÿ çàêîíîì
áîëüøèõ ÷èñåë.  êà÷åñòâå èëëþñòðàöèè íà ðèñ. 1.1 ïîêàçàíà ðàáî÷àÿ êíèãà Excel,
ãäå ñìîäåëèðîâàíî 1 000 ïîäáðàñûâàíèé ìîíåòû è ïîñòðîåí ãðàôèê ÷àñòîò âûïàäåíèÿ ãåðáà.) Ýòè ÷èñëà åñòåñòâåííî ñâÿçàòü ñ êàæäûì ñîáûòèåì, ïðîèñõîäÿùèì
â ñëó÷àéíîì îïûòå. Îíè íàçûâàþòñÿ âåðîÿòíîñòÿìè è â òåîðèè âåðîÿòíîñòåé
îïðåäåëÿþòñÿ ÷èñòî àêñèîìàòè÷åñêè. Âåðîÿòíîñòü ñîáûòèÿ À îáîçíà÷àåòñÿ êàê
Ð(À) è ìîæåò ïðèíèìàòü ëþáûå çíà÷åíèÿ îò íóëÿ äî åäèíèöû: 0 ≤ Ð(À) ≤ 1.
Ðèñ. 1.1. Ìîäåëü ïîäáðàñûâàíèÿ ìîíåòû è ãðàôèê ÷àñòîòû âûïàäåíèÿ ãåðáà
Глава 1. Основные понятия теории вероятностей
21
1.1.2. Алгебра случайных событий
Ïðèâåäåì íåêîòîðûå âàæíûå îïðåäåëåíèÿ è òåîðåìû àëãåáðû ñëó÷àéíûõ
ñîáûòèé.
Ðàçëè÷àþò ñëåäóþùèå âèäû ñëó÷àéíûõ ñîáûòèé. Äîñòîâåðíûì íàçûâàåòñÿ
ñîáûòèå U, êîòîðîå â ðåçóëüòàòå îïûòà íåïðåìåííî äîëæíî ïðîèçîéòè, â ýòîì
ñëó÷àå Ð(U) = 1. Íåâîçìîæíûì íàçûâàåòñÿ ñîáûòèå V, êîòîðîå â ðåçóëüòàòå
îïûòà íå ìîæåò ïðîèçîéòè íèêîãäà; òîãäà Ð(V) = 0. Ñîáûòèå } íàçûâàåòñÿ ïðîòèâîïîëîæíûì ñîáûòèþ À, åñëè îíî ñîñòîèò â íåïîÿâëåíèè ñîáûòèÿ À. Ñóììà
âåðîÿòíîñòåé ïðîòèâîïîëîæíûõ ñîáûòèé âñåãäà ðàâíà åäèíèöå: Ð(}) + Ð(À) = 1.
Íàïðèìåð, ïðè ïîäáðàñûâàíèè ìîíåòû ìîæåò ïðîèçîéòè òîëüêî îäíî èç äâóõ ñîáûòèé (âûïàäåíèå îðëà èëè âûïàäåíèå ðåøêè), êîòîðûå íå ìîãóò ïðîèçîéòè îäíîâðåìåííî. Ïîýòîìó äàííûå ñîáûòèÿ ïðîòèâîïîëîæíû.
Íåñêîëüêî ñîáûòèé â äàííîì îïûòå íàçûâàþòñÿ íåñîâìåñòíûìè èëè âçàèìîèñêëþ÷àþùèìè, åñëè íèêàêèå äâà èç íèõ íå ìîãóò ïîÿâèòüñÿ âìåñòå. Êëàññè÷åñêèé ïðèìåð íåñîâìåñòíûõ ñîáûòèé: 6 ñîáûòèé, ñîñòîÿùèõ â òîì, ÷òî ïðè áðîñàíèè èãðàëüíîãî êóáèêà ïîÿâÿòñÿ öèôðû 1, 2, 3, 4, 5 èëè 6 ñîîòâåòñòâåííî.
Ñóììà âåðîÿòíîñòåé âñåõ íåñîâìåñòíûõ ñîáûòèé, ñâÿçàííûõ ñ òåì èëè èíûì
îïûòîì, ðàâíà åäèíèöå (â òàêîì ñëó÷àå ãîâîðÿò, ÷òî ýòè ñîáûòèÿ ñîñòàâëÿþò
ïîëíóþ ãðóïïó ñîáûòèé). Åñëè À1, À2, ..., Àn — íåñîâìåñòíûå ñîáûòèÿ, òî
Ð(À1 èëè À2 èëè ... èëè Àn) = Ð(À1) + Ð(À2) + ... + Ð(Àn).
Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé ñëîæåíèÿ âåðîÿòíîñòåé.
 ëåâîé ÷àñòè ïîñëåäíåãî ðàâåíñòâà çàïèñàíà âåðîÿòíîñòü ñóììû ñîáûòèé:
ñóììîé (îáúåäèíåíèåì) äâóõ ñîáûòèé À è  íàçûâàåòñÿ ñîáûòèå “À èëè ”
(òàêæå îáîçíà÷àåòñÿ êàê À +  èëè À J Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà,
êîãäà ïðîèñõîäèò èëè ñîáûòèå À, èëè ñîáûòèå Â. Àíàëîãè÷íî îïðåäåëÿåòñÿ ñóììà ëþáîãî ÷èñëà ñîáûòèé.  àëãåáðå ñëó÷àéíûõ ñîáûòèé ââîäèòñÿ åùå îäíà îïåðàöèÿ íàä ñîáûòèÿìè. Ïðîèçâåäåíèåì (ïåðåñå÷åíèåì) ñîáûòèé À è  íàçûâàåòñÿ
ñîáûòèå “À è ” (òàêæå îáîçíà÷àåòñÿ êàê À #  èëè À Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà, êîãäà ïðîèñõîäèò è ñîáûòèå À, è ñîáûòèå Â. Ïîäîáíûì îáðàçîì îïðåäåëÿåòñÿ ïðîèçâåäåíèå ëþáîãî ÷èñëà ñîáûòèé.
Ñîáûòèÿ À è Â íàçûâàþòñÿ íåçàâèñèìûìè, åñëè ïîÿâëåíèå îäíîãî èç íèõ íå
ìåíÿåò âåðîÿòíîñòè ïîÿâëåíèÿ äðóãîãî. Íàïðèìåð, íåçàâèñèìûìè áóäóò ñîáûòèÿ
“ïðè ïåðâîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 2” è “ïðè âòîðîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 5”. Åñëè À1, À2, ..., Àn — âçàèìíî íåçàâèñèìûå ñëó÷àéíûå ñîáûòèÿ, òî
Ð(À1 è À2 è ... è Àn) = Ð(À1)×Ð(À2)×...×Ð(Àn).
Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé óìíîæåíèÿ âåðîÿòíîñòåé.
1.1.3. Условные вероятности
Óñëîâíóþ âåðîÿòíîñòü ñîáûòèÿ À ïðè óñëîâèè, ÷òî ïðîèçîøëî ñîáûòèå Â,
îáîçíà÷àþò êàê Ð(À|Â). Ïðèâåäåì ôîðìóëó, ñâÿçûâàþùóþ âåðîÿòíîñòü ñîâìåñòíîãî ïîÿâëåíèÿ ñîáûòèé À è  è óñëîâíûå âåðîÿòíîñòè ýòèõ ñîáûòèé:
Ð(À è Â) = Ð(À) Ð(Â|À) = Ð(Â) Ð(À|Â).
Åñëè ñîáûòèÿ À è Â íåçàâèñèìû, òî Ð(À|Â) = Ð(À) è Ð(Â|À) = Ð(Â).
22
Часть I. Основные понятия теории вероятностей и математической статистики
Ïðèìåð 1. Èãðîê áðîñàåò ïÿòü ðàç ñèììåòðè÷íóþ ìîíåòó. Ñ÷èòàÿ, ÷òî ïîäáðàñûâàíèÿ íåçàâèñèìû, êàêîâà âåðîÿòíîñòü ñîáûòèÿ, ÷òî ãåðá âûïàäåò òî÷íî äâà ðàçà?
Ãåðá âûïàäåò òî÷íî äâà ðàçà òîëüêî ïðè ñëåäóþùèõ äåñÿòè âîçìîæíûõ ïîñëåäîâàòåëüíîñòÿõ âûïàäåíèÿ ãåðáà èëè ðåøêè (à — ãåðá, Ð — ðåøêà):
ÃÃÐÐÐ, ÃÐÃÐÐ, ÃÐÐÃÐ, ÃÐÐÐÃ, ÐÃÃÐÐ, ÐÃÐÃÐ, ÐÃÐÐÃ, ÐÐÃÃÐ, ÐÐÃÐÃ, ÐÐÐÃÃ.
Ïðè ëþáîì ïîäáðàñûâàíèè ìîíåòû âåðîÿòíîñòü âûïàäåíèÿ ãåðáà è âåðîÿòíîñòü âûïàäåíèÿ ðåøêè ðàâíû 1/32. Ïÿòü ïîäáðàñûâàíèé ìîíåòû íåçàâèñèìû.
Èç òåîðåìû óìíîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî âåðîÿòíîñòü ïîëó÷åíèÿ ïîñëåäîâàòåëüíîñòè ÃÃÐÐÐ ìîæíî ïîäñ÷èòàòü ñëåäóþùèì îáðàçîì:
Ð(ÃÃÐÐÐ) = Ð(Ã)·Ð(Ã)·Ð(Ð)·Ð(Ð)·Ð(Ð) = (1/2)5 = 1/32.
Äëÿ êàæäîé èç îñòàëüíûõ äåñÿòè ïîñëåäîâàòåëüíîñòåé âåðîÿòíîñòü òàêæå
ðàâíà 1/32. Êàæäàÿ èç ýòèõ äåñÿòè ïîñëåäîâàòåëüíîñòåé ñîäåðæèò ïî äâà âûïàäåíèÿ ãåðáà, è ýòè ïîñëåäîâàòåëüíîñòè ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè. Èç òåîðåìû ñëîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî èñêîìàÿ âåðîÿòíîñòü ïðåäñòàâëÿåò ñîáîé ñóììó ýòèõ äåñÿòè ðàâíûõ ìåæäó ñîáîé âåðîÿòíîñòåé, ò.å. îíà ðàâíà 10/32.
Àíàëîãè÷íî ìîæíî ïîêàçàòü, ÷òî âåðîÿòíîñòü ñîáûòèÿ “ãåðá íå âûïàäåò íè ðàçó” ðàâíà 1/32; âåðîÿòíîñòü òîãî, ÷òî ãåðá âûïàäåò ðîâíî îäèí ðàç, ðàâíà 5/32; âåðîÿòíîñòü âûïàäåíèÿ ãåðáà ðîâíî òðè ðàçà ðàâíà 10/32; âåðîÿòíîñòè òîãî, ÷òî
ãåðá âûïàäåò òî÷íî 4 è 5 ðàç, ðàâíû 5/32 è 1/32 ñîîòâåòñòâåííî. Âñå øåñòü ïåðå÷èñëåííûõ âûøå ñîáûòèé ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè è îáðàçóþò ïîëíóþ
ãðóïïó ñîáûòèé. Êàê íå òðóäíî ïîäñ÷èòàòü, ñóììà èõ âåðîÿòíîñòåé ðàâíà 1.
1.2. Распределения случайных величин
Åñëè ñëó÷àéíîå ñîáûòèå ïîëíîñòüþ õàðàêòåðèçóåòñÿ âåðîÿòíîñòüþ ïîÿâëåíèÿ
ýòîãî ñîáûòèÿ, à ñîâîêóïíîñòü ñëó÷àéíûõ ñîáûòèé ìîæíî îïèñàòü ñ ïîìîùüþ
âåðîÿòíîñòåé ýòèõ ñîáûòèé è òåîðåì àëãåáðû ñëó÷àéíûõ ñîáûòèé, òî îïèñàíèå
âåðîÿòíîñòíûõ ñâîéñòâ ñëó÷àéíûõ âåëè÷èí ÿâëÿåòñÿ áîëåå ñëîæíîé çàäà÷åé. Íàïîìíèì, ÷òî ñëó÷àéíîé íàçûâàåòñÿ âåëè÷èíà, êîòîðàÿ â ðåçóëüòàòå îïûòà ìîæåò
ïðèíèìàòü òî èëè èíîå çíà÷åíèå (çàðàíåå íåèçâåñòíî, êàêîå èìåííî).
Âåðîÿòíîñòíûå ñâîéñòâà ñëó÷àéíûõ âåëè÷èí îïèñûâàþòñÿ çàêîíîì ðàñïðåäåëåíèÿ, ò.å. ñîîòíîøåíèåì, óñòàíàâëèâàþùèì ñâÿçü ìåæäó âîçìîæíûìè çíà÷åíèÿìè ñëó÷àéíîé âåëè÷èíû è ñîîòâåòñòâóþùèìè èì âåðîÿòíîñòÿìè. Çàêîí ðàñïðåäåëåíèÿ ìîæåò èìåòü ðàçëè÷íûå ôîðìû.
Ðàçëè÷àþò äèñêðåòíûå è íåïðåðûâíûå ñëó÷àéíûå âåëè÷èíû.
1.2.1. Дискретные случайные величины
Äèñêðåòíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàþò âåëè÷èíó, ïðèíèìàþùóþ òîëüêî
êîíå÷íîå èëè ñ÷åòíîå ìíîæåñòâî çíà÷åíèé.
Äëÿ îïèñàíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Õ, ïðèíèìàþùåé êîíå÷íîå
ìíîæåñòâî çíà÷åíèé, ÷àñòî ïðèìåíÿåòñÿ òàáëèöà âèäà
õi
Ð(Õ = õi)
õ1
p1
õ2
p2
...
...
õn–1
pn–1
xn
pn
Çäåñü õi — âîçìîæíûå çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ, ði = Ð(Õ = õi) — âåðîÿòíîñòü ñîáûòèÿ, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå õi (1 ≤ i ≤ n).
Îòìåòèì, ÷òî
Глава 1. Основные понятия теории вероятностей
23
n
∑p
i
= 1, P(X < u ) =
i =1
∑
pi .
i : xi < u
 ïîñëåäíåì âûðàæåíèè ñóììèðîâàíèå âåäåòñÿ ïî âñåì òàêèì íîìåðàì i, ÷òî
õi < u. Ñîâîêóïíîñòü âåðîÿòíîñòåé ði = Ð(Õ = õi) ÷àñòî íàçûâàþò ôóíêöèåé âåðîÿòíîñòåé, à âåðîÿòíîñòü Ð(Õ < u) îáîçíà÷àþò êàê F(u) è íàçûâàþò ôóíêöèåé
ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ. Îíà ÿâëÿåòñÿ íåóáûâàþùåé ðàçðûâíîé
ñòóïåí÷àòîé ôóíêöèåé, ïðèíèìàþùåé çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1.
Ïðèìåð 2. Êàê è â ïðèìåðå 1, èãðîê ïÿòü ðàç ïîäáðàñûâàåò ñèììåòðè÷íóþ ìîíåòó. Îáîçíà÷èì ÷åðåç Õ ñëó÷àéíóþ âåëè÷èíó, ðàâíóþ ÷èñëó âûïàäåíèÿ ãåðáà â ñåðèè
ïîäáðàñûâàíèÿ ìîíåòû. Ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 0, 1, 2,
3, 4 è 5. Âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò êàêîå-ëèáî èç ýòèõ
çíà÷åíèé, îïðåäåëåíà â ïðèìåðå 1. Ñîñòàâèì òàáëèöó ðàñïðåäåëåíèÿ ýòîé ñëó÷àéíîé
âåëè÷èíû. (Íà ðèñ. 1.2 ïîêàçàíî ãðàôè÷åñêîå ïðåäñòàâëåíèå ýòîãî ðàñïðåäåëåíèÿ.)
õi
0
1
2
3
4
5
Ð(Õ = õi)
1/32
5/32
10/32
10/32
5/32
1/32
Ðèñ. 1.2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé
Ïðèâåäåì çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ:
0, u < 0,
 p = 1 32, 0 ≤ u < 1,
 1
 p1 + p2 = 6 32, 1 ≤ u < 2,

F (u ) = P(X < n) =  p1 + p2 + p3 = 16 32, 2 ≤ u < 3,
 p + p + p + p = 26 32, 3 ≤ u < 4,
2
3
4
 1
 p1 + p2 + p3 + p4 + p5 = 31 32, 4 ≤ u < 5,

1, u ≥ 5.
Ãðàôèêîì ôóíêöèè F(u) áóäåò âîçðàñòàþùàÿ ñòóïåí÷àòàÿ ôóíêöèÿ ñî ñêà÷êàìè â òî÷êàõ õ = 1, 2, 3, 4, 5, ïîêàçàííàÿ íà ðèñ. 1.3.
24
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.3. Ãðàôèê ôóíêöèè ðàñïðåäåëåíèÿ
Ïðèìåðû äðóãèõ äèñêðåòíûõ ðàñïðåäåëåíèé ïðèâåäåíû â ðàçäåëå 1.4.
1.2.2. Непрерывные случайные величины
Íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàåòñÿ ñëó÷àéíàÿ âåëè÷èíà, âîçìîæíûå çíà÷åíèÿ êîòîðîé íåïðåðûâíî çàïîëíÿþò êàêîé-ëèáî èíòåðâàë (âîçìîæíî,
áåñêîíå÷íûé). Äëÿ íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû Õ òàêæå â êà÷åñòâå çàêîíà
ðàñïðåäåëåíèÿ âûñòóïàåò ôóíêöèÿ ðàñïðåäåëåíèÿ F(u), ÷èñëåííî ðàâíàÿ âåðîÿòíîñòè òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ îêàæåòñÿ ìåíüøå çàäàííîãî ÷èñëà u, ò.å.
F(u) = Ð(Õ < u). Ôóíêöèÿ F(u) — íåïðåðûâíàÿ ôóíêöèÿ, íåóáûâàþùàÿ è ïðèíèìàþùàÿ çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1, ïðè÷åì F(–∞) = 0 è F(+∞) = 1.
Îòìåòèì, ÷òî ðàñïðåäåëåíèå íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû íåâîçìîæíî
çàäàòü ñ ïîìîùüþ âåðîÿòíîñòåé îòäåëüíûõ çíà÷åíèé ïîäîáíî ðàñïðåäåëåíèÿì
äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, ïîñêîëüêó Ð(Õ = õ) = 0 äëÿ ëþáîãî çíà÷åíèÿ õ.
Íî åñëè ôóíêöèÿ F(u) äèôôåðåíöèðóåìàÿ, òî ìîæíî îïðåäåëèòü âåðîÿòíîñòü ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â êàêîé-ëèáî ìàëûé èíòåðâàë äëèíîé dx, ïðèìûêàþùèé ê òî÷êå õ, è ïðè ýòîì Ð(õ ≤ Õ < õ + dx) = f(x)dx, ãäå f(x) — ïðîèçâîäíàÿ ôóíêöèè F(u) â òî÷êå õ. Ôóíêöèÿ f(x) íàçûâàåòñÿ ïëîòíîñòüþ
âåðîÿòíîñòè ñëó÷àéíîé âåëè÷èíû Õ. Îíà ìîæåò ïðèíèìàòü òîëüêî íåîòðèöàòåëüíûå çíà÷åíèÿ. Èç îïðåäåëåíèÿ ïëîòíîñòè âåðîÿòíîñòè ñëåäóåò, ÷òî
+∞
u
F (u ) =
∫
−∞
f ( x)dx,
∫
−∞
b
f ( x)dx = 1, P (a ≤ X < b) = ∫ f ( x)dx = F (b) − F (a).
a
Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî, íàïðèìåð, ïîëîæèòåëüíûå çíà÷åíèÿ, òî äëÿ òàêîé ñëó÷àéíîé âåëè÷èíû çíà÷åíèÿ îáåèõ ôóíêöèé
F(õ) è f(x) ïðè îòðèöàòåëüíûõ õ äîëæíû áûòü íóëåâûìè.
Ïðèìåðû íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí ïðèâåäåíû â ðàçäåëå 1.5.
1.2.3. Числовые характеристики случайных величин
Çàêîí ðàñïðåäåëåíèÿ ïîëíîñòüþ õàðàêòåðèçóåò ñëó÷àéíóþ âåëè÷èíó. ×òîáû îïðåäåëèòü çàêîí ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû, äîñòàòî÷íî çàäàòü åå ïëîòíîñòü âåðîÿòíîñòè èëè ôóíêöèþ ðàñïðåäåëåíèÿ. Îäíàêî òàêàÿ ïîëíàÿ, èñ÷åðïûâàþùàÿ õàðàêòåðèñòèêà ñëó÷àéíîé âåëè÷èíû äîâîëüíî ñëîæíà. Ìåæäó òåì äëÿ
ðåøåíèÿ ìíîãèõ çàäà÷ ïðàêòè÷åñêè âîâñå íå íóæíî çíàòü ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû, à äîñòàòî÷íî çíàòü ëèøü íåêîòîðûå ÷èñëà, õàðàêòåðèçóþùèå ðàñГлава 1. Основные понятия теории вероятностей
25
ïðåäåëåíèå, òàê íàçûâàåìûå ÷èñëîâûå õàðàêòåðèñòèêè ñëó÷àéíîé âåëè÷èíû. Íàïðèìåð, äëÿ ãðóáîãî îïèñàíèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû ìîæíî îãðàíè÷èòüñÿ åå ñðåäíèì çíà÷åíèåì è âåëè÷èíîé ðàçáðîñà âîçìîæíûõ çíà÷åíèé.
Èç ÷èñëîâûõ õàðàêòåðèñòèê íàèáîëåå ÷àñòî èñïîëüçóþòñÿ ìîìåíòû ñëó÷àéíîé
âåëè÷èíû. Ïåðâûé ìîìåíò íàçûâàåòñÿ ìàòåìàòè÷åñêèì îæèäàíèåì (èëè ñðåäíèì
ñëó÷àéíîé âåëè÷èíû) è âû÷èñëÿåòñÿ ïî îäíîé èç ñëåäóþùèõ ôîðìóë (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ):
MX = ∑ xi pi , MX =
i
+∞
∫ xf ( x)dx.
−∞
Âåëè÷èíà ÌÕ õàðàêòåðèçóåò ñðåäíåå ïîëîæåíèå çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ.
Âòîðîé öåíòðàëüíûé ìîìåíò (ò.å. ìîìåíò îòíîñèòåëüíî ìàòåìàòè÷åñêîãî
îæèäàíèÿ ÌÕ) õàðàêòåðèçóåò ðàçáðîñ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû âîêðóã çíà÷åíèÿ ÌÕ è íàçûâàåòñÿ äèñïåðñèåé. Äèñïåðñèÿ DX (÷àñòî òàêæå èñïîëüçóþò
îáîçíà÷åíèå σ2 èëè σÕ2) âû÷èñëÿåòñÿ ïî ôîðìóëàì (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ
äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ)
DX = M(X − MX) 2 = ∑ ( xi − MX)2 pi =∑ xi2 pi − (MX) 2 ,
i
DX = M(X − MX) 2 =
i
+∞
∫ ( x − MX)
+∞
2
−∞
f ( x)dx = ∫ x 2 f ( x)dx − (MX) 2 .
−∞
Íà ïðàêòèêå èíîãäà èñïîëüçóþò ìîìåíòû áîëåå âûñîêîãî ïîðÿäêà, íî, êàê
ïðàâèëî, íå âûøå ÷åòâåðòîãî. Öåíòðàëüíûé ìîìåíò r-ãî ïîðÿäêà µr îïðåäåëÿåòñÿ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ñëó÷àéíîé âåëè÷èíû (Õ – ÌÕ)r è âû÷èñëÿåòñÿ ïî ôîðìóëàì
µ r = M(X − MX) r = ∑ ( xi − MX) r pi ,
i
µ r = M(X − MX) r =
+∞
∫ ( x − MX) dx,
r
−∞
ñîîòâåòñòâóþùèì äèñêðåòíîìó è íåïðåðûâíîìó ñëó÷àÿì.  ýòèõ îáîçíà÷åíèÿõ
DX = µ2.
Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé âñå öåíòðàëüíûå ìîìåíòû íå÷åòíîãî ïîðÿäêà
ðàâíû íóëþ. Îíè ïîëîæèòåëüíû, åñëè ðàñïðåäåëåíèå àñèììåòðè÷íî è èìååò äëèííûé “õâîñò” ñïðàâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåðîì òàêîãî ðàñïðåäåëåíèÿ ìîæåò ñëóæèòü F-ðàñïðåäåëåíèå, îïèñàííîå íèæå), è îòðèöàòåëüíû, åñëè ðàñïðåäåëåíèå èìååò äëèííûé “õâîñò” ñëåâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåð —
ëîãèñòè÷åñêîå ðàñïðåäåëåíèå). Ïîýòîìó ôóíêöèÿ ìîìåíòîâ β1 = µ3/µ23/2 ÷àñòî
ñëóæèò ìåðîé àñèììåòðèè è íàçûâàåòñÿ êîýôôèöèåíòîì àñèììåòðèè.
Öåíòðàëüíûå ìîìåíòû ÷åòíûõ ïîðÿäêîâ âñåãäà ïîëîæèòåëüíû, ÷åðåç íèõ
âûðàæàþò êîýôôèöèåíò ýêñöåññà, êîòîðûé õàðàêòåðèçóåò îñòðîòó ïèêà ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè è çàäàåòñÿ âûðàæåíèåì β 2 = µ4/µ22 – 3. Äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. íèæå) β 1 = 0 è β 2 = 0. Ðàñïðåäåëåíèÿ ñ ïîëîæèòåëüíûì ýêñöåññîì îáû÷íî èìåþò áîëåå îñòðûé ïèê, ÷åì ãðàôèê ôóíêöèè
ïëîòíîñòè íîðìàëüíîãî ðàñïðåäåëåíèÿ, à ðàñïðåäåëåíèÿ ñ îòðèöàòåëüíûì β 2 —
26
Часть I. Основные понятия теории вероятностей и математической статистики
áîëåå ñãëàæåííûé ïèê ïî ñðàâíåíèþ ñ íîðìàëüíûì (íàïðèìåð — ðàñïðåäåëåíèå Ñòüþäåíòà, êîòîðîå îïèñàíî íèæå).
Äðóãèìè õàðàêòåðèñòèêàìè ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé ìîãóò ñëóæèòü ìåäèàíà è ìîäà. Ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå
íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2. Îòìåòèì, ÷òî
äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ ìåäèàíà íå âñåãäà âû÷èñëÿåòñÿ îäíîçíà÷íî.
Ìîäà µ îïðåäåëÿåòñÿ äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé, èìåþùèõ ïëîòíîñòü
âåðîÿòíîñòè, è ñîîòâåòñòâóåò òàêîìó çíà÷åíèþ ñëó÷àéíîé âåëè÷èíû, êîòîðîå ÿâëÿåòñÿ òî÷êîé ìàêñèìóìà äëÿ ôóíêöèè ïëîòíîñòè âåðîÿòíîñòåé. Îáû÷íî â ñòàòèñòèêå èìåþò äåëî ñ îäíîìîäàëüíûìè ðàñïðåäåëåíèÿìè, ò.å. ñ òàêèìè, ôóíêöèÿ
ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ èìååò îäèí ìàêñèìóì1. Äëÿ ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå îæèäàíèå, ìîäà è ìåäèàíà ñîâïàäàþò.
Îòìåòèì, ÷òî äëÿ áîëüøèíñòâà îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå
îæèäàíèå, ìåäèàíà è ìîäà ðàñïîëàãàþòñÿ íà ÷èñëîâîé îñè â òîì ïîðÿäêå, â êîòîðîì îíè çäåñü ïåðå÷èñëåíû, ëèáî â îáðàòíîì (ýòî íàçûâàåòñÿ “àëôàâèòíîå ïðàâèëî”). Òàêèì îáðàçîì, ìåäèàíà ëåæèò ìåæäó ìàòåìàòè÷åñêèì îæèäàíèåì è ìîäîé,
ïðè÷åì áëèæå ê ìàòåìàòè÷åñêîìó îæèäàíèþ. Äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé
îïðåäåëåíà ñïåöèàëüíàÿ ìåðà àñèììåòðèè — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà,
êîòîðûé âû÷èñëÿåòñÿ ïî ôîðìóëå s = (MX – µ)/σ, ãäå µ — ìîäà, σ — êîðåíü èç
äèñïåðñèè. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé êîýôôèöèåíò Ïèðñîíà ðàâåí íóëþ,
îí õàðàêòåðèçóåò ñòåïåíü îòêëîíåíèÿ ìîäû îò ìàòåìàòè÷åñêîãî îæèäàíèÿ.
 ìàòåìàòè÷åñêîé ñòàòèñòèêå òàêæå øèðîêî èñïîëüçóþòñÿ êâàíòèëè ñëó÷àéíûõ âåëè÷èí. Êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 1/2. Êâàíòèëè íåêîòîðûõ ïîðÿäêîâ èìåþò ñïåöèàëüíûå íàçâàíèÿ: êâàðòèëè ξ0,25, ξ0,5, ξ0,75, äåöèëè
ξ0,1, ξ0,2, ..., ξ0,9, ïðîöåíòèëè ξ0,01, ξ0,02, ..., ξ0,99 äåëÿò îáëàñòü èçìåíåíèÿ ñëó÷àéíîé
âåëè÷èíû Õ ñîîòâåòñòâåííî íà 4, 10 è 100 èíòåðâàëîâ, çíà÷åíèÿ èç êîòîðûõ ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò ñ ðàâíûìè âåðîÿòíîñòÿìè. Äëÿ ìíîãèõ âåðîÿòíîñòíûõ ðàñïðåäåëåíèé çíà÷åíèÿ êâàíòèëåé çàäàííîãî óðîâíÿ ïîäñ÷èòàíû, ñâåäåíû
â ñïåöèàëüíûå òàáëèöû è èñïîëüçóþòñÿ ïðè ïîñòðîåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ.
1.2.4. Вероятностные неравенства
 òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå áîëüøóþ ðîëü èãðàþò
íåðàâåíñòâà, ñâÿçûâàþùèå âåðîÿòíîñòè ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â îïðåäåëåííûé èíòåðâàë ñ ÷èñëîâûìè õàðàêòåðèñòèêàìè ðàñïðåäåëåíèÿ. Íàèáîëåå
îáùèì íåðàâåíñòâîì òàêîãî òèïà ÿâëÿåòñÿ íåðàâåíñòâî ×åáûøåâà, êîòîðîå
ñïðàâåäëèâî äëÿ ëþáîãî âåðîÿòíîñòíîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ:
Ð(|ÌÕ – X| ≥ kσ) ≤ 1/k2.
Çäåñü è äàëåå â ýòîì ðàçäåëå ÌÕ — ìàòåìàòè÷åñêîå îæèäàíèå, σ2 = DX —
äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Õ. Ïðåäïîëàãàåòñÿ, ÷òî k > 0. Åñëè ñëó÷àéíàÿ
âåëè÷èíà Õ ïðèíèìàåò òîëüêî ïîëîæèòåëüíûå çíà÷åíèÿ, òî èìååò ìåñòî íåðàâåíñòâî Ìàðêîâà Ð(Õ ≥ k⋅ÌX) ≤ 1/k.
Äëÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ îäíîìîäàëüíîå ðàñïðåäåëåíèå, äîêàçàíî
íåñêîëüêî ïîäîáíûõ íåðàâåíñòâ, êîòîðûå â îáùåì ñëó÷àå òî÷íåå, ÷åì íåðàâåíñòâî ×åáûøåâà.
1
Äëÿ òàêèõ ðàñïðåäåëåíèé òàêæå âñòðå÷àþòñÿ íàçâàíèÿ óíèìîäàëüíîå è îäíîâåðøèííîå.
Глава 1. Основные понятия теории вероятностей
27
Íåðàâåíñòâî Ãàóññà:
P(| X − MX | ≥ kσ) ≤
4 1 + s2
, k > |s|,
9 (k − | s |) 2
çäåñü s — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà (ñì. ïðåäûäóùèé ðàçäåë)2. Åñëè
ðàñïðåäåëåíèå ñèììåòðè÷íî (â ýòîì ñëó÷àå s = 0), òîãäà íåðàâåíñòâî Ãàóññà èìååò âèä (ñðàâíèòå åãî ñ íåðàâåíñòâîì ×åáûøåâà)
P(| X − MX | ≥ kσ) ≤
4
.
9k 2
Åñëè â êà÷åñòâå ìåðû àñèììåòðèè ðàñïðåäåëåíèÿ èñïîëüçîâàòü âåëè÷èíó
δ = ν/σ, ãäå ν = M|X – µ|, òîãäà äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ñïðàâåäëèâî
íåðàâåíñòâî Ïèêà
P(| X − MX | ≥ kσ) ≤
4 1 − δ2
,
9 (k − δ) 2
êîòîðîå èíîãäà òî÷íåå íåðàâåíñòâà Ãàóññà.
Ïðèìåðû èñïîëüçîâàíèÿ ýòèõ íåðàâåíñòâ ïðèâåäåíû â ãëàâå 2 ïðè ïîñòðîåíèè
äîâåðèòåëüíûõ èíòåðâàëîâ.
1.2.5. Двумерные распределения
Ðàññìîòðèì êðàòêî äâóìåðíûå ñëó÷àéíûå âåëè÷èíû Z = (X, Y). Âåðîÿòíîñòíûå ñâîéñòâà òàêèõ ñëó÷àéíûõ âåëè÷èí õàðàêòåðèçóþò ôóíêöèè ñîâìåñòíîãî
ðàñïðåäåëåíèÿ F(x, y), êîòîðûå îïðåäåëÿþòñÿ òàê æå, êàê äëÿ îäíîìåðíûõ âåëè÷èí, ò.å. F(x, y) = P(X < x è Y < y). Äëÿ êàæäîé ñîñòàâëÿþùåé X è Y ñëó÷àéíîé
âåëè÷èíû Z ñóùåñòâóþò ÷àñòíûå ôóíêöèè ðàñïðåäåëåíèÿ:
F1(x) ≡ F(X < x) ≡ P(X < x è Y < ∞) = F(x, ∞),
F2(ó) ≡ F(Y < y) ≡ P(X < ∞ è Y < y) = F(∞, y).
Îòìåòèì, ÷òî ôóíêöèÿ F(x, y) ïîëíîñòüþ îïðåäåëÿåò ôóíêöèè F1(x) è F2(ó).
Îäíàêî ýòè ôóíêöèè îïðåäåëÿþò ôóíêöèþ F(x, y) òîëüêî â òîì ñëó÷àå, êîãäà
êîìïîíåíòû X è Y íåçàâèñèìû; òîãäà F(x, y) = F1(x)F2(ó).
Ìîæíî âû÷èñëèòü ëþáûå ìîìåíòû êàæäîé ñîñòàâëÿþùåé X è Y (åñëè, êîíå÷íî, îíè ñóùåñòâóþò), íàïðèìåð ÌÕ, DX, MY, DY. Ìîæíî òàêæå âû÷èñëèòü
ðàçëè÷íûå ñìåøàííûå ìîìåíòû ñëó÷àéíûõ âåëè÷èí X è Y. Ñðåäè ñìåøàííûõ
ìîìåíòîâ âûäåëÿþò êîâàðèàöèþ âåëè÷èí X è Y, îïðåäåëÿåìóþ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ïðîèçâåäåíèÿ (X – MX)(Y – MY), ò.å.
cov(X, Y) = M[(X – MX)(Y – MY)].
Íîðìèðîâàííóþ íà äèñïåðñèè êîâàðèàöèþ íàçûâàþò êîýôôèöèåíòîì êîððåëÿöèè ρ ñëó÷àéíûõ âåëè÷èí X è Y:
ρ=
cov(X, Y)
DX ⋅ DY
.
2
Ñóùåñòâóåò äðóãîé âàðèàíò íåðàâåíñòâà Ãàóññà, â êîòîðîì ðàññìàòðèâàåòñÿ èíòåðâàë,
ñèììåòðè÷íûé îòíîñèòåëüíî ìîäû (à íå îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ). Äëÿ
ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ýòè äâà âàðèàíòà íåðàâåíñòâà ñîâïàäàþò.
28
Часть I. Основные понятия теории вероятностей и математической статистики
Çíà÷åíèå ýòîãî êîýôôèöèåíòà ëåæèò ìåæäó –1 è 1. Îí õàðàêòåðèçóåò ñòåïåíü
ëèíåéíîé çàâèñèìîñòè ìåæäó âåëè÷èíàìè X è Y. Åñëè X è Y ñâÿçàíû ñòðîãî
ëèíåéíî (íàïðèìåð, Y = –2Õ + 5), òî àáñîëþòíàÿ âåëè÷èíà ρ ðàâíà 1, åñëè X
è Y íåçàâèñèìû, òî ρ = 0. Îäíàêî íóëåâàÿ êîððåëÿöèÿ íå îçíà÷àåò íåçàâèñèìîñòü X è Y (çà èñêëþ÷åíèåì ñëó÷àÿ, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò
íîðìàëüíîå ðàñïðåäåëåíèå) — èç ýòîãî ñëåäóåò òîëüêî îòñóòñòâèå êàêîé-ëèáî ëèíåéíîé çàâèñèìîñòè ìåæäó X è Y.
1.3. Функции от случайных величин
Ôóíêöèÿ îò ñëó÷àéíûõ âåëè÷èí òàêæå ÿâëÿåòñÿ ñëó÷àéíîé âåëè÷èíîé.  ïðèíöèïå, ëþáóþ ñëó÷àéíóþ âåëè÷èíó ìîæíî ïðåäñòàâèòü â âèäå ôóíêöèè îò íåêîòîðîé äðóãîé ñëó÷àéíîé âåëè÷èíû (íàïðèìåð, êàê ôóíêöèþ îò ðàâíîìåðíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû; ñì. ïðèâåäåííóþ íèæå òåîðåìó). Ïðåîáðàçîâàíèå
ñëó÷àéíûõ âåëè÷èí øèðîêî ïðèìåíÿåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå. Ôóíêöèè îò
ñëó÷àéíûõ âåëè÷èí òàêæå èñïîëüçóþòñÿ ïðè ãåíåðèðîâàíèè ñëó÷àéíûõ âåëè÷èí.
Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ è Y ñâÿçàíû âçàèìíî îäíîçíà÷íûì ñîîòâåòñòâèåì Y = ϕ(Õ) è Õ = ψ(Y), ãäå ψ — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ϕ3. Îáîçíà÷èì
÷åðåç fX(x), fY(x), FX(x) è FY(x) ïëîòíîñòè âåðîÿòíîñòåé è ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî. Îíè ñâÿçàíû ìåæäó ñîáîé ñëåäóþùèìè ôîðìóëàìè:
fY(x) = fX(ψ(x))⋅|ψ′(õ)|, FY(x) = FX(ψ(x)).
Èìåþò ìåñòî òàêæå “îáðàòíûå” ôîðìóëû (åñëè ïîìåíÿòü ìåñòàìè Õ è Y
è ôóíêöèþ ψ çàìåíèòü íà ϕ), ïîêàçûâàþùèå çàâèñèìîñòü ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ îò ðàñïðåäåëåíèÿ âåëè÷èíû Y.
 îáùåì ñëó÷àå (åñëè íå òðåáîâàòü âçàèìíî îäíîçíà÷íîãî ñîîòâåòñòâèÿ ìåæäó
Õ è Y) ôóíêöèÿ ðàñïðåäåëåíèÿ FY(x) ñâÿçàíà ñ ôóíêöèåé FX(x) ôîðìóëîé
FY (u ) =
∫
dFX ( x) .
ϕ ( x ) ≤u
Îòìåòèì, ÷òî äëÿ ìîìåíòîâ ñëó÷àéíûõ âåëè÷èí Õ è Y íåò ïðîñòûõ ôîðìóë,
îòîáðàæàþùèõ èõ çàâèñèìîñòü. (Ôîðìóëà ÌY = ϕ(ÌÕ), êîòîðóþ ÷àñòî ïûòàþòñÿ èñïîëüçîâàòü ñòóäåíòû, â îáùåì ñëó÷àå íåâåðíà.) Îäíàêî ìîæíî óêàçàòü
ïðîñòóþ çàâèñèìîñòü ìåæäó êâàíòèëÿìè ζð è ξð ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî: åñëè ϕ — âîçðàñòàþùàÿ ôóíêöèÿ, òî ζð = ϕ(ξð) äëÿ ëþáîãî ð
(0 < p < 1); åñëè æå ϕ — óáûâàþùàÿ ôóíêöèÿ, òî â ýòîì ñëó÷àå ζð = ϕ(ξ1–ð).
Äëÿ ìåäèàí ζ0,5 è ξ0,5 ñîîòíîøåíèå ζ0,5 = ϕ(ξ0,5) ñïðàâåäëèâî êàê äëÿ âîçðàñòàþùåé, òàê è äëÿ óáûâàþùåé ôóíêöèè ϕ.
Ïðèâåäåì äâå òåîðåìû, êîòîðûå íàõîäÿò ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå.
Òåîðåìà. Ïóñòü ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íåïðåðûâíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = F(X) ðàñïðåäåëåíà ðàâíîìåðíî íà
èíòåðâàëå [0, 1].
3
Îòñóòñòâèå ñâîéñòâà âçàèìíî îäíîçíà÷íîãî îòîáðàæåíèÿ Õ ↔ Y èçìåíÿåò (óñëîæíÿåò) ïðèâåäåííûå íèæå ôîðìóëû, íî íå ÿâëÿåòñÿ ïðèíöèïèàëüíûì ïðåïÿòñòâèåì äëÿ èõ ïîñòðîåíèÿ.
Глава 1. Основные понятия теории вероятностей
29
Òåîðåìà4. Ïóñòü G(x) — ôóíêöèÿ, îáðàòíàÿ ê íåïðåðûâíîé ñòðîãî ìîíîòîííîé ôóíêöèè ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = G(X), ãäå
ñëó÷àéíàÿ âåëè÷èíà X ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1], èìååò
ôóíêöèþ ðàñïðåäåëåíèÿ F(x).
Ïåðâàÿ òåîðåìà èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ òàê íàçûâàåìûõ ïðîáèòãðàôèêîâ íà ýòàïå ïðåäâàðèòåëüíîãî àíàëèçà âûáîðî÷íûõ ðàñïðåäåëåíèé (ñì.
ãëàâó 9). Âòîðàÿ òåîðåìà ëåæèò â îñíîâå ìåòîäà îáðàòíûõ ôóíêöèé ãåíåðèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, àêòèâíî ïðèìåíÿåìîãî íà ïðàêòèêå (ñì. ãëàâó 7).
1.3.1. Линейное преобразование случайных величин
Ýòî ïðîñòåéøàÿ çàâèñèìîñòü âèäà Y = aX + b ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ
è Y.  ýòîì ñëó÷àå FY(x) = FX((x – b)/à). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ íåïðåðûâíà
(ò.å. ñóùåñòâóåò åå ïëîòíîñòü âåðîÿòíîñòè fX(x)), òîãäà f Y ( x) =
1
 x −b
fX 
.
|a|  a 
Ìåæäó ìîìåíòàìè ñëó÷àéíûõ âåëè÷èí Õ è Y ñóùåñòâóþò òàêèå ñîîòíîøåíèÿ:
ÌY = Ì(aX + b) = ÌX + b, DY = D(aX + b) = a2DX,
M(Y)r = M(aX + b) r = a r mr + Cr1a r −1bmr −1 + ... + Crr −1ab r −1m1 + b r ,
çäåñü Ì(Õ)k — íà÷àëüíûå (îòíîñèòåëüíî õ = 0) ìîìåíòû ïîðÿäêà k ñëó÷àéíîé
r!
— áèíîìèàëüíûå êîýôôèöèåíòû.
k !(r − k )!
Äëÿ ñòàòèñòè÷åñêîãî àíàëèçà îñîáûé èíòåðåñ ïðåäñòàâëÿåò ëèíåéíîå ïðåîáðàçîâàíèå ê ñòàíäàðòíîìó âèäó (íîðìèðîâàíèå ñëó÷àéíîé âåëè÷èíû). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå ÌÕ è äèñïåðñèþ σ2, òîãäà ñëó÷àéíàÿ âåX − MX
ëè÷èíà Y =
, ó êîòîðîé ÌY = 0 è DY = 1, íàçûâàåòñÿ ñòàíäàðòèçîâàííîé
σ
(íîðìèðîâàííîé) ñëó÷àéíîé âåëè÷èíîé. Íîðìèðîâàíèå ñëó÷àéíûõ âåëè÷èí ÷àñòî
ïðèìåíÿåòñÿ íà ïðåäâàðèòåëüíîì ýòàïå ñòàòèñòè÷åñêîãî àíàëèçà (ñì. ãëàâó 8).
âåëè÷èíû Õ, Crk =
1.3.2. Суммы случайных величин
Äëÿ ñëó÷àéíîé âåëè÷èíû Z = X + Y âñåãäà âåðíî (âíå çàâèñèìîñòè îò òîãî,
áóäóò ëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìûìè), ÷òî
MZ = M(X + Y) = MX + MY.
Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Z âû÷èñëÿåòñÿ ïî ôîðìóëå
DZ = D(X + Y) = DX + DY + 2cov(X, Y).
Åñëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû, òî D(X + Y) = DX + DY.
4
 ôîðìóëèðîâêàõ òåîðåì ìû íàìåðåíî íàëîæèëè æåñòêèå îãðàíè÷åíèÿ (íåïðåðûâíîñòü
è ñòðîãóþ ìîíîòîííîñòü) íà ôóíêöèþ ðàñïðåäåëåíèÿ F(x), ÷òîáû èçáåæàòü ïðîáëåì ñ íåîäíîçíà÷íîñòüþ îáðàòíîé ôóíêöèè G(x) â ñëó÷àå ðàçðûâíîé èëè íåñòðîãî ìîíîòîííîé ôóíêöèè
F(x). Íà ïðàêòèêå ýòè òåîðåìû èñïîëüçóþòñÿ äëÿ ëþáûõ ôóíêöèé ðàñïðåäåëåíèÿ, åñëè äîîïðåäåëèòü èõ äîëæíûì îáðàçîì.
30
Часть I. Основные понятия теории вероятностей и математической статистики
 ñëó÷àå, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò ñîâìåñòíóþ ïëîòíîñòü âåðîÿòíîñòè f(x, y), òîãäà ïëîòíîñòü âåðîÿòíîñòè g(x) ñëó÷àéíîé âåëè÷èíû
Z = X + Y âûðàæàåòñÿ ôîðìóëîé
g ( z) =
+∞
∫
−∞
+∞
f ( x, z − x)dx = ∫ f ( z − y, y )dy .
−∞
 ÷àñòíîñòè, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû (â ýòîì ñëó÷àå
f(x, y) = fX(x) fY(ó)), òîãäà
g ( z) =
+∞
∫
−∞
+∞
f X ( x) f Y ( z − x )dx = ∫ f X ( z − y ) f Y ( y )dy .
−∞
N
Åñëè Z ÿâëÿåòñÿ ñóììîé N ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN, ò.å. Z = ∑ X i , òîi =1
N
ãäà MZ = ∑ MX i . Äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí âû÷èñëÿåòñÿ ïî ôîðìóëå
i =1
N
N −1 N
DZ = ∑ DX i + 2∑∑ cov(X i , X j ) .
i =1
j =1 j > i
Òàêèì îáðàçîì, äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí ðàâíÿåòñÿ ñóììå èõ
äèñïåðñèé è ñóììû êîâàðèàöèé âñåõ âîçìîæíûõ ïàð ñëó÷àéíûõ âåëè÷èí. Äëÿ
N
íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN DZ = ∑ DX i .
i=1
N
Åñëè êîëè÷åñòâî ñëàãàåìûõ â ñóììå Z = ∑ X i íåîãðàíè÷åííî âîçðàñòàåò, òî
i =1
ïðè äîñòàòî÷íî îáùèõ óñëîâèÿõ, íàêëàäûâàåìûõ íà ñëó÷àéíûå âåëè÷èíû Xi,
ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Z ñõîäèòñÿ ê íîðìàëüíîìó ðàñïðåäåëåíèþ.
Ïåðå÷èñëåíèå ýòèõ óñëîâèé ñîñòàâëÿåò ñîäåðæàíèå öåíòðàëüíûõ ïðåäåëüíûõ
òåîðåì òåîðèè âåðîÿòíîñòåé.
1.3.3. Центральная предельная теорема
Èñêëþ÷èòåëüíîå çíà÷åíèå öåíòðàëüíûõ ïðåäåëüíûõ òåîðåì îáúÿñíÿåòñÿ òåì,
÷òî îíè ÿâëÿþòñÿ òåîðåòè÷åñêîé îñíîâîé ïðèìåíåíèÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ïðè ðåøåíèè ìíîãèõ ïðàêòè÷åñêèõ çàäà÷. Âñåãäà, êîãäà ìîæíî ïðåäïîëîæèòü, ÷òî ðàññìàòðèâàåìàÿ âåëè÷èíà ÿâëÿåòñÿ ñóììîé áîëüøîãî ÷èñëà ñëó÷àéíûõ ôàêòîðîâ, âëèÿíèå êàæäîãî èç êîòîðûõ ïðåíåáðåæèìî ìàëî, åå
ðàñïðåäåëåíèå áóäåò áëèçêî ê íîðìàëüíîìó ðàñïðåäåëåíèþ. Òàêèìè âåëè÷èíàìè
ÿâëÿþòñÿ, íàïðèìåð, îøèáêè ðåãèñòðàöèè â èçìåðèòåëüíûõ ïðèáîðàõ, ðåçóëüòàòû ñëó÷àéíîãî ýêñïåðèìåíòà, çàâèñÿùåãî îò ìíîãèõ ìàëûõ ôàêòîðîâ, ðàññåèâàíèå ýëåêòðîíîâ ïðè áîìáàðäèðîâêå èìè ìèøåíåé è ò.ä.
Ïðèâåäåì ïðîñòåéøèé âàðèàíò öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, îòíîñÿùèéñÿ ê ñóììàì íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëàãàåìûõ ñ êîíå÷íîé
äèñïåðñèåé. Èìåííî ýòîò âàðèàíò òåîðåìû ñëóæèò îñíîâîé äëÿ ïîñòðîåíèÿ ðàçëè÷íûõ àñèìïòîòè÷åñêèõ îöåíîê âûáîðî÷íûõ ïàðàìåòðîâ ðàñïðåäåëåíèé â ñòàòèñòè÷åñêîì àíàëèçå (ñì. ðàçäåë 2.2).
Глава 1. Основные понятия теории вероятностей
31
Òåîðåìà. Ïóñòü Õ1, Õ2, ..., Xn, ... — ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí ñ ìàòåìàòè÷åñêèì îæèäàíèåì
ÌXk = m è êîíå÷íîé äèñïåðñèåé DXk = σ2 > 0. Îáîçíà÷èì Yn = Õ1 + Õ2 + ... + Xn.
Òîãäà ïðè n → ∞ äëÿ ëþáîãî õ
 Y − nm

< x  → Φ ( x) ,
P n
 σ n

ãäå Ô(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
Ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Yn íàçûâàåòñÿ àñèìïòîòè÷åñêè íîðìàëüíîé.
Ñóùåñòâóþò áîëåå îáùèå âàðèàíòû öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, ñïðàâåäëèâûå äëÿ ïîñëåäîâàòåëüíîñòåé Yn = Õ1 + Õ2 + ... + Xn, êîãäà Xk ìîãóò èìåòü
ðàçëè÷íûå ðàñïðåäåëåíèÿ è áûòü çàâèñèìûìè. Ðàçëè÷íûå âàðèàíòû òåîðåìû
ìîæíî íàéòè â [6].
1.4. Примеры дискретных распределений
Ïðèâåäåì ïðèìåðû ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà.
1.4.1. Равномерное дискретное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå äèñêðåòíîå ðàñïðåäåëåíèå, åñëè
îíà ïðèíèìàåò êîíå÷íîå ÷èñëî ðàçëè÷íûõ çíà÷åíèé ñ îäèíàêîâîé âåðîÿòíîñòüþ.
Ïóñòü, äëÿ îïðåäåëåííîñòè, âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 1, 2, ..., n.
Òîãäà Ð(Õ = i) = 1/n äëÿ âñåõ öåëûõ çíà÷åíèé i èç èíòåðâàëà [1, n]. Îòìåòèì,
÷òî â ýòîì ñëó÷àå ÌÕ = (n + 1)/2, DX = (n + 1)(2n + 1)/6. Ãðàôèê ýòîãî
ðàñïðåäåëåíèÿ äëÿ n = 10 ïîêàçàí íà ðèñ. 1.4.
Ýòî ðàñïðåäåëåíèå ÷àñòî èñïîëüçóåòñÿ äëÿ ìîäåëèðîâàíèÿ ðàâíîâåðîÿòíûõ
äèñêðåòíûõ ñîáûòèé.
Ðèñ. 1.4.
Äèñêðåòíîå
ðàñïðåäåëåíèå
ðàâíîìåðíîå
1.4.2. Распределение Бернулли
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Áåðíóëëè ñ ïàðàìåòðîì ð
(0 < p < 1), åñëè Ð(Õ = 1) = ð è Ð(Õ = 0) = 1 – p. Òàêèì îáðàçîì, ñëó÷àéíàÿ âå-
32
Часть I. Основные понятия теории вероятностей и математической статистики
ëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî äâà çíà÷åíèÿ, 1 è 0, ñ âåðîÿòíîñòÿìè ð è 1 – p
ñîîòâåòñòâåííî. Îòìåòèì, ÷òî ÌÕ = ð è DX = p(1 – p).
Ýòî ðàñïðåäåëåíèå èãðàåò ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïîñêîëüêó ÿâëÿåòñÿ ìîäåëüþ ëþáîãî ñëó÷àéíîãî ýêñïåðèìåíòà, ðåçóëüòàòîì êîòîðîãî ìîæåò áûòü îäèí èç äâóõ âîçìîæíûõ èñõîäîâ:
èñõîä “1” ïðîèçîéäåò ñ âåðîÿòíîñòüþ ð è èñõîä “0” — ñ âåðîÿòíîñòüþ 1 – ð
(èñõîä “1” ÷àñòî íàçûâàþò “óñïåõîì”, à èñõîä “0” — “íåóäà÷åé”).
1.4.3. Биномиальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè
n è p (0 < p < 1, n ≥ 1), åñëè
P(X = k ) = Cnk p k (1 − p) n − k , k ∈ 0, n.
Çäåñü Cnk =
n!
— áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåk !(n − k )!
ëè÷èíû ÌÕ = np, DX = np(1 – p). Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ n = 20 è p = 0,5 ïîêàçàíî íà ðèñ. 1.5.
Ðèñ. 1.5. Áèíîìèàëüíîå ðàñïðåäåëåíèå
Áèíîìèàëüíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ ñëó÷àéíûõ ýêñïåðèìåíòîâ,
ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé. Â ðåçóëüòàòå êàæäîãî èç
íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0”. Ïðèíÿòûì íàçâàíèåì äëÿ òàêîé ìîäåëè ñëó÷àéíûõ ýêñïåðèìåíòîâ ÿâëÿåòñÿ ñõåìà Áåðíóëëè. Ñëó÷àéíàÿ âåëè÷èíà, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1”
â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè äîñòàòî÷íî áîëüøèõ n è ïðè óñëîâèè, ÷òî 1/(n + 1) < p
< n/(n + 1), ÷àñòî èñïîëüçóþòñÿ ïðèáëèæåííûå ôîðìóëû, îñíîâàííûå íà àïïðîêñèìàöèè ýòîãî ðàñïðåäåëåíèÿ íîðìàëüíûì.  Excel åñòü ôóíêöèÿ
БИНОМРАСП (ñì. ãëàâó 4), êîòîðàÿ ïîçâîëÿåò âû÷èñëÿòü êàê çíà÷åíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè ëþáûõ n, p è k, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ
F(x). (Ãðàôèêè íà ðèñ. 1.5 ïîñòðîåíû ñ ïîìîùüþ ýòîé ôóíêöèè.)
Глава 1. Основные понятия теории вероятностей
33
1.4.4. Распределение Пуассона
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ
(λ > 0), åñëè
P(X = k ) = e − λ
λk
, k = 0, 1, 2, ... .
k!
Äëÿ ýòîãî ðàñïðåäåëåíèÿ ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ñîâïàäàþò,
ò.å. ÌÕ = DX = λ. Ðàñïðåäåëåíèÿ âåðîÿòíîñòåé äëÿ äâóõ çíà÷åíèé λ ïîêàçàíû
íà ðèñ. 1.6.
Ðèñ. 1.6. Ðàñïðåäåëåíèå Ïóàññîíà
Ðàñïðåäåëåíèå Ïóàññîíà èãðàåò âàæíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå. Îíî ÿâëÿåòñÿ ìîäåëüþ äëÿ îïèñàíèÿ ñëó÷àéíîãî ÷èñëà
ïîÿâëåíèé îïðåäåëåííûõ ñîáûòèé â ôèêñèðîâàííûé ïðîìåæóòîê âðåìåíè èëè
â ôèêñèðîâàííîé îáëàñòè ïðîñòðàíñòâà. Òðàäèöèîííûìè ïðèìåðàìè ñëó÷àéíûõ
âåëè÷èí, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà, ÿâëÿþòñÿ ÷èñëî àëüôà÷àñòèö, èñïóñêàåìûõ ðàäèîàêòèâíûì èñòî÷íèêîì çà îïðåäåëåííûé ïðîìåæóòîê
âðåìåíè; êîëè÷åñòâî áàêòåðèé, âèäèìûõ ïîä ìèêðîñêîïîì; ìóòàöèè, âûçâàííûå
ðàäèàöèåé; êîëè÷åñòâî çâåçä â îïðåäåëåííîé îáëàñòè çâåçäíîãî íåáà; êîëè÷åñòâî
äåðåâüåâ íà ó÷àñòêå ëåñà è ò.ä.  Excel äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k)
è çíà÷åíèé ôóíêöèè ðàñïðåäåëåíèÿ F(x) åñòü ôóíêöèÿ ПУАССОН (ñì. ãëàâó 4).
Îòìåòèì òàêæå ñîîòíîøåíèÿ ìåæäó ðàñïðåäåëåíèÿìè Ïóàññîíà è χ2 (ñì.
ðàçäåë 1.5.5), êîòîðûå èñïîëüçóþòñÿ ïðè ïîñòðîåíèè èíòåðâàëüíûõ îöåíîê äëÿ
ïàðàìåòðà λ (ñì. ðàçäåë 2.3.8): Ð(Õ ≥ k) = Ð(Y ≤ 2λ), ãäå Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2k ñòåïåíÿìè ñâîáîäû, è Ð(Õ ≤ k) =
= Ð(Z ≥ 2λ), ãäå Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1)
ñòåïåíÿìè ñâîáîäû.
1.4.5. Геометрическое распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì ð
(0 < p < 1), åñëè
Ð(Õ = k) = p(1 – p)k, k = 0, 1, 2, ... .
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (1 – p)/p, DX = (1 – p)/p2. Ðàñïðåäåëåíèå
âåðîÿòíîñòåé äëÿ çíà÷åíèÿ ïàðàìåòðà p = 0,7 ïîêàçàíî íà ðèñ. 1.7.
34
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.7. Ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå
Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì îòðèöàòåëüíîãî áèíîìèàëüíîãî
ðàñïðåäåëåíèÿ ïðè ïàðàìåòðå r = 1 (ñì. ðàçäåë 1.4.7) è îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè (ðàçäåë 1.4.3), íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1” ðîâíî îäèí ðàç.
1.4.6. Гипергеометрическое распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè N, n è ð (N ≥ n ≥ 0, 0 < p < 1), åñëè
P(X = k ) =
k
C Np
C Nn −(1k− p )
C Nn
, k = 0, 1, 2, ..., n .
Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
ÌÕ = np, DX = np (1 − p )
N −n
. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàN −1
ìåòðîâ N = 100, n = 10 è p = 0,4 ïîêàçàíî íà ðèñ. 1.8.
Òèïè÷íàÿ ñèòóàöèÿ, â êîòîðîé ïîÿâëÿåòñÿ ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå,
ñëåäóþùàÿ: ïðîâåðÿåòñÿ ïàðòèÿ ãîòîâîé ïðîäóêöèè îáúåìîì N, â êîòîðîé ëþáîå
èçäåëèå ñ âåðîÿòíîñòüþ ð ÿâëÿåòñÿ ãîäíûì è, ñîîòâåòñòâåííî, ñ âåðîÿòíîñòüþ 1 –
ð — áðàêîâàííûì. Ñëó÷àéíûì îáðàçîì âûáèðàþòñÿ n èçäåëèé. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî ãîäíûõ èçäåëèé ñðåäè n âûáðàííûõ èçäåëèé.
Åñëè n/N < 0,1, ýòî ðàñïðåäåëåíèå õîðîøî àïðîêñèìèðóåòñÿ áèíîìèàëüíûì
ðàñïðåäåëåíèåì.  Excel èìååòñÿ ôóíêöèÿ ГИПЕРГЕОМЕТ, âû÷èñëÿþùàÿ âåðîÿòíîñòè Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ N, n, ð è k (ñì. ðàçäåë 4.6.6).
1.4.7. Отрицательное биномиальное распределение
(распределение Паскаля)
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå
(ðàñïðåäåëåíèå Ïàñêàëÿ) ñ ïàðàìåòðàìè r è ð (0 < p < 1), åñëè
P(X = k ) = Crk+ k −1 p r (1 − p) r , k = 0, 1, 2, ... .
Глава 1. Основные понятия теории вероятностей
35
Ðèñ. 1.8. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå
Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
ÌÕ = r(1 – p)/p, DX = r(1 – p)/p2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ r = 10 è p = 0,8 ïîêàçàíî íà ðèñ. 1.9.
Ðèñ. 1.9. Îòðèöàòåëüíîå
ðàñïðåäåëåíèå
áèíîìèàëüíîå
Ïðè íàòóðàëüíîì r îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè, íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1”
ðîâíî r ðàç. Ýòî ðàñïðåäåëåíèå ÷àñòî ïîÿâëÿåòñÿ â ïîïóëÿöèîííîé áèîëîãèè.
 Excel èìååòñÿ ôóíêöèÿ ОТРБИНОМРАСП, âû÷èñëÿþùàÿ âåðîÿòíîñòè
Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ r, ð è k (ñì. ðàçäåë 4.6.10).
1.5. Примеры непрерывных распределений
1.5.1. Равномерное непрерывное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b],
åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.10) âû÷èñëÿåòñÿ ïî ôîðìóëå
 1
, если x ∈ [a, b],

f ( x) =  b − a
 0,
если x ∉ [a, b].
36
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.10. Ïëîòíîñòü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (a + b)/2, DX = (b – a)2/12, β1 = 0,
β2 = –1,2. Ñëó÷àéíàÿ âåëè÷èíà Y = (X – a)/(b – a) ðàñïðåäåëåíà ðàâíîìåðíî íà
èíòåðâàëå [0, 1]. Ðàâíîìåðíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íåïðåðûâíûì àíàëîãîì
äèñêðåòíîãî ðàâíîìåðíîãî ðàñïðåäåëåíèÿ, îïèñûâàþùåãî ñëó÷àéíûå ýêñïåðèìåíòû ñ ðàâíîâåðîÿòíûìè èñõîäàìè.
Òåîðåìû èç ðàçäåëà 1.3, ïîêàçûâàþùèå âçàèìîñâÿçü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ ñ äðóãèìè òèïàìè ðàñïðåäåëåíèé, îáúÿñíÿþò øèðîêîå èñïîëüçîâàíèå ðàâíîìåðíîãî ðàñïðåäåëåíèÿ â ñòàòèñòè÷åñêîì ìîäåëèðîâàíèè (áîëåå ïîäðîáíî îá
ýòîì ðå÷ü èäåò â ãëàâå 7).  Excel ôóíêöèÿ СЛЧИС ãåíåðèðóåò ñëó÷àéíûå ÷èñëà,
ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] (ñì. ðàçäåë 4.13.1).
1.5.2. Треугольное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò òðåóãîëüíîå ðàñïðåäåëåíèå (íàçûâàåìîå òàêæå
ðàñïðåäåëåíèåì Ñèìïñîíà) íà èíòåðâàëå [a, b], åñëè åå ïëîòíîñòü âåðîÿòíîñòè
(ðèñ. 1.11) âû÷èñëÿåòñÿ ïî ôîðìóëå
2
 2
−
a + b − 2 x , если x ∈ [a, b],

f ( x ) =  b − a (b − a ) 2
 0,
если x ∉ [a, b].

Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû MX =
1
(4(a3 + b3 ) − (a + b)3 ) , DX = (b –
6(b − a) 2
– a)3/24. Åñëè Õ1 è Õ2 — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, ðàâíîìåðíî ðàñïðå-
a b
äåëåííûå íà èíòåðâàëå  ,  , òî ñëó÷àéíàÿ âåëè÷èíà Õ = Õ1 + Õ2 èìååò òðå2 2
óãîëüíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b].
1.5.3. Показательное (экспоненциальное) распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.12) âû÷èñëÿåòñÿ ïî ôîðìóëå
λe − λx , если x ≥ 0,
f ( x) = 
если x < 0.
 0,
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = 1/λ, DX = 1/λ2; åå ôóíêöèÿ ðàñïðåäåëåíèÿ âû÷èñëÿåòñÿ ïî ïðîñòîé ôîðìóëå F(u) = 1 – e–λu (u ≥ 0). Ýòî ðàñïðåäåëåíèå
Глава 1. Основные понятия теории вероятностей
37
Ðèñ. 1.11. Ïëîòíîñòü òðåóãîëüíîãî ðàñïðåäåëåíèÿ
Ðèñ. 1.12. Ïëîòíîñòü ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ
÷àñòî âñòðå÷àåòñÿ â ìîäåëèðîâàíèè ñëó÷àéíûõ ïðîöåññîâ (îíî îáëàäàåò òàê íàçûâàåìûì ñâîéñòâîì îòñóòñòâèÿ ïîñëåäåéñòâèÿ).  Excel ôóíêöèÿ ЭКСПРАСП
âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.15).
1.5.4. Нормальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m
è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.13) âû÷èñëÿåòñÿ ïî ôîðìóëå
f ( x) =
1
2πσ
e
−
( x − m )2
2σ 2
,
x ∈ (−∞, ∞).
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = m, DX = σ2, β1 = 0, β2 = 0. Íîðìàëüíîå
ðàñïðåäåëåíèå íàçûâàþò òàêæå ãàóññîâñêèì ðàñïðåäåëåíèåì, çàêîíîì Ãàóññà,
âòîðûì çàêîíîì Ëàïëàñà, ðàñïðåäåëåíèåì Ãàóññà–Ëàïëàñà è äð.
Åñëè m = 0 è σ2 = 1, òî ðàñïðåäåëåíèå íàçûâàåòñÿ ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì. Ëèíåéíîå ïðåîáðàçîâàíèå Y = (X – m)/σ ïðèâîäèò ïðîèçâîëüíóþ íîðìàëüíî ðàñïðåäåëåííóþ âåëè÷èíó Õ ê ñòàíäàðòíîìó íîðìàëüíîìó ðàñïðåäåëåíèþ.
Ôóíäàìåíòàëüíàÿ ðîëü, êîòîðóþ èãðàåò íîðìàëüíîå ðàñïðåäåëåíèå â òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, îáúÿñíÿåòñÿ òåì, ÷òî ïðè äîñòà-
38
Часть I. Основные понятия теории вероятностей и математической статистики
òî÷íî øèðîêèõ óñëîâèÿõ ðàñïðåäåëåíèå ñóììû ñëó÷àéíûõ âåëè÷èí ñ ðîñòîì
÷èñëà ñëàãàåìûõ àñèìïòîòè÷åñêè ñõîäèòñÿ ê íîðìàëüíîìó. Ñîîòâåòñòâóþùèå
óñëîâèÿ ñõîäèìîñòè ïðèâåäåíû â öåíòðàëüíîé ïðåäåëüíîé òåîðåìå òåîðèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.3.3).
Ðèñ. 1.13. Ïëîòíîñòü íîðìàëüíîãî ðàñïðåäåëåíèÿ
Íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà ñ áîëüøîé âåðîÿòíîñòüþ ïðèíèìàåò çíà÷åíèÿ, áëèçêèå ê ñâîåìó ìàòåìàòè÷åñêîìó îæèäàíèþ. Ýòî ñâîéñòâî
íîðìàëüíîãî ðàñïðåäåëåíèÿ ôîðìóëèðóåòñÿ êàê ïðàâèëî ñèãì:
 0,3173..., k = 1,

P(| X − m |≥ kσ ) = 0, 0455...., k = 2,
 0, 0027...., k = 3.

×àùå âñåãî èñïîëüçóþò ïðàâèëî òðåõ ñèãì, êîòîðîå íàõîäèò øèðîêîå ïðèìåíåíèå â ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ.
 Excel ôóíêöèè НОРМСТРАСП è НОРМРАСП (ñì. ðàçäåëû 4.6.8 è 4.6.9) âû÷èñëÿþò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ ñîîòâåòñòâåííî ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî ðàñïðåäåëåíèé, à ôóíêöèè
НОРМСТОБР è НОРМОБР — çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî çàêîíîâ (ñì. ðàçäåëû 4.7.5
è 4.7.6). Ïîñëåäíèå ôóíêöèè ìîæíî èñïîëüçîâàòü äëÿ ãåíåðèðîâàíèÿ íîðìàëüíî
ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ãëàâó 7).
1.5.5. Распределение “хи/квадрат”
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå
ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.14) âû÷èñëÿåòñÿ ïî ôîðìóëå
n
x
−1 −

1
2
2
, если x ≥ 0,
x
e
 n
 2 n
f ( x) =  2 Γ  
2

 0,
если x < 0.
Глава 1. Основные понятия теории вероятностей
39
Çäåñü è äàëåå Ã(õ) — ãàììà-ôóíêöèÿ Ýéëåðà5. Äëÿ äàííîãî ðàñïðåäåëåíèÿ
ÌÕ = n, DX = 2n, β1 = 2
2
, β2 = 12/n. Ïðè n ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå õ = n – 2.
n
Ðèñ. 1.14. Ðàñïðåäåëåíèå χ2
Ìíîãî÷èñëåííûå ïðèìåíåíèÿ ýòîãî ðàñïðåäåëåíèÿ â òåîðèè âåðîÿòíîñòåé îñíîâàíû íà òîì ôàêòå, ÷òî åñëè Õ1, Õ2, ..., Õn — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, òî ñëó÷àéíàÿ âåëè÷èíà
Y = ∑ i =1 X i2 èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ìàòåìàòè÷åñêîé
n
ñòàòèñòèêå ðàñïðåäåëåíèå χ2 ïðèìåíÿåòñÿ ïðè ïîñòðîåíèè öåëîãî ðÿäà ðàçíîîáðàçíûõ êðèòåðèåâ, â òîì ÷èñëå ïðè ñîãëàñîâàíèè âûáîðî÷íûõ äàííûõ ñ âûáðàííûì çàêîíîì ðàñïðåäåëåíèÿ è â ìåòîäå íàèìåíüøèõ êâàäðàòîâ (ñì. ãëàâû 2 è 3).
 Excel åñòü òðè ôóíêöèè, ХИ2РАСП, ХИ2ОБР è ХИ2ТЕСТ, ñâÿçàííûå ñ ðàñïðåäåëåíèåì χ2. Ïîäðîáíî ýòè ôóíêöèè îïèñàíû â ãëàâå 4.
1.5.6. Распределение Стьюдента
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ñòüþäåíòà (t-ðàñïðåäåëåíèå)
ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.15) âû÷èñëÿåòñÿ ïî ôîðìóëå
 n +1
n +1
Γ
−

2   x2  2

f ( x) =
, x ∈ (−∞, ∞).
1 + 
n 
n
nπ Γ   
2
5
Çíà÷åíèÿ ãàììà-ôóíêöèè Γ ( n ) =
∫
∞
0
e − x x n −1 dx ìîæíî ïîëó÷èòü ñ ïîìîùüþ ôóíêöèè Excel
ГАММАНЛОГ, âû÷èñëÿþùåé íàòóðàëüíûé ëîãàðèôì ãàììà-ôóíêöèè. Òàêæå îòìåòèì, ÷òî
Ã(n) = (n – 1)!, åñëè n — íàòóðàëüíîå ÷èñëî.
40
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.15. Ïëîòíîñòü ðàñïðåäåëåíèÿ Ñòüþäåíòà
Äëÿ ýòîãî ðàñïðåäåëåíèÿ ïðè n > 2 ÌÕ = 0, DX = n/(n – 2) (åñëè n ≤ 2, òî DX = ),
β1 = 0, β2 = 6/(n – 4) (ïðè n > 4). Ïðè áîëüøèõ çíà÷åíèÿõ n ðàñïðåäåëåíèå Ñòüþäåíòà
àñèìïòîòè÷åñêè ñáëèæàåòñÿ ñî ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì.
Ðàñïðåäåëåíèå Ñòüþäåíòà èìååò ìíîãî÷èñëåííûå ïðèìåíåíèÿ â ìàòåìàòè÷åñêîé
ñòàòèñòèêå. Åñëè Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè
ñâîáîäû, òîãäà ñëó÷àéíàÿ âåëè÷èíà X = Y
n
èìååò t-ðàñïðåäåëåíèå òàêæå ñ n
Z
ñòåïåíÿìè ñâîáîäû. (Î ïðèìåíåíèè ðàñïðåäåëåíèÿ Ñòüþäåíòà ðå÷ü èäåò â ãëàâå 2.)
 Excel èìåþòñÿ ôóíêöèè СТЬЮДРАСП è СТЬЮДОБР, âû÷èñëÿþùèå ñîîòâåòñòâåííî çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.12 è 4.7.7).
1.5.7. F/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà)
ñ (m, n) ñòåïåíÿìè ñâîáîäû (m, n ≥ 1), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.16)
âû÷èñëÿåòñÿ ïî ôîðìóëå
 m+n
m
m+n
 Γ  2   m  2 m −1  m  − 2


2
, если x ≥ 0,
x 1 + x 

f ( x) =   m   n   n 
n 

Γ Γ 
  2  2

если x < 0.
 0,
2n 2 (m + n − 2)
n
(ïðè n > 2), DX =
(åñëè
m(n − 2) 2 (n − 4)
n−2
n(m − 2)
.
n > 4). Ïðè m ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå x =
m(n + 2)
Äëÿ ýòîãî ðàñïðåäåëåíèÿ MX =
Глава 1. Основные понятия теории вероятностей
41
Ðèñ. 1.16. Ïëîòíîñòü F-ðàñïðåäåëåíèÿ
Åñëè íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû Y1 è Y2 èìåþò ðàñïðåäåëåíèå χ2 ñ m
è n ñòåïåíÿìè ñâîáîäû ñîîòâåòñòâåííî, òîãäà ñëó÷àéíàÿ âåëè÷èíà X =
Y1 m
áóY2 n
äåò èìåòü F-ðàñïðåäåëåíèå.
F-ðàñïðåäåëåíèå èãðàåò îñíîâíóþ ðîëü ïðè ñðàâíåíèè âûáîðî÷íûõ äèñïåðñèé
èç íîðìàëüíî ðàñïðåäåëåííûõ ñîâîêóïíîñòåé. Îíî òàêæå øèðîêî èñïîëüçóåòñÿ
â ðåãðåññèîííîì è äèñïåðñèîííîì àíàëèçå. Â Excel èìåþòñÿ ôóíêöèè FРАСП
è FРАСПОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.1 è 4.7.1).
1.5.8. Логарифмически нормальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãàðèôìè÷åñêè íîðìàëüíîå (ëîãíîðìàëüíîå)
ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.17)
âû÷èñëÿåòñÿ ïî ôîðìóëå
 1
 (ln x − m) 2 
exp  −

 , если x > 0,
f ( x) =  xσ 2π
2σ 2



если x ≤ 0.
 0,
Ðèñ. 1.17. Ïëîòíîñòü ëîãíîðìàëüíîãî ðàñïðåäåëåíèÿ
42
Часть I. Основные понятия теории вероятностей и математической статистики
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = exp(m + σ2/2), DX = (exp(σ2) –
1)exp(2m + σ2). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãíîðìàëüíîå ðàñïðåäåëåíèå, òî åå ëîãàðèôì Y = lnX ðàñïðåäåëåí ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2.
Ýòî ðàñïðåäåëåíèå íàõîäèò ïðèìåíåíèå â òåîðèè íàäåæíîñòè, ñòàòèñòè÷åñêîé ôèçèêå, ýêîíîìè÷åñêîé ñòàòèñòèêå, áèîëîãèè è ò.ä.  Excel èìåþòñÿ
ôóíêöèè ЛОГНОРМРАСП è ЛОГНОРМОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.7 è 4.7.4).
1.5.9. Бета/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áåòà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è β (α > 0,
β > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.18) âû÷èñëÿåòñÿ ïî ôîðìóëå
 Γ (α + β) α −1
x (1 − x)β −1 , если x ∈ [0,1],

f ( x) =  Γ(α)Γ(β)
 0,
если x ∉ [0,1].

Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/(α + β), DX = αβ/(α + β)2(α + β + 1).
Åñëè α > 1 è β > 1, òî ðàñïðåäåëåíèå îäíîìîäàëüíî ñ ìîäîé â òî÷êå õ = (α –
– 1)/(α + β – 1). Ïðè α = β = 1 áåòà-ðàñïðåäåëåíèå ÿâëÿåòñÿ ðàâíîìåðíûì íà èíòåðâàëå [0, 1] ðàñïðåäåëåíèåì, ïðè α = β = 2 — òðåóãîëüíûì, â ñëó÷àå
α = β = 1/2 îíî íàçûâàåòñÿ ðàñïðåäåëåíèåì àðêñèíóñà, à ïðè β = α + 1 — îáîáùåííûì ðàñïðåäåëåíèåì àðêñèíóñà.
 ìàòåìàòè÷åñêîé ñòàòèñòèêå áåòà-ðàñïðåäåëåíèå íàèáîëåå ÷àñòî âñòðå÷àåòñÿ
â êà÷åñòâå ðàñïðåäåëåíèÿ ïîðÿäêîâûõ ñòàòèñòèê (ñì. ãëàâó 2).  Excel ôóíêöèè
БЕТАРАСП è БЕТАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.2 è 4.7.2).
Ðèñ. 1.18. Ïëîòíîñòü áåòà-ðàñïðåäåëåíèÿ
Глава 1. Основные понятия теории вероятностей
43
1.5.10. Гамма/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ
(α > 0, λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.19) âû÷èñëÿåòñÿ ïî ôîðìóëå
 λ α α −1 − λx
x e , если x > 0,

f ( x) =  Γ(α)
 0,
если x ≤ 0.

Ðèñ. 1.19. Ïëîòíîñòü ãàììà-ðàñïðåäåëåíèÿ ïðè α = 1 è λ = 0,5
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/λ, DX = α/λ2. Ïðè α ≤ 1 ìîäà ðàñïðåäåëåíèÿ íàõîäèòñÿ â íóëå, à ïðè α ≥ 1 — â òî÷êå õ = (α – 1)/λ. Åñëè α = 1, òî
ãàììà-ðàñïðåäåëåíèå ñîâïàäàåò ñ ïîêàçàòåëüíûì ðàñïðåäåëåíèåì, à ïðè α = n/2,
λ = 1/2 — ñ ðàñïðåäåëåíèåì χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ñëó÷àå λ = nµ è α = n
(n — íàòóðàëüíîå ÷èñëî) ýòî ðàñïðåäåëåíèå íàçûâàþò ðàñïðåäåëåíèåì Ýðëàíãà
ñ ïàðàìåòðàìè n è µ. Ïðè íàòóðàëüíîì α è λ = 1 ãàììà-ðàñïðåäåëåíèå íàçûâàåòñÿ ïîêàçàòåëüíî-ñòåïåííûì.
Äàííîå ðàñïðåäåëåíèå è åãî ÷àñòíûå ñëó÷àè øèðîêî èñïîëüçóþòñÿ â òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå.  Excel ôóíêöèè ГАММАРАСП
è ГАММАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.5 è 4.7.3).
1.5.11. Распределение Вейбулла–Гнеденко
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ñ ïàðàìåòðàìè
α è λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.20) âû÷èñëÿåòñÿ ïî ôîðìóëå
| α | λx α −1e− λx , если x > 0,
f ( x) = 
если x ≤ 0.
 0,
α
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
 2  2  1
λ −1/ α  1 
MX =
Γ   è DX = λ −2 / α  Γ   − 2
α
α
 α  α  α
44
2
  1   
Γ  α    .
    
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.20. Ïëîòíîñòü ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî ïðè α = 1 è α = 3 è λ = 2
Ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ÷àñòî èñïîëüçóåòñÿ â òåîðèè íàäåæíîñòè,
â ÷àñòíîñòè äëÿ îïèñàíèÿ âðåìåíè áåçîòêàçíîé ðàáîòû ïðèáîðîâ.  Excel ôóíêöèÿ ВЕЙБУЛЛ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.4).
1.5.12. Распределения Пирсона
Ñèñòåìà ðàñïðåäåëåíèé Ïèðñîíà îñíîâàíà íà òîì, ÷òî ïëîòíîñòè âåðîÿòíîñòè
ìíîãèõ èçâåñòíûõ ðàñïðåäåëåíèé ïîä÷èíÿþòñÿ äèôôåðåíöèàëüíîìó óðàâíåíèþ
îäíîãî îïðåäåëåííîãî òèïà, êîòîðîå çàâèñèò îò ÷åòûðåõ ïàðàìåòðîâ.  çàâèñèìîñòè
îò çíà÷åíèé ýòèõ ïàðàìåòðîâ ðàçëè÷àþò 12 òèïîâ ðàñïðåäåëåíèé, ñðåäè êîòîðûõ òàêèå ðàñïðåäåëåíèÿ, êàê íîðìàëüíîå, ãàììà-ðàñïðåäåëåíèå, áåòà-ðàñïðåäåëåíèå, ðàñïðåäåëåíèå Ñòüþäåíòà è äðóãèå. Óæå ýòî ïåðå÷èñëåíèå ðàñïðåäåëåíèé, èãðàþùèõ
ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, ïîêàçûâàåò âàæíîñòü ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ïîñêîëüêó â ìàòåìàòè÷åñêîé ëèòåðàòóðå ïîëíîå îïèñàíèå ðàñïðåäåëåíèé Ïèðñîíà âñòðå÷àåòñÿ ðåäêî (îáû÷íî óêàçûâàþòñÿ òîëüêî íåêîòîðûå òèïû ðàñïðåäåëåíèé), ïðèâåäåì èõ ïîäðîáíóþ
êëàññèôèêàöèþ. (Ïðèâåäåííûé íèæå ìàòåðèàë, ñ íåáîëüøèìè äîïîëíåíèÿìè àâòîðà, âçÿò èç [8]. Äðóãóþ êëàññèôèêàöèþ êðèâûõ Ïèðñîíà ìîæíî íàéòè â [4].)
Ðàñïðåäåëåíèÿìè Ïèðñîíà íàçûâàþòñÿ íåïðåðûâíûå ðàñïðåäåëåíèÿ, ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ ÿâëÿþòñÿ ðåøåíèÿìè äèôôåðåíöèàëüíîãî óðàâíåíèÿ
df ( x)
x+a
=
f ( x),
dx
b0 + 2b1 x + b2 x 2
ãäå a, b0, b1, b2 — ïàðàìåòðû ðàñïðåäåëåíèÿ. Ýòè ïàðàìåòðû ïîëíîñòüþ îïðåäåëÿþòñÿ ïåðâûìè ÷åòûðüìÿ öåíòðàëüíûìè ìîìåíòàìè ðàñïðåäåëåíèÿ. Ïóñòü
µk — k-é öåíòðàëüíûé ìîìåíò, òîãäà
a=
b1 = −
µ 3 (µ 4 + 3µ 22 )
µ (4µ 2 µ 4 − 3µ 32 )
, b0 = − 2
,
A
A
µ 3 (µ 4 + 3µ 22 )
2µ µ − 3µ 32 − 6µ 32
, b2 = − 2 4
,
2A
A
ãäå A = 10µ 2 µ 4 − 18µ 32 − 12µ 32 .
Глава 1. Основные понятия теории вероятностей
45
Òèïû ðàñïðåäåëåíèé Ïèðñîíà ðàçëè÷àþò â ñîîòâåòñòâèè ñî çíà÷åíèÿìè êîðíåé êâàäðàòíîãî óðàâíåíèÿ b0 + 2b1õ + b2õ2 = 0. Ââåäåì îáîçíà÷åíèÿ: D = b0b2 –
b12, λ = b12/b0b2 = 1 – D. Îòìåòèì, ÷òî áîëüøèíñòâî ïðèâåäåííûõ íèæå ôîðìóë
äëÿ ïëîòíîñòåé âåðîÿòíîñòè óïðîùàåòñÿ, åñëè çà íà÷àëî îòñ÷åòà âçÿòü ìîäó ðàñïðåäåëåíèÿ èëè ìàòåìàòè÷åñêîå îæèäàíèå.
Òèï I. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β), α, β > 0. Îáîçíà÷èì
êàê m = (α – à)/b2(α + β), n = (β – à)/b2(α + β). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé Ïèðñîíà îïðåäåëÿåòñÿ ôîðìóëîé

α 2mβ2 n
(α + x) m (β − x) n , если x ∈ [−α,β],

m + n +1
f ( x) =  (α + β)
B(m + 1, n + 1)
0,
если x ∉ [−α,β].

Çäåñü è äàëåå B(m, n) =
Γ ( m) Γ ( n )
(m > 0, n > 0) — áåòà-ôóíêöèÿ.
Γ ( m + n)
Ðàñïðåäåëåíèÿìè ýòîãî òèïà ÿâëÿþòñÿ áåòà-ðàñïðåäåëåíèÿ.
Òèï II. D < 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 – α2), α = −b0 b2 > 0. Îáîçíà÷èì êàê m = 1/2b2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
1

(α 2 − x 2 )m , если x ∈ [−α, α],
 2 m +1
f ( x) =  α B (m + 1,1/ 2)
0,
если x ∉ [−α,α].

Ýòî ðàñïðåäåëåíèå ñèììåòðè÷íî îòíîñèòåëüíî òî÷êè õ = 0.
Òèï III. D < 0, λ = ∞ è b0 + 2b1õ + b2õ2 = 2b1(õ + α), α = b0/2b1. Îáîçíà÷èì
êàê m = (à – α)/2b1, k = –1/2b1 (k > 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 k m +1
( x + α) m e − k ( x + α ) , если x > −α,

f ( x) =  Γ(m + 1)
0,
если x ≤ −α.

Ýòîò òèï ðàñïðåäåëåíèÿ ÿâëÿåòñÿ ãàììà-ðàñïðåäåëåíèåì.
Òèï IV. D > 0, 0 < λ < 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α2 = D/(b2)2. Îáîçíà÷èì êàê m = –1/2b2 ≥ 1/2, k = –b1(2b2 + 1)/(b2)2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî
òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) = c(α 2 + x 2 ) − m e − k arctg(x / α ) , x ∈ (−∞, ∞),
∞
ãäå c −1 = ∫ (α 2 + x 2 )− m e− k arctg(x / α) dx.
−∞
Òèï V. D = 0, λ = 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α = b1/b2. Îáîçíà÷èì êàê
m = –1/b2 ≥ 1, k = –b1(2b2 + 1)/b2 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
46
Часть I. Основные понятия теории вероятностей и математической статистики
k
−
 k m −1
x − m e x , если x > 0,

f ( x) =  Γ(m − 1)
0,
если x ≤ 0.

Òèï VI. D < 0, λ > 1 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β). Îáîçíà÷èì êàê
m = (α – à)/b2(α + β) > 1, n = (β – à)/b2(α + β) > –1. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî
òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 (α + β) − ( m + n +1)
( x + α) m ( x − β) n , если x > β,

f ( x) =  B(−m − n − 1, n + 1)
0,
если x ≤ β.

Òèï VII. D > 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 + α2), α2 = b0/b2. Îáîçíà÷èì
êàê m = 1/2b2 ≥ 1/2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) =
α
(α 2 + x 2 ) − m , если x ∈ (−∞, ∞).
1 1

B m − , 
2 2

Ðàñïðåäåëåíèå ýòîãî òèïà ÿâëÿåòñÿ ðàñïðåäåëåíèåì Ñòüþäåíòà.
Òèï VIII. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì
êàê m = 1/b2 (–1 < m < 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 m +1
( x + α)m , если x ∈ [−α,0],

f ( x) =  α m +1
0,
если x ∉ [−α, 0].
Òèï IX. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì
êàê m = 1/b2 (m < –1). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 m +1
( x + α)m , если x ∈ [−α,0],

f ( x) =  α m +1
0,
если x ∉ [−α, 0].
Òèï X. D = 0, λ = 0 è b0 + 2b1õ + b2õ2 = b0, ÷èñëèòåëü äðîáè â äèôôåðåíöèàëüíîì óðàâíåíèè Ïèðñîíà ðàâåí à. Îáîçíà÷èì êàê m = à/b0 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
me − mx , если x > 0,
f ( x) = 
если x ≤ 0.
0,
Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ïîêàçàòåëüíûì.
Òèï XI. D = 0, λ íå îïðåäåëåíî, b0 + 2b1õ + b2õ2 = b0. Îáîçíà÷èì êàê σ2 = b0.
Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) =
1
2πσ
e
−
x2
2 σ2
, x ∈ (−∞, ∞).
Глава 1. Основные понятия теории вероятностей
47
Äàííîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íîðìàëüíûì.
Òèï ÕII. Ðàñïðåäåëåíèå ýòîãî òèïà ñîâïàäàåò ñ ðàñïðåäåëåíèåì òèïà I, åñëè
â ïîñëåäíåì ðàñïðåäåëåíèè ïîëîæèòü m = –n.
Ðàñïðåäåëåíèÿ Ïèðñîíà èñïîëüçóþòñÿ äëÿ ñãëàæèâàíèÿ ðàñïðåäåëåíèé âûáîðî÷íûõ çíà÷åíèé. Ýòà ñèñòåìà ðàñïðåäåëåíèé ïðèìåíÿåòñÿ òàêæå äëÿ ïîäáîðà
ðàñïðåäåëåíèÿ ê ýìïèðè÷åñêèì äàííûì òîãäà, êîãäà ïî êàêèì-ëèáî ïðè÷èíàì
òðóäíî èëè íåâîçìîæíî îáîñíîâàòü òèï ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.  ýòîì ñëó÷àå ïî âûáîðêå âû÷èñëÿþòñÿ ïåðâûå ÷åòûðå ìîìåíòà, çàòåì îïðåäåëÿåòñÿ òèï ðàñïðåäåëåíèÿ Ïèðñîíà, çàòåì ìîæíî ïðîâåðèòü ñòåïåíü ñîãëàñîâàííîñòè ýìïèðè÷åñêèõ äàííûõ è ïîëó÷åííîãî ðàñïðåäåëåíèÿ Ïèðñîíà
ñ ïîìîùüþ êðèòåðèÿ Êîëìîãîðîâà–Ñìèðíîâà èëè êðèòåðèÿ χ2.
48
Часть I. Основные понятия теории вероятностей и математической статистики
Глава
2
Основные статистические
методы
Ï
ðè âûïîëíåíèè ñòàòèñòè÷åñêîãî àíàëèçà íàèáîëåå ÷àñòî â êà÷åñòâå èñõîäíîãî ìàòåðèàëà èñïîëüçóåòñÿ ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ íàáëþäåíèé
ñëó÷àéíîé âåëè÷èíû Õ. Äðóãèìè ñëîâàìè, ïðåäïîëàãàåòñÿ, ÷òî èìååòñÿ âåðîÿòíîñòíûé ýêñïåðèìåíò, â êîòîðîì íàáëþäàåòñÿ ñëó÷àéíàÿ âåëè÷èíà Õ, è âûïîëíÿåòñÿ n íåçàâèñèìûõ ðåàëèçàöèé ýòîãî ýêñïåðèìåíòà. Íàáëþäàåìûå çíà÷åíèÿ
õ1, õ2, ..., õn íàçûâàþòñÿ ñëó÷àéíîé âûáîðêîé, êîëè÷åñòâî íàáëþäåíèé n — îáúåìîì âûáîðêè. Êàê ñëó÷àéíàÿ âåëè÷èíà Õ, òàê è åå çíà÷åíèÿ ìîãóò áûòü âåêòîðàìè. Ìíîæåñòâî âîçìîæíûõ çíà÷åíèé, êîòîðûå ìîãóò íàáëþäàòüñÿ ïðè ðåàëèçàöèè
ýêñïåðèìåíòà, îáðàçóþò âûáîðî÷íîå ïðîñòðàíñòâî, èëè, â äðóãèõ òåðìèíàõ, ãåíåðàëüíóþ ñîâîêóïíîñòü. Ñ òî÷êè çðåíèÿ òåîðèè âåðîÿòíîñòåé âûáîðêà õ1, õ2, ..., õn
ÿâëÿåòñÿ ðåàëèçàöèåé íåêîòîðîé ñëó÷àéíîé âåëè÷èíû Õ. Çàäà÷è ìàòåìàòè÷åñêîé
ñòàòèñòèêè âîçíèêàþò, êîãäà ôóíêöèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ íåèçâåñòíà, ïðè ýòîì ìåòîäû ñòàòèñòè÷åñêîãî àíàëèçà ïîçâîëÿþò ïîëó÷èòü èíôîðìàöèþ î ðàçëè÷íûõ çàêîíîìåðíîñòÿõ â ãåíåðàëüíîé ñîâîêóïíîñòè.
Ïðåæäå ÷åì îïèñûâàòü çàäà÷è ñòàòèñòè÷åñêîãî àíàëèçà, îòìåòèì, ÷òî ïåðåä íåïîñðåäñòâåííûì ïðîâåäåíèåì àíàëèçà äàííûõ, êàê ïðàâèëî, âûïîëíÿåòñÿ ýòàï
ïðåäâàðèòåëüíîãî àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ. Íà ýòîì ýòàïå íåîáõîäèìî ÷åòêî îïðåäåëèòü öåëè àíàëèçà, ïîëó÷èòü è ïåðâè÷íî îáðàáîòàòü äàííûå,
îïðåäåëèòü èõ òèï è ñòðóêòóðó, ïîäîáðàòü è îáîñíîâàòü ñòàòèñòè÷åñêèå ìåòîäû,
ñ ïîìîùüþ êîòîðûõ ìîæíî äîñòè÷ü öåëåé àíàëèçà, ïîäãîòîâèòü äàííûå äëÿ ïðèìåíåíèÿ âûáðàííûõ ñòàòèñòè÷åñêèõ ìåòîäîâ è òîëüêî ïîñëå ýòîãî âûïîëíèòü íåïîñðåäñòâåííî ñòàòèñòè÷åñêèé àíàëèç äàííûõ. Ýòîò ýòàï, êðîìå ôîðìàëüíûõ ìåòîäîâ
àíàëèçà äàííûõ, ÷àñòî âêëþ÷àåò â ñåáÿ íåôîðìàëüíûå ñïîñîáû îöåíêè ýòèõ äàííûõ. Èç ñêàçàííîãî ÿñíî, ÷òî ïðåäâàðèòåëüíûé ýòàï ñòàòèñòè÷åñêîãî àíàëèçà
òðåáóåò îòäåëüíîãî ðàññìîòðåíèÿ. Êðîìå òîãî, íà ýòîì ýòàïå òàêæå ïðèìåíÿþòñÿ
ñòàòèñòè÷åñêèå ìåòîäû. Ïðåäâàðèòåëüíîìó àíàëèçó ïîñâÿùåíà ãëàâà 8. Çäåñü
æå ìû ðàññìîòðèì îáùèå ïîíÿòèÿ è ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè.
 çàâèñèìîñòè îò òîãî, êàêîâ êëàññ âîçìîæíûõ ðàñïðåäåëåíèé ãåíåðàëüíîé
ñîâîêóïíîñòè è ÷òî íóæíî çíàòü î ôóíêöèè ðàñïðåäåëåíèÿ, âîçíèêàþò ðàçëè÷íûå ñòàòèñòè÷åñêèå çàäà÷è. Ðàññìîòðèì îñíîâíûå èç íèõ.
2.1. Точечное оценивание параметров распределения
Ïðåäïîëàãàåòñÿ, ÷òî íåèçâåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ïðèíàäëåæèò íåêîòîðîìó ñåìåéñòâó ðàñïðåäåëåíèé F(u, θ), çàâèñÿùåìó îò íåêîòîðîãî ïàðàìåòðà θ
(ïàðàìåòð θ, âîçìîæíî, âåêòîðíûé, ò.å. θ = (θ1, θ2, ..., θk)); òàê, íàïðèìåð,
ñåìåéñòâî íîðìàëüíûõ ðàñïðåäåëåíèé çàâèñèò îò äâóõ ïàðàìåòðîâ — ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè. Íóæíî ïî íàáëþäåíèÿì (çíà÷åíèÿì âûáîðêè)
îöåíèòü ïàðàìåòð (èëè íåñêîëüêî ïàðàìåòðîâ).
Äëÿ ïîñòðîåíèÿ îöåíîê èñïîëüçóþòñÿ ñòàòèñòèêè — ôóíêöèè îò âûáîðî÷íûõ çíà÷åíèé. Ðàñïðîñòðàíåííûìè ïðèìåðàìè ñòàòèñòèê ÿâëÿþòñÿ:
âûáîðî÷íîå ñðåäíåå x =
1 n
∑ xi ,
n i =1
âûáîðî÷íàÿ äèñïåðñèÿ Sn2 =
1 n
∑ ( xi − x )2 ,
n i =1
âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk =
1 n k
∑ xi ,
n i =1
âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k =
1 n
∑ ( xi − x )k .
n i =1
Íèæå áóäóò ïðèâåäåíû ïðèìåðû äðóãèõ ñòàòèñòèê.
ßñíî, ÷òî íå âñÿêàÿ ñòàòèñòèêà ìîæåò ñëóæèòü îöåíêîé íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ. Ïîñêîëüêó ðåçóëüòàòû îïûòîâ ñëó÷àéíû, ëþáàÿ ñòàòèñòèêà ïðåäñòàâëÿåò ñîáîé ñëó÷àéíóþ âåëè÷èíó. ×òîáû ñòàòèñòèêà ìîãëà ñëóæèòü îöåíêîé äàííîãî ïàðàìåòðà θ, íåîáõîäèìî, ÷òîáû ðàñïðåäåëåíèå ýòîé
ñòàòèñòèêè áûëî ñîñðåäîòî÷åíî â äîñòàòî÷íîé áëèçîñòè îò íåèçâåñòíîãî çíà÷åíèÿ
ïàðàìåòðà θ, ò.å. òàê, ÷òîáû âåðîÿòíîñòü áîëüøèõ îòêëîíåíèé ýòîé ñòàòèñòèêè
îò θ áûëà äîñòàòî÷íî ìàëà. Æåëàòåëüíî òàêæå, ÷òîáû òî÷íîñòü îöåíèâàíèÿ óâåëè÷èâàëàñü ïðè óâåëè÷åíèè îáúåìà âûáîðêè.  ñâÿçè ñ ýòèì ââîäÿò ñëåäóþùèå
îïðåäåëåíèÿ, õàðàêòåðèçóþùèå îöåíêè.
Ïóñòü θ̂ n — íåêîòîðàÿ ñòàòèñòè÷åñêàÿ îöåíêà, ïîëó÷åííàÿ ïî âûáîðêå õ1,
õ2, ..., xn è îöåíèâàþùàÿ íåèçâåñòíûé ïàðàìåòð θ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Åñëè îöåíêà îïðåäåëÿåòñÿ îäíèì ÷èñëîì θ̂ n , òî åå íàçûâàþò òî÷å÷íîé; åñëè âû÷èñëÿþòñÿ äâå âåëè÷èíû, θ1n è θ2n, òàêèå, ÷òî
θ1n ≤ θ ≤ θ2n, òî òàêóþ îöåíêó äëÿ θ íàçûâàþò èíòåðâàëüíîé (èíòåðâàëüíûå
îöåíêè ðàññìîòðåíû â ñëåäóþùåì ðàçäåëå).
2.1.1. Несмещенность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ íåñìåùåííîé, åñëè ïðè ëþáîì îáúåìå âûáîðêè åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî îöåíèâàåìîìó ïàðàìåòðó θ: Ì θ̂ n = θ. Ýòî ñâîéñòâî
îçíà÷àåò, ÷òî îöåíêà θ̂ n â ñðåäíåì ïðàâèëüíî îöåíèâàåò íåèçâåñòíûé ïàðàìåòð θ;
ò.å. åñëè åñòü íåêîòîðîå ìíîæåñòâî îöåíîê äàííîãî ïàðàìåòðà (çíà÷åíèÿ îäíîé è
òîé æå ñòàòèñòèêè), òî ñðåäíåå ýòèõ îöåíîê áóäåò ñîâïàäàòü ñ èñòèííûì çíà÷åíèåì ïàðàìåòðà èëè áóäåò ê íåìó áëèçêî.
Îòìåòèì, ÷òî âñå âûáîðî÷íûå íà÷àëüíûå ìîìåíòû, âêëþ÷àÿ âûáîðî÷íîå
ñðåäíåå, ÿâëÿþòñÿ íåñìåùåííûìè îöåíêàìè ñîîòâåòñòâóþùèõ ìîìåíòîâ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îäíàêî âûáîðî÷íàÿ äèñïåðñèÿ Sn2 ÿâëÿåòñÿ
50
Часть I. Основные понятия теории вероятностей и математической статистики
ñìåùåííîé (êàê è äðóãèå öåíòðàëüíûå âûáîðî÷íûå ìîìåíòû): íåòðóäíî ïîêàçàòü, ÷òî MS n2 =
n −1
DX . Íî ïîñêîëüêó ïðè n → ∞ ÌSn2 → DX, îöåíêó Sn2 íàçûn
âàþò àñèìïòîòè÷åñêè íåñìåùåííîé. Åñëè íåìíîãî èçìåíèòü ñòàòèñòèêó Sn2, òî
íîâàÿ îöåíêà äèñïåðñèè áóäåò íåñìåùåííîé:
sn2 =
n 2
1 n
Sn =
∑ ( xi − x )2 .
n −1
n − 1 i =1
Îòìåòèì òàêæå, ÷òî äëÿ íåñìåùåííûõ îöåíîê âåëè÷èíà Ì( θ̂ n – θ)2 ñîâïàäàåò
ñ äèñïåðñèåé ñòàòèñòèêè θ̂ n .
2.1.2. Эффективность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ ýôôåêòèâíîé, åñëè èìååò íàèìåíüøóþ äèñïåðñèþ ñðåäè âñåõ âîçìîæíûõ îöåíîê ïàðàìåòðà θ ïðè ôèêñèðîâàííîì îáúåìå âûáîðêè n.
Ýôôåêòèâíîñòü îöåíêè îáåñïå÷èâàåò íàèìåíüøèé ðàçáðîñ âîçìîæíûõ çíà÷åíèé
îöåíêè θ̂ n âîêðóã èñòèííîãî çíà÷åíèÿ ïàðàìåòðà θ.
Ýôôåêòèâíîñòü îöåíîê ñèëüíî çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè1. Òàê, åñëè ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå,
òî âûáîðî÷íûå ñðåäíåå è äèñïåðñèÿ áóäóò ýôôåêòèâíûìè îöåíêàìè.
2.1.3. Состоятельность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ ñîñòîÿòåëüíîé, åñëè ïðè íåîãðàíè÷åííîì ðîñòå îáúåìà
âûáîðêè äëÿ ïðîèçâîëüíîãî ε > 0
P(| θ̂ n – θ| > ε) → 0 ïðè n → ∞,
èëè, êàê ãîâîðÿò, θ̂ n ñòðåìèòñÿ ê θ ïî âåðîÿòíîñòè ïðè n → ∞.
Ïîíÿòèÿ ñîñòîÿòåëüíîñòè îöåíêè è íåñìåùåííîñòè (òî÷íåå, àñèìïòîòè÷åñêîé
íåñìåùåííîñòè) òåñíî ñâÿçàíû: åñëè îöåíêà θ̂ n ÿâëÿåòñÿ ñîñòîÿòåëüíîé, òî îíà
àñèìïòîòè÷åñêè íåñìåùåííàÿ. Îáðàòíîå óòâåðæäåíèå íå âåðíî, ò.å. ñâîéñòâî ñîñòîÿòåëüíîñòè ÿâëÿåòñÿ áîëåå ñèëüíûì, ÷åì óñëîâèå íåñìåùåííîñòè.
Îòìåòèì, ÷òî âûáîðî÷íîå ñðåäíåå è âûáîðî÷íàÿ äèñïåðñèÿ ÿâëÿþòñÿ ñîñòîÿòåëüíûìè îöåíêàìè. Íèæå áóäóò ïðèâåäåíû ïðèìåðû âûáîðî÷íûõ ñòàòèñòèê,
êîòîðûå ÷àñòî èñïîëüçóþòñÿ â ñòàòèñòè÷åñêîì àíàëèçå, âìåñòå ñ èíòåðâàëüíûìè
îöåíêàìè ïàðàìåòðîâ ðàñïðåäåëåíèé, êîòîðûå ñåé÷àñ ðàññìîòðèì.
1
Òî÷íåå, ýôôåêòèâíîñòü îöåíîê îáû÷íî äîêàçûâàåòñÿ (èëè, èíà÷å ãîâîðÿ, ñòðîÿòñÿ ýôôåêòèâíûå îöåíêè) íà îñíîâå ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, â êîòîðîì ôóíêöèÿ ïðàâäîïîäîáèÿ îïðåäåëÿåòñÿ èñõîäÿ èç ïðåäïîëîæåíèÿ, ÷òî èçâåñòåí êëàññ ðàñïðåäåëåíèé, êîòîðîìó
ïðèíàäëåæèò ðàñïðåäåëåíèå äàííîé ãåíåðàëüíîé ñîâîêóïíîñòè.
Глава 2. Основные статистические методы
51
2.2. Интервальное оценивание параметров
распределения
Òî÷å÷íûå îöåíêè èìåþò òîò íåäîñòàòîê, ÷òî ïî íèì íåëüçÿ ñóäèòü î òî÷íîñòè
ïîëó÷åííûõ îöåíîê. Ïîýòîìó âîçíèêàåò çàäà÷à îïðåäåëåíèÿ íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé òàêîãî èíòåðâàëà (θ1, θ2), êîòîðûé ïîêðûâàë áû íåèçâåñòíîå
çíà÷åíèå ïàðàìåòðà θ ñ çàäàííîé âåðîÿòíîñòüþ.
Ïóñòü Ð(θ1 ≤ θ ≤ θ2) = α, ãäå ñëó÷àéíûé èíòåðâàë (θ1, θ2), êîòîðûé íàçûâàåòñÿ
äîâåðèòåëüíûì èíòåðâàëîì, ñ çàäàííîé âåðîÿòíîñòüþ α ñîäåðæèò îöåíèâàåìûé
ïàðàìåòð θ. Âåëè÷èíó α íàçûâàþò äîâåðèòåëüíûì óðîâíåì èëè íàäåæíîñòüþ.
Âåëè÷èíà δ = (θ1 – θ2)/2 õàðàêòåðèçóåò òî÷íîñòü èíòåðâàëüíîé îöåíêè. Îáû÷íî
âåëè÷èíó α áåðóò ðàâíîé 0,95, 0,99 èëè 0,999. Âåëè÷èíó 1 – α íàçûâàþò óðîâíåì çíà÷èìîñòè îòêëîíåíèÿ îöåíêè. Êîíöû äîâåðèòåëüíîãî èíòåðâàëà θ1 è θ2
íàçûâàþò äîâåðèòåëüíûìè ãðàíèöàìè.
Îäèí èç ðàñïðîñòðàíåííûõ ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ çàêëþ÷àåòñÿ â ñëåäóþùåì. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåòñÿ íåñìåùåííàÿ
òî÷å÷íàÿ îöåíêà θ̂ n ïàðàìåòðà θ. Íàïîìíèì, ÷òî îöåíêà (ñòàòèñòèêà) θ̂ n ÿâëÿåòñÿ
ñëó÷àéíîé âåëè÷èíîé. Êàêèì-ëèáî ñïîñîáîì âû÷èñëÿåòñÿ äèñïåðñèÿ ñòàòèñòèêè θ̂ n
èëè
åå
îöåíêà
σ̂ 2n . Çàòåì ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà ( θ̂ n –
k1 σ̂ n , θ̂ n + k2 σ̂ n ), ãäå k1 è k2 — êîýôôèöèåíòû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþò
âûáðàííûé äîâåðèòåëüíûé óðîâåíü è àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè
ãåíåðàëüíîé ñîâîêóïíîñòè (íàïðèìåð, íîðìàëüíîñòü èëè ñèììåòðè÷íîñòü ðàñïðåäåëåíèÿ). Íî ïîñêîëüêó òàêîé èíòåðâàë îïðåäåëÿåòñÿ íå îäíîçíà÷íî, íàêëàäûâàåòñÿ äîïîëíèòåëüíîå óñëîâèå, ÷òîáû äàííûé èíòåðâàë èìåë ìèíèìàëüíóþ äëèíó.
Åñëè ðàñïðåäåëåíèå ñòàòèñòèêè θ̂ n ñèììåòðè÷íî (èëè áëèçêî ê ñèììåòðè÷íîìó),
òî â ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë ìèíèìàëüíîé äëèíû ïîëó÷àåòñÿ ïðè
k1 = k2. Íà òàêîé îñíîâå ñòðîèòñÿ, â ÷àñòíîñòè, èçâåñòíûé êðèòåðèé Ñòüþäåíòà
(ñì. íèæå) äëÿ íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé. Â ñàìîì
îáùåì ñëó÷àå (ïðè ìèíèìàëüíûõ ïðåäïîëîæåíèÿõ îòíîñèòåëüíî ðàñïðåäåëåíèÿ
ãåíåðàëüíîé ñîâîêóïíîñòè) äîâåðèòåëüíûå èíòåðâàëû ìîæíî ïîñòðîèòü íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà èëè äðóãèõ ïîäîáíûõ íåðàâåíñòâ (ñì. ðàçäåë 1.2.4).
Îäíàêî òàêèå èíòåðâàëüíûå îöåíêè èìåþò íåáîëüøóþ òî÷íîñòü.
Âàæíóþ ðîëü ïðè ïîñòðîåíèè òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê èãðàþò èõ àñèìïòîòè÷åñêèå ñâîéñòâà. ×àñòî ÿâíî èëè íå ÿâíî èñïîëüçóåòñÿ ñëåäóþùàÿ äîñòàòî÷íî
îáùàÿ ñõåìà ðàññóæäåíèé [6, ñ. 371]. Ïóñòü èìåþòñÿ íåçàâèñèìûå îäèíàêîâî ðàñïðåäåëåííûå âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn, êîòîðûå ÿâëÿþòñÿ ðåàëèçàöèåé
ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u). Òðåáóåòñÿ ïî âûáîðêå îöåíèòü ìàòåìàòè÷åñêîå îæèäàíèå G = MY = ∫ g (u )dF (u ) ñëó÷àéíîé âåëè÷èíû
Y = g(X). (Åñòåñòâåííî ïðåäïîëîæåíèå î òîì, ÷òî ôóíêöèÿ g òàêîâà, ÷òî ñëó÷àéíàÿ
âåëè÷èíà Y èìååò êîíå÷íûé ïåðâûé ìîìåíò.) Ñòàòèñòèêà Gˆ n , îöåíèâàþùàÿ çíà÷åíèå âåëè÷èíû G, âû÷èñëÿåòñÿ ïî ôîðìóëå Gˆ n =
52
1 n
∑ g ( xi ) . Ýòà îöåíêà íåñìåùåíà:
n i =1
Часть I. Основные понятия теории вероятностей и математической статистики
1 n
1 n
1 n
MGˆ n = ∑ Mg ( xi ) = ∑ Mg (X) = ∑ MY = G.
n i =1
n i =1
n i =1
Ïî óñèëåííîìó çàêîíó áîëüøèõ ÷èñåë îíà òàêæå ñîñòîÿòåëüíà2, ò.å. ñ âåðîÿòíîñòüþ 1 ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Gˆ ñõîäèòñÿ ê çíà÷åíèþ G. Åñn
ëè åùå ïîòðåáîâàòü, ÷òîáû ñóùåñòâîâàëà äèñïåðñèÿ DY = σ2, òî èç öåíòðàëüíîé
ïðåäåëüíîé òåîðåìû äëÿ ñóììû îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ ñëàãàåìûõ ñëåäóåò, ÷òî ñëó÷àéíàÿ âåëè÷èíà
Zn =
n ˆ
1 n g ( xi ) − G
(Gn − G ) =
∑ σ
σ
n i =1
àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1). Îòñþäà âûòåêàåò, ÷òî ïðè
áîëüøèõ n íåðàâåíñòâî
σ
σ
Gˆ n − α
< G < Gˆ n + α
n
n
âûïîëíÿåòñÿ ñ âåðîÿòíîñòüþ pα =
2
2π
∫
α
0
−
e
u2
2
du = 2Ô(α) – 1, ãäå Ô(u) — ôóíêöèÿ
ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ïðè çàäàííîì çíà÷åíèè âåðîÿòíîñòè ðα èç ïîñëåäíåãî ðàâåíñòâà îïðåäåëÿåòñÿ çíà÷åíèå α, â ðåçóëüòàòå ïîëó÷àåì äîâåðèòåëüíûé èíòåðâàë
 ˆ
σ ˆ
σ 
, Gn + α
 Gn − α
,
n
n

êîòîðûé ñîäåðæèò îöåíèâàåìîå çíà÷åíèå G ñ âåðîÿòíîñòüþ ðα.
Ïîñòðîåííàÿ èíòåðâàëüíàÿ îöåíêà íå âñåãäà ïðèìåíèìà íà ïðàêòèêå, ïîñêîëüêó çíà÷åíèå äèñïåðñèè σ2 ìîæåò áûòü íåèçâåñòíûì. Îäíàêî ïðè áîëüøèõ
n, èñõîäÿ èç òåõ æå ñîîáðàæåíèé, êîòîðûå èçëîæåíû âûøå, èìååì
DY = σ 2 ≈
1 n
∑ ( g ( xi ) − Gˆ n )2 = Sn2 .
n i =1
Îøèáêà, âîçíèêàþùàÿ ïðè çàìåíå â ïðèâåäåííûõ âûøå ôîðìóëàõ âåëè÷èíû σ
åå îöåíêîé Sn, èìååò áîëåå âûñîêèé ïîðÿäîê ìàëîñòè (ïðè n → ), ÷åì îøèáêà,
âîçíèêàþùàÿ ïðè çàìåíå òî÷íîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Zn íîðìàëüíûì ðàñïðåäåëåíèåì. Ïîýòîìó “áåç çàçðåíèÿ ñîâåñòè” â êà÷åñòâå äîâåðèòåëüíîãî èíòåðâàëà äëÿ èñòèííîãî çíà÷åíèÿ G ìîæíî èñïîëüçîâàòü èíòåðâàë
Sn ˆ
S 
 ˆ
, Gn + α n  .
 Gn − α
n
n

Åñëè îäíîâðåìåííî îöåíèâàþòñÿ íåñêîëüêî ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, òî èíîãäà âîçìîæíî ïîñòðîåíèå ìíîãîìåðíûõ (ðàçìåðíîñòü ïî ÷èñëó îöåíèâàåìûõ ïàðàìåòðîâ) äîâåðèòåëüíûõ îáëàñòåé, êîòîðûå ñîäåðæàò íåèçâåñòíûå
çíà÷åíèÿ ïàðàìåòðîâ. Îäíàêî ïîñòðîåíèå òàêèõ îáëàñòåé âûçûâàåò îïðåäåëåííûå
çàòðóäíåíèÿ, ïîñêîëüêó ñòàòèñòèêè, îöåíèâàþùèå ïàðàìåòðû, íå ÿâëÿþòñÿ íåçàâèñèìûìè ñëó÷àéíûìè âåëè÷èíàìè (ïîýòîìó íåëüçÿ ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü ïðîñòî êàê ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ îòäåëüíûõ ïàðàìåòðîâ).
2
Òî÷íåå, îíà ñèëüíî ñîñòîÿòåëüíà.
Глава 2. Основные статистические методы
53
Âìåñòå ñ òåì, åñëè óäàåòñÿ ïîñòðîèòü òàêóþ äîâåðèòåëüíóþ îáëàñòü, êàê ïðàâèëî, îíà çíà÷èòåëüíî áîëåå òî÷íî ëîêàëèçóåò çíà÷åíèÿ íåèçâåñòíûõ ïàðàìåòðîâ
ðàñïðåäåëåíèÿ, ÷åì ïðîñòîå ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ.  ýòîé êíèãå ìû íå áóäåì ðàññìàòðèâàòü ìíîãîìåðíûå äîâåðèòåëüíûå îáëàñòè.
2.3. Выборочные статистики и интервальные оценки
Ïðèâåäåì ïðèìåðû ñòàòèñòèê è äîâåðèòåëüíûå èíòåðâàëû äëÿ íèõ, êîòîðûå
íàõîäÿò íàèáîëüøåå ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå.  ïîñëåäóþùèõ ÷àñòÿõ êíèãè áóäåò ïîêàçàíà èõ ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ñ èñïîëüçîâàíèåì ñòàòèñòè÷åñêèõ ôóíêöèé èëè ñðåäñòâ Excel.
Ïîñêîëüêó ñâîéñòâà ýòèõ ñòàòèñòèê, è îñîáåííî ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ, çàâèñÿò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ïðè èõ
îïèñàíèè íåîáõîäèìî óêàçûâàòü ñòàòèñòè÷åñêóþ ìîäåëü, â ðàìêàõ êîòîðîé ïðèìåíèìû äàííûå ñòàòèñòèêè è äîâåðèòåëüíûå èíòåðâàëû. Ñòàòèñòè÷åñêàÿ ìîäåëü
îïèñûâàåò àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè,
òðåáîâàíèÿ ê âûáîðî÷íûì çíà÷åíèÿì (íàïðèìåð, èõ íåçàâèñèìîñòü èëè ìèíèìàëüíûé îáúåì âûáîðêè) è, âîçìîæíî, ñïîñîá ïðåäñòàâëåíèÿ äàííûõ. Ñòàòèñòè÷åñêèå
ìîäåëè ìîãóò áûòü ðàçëè÷íûìè äëÿ òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê. Äàëåå
â ýòîì ðàçäåëå ïðåäïîëàãàåòñÿ, ÷òî, åñëè íå óêàçàíî äðóãîå, âñå âûáîðî÷íûå çíà÷åíèÿ íåçàâèñèìû è èìåþò îäèíàêîâîå ðàñïðåäåëåíèå, ò.å. òðåáîâàíèå íåçàâèñèìîñòè
âûáîðî÷íûõ çíà÷åíèé âêëþ÷àåòñÿ â ñòàòèñòè÷åñêóþ ìîäåëü îáÿçàòåëüíî.
Åñëè êîíêðåòíàÿ âûáîðêà íå ñîîòâåòñòâóåò îïðåäåëåííîé ñòàòèñòè÷åñêîé ìîäåëè, íî âñå ðàâíî íà îñíîâå äàííîé âûáîðêè âû÷èñëÿþòñÿ êàêèå-ëèáî îöåíêè, îïðåäåëÿåìûå â ðàìêàõ òîëüêî ýòîé ñòàòèñòè÷åñêîé ìîäåëè, òî âåñüìà âåðîÿòíî, ÷òî òå
âûâîäû, êîòîðûå ìîæíî ñäåëàòü íà îñíîâå ïîëó÷åííûõ îöåíîê, îêàæóòñÿ îøèáî÷íûìè. Çàìåòèì, ÷òî ñòàòèñòè÷åñêèé àíàëèç âûïîëíÿåòñÿ íå ïðîñòî èç-çà ëþáâè
ê âû÷èñëåíèÿì, à äëÿ îïðåäåëåííûõ öåëåé, ñðåäñòâîì äîñòèæåíèÿ êîòîðûõ ñëóæèò
ñòàòèñòè÷åñêèé àíàëèç. Ïðè÷èíîé áîëüøèíñòâà íåâåðíûõ ñòàòèñòè÷åñêèõ âûâîäîâ,
êîòîðûå âåñüìà ÷àñòî ìîæíî âñòðåòèòü íà ïðàêòèêå, ÿâëÿåòñÿ íåïðàâîìåðíîå
ïðèìåíåíèå îöåíîê (è ñòàòèñòè÷åñêèõ êðèòåðèåâ, î êîòîðûõ ñêàçàíî íèæå) â ñèòóàöèè, êîãäà âûáîðêà íå óäîâëåòâîðÿåò óñëîâèÿì ñòàòèñòè÷åñêîé ìîäåëè.
Ñ äðóãîé ñòîðîíû, ÷àñòî ìîæíî ïðåíåáðå÷ü óìåðåííûìè îòêëîíåíèÿìè îò óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è ïîïûòàòüñÿ ïðèìåíèòü îöåíêè äàííîé ìîäåëè.
Ïîýòîìó ïðè îïèñàíèè îöåíîê áóäåì ïîêàçûâàòü âîçìîæíîñòü îñëàáëåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è óêàçûâàòü ñòåïåíü îòêëîíåíèÿ îò ìîäåëè, ïðè êîòîðîé ñòàòèñòèêè ñîõðàíÿþò ñâîè ñâîéñòâà.
Ñäåëàåì åùå îäíî çàìå÷àíèå. Çäåñü ìû íå ðàññìàòðèâàåì ìåòîäû ïîñòðîåíèÿ
îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ. Ìû ïðèâîäèì òîëüêî ãîòîâûå ôîðìóëû è ðåêîìåíäàöèè ïî èõ ïðèìåíåíèþ. ×èòàòåëü, êîòîðûé õî÷åò ïîáëèæå ïîçíàêîìèòüñÿ
ñ ìåòîäàìè ïîñòðîåíèÿ îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ, ìîæåò îáðàòèòüñÿ ê
ìíîãî÷èñëåííûì èçäàíèÿì ïî äàííîìó âîïðîñó, ñðåäè êîòîðûõ âûäåëèì [5, 6, 17].
2.3.1. Статистика для оценивания математического ожидания
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íîå ìàòåìàòè÷åñêîå îæèäàíèå. Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè
54
Часть I. Основные понятия теории вероятностей и математической статистики
êîíå÷íîãî âòîðîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Çäåñü
è äàëåå, åñëè íå óêàçàíî äðóãîå, n — îáúåì âûáîðêè.
Ñòàòèñòèêà äëÿ îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ:
x=
1 n
∑ xi .
n i =1
Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå äèñïåðñèÿ: Dx =
DX
,
n
ãäå DX — äèñïåðñèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îòìåòèì òàêæå,
÷òî êîýôôèöèåíò àñèììåòðèè β1 ( x ) ðàñïðåäåëåíèÿ ñòàòèñòèêè x ñâÿçàí ñ êîýôôèöèåíòîì àñèììåòðèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè β1 (X) (ñì. ðàçäåë 1.2.3) çàâèñèìîñòüþ β1 ( x ) =
β1 (X)
n
.
Интервальные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íîé èçâåñòíîé äèñïåðñèåé σ2.
Ýòî íàèáîëåå îáùàÿ ñòàòèñòè÷åñêàÿ ìîäåëü.  ðàìêàõ òàêîé ìîäåëè äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ìîæíî ïîñòðîèòü
òîëüêî íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà (ñì. ðàçäåë 1.2.4), êîòîðîå â äàííîì
ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k
σ
n
) ≤ 1−
1
. Êîýôôèöèåíò k íàõîäèòñÿ
k2
â ñîîòâåòñòâèè ñ çàäàííûì äîâåðèòåëüíûì óðîâíåì α èç ðàâåíñòâà α = 1 – 1/k2:

σ
σ 
,x +k
k = 1/ 1 − α . Äîâåðèòåëüíûé èíòåðâàë áóäåò èìåòü âèä  x − k
.
n
n

Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñèììåòðè÷íîå îäíîìîäàëüíîå ðàñïðåäåëåíèå ñ èçâåñòíîé êîíå÷íîé äèñïåðñèåé σ2.
 ýòîé ñòàòèñòè÷åñêîé ìîäåëè ðàñïðåäåëåíèå ñòàòèñòèêè x òàêæå áóäåò ñèììåòðè÷íûì è îäíîìîäàëüíûì3. Ïîýòîìó äëÿ ïîñòðîåíèÿ èíòåðâàëüíûõ îöåíîê
ìîæíî âîñïîëüçîâàòüñÿ íåðàâåíñòâîì Ãàóññà, êîòîðîå â äàííîì ñëó÷àå áóäåò
èìåòü âèä P(| x − MX | ≤ k
k=
3
2 1− α
σ
n
) ≤ 1−
4
. Çíà÷åíèå k çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå
9k 2
, ãäå α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, à äîâåðèòåëüíûé èíòåð-

σ

n
âàë èìååò âèä  x − k
,x +k
σ 
.
n
Ñòàòèñòè÷åñêàÿ ìîäåëü 3. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì è íåèçâåñòíîé äèñïåðñèåé. Îáúåì âûáîðêè n áîëüøå 30.
3
Ê ñîæàëåíèþ, â ýòîé ìîäåëè íåëüçÿ îñâîáîäèòüñÿ îò óñëîâèÿ ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ, ïîñêîëüêó, êàê èçâåñòíî, ñâåðòêà îäíîìîäàëüíûõ ðàñïðåäåëåíèé íå îáÿçàíà áûòü îäíîìîäàëüíûì ðàñïðåäåëåíèåì. Äðóãèìè ñëîâàìè, åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè
îäíîìîäàëüíî, òî ðàñïðåäåëåíèå
x
íå âñåãäà áóäåò îäíîìîäàëüíûì.
Глава 2. Основные статистические методы
55
 äàííîé ìîäåëè ìîæíî ïîñòðîèòü èíòåðâàëüíûå îöåíêè, îñíîâûâàÿñü íà àñèìïòîòè÷åñêèõ ñâîéñòâàõ ñòàòèñòèêè x (ñì. ðàçäåë 2.2). Ñäåëàåì îáùåå çàìå÷àíèå
î òîì, êàêîé îáúåì âûáîðêè ñ÷èòàòü äîñòàòî÷íûì, ÷òîáû ïðèìåíÿòü àñèìïòîòè÷åñêèå îöåíêè.  ëèòåðàòóðå ïî ïðèêëàäíîé ñòàòèñòèêå îáû÷íî óêàçûâàåòñÿ, ÷òî äëÿ
ýòîãî äîñòàòî÷íî, ÷òîáû n áûëî áîëüøå 20, 25 èëè 30. Òî÷íóþ íèæíþþ ãðàíèöó
äëÿ n îïðåäåëèòü ñëîæíî, ïîñêîëüêó îíà çàâèñèò îò ìíîãèõ ôàêòîðîâ, ïðåæäå âñåãî îò òèïà ðàñïðåäåëåíèÿ.  òåîðèè âåðîÿòíîñòåé ïîêàçàíî (íåðàâåíñòâî ÁåððèÝññååíà è ïîäîáíûå), ÷òî ñêîðîñòü ñõîäèìîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè x ê íîðìàëüíîìó â ðàâíîìåðíîé ìåòðèêå (è äàæå â èíòåãðàëüíûõ ìåòðèêàõ) èìååò ïîðÿ-
 1 
 è ýòîò ïîðÿäîê íåëüçÿ óëó÷øèòü, íå ââîäÿ äîïîëíèòåëüíûõ ïðåäïî n
äîê O 
ëîæåíèé. Îòñþäà ñëåäóåò, ÷òî çíà÷åíèå n äîëæíî áûòü äîñòàòî÷íî áîëüøèì (õîòÿ
áû áîëüøå 100). Îäíàêî íà ïðàêòèêå óæå ïðè n ≥ 20 ïîëó÷àþòñÿ äîñòàòî÷íî òî÷íûå îöåíêè.  äàëüíåéøåì, åñëè íå îãîâîðåíî äðóãîå, áóäåì ïðèìåíÿòü àñèìïòîòè÷åñêèå ìåòîäû, êîãäà n ≥ 30. Îäíàêî ñëåäóåò ïîìíèòü, ÷òî êàêîé áû íå áûë îáúåì âûáîðêè, àñèìïòîòè÷åñêèå îöåíêè — ýòî âñåãäà òîëüêî ïðèáëèæåííûå îöåíêè.
Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ íà îñíîâå
àñèìïòîòè÷åñêîé íîðìàëüíîñòè îöåíîê, êàê ïîêàçàíî â ðàçäåëå 2.2. Äîâåðèòåëü-

Sn

n
íûé èíòåðâàë èìååò âèä  x − k
,x +k
Sn 
 , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç
n
óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ
ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
Îòìåòèì, ÷òî ïðèìåíåíèå âìåñòî íîðìàëüíîãî ðàñïðåäåëåíèÿ ðàñïðåäåëåíèÿ
Ñòüþäåíòà ðàñøèðÿåò äîâåðèòåëüíûé èíòåðâàë, òåì ñàìûì ïîâûøàÿ åãî íàäåæíîñòü. Ïîýòîìó íà ïðàêòèêå îáû÷íî ïðèìåíÿþò äîâåðèòåëüíûé èíòåðâàë, ïîñòðîåííûé ñ ïîìîùüþ ðàñïðåäåëåíèÿ Ñòüþäåíòà, êàê ïîêàçàíî â ðàçäåëå 2.3.6.
Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ êîíêðåòíûõ
ðàñïðåäåëåíèé áóäóò ïîêàçàíû íèæå.
2.3.2. Статистика для оценивания дисперсии
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íóþ äèñïåðñèþ.
Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè êîíå÷íîãî ÷åòâåðòîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
Ñòàòèñòèêà äëÿ îöåíêè äèñïåðñèè DX:
âûáîðî÷íàÿ äèñïåðñèÿ Sn2 =
1 n
∑ ( xi − x )2 ,
n i =1
ãäå n — îáúåì âûáîðêè.
Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî MSn2 =
56
n −1
DX , äèñïåðñèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå
n
Часть I. Основные понятия теории вероятностей и математической статистики
DS n2 =
µ 4 − µ 22 2(µ 4 − 2µ 22 ) µ 4 − 3µ 22 µ 4 − µ 22
 1
−
+
=
+ O 2
n
n2
n3
n
n

,

ãäå µr — r-é öåíòðàëüíûé ìîìåíò ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðèâåäåì òàêæå
ôîðìóëû äëÿ òðåòüåãî öåíòðàëüíîãî ìîìåíòà ñòàòèñòèêè S n2 è åå êîýôôèöèåíòà
àñèììåòðèè β1 ( S n2 ) (ñì. ðàçäåë 1.2.3):
M(Sn2 − MS n2 )3 =
β1 (Sn2 ) =
Íåñìåùåííîé
îöåíêîé
µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32
 1
+ O 3  ,
2
n
n 
µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32
(µ 4 − µ )n
2
2
äëÿ
 1
+ O  3/ 2
n
äèñïåðñèè

.

DX
áóäåò
ñòàòèñòèêà
µ −µ
1
 1 
+ O 2  .
( xi − x ) 2 , äèñïåðñèÿ êîòîðîé èìååò ïîðÿäîê Dsn2 = 4
∑
n − 1 i =1
n
n 
2
2
Ðàçëè÷èå ìåæäó îöåíêàìè S n è sn èìååò çíà÷åíèå òîëüêî ïðè î÷åíü ìàëûõ
sn2 =
2
2
n
çíà÷åíèÿõ n. Ïðè n > 10 ðàçíîñòü ìåæäó íèìè ìåíüøå 10%.
Ïðèâåäåì åùå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè îöåíêè ñðåäíåêâàäðàòè÷íîãî
îòêëîíåíèÿ Sn:
µ − µ 22
1
 1 
+ O 2  .
MSn = σ + O   è DS n = 4
4µ 2 n
n
n 
Интервальные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì. Îáúåì âûáîðêè — íå ìåíåå 50.
Åñëè íåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîé äèñïåðñèè ÿâëÿåòñÿ èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè
ðàñïðåäåëåíèÿ ñòàòèñòèê äëÿ âû÷èñëåíèÿ ìîìåíòîâ ãåíåðàëüíîé ñîâîêóïíîñòè.
 ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë èìååò âèä
(S
2
n
− kσ( S n2 ), Sn2 + kσ( Sn2 ) ) , ãäå
êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå σ(S n2 ) ñòàòèñòèêè S n2 âû÷èñëÿåòñÿ ïî ôîð-
µ 4 − S 22
1 n
, ãäå µ 4 = ∑ ( xi − x )4 4.
n i =1
n
Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ äèñïåðñèè êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò
ïîêàçàíû íèæå.
ìóëå σ(S n2 ) =
4
Ïî ýòîé ôîðìóëå âû÷èñëÿåòñÿ ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå ñòàòèñòèêè Sn2 ñ òî÷íîñòüþ
O (1/ n ) . Ìîæíî èñïîëüçîâàòü áîëåå òî÷íóþ ôîðìóëó, íî, êàê ïðàâèëî, ýòîãî íå òðåáóåòñÿ.
Глава 2. Основные статистические методы
57
2.3.3. Статистики для оценивания моментов
Точечные оценки для начальных моментов
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà.
Ñòàòèñòèêà äëÿ îöåíêè íà÷àëüíîãî ìîìåíòà mk ïîðÿäêà k:
âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk =
1 n k
∑ xi .
n i =1
Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Ðàñïðåäåëåíèå ñòàòèñòèêè mk àñèìïòîòè÷åñêè íîðìàëüíî. Åå äèñïåðñèÿ: Dmk =
m2 k − mk2
.
n
Точечные оценки для центральных моментов
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà.
Ñòàòèñòèêà äëÿ îöåíêè öåíòðàëüíîãî ìîìåíòà µk ïîðÿäêà k:
âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k =
1 n
( xi − x ) k .
∑
n i =1
Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ: Ì µ k = µk + Î(n–1). Åå äèñïåðñèÿ:
µ 2 k − 2kµ k −1µ k +1 − µ k2 + k 2 µ 2 µ 2k −1
 1 
+ O 2  .
n
n 
Èíòåðâàëüíûå îöåíêè äëÿ ìîìåíòîâ âûøå âòîðîãî ïîðÿäêà ñòðîÿòñÿ ðåäêî.
Åñëè íå äåëàòü ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè,
òî äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíûõ ìîìåíòîâ ìîæíî ïîñòðîèòü òîëüêî
íà îñíîâå èõ àñèìïòîòè÷åñêîé íîðìàëüíîñòè ïðè äîñòàòî÷íî áîëüøèõ çíà÷åíèÿõ n.
Dµ k =
2.3.4. Статистики для оценивания коэффициентов
асимметрии и эксцесса
Точечные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ÷åòâåðòîãî ïîðÿäêà.
Íàïîìíèì, ÷òî êîýôôèöèåíò àñèììåòðèè âû÷èñëÿåòñÿ ïî ôîðìóëå β1 = µ3/µ23/2,
à êîýôôèöèåíò ýêñöåññà — ïî ôîðìóëå β2 = µ4/µ22 – 3, ãäå µk — öåíòðàëüíûå ìîìåíòû ïîðÿäêà k (ñì. ðàçäåë 1.2.3). Äëÿ ïîëó÷åíèÿ îöåíîê ýòèõ êîýôôèöèåíòîâ
âû÷èñëÿþòñÿ âûáîðî÷íûå öåíòðàëüíûå ìîìåíòû µ k =
1 n
∑ ( xi − x )k , êîòîðûå çàòåì
n i =1
ïîäñòàâëÿþòñÿ â ïðèâåäåííûå ôîðìóëû âìåñòî µk. Ïîëó÷àåì îöåíêè:
β1 =
58
µ3
µ
3
2
,
β2 =
µ4
−3.
µ 22
Часть I. Основные понятия теории вероятностей и математической статистики
Ýòè îöåíêè ñîñòîÿòåëüíûå è àñèìïòîòè÷åñêè íåñìåùåííûå: M β1 = β1 + O(n −1 ) ,
M β2 = β 2 + O (n −1 ) . Îòìåòèì òàêæå, ÷òî D β1 =
d=
d
 1
+ O  3/ 2
n
n

 , ãäå

4µ 22 µ 6 − 12µ 2 µ 3µ 5 − 24µ 32 µ 4 + 9µ 32 µ 4 + 35µ 32 µ 32 + 36µ 52
.
4µ 52
Åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñèììåòðè÷íî, òî
d=
4µ 22 µ 6 − 24µ 32 µ 4 + 36µ 52
.
4µ 52
Îòìåòèì òàêæå, ÷òî íà ïðàêòèêå, åñëè âûáîðî÷íîå ðàñïðåäåëåíèå áëèçêî
ê íîðìàëüíîìó, äëÿ îöåíêè ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé s1 è s2 êîýôôèöèåíòîâ β1 è β2 èñïîëüçóþò ôîðìóëû
s1 =
6(n − 2)
24n(n − 2)(n − 3)
, s2 =
.
(n + 1)(n + 3)
(n + 1)2 (n + 3)(n + 5)
 ðàçäåëå 9.2 ïîêàçàíî ïðàêòè÷åñêîå ïðèìåíåíèå êîýôôèöèåíòîâ β1 è β2 äëÿ
ïîäáîðà ôóíêöèé ðàñïðåäåëåíèé.
2.3.5. Статистика для оценивания медианы
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè.
Íàïîìíèì, ÷òî ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2.
Òî÷å÷íàÿ îöåíêà äëÿ ìåäèàíû ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
Íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé ñòðîèòñÿ âàðèàöèîííûé ðÿä, ò.å. çíà÷åíèÿ õ1, õ2, ..., õn ðàñïîëàãàþòñÿ â ïîðÿäêå âîçðàñòàíèÿ. Ïîëó÷àåì ïîñëåäîâàòåëüíîñòü õ(1) ≤ õ(2) ≤ ... ≤ õ(n), êîòîðàÿ íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì (î âàðèàöèîííîì ðÿäå ðå÷ü èäåò íèæå, â ðàçäåëå 2.3.9). Åñëè îáúåì âûáîðêè n —
íå÷åòíîå ÷èñëî, ò.å. n = 2k + 1, òî â êà÷åñòâå îöåíêè ìåäèàíû âûáèðàåòñÿ çíà÷åíèå õ(k) èç âàðèàöèîííîãî ðÿäà. Åñëè n ÷åòíîå, ò.å. n = 2k , òî â êà÷åñòâå
îöåíêè ìåäèàíû âûáèðàåòñÿ ïîëóñóììà çíà÷åíèé õ(k) è õ(k+1) âàðèàöèîííîãî ðÿäà5. Áîëåå ïîäðîáíî ïîëó÷åíèå îöåíêè ìåäèàíû îïèñàíî â ðàçäåëå 8.4.
Äàëåå ïðèâåäåì ìåòîäû îöåíèâàíèÿ ïàðàìåòðîâ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé, äëÿ ðåàëèçàöèè êîòîðûõ â Excel ïðåäóñìîòðåíû ñïåöèàëüíûå ôóíêöèè èëè ñðåäñòâà (ñì. ãëàâû 4 è 5).
2.3.6. Оценки параметров нормального распределения
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2.
5
 ïðèíöèïå, â ïîñëåäíåì ñëó÷àå â êà÷åñòâå îöåíêè ìåäèàíû ìîæíî âçÿòü ëþáîå çíà÷åíèå èç
èíòåðâàëà (õ(k), õ(k+1)).
Глава 2. Основные статистические методы
59
Точечные оценки
Äëÿ òî÷å÷íîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ m è äèñïåðñèè σ2 èñïîëüçóþòñÿ ñòàòèñòèêè x =
1 n
1 n
xi è Sn2 = ∑ ( xi − x )2 , êîòîðûå ÿâëÿþòñÿ íåñìå∑
n i =1
n i =1
ùåííûìè ( S n2 àñèìïòîòè÷åñêè íåñìåùåííàÿ), ýôôåêòèâíûìè è ñîñòîÿòåëüíûìè
îöåíêàìè íåèçâåñòíûõ m è σ2. Ôîðìóëû äëÿ äèñïåðñèé ýòèõ ñòàòèñòèê ïðèâåäåíû â ðàçäåëàõ 2.3.1 è 2.3.2.
Ñòàòèñòèêà x ðàñïðåäåëåíà ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíè-
n ( x − m) / σ èìååò ñòàíäàðòíîå íîð-
åì m è äèñïåðñèåé σ2/n, à ñëó÷àéíàÿ âåëè÷èíà
ìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà n S /σ2 èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1)
2
n
ñòåïåíüþ ñâîáîäû (ñì. ðàçäåë 1.5.5). Ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ
ñâîáîäû (ñì. ðàçäåë 1.5.6) èìååò ñëó÷àéíàÿ âåëè÷èíà
n − 1( x − m) / S n . Ýòè ñâîéñò-
2
n
âà ñòàòèñòèê x è S èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ.
Интервальные оценки для математического ожидания
Ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ
çàâèñèò îò òîãî, èçâåñòíî ëè çíà÷åíèå äèñïåðñèè σ2. Åñëè çíà÷åíèå äèñïåðñèè
èçâåñòíî, òî äîâåðèòåëüíûé èíòåðâàë, ñîîòâåòñòâóþùèé äîâåðèòåëüíîìó óðîâíþ

σ 
 , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ
n
n

α = 2Ô(k) – 1, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
( Excel, êðîìå äðóãèõ ñðåäñòâ, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé Excel ДОВЕРИТ, êîòîðàÿ ïî çàäàííûì çíà÷åíèÿì
σ
α, σ è n âû÷èñëÿåò âåëè÷èíó k
(ñì. ðàçäåë 4.11.2).)
n
 ñëó÷àå, êîãäà çíà÷åíèå äèñïåðñèè σ2 íåèçâåñòíî, âìåñòî ýòîãî çíà÷åíèÿ èñ1 n
ïîëüçóþò âûáîðî÷íóþ äèñïåðñèþ Sn2 = ∑ ( xi − x ) 2 , à çíà÷åíèå êîýôôèöèåíòà k
n i =1
îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ
Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà
α, èìååò âèä  x − k
σ
,x +k
n − 1( x − m) / S n èìååò èìåííî òàêîå ðàñïðåäåëåíèå. Äîâåðèòåëüíûé èíòåðâàë

Sn

n −1
èìååò âèä  x − k
,x +k

.
n −1 
Sn
 ãëàâå 10 ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ.
Интервальные оценки для дисперсии
Ïðåäïîëîæèì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ
ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû (ñëó÷àé, êîãäà èçâåñòíî ìàòåìàòè÷åñêîå
îæèäàíèå, ðàññìîòðåí â ãëàâå 10). Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà n S n2 /σ2 èìååò
60
Часть I. Основные понятия теории вероятностей и математической статистики
ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû, äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ïðè
çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì îáðàçîì. Âû÷èñëÿþòñÿ
òî÷å÷íûå îöåíêè x =
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 è îïðåäåëÿþòñÿ êîýôôèöèåíòû
∑
n i =1
n i =1
tн = Fn−−11 ( β н ) è tв = Fn−−11 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fn−−11 — ôóíêöèÿ,
îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Äîâåðèòåëü-
n 2 n 2
S n , Sn  .
tн 
 tв
íûé èíòåðâàë èìååò âèä 
Òàêæå ìîæíî ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü äëÿ ñîâìåñòíîãî îöåíèâàíèÿ
ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè [7, ñ. 94, 18, ñ. 181].
2.3.7. Оценка параметра р распределения Бернулли
Íàïîìíèì, ÷òî ðàñïðåäåëåíèå Áåðíóëëè îáû÷íî ðàññìàòðèâàåòñÿ êàê ìîäåëü
ñëó÷àéíîãî ýêñïåðèìåíòà, â ðåçóëüòàòå êîòîðîãî ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0” (ñì. ðàçäåë 1.4.2). Öåëüþ
ñòàòèñòè÷åñêîãî àíàëèçà îáû÷íî ÿâëÿåòñÿ îïðåäåëåíèå çíà÷åíèÿ âåðîÿòíîñòè ð
(âåðîÿòíîñòü ð ÷àñòî íàçûâàþò áèíîìèàëüíîé âåðîÿòíîñòüþ).
Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä
“1”, è 0 — â ïðîòèâíîì ñëó÷àå.
Точечная оценка
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Äèñïåðñèÿ ñòàòèñòèêè p̂ :
pˆ = r / n ,
Dpˆ = p (1 − p) / n , åå âûáîðî÷íàÿ îöåíêà: Sn2 ( pˆ ) = r (n − r ) / n 2 (n − 1) . Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (ñì. ðàçäåë 1.4.3). Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n.
Интервальные оценки
Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîÿòñÿ
èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ .
Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì
îáðàçîì6. Ñíà÷àëà ïîäñ÷èòûâàåòñÿ âåëè÷èíà r — êîëè÷åñòâî èñõîäîâ “1”, çàòåì
îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1,1k 2 ( β н ) è tв = Fk−3,1k 4 ( β в ) , ãäå βí = (1 – α)/2,
β â = (1 + α)/2, Fm−1,1 m 2 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè áåòà-ðàñïðåäåëåíèÿ
6
Ïîñêîëüêó ñóùåñòâóåò íåñêîëüêî ðàçëè÷íûõ âàðèàíòîâ ïîñòðîåíèÿ äàííîãî äîâåðèòåëüíîãî
èíòåðâàëà, óêàæåì, ÷òî ïðèâåäåííûå íèæå ôîðìóëû âçÿòû èç [4, ñ. 69].
Глава 2. Основные статистические методы
61
ñ ïàðàìåòðàìè m1 è m2 (ñì. ðàçäåë 1.5.9), k1 = r, k2 = n – r + 1, k3 = r + 1,
k4 = n – r. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä ( tн , tв ) . Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó áèíîìèàëüíûì ðàñïðåäåëåíèåì è áåòàðàñïðåäåëåíèåì: åñëè Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p, òîãäà Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Fn–k,k+1 — ôóíêöèÿ áåòà-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè.
Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Êàê óêàçûâàëîñü, ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) òî÷å÷íàÿ îöåíêà pˆ = r / n ðàñïðåäåëåíà
ïðèáëèæåííî ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì p è äèñïåðñèåé
p(1 – p)/n. Ïîýòîìó ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ìîæíî ïîñòðîèòü ñëåäóþùèì îáðàçîì. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n .
Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Äàëåå ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë

1
1
1
1
ˆ + k 2 − k pˆ (1 − pˆ )n + k 2 pn
ˆ + k 2 + k pˆ (1 − pˆ )n + k 2
 pn
2
4
2
4

,

n + k2
n + k2








è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
 pˆ − k
 .
n
n


Çäåñü ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî
íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ = p (1 − p) / n çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n .
Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Âûáîðêà õ1, õ2, ..., xn ñîñòîèò èç ðåçóëüòàòîâ n
ýêñïåðèìåíòîâ, â êàæäîì èç êîòîðûõ ïðîâîäèëîñü N èñïûòàíèé, â êàæäîì èñïûòàíèè ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) —
èñõîä “0”. Çäåñü xi ðàâíî ÷èñëó èñõîäîâ “1” â i-ì ýêñïåðèìåíòå.
Точечная оценка
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
pˆ =
1
nN
n
∑x
i
. Äèñïåðñèÿ ñòàòèñòèêè p̂ : Dpˆ = p (1 − p) / nN . Ðàñïðåäåëåíèå ñòàòè-
i =1
ñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/nN.
Интервальные оценки
Ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, áîëüøå 30, òî íàèáîëåå ïðîñòîé äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ
íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ , êîòîðàÿ
çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå pˆ =
62
1
nN
n
∑x
i
. Ïî çàäàííîìó çíà÷åíèþ äîâåðèòåëüíîãî
i =1
Часть I. Основные понятия теории вероятностей и математической статистики
óðîâíÿ α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå êîýôôèöèåíòà k. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
 pˆ − k
.
nN
nN 

Çäåñü, êàê è â àñèìïòîòè÷åñêèõ îöåíêàõ ïðåäûäóùåé ìîäåëè, ïðè ïîñòðîåíèè
äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ
íîðìàëüíûì
è
çàìåíà
íåèçâåñòíîãî
çíà÷åíèÿ
äèñïåðñèè
Dpˆ = p (1 − p) / nN âåëè÷èíîé pˆ (1 − pˆ ) / nN .
Преобразование арксинуса
Íåäîñòàòêîì àñèìïòîòè÷åñêèõ äîâåðèòåëüíûõ èíòåðâàëîâ ÿâëÿåòñÿ òî, ÷òî ïðè èõ
ïîñòðîåíèè íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n
(â ìîäåëè 1) èëè âåëè÷èíîé pˆ (1 − pˆ ) / nN (â ìîäåëè 2). Ñóùåñòâóåò ïðåîáðàçîâàíèå
ñòàòèñòèêè p̂ , ðàñïðåäåëåíèå êîòîðîãî ïî÷òè íå çàâèñèò îò íåèçâåñòíîãî çíà÷åíèÿ
âåðîÿòíîñòè ð. Òàêîå ïðåîáðàçîâàíèå íàçûâàåòñÿ ïðåîáðàçîâàíèåì àðêñèíóñà
è èìååò âèä z = arcsin
pˆ . Ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû z ïðè-
áëèæåííî ðàâíî arcsin
p , à äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1/4n. Êðîìå òîãî, ðàñ-
ïðåäåëåíèå âåëè÷èíû z áëèæå ê íîðìàëüíîìó, ÷åì ðàñïðåäåëåíèå ñòàòèñòèêè p̂ .
Èíîãäà
èñïîëüçóþò
äðóãîé
âàðèàíò
ïðåîáðàçîâàíèÿ
àðêñèíóñà:
y = 2 n arcsin pˆ . Çäåñü äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû ó ïðàêòè÷åñêè íå çàâèñèò îò n è ð è ïðèáëèæåííî ðàâíà 1. Åå ìàòåìàòè÷åñêîå îæèäàíèå ïðèáëèæåííî
ðàâíî 2 n arcsin
p.
Ïðèâåäåííûå ïðåîáðàçîâàíèÿ íå ïðèìåíèìû â ñëó÷àå, êîãäà çíà÷åíèå ð áëèçêî ê 0 èëè 1. Ïðåîáðàçîâàíèå Ýíñêîìáà w = arcsin
r + 3/8
(r — êîëè÷åñòâî èñõîn + 1/ 4
äîâ “1”) ëèøåíî ýòîãî íåäîñòàòêà. Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû w ïðèáëèæåííî ðàâíà 1/(4n + 2).
Ïðàêòè÷åñêîå ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ íà îñíîâå ïðåîáðàçîâàíèÿ àðêñèíóñà ïîêàçàíî â ãëàâå 10, ðàçäåë 10.8.3.
2.3.8. Оценка параметра λ распределения Пуассона
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (ñì. ðàçäåë 1.4.4).
Точечная оценка
1 n
∑ xi áóäåò íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé
n i =1
äëÿ íåèçâåñòíîãî ïàðàìåòðà λ. Äèñïåðñèÿ ýòîé îöåíêè: D x = λ/n. Ñëó÷àéíàÿ
Âûáîðî÷íîå ñðåäíåå x =
Глава 2. Основные статистические методы
63
n
âåëè÷èíà
∑x
i
èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì nλ, à ñëó÷àéíàÿ âå-
i =1
ëè÷èíà
n / λ ( x − λ ) àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1).
Интервальные оценки
Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè λ ñòðîÿòñÿ
n
èëè íà îñíîâå ðàñïðåäåëåíèÿ Ïóàññîíà, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
∑x
i
,
i =1
èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷è-
n / λ ( x − λ) .
íû
Èñïîëüçîâàíèå ðàñïðåäåëåíèÿ Ïóàññîíà. Åñëè çàäàí äîâåðèòåëüíûé óðîâåíü
α è âû÷èñëåíà òî÷å÷íàÿ îöåíêà x =
1 n
∑ xi , òî äàëåå äëÿ ïîñòðîåíèÿ äîâåðèòåëün i =1
íîãî èíòåðâàëà ñ èñïîëüçîâàíèåì ðàñïðåäåëåíèÿ Ïóàññîíà îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1 ( β н ) è tв = Fk−1 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fk−1 —
ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè χ2-ðàñïðåäåëåíèÿ ñ k = 2(n x + 1) ñòåïåíÿìè ñâî-
 tн tв 
,
.
 2n 2n 
áîäû (ñì. ðàçäåë 1.5.5). Äîâåðèòåëüíûé èíòåðâàë èìååò âèä 
Çäåñü èñïîëüçîâàíî ñîîòíîøåíèå ìåæäó ðàñïðåäåëåíèåì Ïóàññîíà è ðàñïðåäåëåíèåì χ2 (ñì. ðàçäåë 1.4.4): Ð(Õ ≤ k) = Ð(Z ≥ 2λ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
ðàñïðåäåëåííàÿ ïî çàêîíó Ïóàññîíà ñ ïàðàìåòðîì λ, Z — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1) ñòåïåíüþ ñâîáîäû.
Èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Ïðè äîñòàòî÷íî áîëüøîì n
ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ λ ñòðîèòñÿ òàêèì îáðàçîì. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α è âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà
x=
1 n
∑ xi . Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàín i =1
äàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë


k2 k
k2 k
−
k 2 + 4nx , x +
+
k 2 + 4nx 
x +
2
n
2
n
2
n
2
n


è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà

x
x
x −k
, x +k
.

n
n 

Ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dx = λ / n çàìåíÿåòñÿ âåëè÷èíîé x / n .
64
Часть I. Основные понятия теории вероятностей и математической статистики
2.3.9. Порядковые статистики
Ïîðÿäêîâûå (ðàíãîâûå) ñòàòèñòèêè èãðàþò áîëüøóþ ðîëü â ìàòåìàòè÷åñêîé ñòàòèñòèêå. Íà èõ îñíîâå ñòðîÿòñÿ òàê íàçûâàåìûå íåïàðàìåòðè÷åñêèå èëè
ñâîáîäíûå îò ðàñïðåäåëåíèÿ ìåòîäû, ò.å. ìåòîäû, êîòîðûå íå çàâèñÿò îò íåèçâåñòíîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Íåêîòîðûå òàêèå ìåòîäû áóäóò îïèñàíû íèæå, â ðàçäåëå 2.4. Êðîìå òîãî, ïîðÿäêîâûå ñòàòèñòèêè èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ, àïïðîêñèìèðóþùåé
ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè (ñì. ðàçäåë 8.3), äëÿ îöåíèâàíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, êàê ïîêàçàíî íèæå â ýòîì ðàçäåëå, è âî ìíîãèõ äðóãèõ ñòàòèñòè÷åñêèõ ìåòîäàõ.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ êîíå÷íàÿ âûáîðêà õ1, õ2, ..., xn îáúåìîì n, êîòîðàÿ ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u).
Óïîðÿäî÷åííàÿ ïî âîçðàñòàíèþ ïîñëåäîâàòåëüíîñòü âûáîðî÷íûõ çíà÷åíèé
õ(1) ≤ õ(2) ≤ ... ≤ õ(n)
íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì. Ðàâíûå ìåæäó ñîáîé ÷ëåíû âûáîðêè íóìåðóþòñÿ â ïðîèçâîëüíîì ïîðÿäêå. ×ëåíû âàðèàöèîííîãî ðÿäà õ(i) (i = 1, 2, ..., n) íàçûâàþòñÿ ïîðÿäêîâûìè (ðàíãîâûìè) ñòàòèñòèêàìè. ×èñëî ri = i íàçûâàåòñÿ
ðàíãîì ÷ëåíà õ(i). ( ëèòåðàòóðå òàêæå ìîæíî âñòðåòèòü îïðåäåëåíèå ðàíãà êàê
ri = i/n.)  ñòàòèñòè÷åñêîì àíàëèçå ÷àñòî èñïîëüçóåòñÿ ñòàòèñòèêà Rn = x(n) – x(1),
êîòîðàÿ íàçûâàåòñÿ ðàçìàõîì èëè øèðîòîé âûáîðêè.
Ðàñïðåäåëåíèå ïîðÿäêîâûõ ñòàòèñòèê çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé
ñîâîêóïíîñòè, íî âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå
èç èíòåðâàëà (õ(i–1), õ(i)), íå çàâèñèò îò ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1).
 ÷àñòíîñòè, âåðîÿòíîñòè Ð(Õ < õ(0)) è Ð(Õ > õ(n)) òàêæå ðàâíû 1/(n + 1) [6, ñ. 367].
Оценки квантилей
Íàïîìíèì, ÷òî êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. (Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 0,5).
Îöåíêîé íåèçâåñòíîé êâàíòèëè ïîðÿäêà ð ξð ïðèíèìàåòñÿ âûáîðî÷íàÿ ðêâàíòèëü ξ p = õ(k(p)), ãäå k(p) = np, åñëè np — öåëîå ÷èñëî è k(p) = [np] + 1
â ïðîòèâíîì ñëó÷àå7.
2.4. Проверка статистических гипотез
Ñòàòèñòè÷åñêîé ãèïîòåçîé íàçûâàåòñÿ óòâåðæäåíèå, âûñêàçàííîå îòíîñèòåëüíî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èëè íåêîòîðûõ åãî ïàðàìåòðîâ.
Îáû÷íî òàêóþ ãèïîòåçó îáîçíà÷àþò êàê Í0 — ýòî íóëåâàÿ (ïðåäëîæåííàÿ) ãèïîòåçà. Ïðîòèâîïîëîæíîå óòâåðæäåíèå — îòðèöàíèå ãèïîòåçû Í0 — íàçûâàåòñÿ
êîíêóðèðóþùåé (èëè àëüòåðíàòèâíîé) ãèïîòåçîé è îáîçíà÷àåòñÿ êàê Í1.
Ïðèâåäåì íåñêîëüêî ïðèìåðîâ ñòàòèñòè÷åñêèõ ãèïîòåç.
Ãèïîòåçà Í0: âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè,
ðàâíîìåðíî ðàñïðåäåëåííîé íà èíòåðâàëå [à, b].
Ãèïîòåçà Í0: âûáîðî÷íûå çíà÷åíèÿ èçâëå÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè,
ìàòåìàòè÷åñêîå îæèäàíèå êîòîðîé ëåæèò â ïðåäåëàõ îò à äî b (à è b — àïðèîðíî
çàäàííûå ÷èñëà).
7
[m] îáîçíà÷àåò öåëóþ ÷àñòü ÷èñëà m.
Глава 2. Основные статистические методы
65
Èìååì ïàðíûå íàáëþäåíèÿ (õ1, ó1), (õ2, ó2), ..., (õn, ón), ÿâëÿþùèåñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (Õ, Y). Ãèïîòåçà Í0: êîìïîíåíòû Õ è Y íåçàâèñèìû.
Åñòü äâå âûáîðêè, õ1, õ2, ..., õn è y1, y2, ..., yk, èçâëå÷åííûå èç äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè m1 è m2 ñîîòâåòñòâåííî. Ãèïîòåçà Í0: m1 ≥ m2.
Î÷åâèäíî, â êàæäîé êîíêðåòíîé ñèòóàöèè ìîæíî ñôîðìóëèðîâàòü öåëîå ñåìåéñòâî ðàçëè÷íûõ ãèïîòåç. Ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà èç ýòîãî ìíîæåñòâà
ãèïîòåç ñëåäóåò âûáðàòü òå ãèïîòåçû, êîòîðûå ñôîðìóëèðîâàíû íàèáîëåå ÷åòêî, íå
îñòàâëÿÿ ìåñòà äâîéñòâåííîñòè â óòâåðæäåíèÿõ, è ìàêñèìàëüíî ñîîòâåòñòâóþò öåëè êîíêðåòíîãî èññëåäîâàíèÿ. Ðåêîìåíäóåòñÿ òàêæå âûáèðàòü ïðîñòûå ãèïîòåçû,
ñôîðìóëèðîâàííûå îòíîñèòåëüíî îäíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, òàê êàê ñëîæíûå ãèïîòåçû òðåáóþò è ñëîæíûõ êðèòåðèåâ äëÿ ïðîâåðêè èõ èñòèííîñòè.
Êðèòåðèé ïðîâåðêè ñòàòèñòè÷åñêîé ãèïîòåçû — ýòî ïðîöåäóðà âûðàáîòêè
ðåøåíèÿ î òîì, ïðèíÿòü èëè îòâåðãíóòü äàííóþ ãèïîòåçó. Êðèòè÷åñêîé îáëàñòüþ êðèòåðèÿ (èëè îáëàñòüþ íåïðèíÿòèÿ ãèïîòåçû) ÿâëÿåòñÿ òà ÷àñòü âûáîðî÷íîãî ïðîñòðàíñòâà, êîòîðàÿ ïðèâîäèò ê îòêëîíåíèÿì ãèïîòåçû. Óðîâíåì çíà÷èìîñòè α êðèòåðèÿ ÿâëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ýòîò êðèòåðèé ïðèâåäåò
ê îòêëîíåíèþ íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè, ò.å. âåðîÿòíîñòü òîãî, ÷òî
ïðè âûïîëíåíèè íóëåâîé ãèïîòåçû ðåçóëüòàòû ïðîâåðîê ïîïàäóò â êðèòè÷åñêóþ
îáëàñòü. Åñëè ðåçóëüòàòû ïðîâåðêè íàõîäÿòñÿ â êðèòè÷åñêîé îáëàñòè, òî ãèïîòåçà
Í0 îòêëîíÿåòñÿ è ïðèíèìàåòñÿ àëüòåðíàòèâíàÿ ãèïîòåçà Í1. Ïîýòîìó êðèòè÷åñêàÿ
îáëàñòü äîëæíà áûòü ðàñïîëîæåíà òàì, ãäå îíà ñîîòâåòñòâóåò êîíêóðèðóþùåé ãèïîòåçå. Ïðè âûáîðå ãèïîòåç íóëåâîé ãèïîòåçîé (ïî ñðàâíåíèþ ñ àëüòåðíàòèâíîé)
äîëæíà áûòü òà ãèïîòåçà, êîòîðóþ áîëåå îïàñíî îøèáî÷íî îòâåðãíóòü.
Îòêëîíåíèå íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè íàçûâàåòñÿ îøèáêîé
ïåðâîãî ðîäà. Ïîýòîìó óðîâåíü çíà÷èìîñòè α åñòü âåðîÿòíîñòü ñîâåðøåíèÿ îøèáêè ïåðâîãî ðîäà. Ïðèíÿòèå ãèïîòåçû Í0, êîãäà îíà íåâåðíà, íàçûâàåòñÿ îøèáêîé
âòîðîãî ðîäà. Âåðîÿòíîñòü îøèáêè âòîðîãî ðîäà îáû÷íî îáîçíà÷àþò êàê β.
Åñòåñòâåííî ñòðåìëåíèå ìèíèìèçèðîâàòü âåðîÿòíîñòè îøèáîê ïåðâîãî è âòîðîãî
ðîäà. Ñíèæàÿ óðîâåíü çíà÷èìîñòè α, òåì ñàìûì ñíèæàåì âåðîÿòíîñòü âîçíèêíîâåíèÿ îøèáêè ïåðâîãî ðîäà, íî â ýòîì ñëó÷àå âîçðàñòàåò âåðîÿòíîñòü β âîçíèêíîâåíèÿ îøèáîê âòîðîãî ðîäà.  ñâÿçè ñ ýòèì ââîäÿò ïîíÿòèå ìîùíîñòè êðèòåðèÿ, êîòîðîå îïðåäåëÿþò êàê âåðîÿòíîñòü îòêëîíåíèÿ íóëåâîé ãèïîòåçû, êîãäà îíà
íåâåðíà, ò.å. ìîùíîñòü êðèòåðèÿ ìîæíî îïðåäåëèòü êàê 1 – β. Ýòà âåðîÿòíîñòü çàâèñèò îò ðåàëüíîãî çíà÷åíèÿ ðàññìàòðèâàåìîãî ïàðàìåòðà ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîñêîëüêó ðåàëüíîå çíà÷åíèå ïàðàìåòðà çàðàíåå íå èçâåñòíî, ðàññìàòðèâàþò
ôóíêöèþ ìîùíîñòè, êîòîðàÿ ïîêàçûâàåò ñîîòâåòñòâóþùåå çíà÷åíèå ìîùíîñòè
êðèòåðèÿ äëÿ êàæäîãî âîçìîæíîãî çíà÷åíèÿ ïàðàìåòðà. Ôóíêöèÿ ìîùíîñòè èãðàåò â òåîðèè ïðîâåðêè ãèïîòåç ôóíäàìåíòàëüíóþ ðîëü. Îíà ïîëíîñòüþ õàðàêòåðèçóåò êðèòåðèé, òàê êàê ïîêàçûâàåò, íàñêîëüêî õîðîøî îí ñîîòâåòñòâóåò ñâîåìó îñíîâíîìó íàçíà÷åíèþ — “óëàâëèâàòü” âîçìîæíûå îòêëîíåíèÿ îò íóëåâîé ãèïîòåçû.
×àñòî âîçìîæíûå çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè, íà îñíîâå êîòîðîé
ñòðîèòñÿ êðèòåðèé, ïðèíàäëåæàò íåêîòîðîìó èíòåðâàëó. Òîãäà êðèòè÷åñêàÿ îáëàñòü òàêæå ÿâëÿåòñÿ èíòåðâàëîì. Ãðàíè÷íûå òî÷êè êðèòè÷åñêîé îáëàñòè
íàçûâàþòñÿ êðèòè÷åñêèìè çíà÷åíèÿìè. Êðèòè÷åñêèå çíà÷åíèÿ âûáèðàþòñÿ
òàêèì îáðàçîì, ÷òîáû ïðè âûáðàííîì óðîâíå çíà÷èìîñòè α ìîùíîñòü êðèòåðèÿ
1 – β áûëà íàèáîëüøåé.
66
Часть I. Основные понятия теории вероятностей и математической статистики
Âîçìîæíû òðè âàðèàíòà ðàñïîëîæåíèÿ êðèòè÷åñêîé îáëàñòè, îïðåäåëÿåìûõ
âèäîì íóëåâîé è àëüòåðíàòèâíîé ãèïîòåç, à òàêæå ðàñïðåäåëåíèåì êðèòåðèàëüíîé ñòàòèñòèêè θ.
1. Ïðàâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (têð, +∞), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ > têð) = α. Çíà÷åíèå têð
íàçûâàåòñÿ ïðàâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ
çíà÷èìîñòè α.
2. Ëåâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (–∞, têð), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ < têð) = α. Çíà÷åíèå
têð íàçûâàåòñÿ ëåâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ
çíà÷èìîñòè α.
3. Äâóõñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü, ñîñòîÿùàÿ èç äâóõ èíòåðâàëîâ
(–∞, têð1) è (têð2, +∞), ãäå êðèòè÷åñêèå çíà÷åíèÿ têð1 è têð2 îïðåäåëÿåòñÿ èç
ðàâåíñòâ Ð(θ < têð1) = α/2 è Ð(θ > têð2) = α/2. Ýòè çíà÷åíèÿ íàçûâàþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè, îòâå÷àþùèìè óðîâíþ çíà÷èìîñòè α.
Íåîáõîäèìî ïîä÷åðêíóòü, ÷òî ñòàòèñòè÷åñêèå êðèòåðèè íà îñíîâàíèè âûáîðî÷íûõ íàáëþäåíèé íå äîêàçûâàþò òó èëè èíóþ ãèïîòåçó. Îíè ïîçâîëÿþò óòâåðæäàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò ïðèíÿòîé ãèïîòåçå. Òàêèì
îáðàçîì, âûâîäû, ïðèíèìàåìûå íà îñíîâå ñòàòèñòè÷åñêèõ äàííûõ, ôîðìóëèðóþòñÿ â ñëåäóþùåì âèäå: “ýêñïåðèìåíòàëüíûå äàííûå ñîãëàñóþòñÿ ñ äàííîé ãèïîòåçîé (èëè ïðîòèâîðå÷àò åé)”.
Ñëåäóåò ïðåäóïðåäèòü îá îïàñíîñòè, ñâÿçàííîé ñ ïðèìåíåíèåì íåñêîëüêèõ
ñòàòèñòè÷åñêèõ êðèòåðèåâ ïðè àíàëèçå îäíèõ è òåõ æå äàííûõ. Åñëè ê îäíèì
è òåì æå äàííûì ïðèìåíÿþò äâà ðàçëè÷íûõ êðèòåðèÿ äëÿ ïðîâåðêè îäíîé è òîé
æå íóëåâîé ãèïîòåçû (èëè äâóõ ñõîäíûõ ãèïîòåç) è â êàæäîì ñëó÷àå ïðèíèìàåòñÿ óðîâåíü çíà÷èìîñòè, íàïðèìåð, 0,05, òî âåðîÿòíîñòü òîãî, ÷òî õîòÿ áû ïî îäíîìó èç êðèòåðèåâ íóëåâàÿ ãèïîòåçà áóäåò îøèáî÷íî îòêëîíåíà, ïðåâîñõîäèò 0,05.
Ñëåäóåò âîñïîëüçîâàòüñÿ ëèøü îäíèì êðèòåðèåì, æåëàòåëüíî áîëåå ìîùíûì.
Ñäåëàåì åùå íåêîòîðûå çàìå÷àíèÿ î ïðèìåíåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ.
Âñå ñòàòèñòè÷åñêèå êðèòåðèè äëÿ êîððåêòíîãî ñâîåãî èñïîëüçîâàíèÿ ïðåäïîëàãàþò
âûïîëíåíèå íåêîòîðîãî êîìïëåêñà óñëîâèé (íàïðèìåð, óñëîâèÿ íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè), èëè, êàê ãîâîðÿò, êðèòåðèé “ðàáîòàåò”
â ðàìêàõ êîíêðåòíîé ñòàòèñòè÷åñêîé ìîäåëè. Íà ïðàêòèêå óñëîâèÿ, íàëàãàåìûå
ñòàòèñòè÷åñêîé ìîäåëüþ, ìîãóò è íå âûïîëíÿòüñÿ, ÷òî ïðèâîäèò ê âîçðàñòàíèþ âåðîÿòíîñòè íåïðàâèëüíûõ âûâîäîâ, êîòîðûå äåëàþòñÿ íà îñíîâå òîãî èëè èíîãî êðèòåðèÿ. Äëÿ îäíèõ êðèòåðèåâ ïîäîáíîå ñíèæåíèå íàäåæíîñòè âûâîäîâ ïðîèñõîäèò
â áîëüøåé ñòåïåíè, äëÿ äðóãèõ â ìåíüøåé. Óñòîé÷èâûìè (ðîáàñòíûìè) íàçûâàþòñÿ
òàêèå êðèòåðèè, äëÿ êîòîðûõ óìåðåííûå îòêëîíåíèÿ îò ïðåäïîëàãàåìîé ñòàòèñòè÷åñêîé ìîäåëè íåçíà÷èòåëüíî âëèÿþò íà íàäåæíîñòü âûâîäîâ. Ìíîãèå êðèòåðèè, îïèñàííûå â ïîñëåäíèõ äâóõ ÷àñòÿõ êíèãè, îñíîâàíû íà ïðåäïîëîæåíèè î íîðìàëüíîì
ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè ýòîì êðèòåðèè ïðîâåðêè ãèïîòåç
î ñðåäíèõ çíà÷åíèÿõ â áîëüøèíñòâå ñâîåì óñòîé÷èâû ïðè óìåðåííûõ îòêëîíåíèÿõ
îò íîðìàëüíîñòè, à êðèòåðèè äëÿ ãèïîòåç î çíà÷åíèÿõ äèñïåðñèè — íåò.
Íåêîòîðûå èç êðèòåðèåâ ÿâëÿþòñÿ íåïàðàìåòðè÷åñêèìè èëè ñâîáîäíûìè îò
ðàñïðåäåëåíèé. Ïðèìåíåíèå òàêèõ êðèòåðèåâ íå îñíîâûâàåòñÿ íà ïðåäïîëîæåíèÿõ
Глава 2. Основные статистические методы
67
î êàêîì-ëèáî êîíêðåòíîì âèäå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè èññëåäîâàíèè âûáîðêè èç íîðìàëüíî ðàñïðåäåëåííîé ãåíåðàëüíîé ñîâîêóïíîñòè êðèòåðèè ýòîãî òèïà íåñêîëüêî óñòóïàþò ïî ìîùíîñòè ñîîòâåòñòâóþùèì êðèòåðèÿì,
ïîñòðîåííûì íà ïðåäïîëîæåíèè î íîðìàëüíîñòè. Îíè îáëàäàþò, îäíàêî, òåì ïðåèìóùåñòâîì, ÷òî ñâîáîäíû îò ïîäîáíîãî ïðåäïîëîæåíèÿ î íîðìàëüíîñòè, ïîýòîìó
èõ ìîæíî èñïîëüçîâàòü â ñèòóàöèÿõ, êîãäà âèä ðàñïðåäåëåíèÿ çàðàíåå íå èçâåñòåí.
×òîáû ïîêàçàòü, êàê ñòðîÿòñÿ è êàê “ðàáîòàþò” êðèòåðèè ïðîâåðêè ãèïîòåç,
ðàññìîòðèì òðè òèïà êðèòåðèåâ: êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, êðèòåðèè ïðîâåðêè ãèïîòåç î ðàçëè÷èè (èëè
ðàâåíñòâå) ïàðàìåòðîâ íåñêîëüêèõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è êðèòåðèè ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé. Ìíîãî÷èñëåííûå ïðèìåðû äðóãèõ êðèòåðèåâ
ïðèâåäåíû â ÷àñòÿõ III è IV êíèãè.
2.4.1. Критерии проверки гипотез о значениях параметров
генеральной совокупности
Ìíîãèå ïîäîáíûå êðèòåðèè ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ
(ñì. ðàçäåë 2.3). Íàïðèìåð, íåîáõîäèìî ïðîâåðèòü ãèïîòåçó, ÷òî íåèçâåñòíîå ìàòåìàòè÷åñêîå îæèäàíèå m ãåíåðàëüíîé ñîâîêóïíîñòè ðàâíî íåêîòîðîìó êîíêðåòíîìó çíà÷åíèþ m0. Ïóñòü íà îñíîâå âûáîðêè ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë
(t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α (ò.å. ñ âåðîÿòíîñòüþ α ýòîò èíòåðâàë ñîäåðæèò
íåèçâåñòíîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ m). Òîãäà, åñëè èíòåðâàë (t1, t2)
ïîêðûâàåò çíà÷åíèå m0 (ò.å. âûïîëíÿþòñÿ íåðàâåíñòâà t1 ≤ m0 ≤ t2), ïðèíèìàåòñÿ
âûäâèíóòàÿ ãèïîòåçà ñ óðîâíåì çíà÷èìîñòè 1 – α. Êðèòè÷åñêàÿ îáëàñòü çäåñü ñîñòîèò èç îáúåäèíåíèÿ äâóõ îáëàñòåé: (–∞, t1) è (t2, +∞), t1 è t2 ÿâëÿþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè. Òàêèì îáðàçîì, ÷òîáû ïðîâåðèòü ãèïîòåçó Í0:
m = m0 ñ óðîâíåì çíà÷èìîñòè 1 – α, íåîáõîäèìî ïîñòðîèòü äëÿ çíà÷åíèÿ m äîâåðèòåëüíûé èíòåðâàë (t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α è ïðîâåðèòü âûïîëíåíèå
íåðàâåíñòâ t1 ≤ m0 ≤ t2. Åñëè ýòè íåðàâåíñòâà âûïîëíÿþòñÿ, òî ñ âåðîÿòíîñòüþ α
ãèïîòåçà Í0 ïðèíèìàåòñÿ. Åñëè õîòÿ áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, òî ãèïîòåçà îòêëîíÿåòñÿ. Àíàëîãè÷íî ñòðîÿòñÿ êðèòåðèè î ïðîâåðêå ãèïîòåç
â âèäå íåðàâåíñòâ. Íàïðèìåð, ãèïîòåçà Í0: m ≥ m0.  ýòîì ñëó÷àå íåîáõîäèìî
ïîñòðîèòü ïðàâîñòîðîííèé äîâåðèòåëüíûé èíòåðâàë âèäà (t, +∞), êîòîðûé ñîäåðæàë áû çíà÷åíèå m ñ âåðîÿòíîñòüþ α, è ïðîâåðèòü íåðàâåíñòâî t ≥ m0 (t —
êðèòè÷åñêîå çíà÷åíèå). Åñëè ýòî íåðàâåíñòâî âûïîëíÿåòñÿ, òî ãèïîòåçà Í0 ïðèíèìàåòñÿ ñ óðîâíåì çíà÷èìîñòè 1 – α.  ïðîòèâíîì ñëó÷àå îíà îòâåðãàåòñÿ.
Îáû÷íî â ïîäîáíûõ êðèòåðèÿõ äëÿ óïðîùåíèÿ âû÷èñëåíèé äîâåðèòåëüíûå
èíòåðâàëû ñòðîÿòñÿ íå äëÿ íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, à äëÿ óíèôèöèðîâàííîé ñòàòèñòèêè, êîòîðàÿ ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 èìååò èçâåñòíîå ðàñïðåäåëåíèå. Òàêàÿ ñòàòèñòèêà íàçûâàåòñÿ êðèòåðèàëüíîé ñòàòèñòèêîé. Íàïðèìåð, äëÿ êðèòåðèÿ ïðîâåðêè ãèïîòåçû î çíà÷åíèè ìàòåìàòè÷åñêîãî
îæèäàíèÿ, ñôîðìóëèðîâàííîé âûøå, âû÷èñëÿåòñÿ ñòàòèñòèêà T =
(çäåñü x =
68
n ( x − m0 )
Sn
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 ), êîòîðàÿ â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëå∑
n i =1
n i =1
Часть I. Основные понятия теории вероятностей и математической статистики
íèÿ ãåíåðàëüíîé ñîâîêóïíîñòè è ïðè âûïîëíåíèè óñëîâèÿ m = m0 ïîä÷èíÿåòñÿ
ðàñïðåäåëåíèþ Ñòüþäåíòà. Òîãäà ãðàíèöàìè êðèòè÷åñêîé îáëàñòè äëÿ êðèòåðèÿ
áóäóò ïðîñòî êâàíòèëè ýòîãî ðàñïðåäåëåíèÿ, ïîðÿäîê êîòîðûõ îïðåäåëÿåòñÿ çàäàííûì óðîâíåì çíà÷èìîñòè. Íà òàêîì ïðèíöèïå ïîñòðîåíû ïðèâåäåííûå íèæå
êðèòåðèè. Áîëüøóþ ðîëü â òàêèõ êðèòåðèÿõ èãðàþò àïðèîðíûå ïðåäïîëîæåíèÿ
î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîýòîìó èñïîëüçîâàíèå êîíêðåòíûõ
êðèòåðèåâ ïðîâåðêè ãèïîòåç òðåáóåò îáÿçàòåëüíîãî ñîáëþäåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè, â ðàìêàõ êîòîðîé ïðèìåíèì äàííûé êðèòåðèé.
Âî ìíîãèõ ñëó÷àÿõ, ÷òîáû óìåíüøèòü çàâèñèìîñòü êðèòåðèàëüíûõ ñòàòèñòèê
îò àïðèîðíûõ ïðåäïîëîæåíèé î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè
(à òàêæå â ñëó÷àÿõ, êîãäà ñ òî÷íûìè ðàñïðåäåëåíèÿìè êðèòåðèàëüíûõ ñòàòèñòèê
ïî êàêèì-ëèáî ïðè÷èíàì òðóäíî ðàáîòàòü (ñëîæíûå âû÷èñëåíèÿ è ò.ï.)), êðèòåðèè ñòðîÿò íà îñíîâå àñèìïòîòè÷åñêèõ ðàñïðåäåëåíèé ýòèõ ñòàòèñòèê. Ïðè èñïîëüçîâàíèè òàêèõ êðèòåðèåâ ñëåäóåò ïîìíèòü, ÷òî, âî-ïåðâûõ, îíè ðàáîòàþò òîëüêî
ïðè äîñòàòî÷íî áîëüøîì îáúåìå âûáîðêè, âî-âòîðûõ, ýòè êðèòåðèè ïðèáëèæåííûå, ñòåïåíü òî÷íîñòè êîòîðûõ óäàåòñÿ îïðåäåëèòü òîëüêî â ðåäêèõ ñëó÷àÿõ.
Ïðèâåäåì íåñêîëüêî êðèòåðèåâ ïðîâåðêè çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðûå ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ. Ðàññìîòðèì êðèòåðèè äëÿ ñëó÷àÿ ðàâåíñòâà è íåðàâåíñòâ. Ôîðìû îïèñàíèÿ êðèòåðèåâ, èñïîëüçóåìîé â ýòèõ ïðèìåðàõ, áóäåì ïðèäåðæèâàòüñÿ è äàëåå ïðè îïèñàíèè êðèòåðèåâ
â ïîñëåäóþùèõ ãëàâàõ.
Критерий проверки значения математического ожидания нормальной
совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ïîä÷èíÿþùåéñÿ íîðìàëüíîìó çàêîíó ðàñïðåäåëåíèÿ ñ íåèçâåñòíûì
ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: µ = m0
Í0: µ ≤ m0
Í0: µ ≥ m0
Í1: µ ≠ m0
Í1: µ > m0
Í1: µ < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
 êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåì ñòàòèñòèêó T =
n ( x − m0 )
,
Sn
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòè∑
n i =1
n i =1
ñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Îïðåäåëÿþòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê
êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ
íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ ïðàâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
ãäå x =
Глава 2. Основные статистические методы
69
Ñëó÷àé â). Îïðåäåëÿåòñÿ ëåâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü
ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Ýòîò êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî. Ïðè ïðîâåðêå ðàâåíñòâà â ñèëó ñèììåòðèè ðàñïðåäåëåíèÿ Ñòüþäåíòà äîñòàòî÷íî ñðàâíèòü |Ò| ñ êâàíòèëåì tâ ïîðÿäêà 1 – α/2.
Критерий проверки значения дисперсии нормальной совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ è ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
2
2
á) Íåðàâåíñòâî
2
â) Íåðàâåíñòâî
Í0: σ = σ0
Í0: σ ≤ σ0
2
Í0: σ2 ≥ σ02
Í1: σ2 ≠ σ02
Í1: σ2 > σ02
Í1: σ2 < σ02
Çäåñü σ02 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Êðèòåðèàëüíàÿ
ñòàòèñòèêà
âû÷èñëÿåò&