ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ ФГОУ ВПО «СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» Т. В. Крупкина, А. И. Пыжев, С. В. Бабенышев, Е. С. Кирик ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ПРИМЕРАХ И ЗАДАЧАХ для студентов экономического факультета Учебное пособие СФУ 2007 УДК 000.000 ББК 22.17я73 К 84 Рецензенты Т. В. Крупкина К 84 Теория вероятностей и математическая статистика в примерах и задачах. : учебное пособие / Т. В. Крупкина, А. И. Пыжев, С. В. Бабенышев, Е. С. Кирик. Сибирский федеральный университет. Красноярск: 2007. 171 с. ISBN 0-0000-0000-0 Посвящено курсу «Теория вероятностей и математическая статистика». Включает в себя широкий набор разобранных примеров и задачи для аудиторной и самостоятельной работы, большая часть которых снабжена ответами, а также необходимые для решения задач теоретические сведения. Предназначено для студентов экономических направлений и специальностей. ISBN 0-0000-0000-0 © Сибирский федеральный университет, 2007 © Т. В. Крупкина, А. И. Пыжев, С. В. Бабенышев, Е. С. Кирик, 2007 Содержание Содержание Принятые обозначения и сокращения 5 1. Классическое определение вероятности 6 2. Основания теории вероятностей 2.1. Основные понятия . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Геометрическое определение вероятности . . . . . . . . . . . 21 21 28 3. Теоремы исчисления вероятностей 3.1. Теоремы сложения и умножения . . . . . . . . . . . . . . . . 3.2. Формула полной вероятности. Формула Байеса . . . . . . . 36 36 44 4. Схемы испытаний 4.1. Схема Бернулли. Полиномиальная схема . . . . . . . . . . . 4.2. Асимптотические формулы для схемы Бернулли . . . . . . . 51 51 57 5. Одномерные дискретные случайные величины 63 6. Непрерывные случайные величины 6.1. Одномерные непрерывные случайные величины . . . . . . . 6.2. Многомерные случайные величины . . . . . . . . . . . . . . 70 70 77 7. Числовые характеристики одномерной случайной величины 7.1. Математическое ожидание . . . . . . . . . . . . . . . . . . . 7.2. Другие числовые характеристики случайной величины . . . . 7.3. Математические ожидания и дисперсии некоторых важных распределений . . . . . . . . . . . . . . . 87 87 92 98 8. Линейная зависимость между случайными величинами 100 8.1. Линейная зависимость двух величин . . . . . . . . . . . . . . 100 8.2. Числовые характеристики многомерной случайной величины 103 9. Условные распределения 110 9.1. Условные законы распределения . . . . . . . . . . . . . . . . 110 9.2. Регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 10. Закон больших чисел, центральная предельная теорема 117 10.1. Неравенства и закон больших чисел . . . . . . . . . . . . . . 117 10.2. Центральная предельная теорема . . . . . . . . . . . . . . . 118 3 Содержание 11. Случайная выборка 123 11.1. Основные понятия . . . . . . . . . . . . . . . . . . . . . . . . 123 11.2. Группировка выборки. Графические характеристики . . . . . 125 12. Числовые характеристики выборки 131 12.1. Выборочные характеристики . . . . . . . . . . . . . . . . . . 131 12.2. Статистики . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 13. Статистические оценки 138 13.1. Критерии качества оценок . . . . . . . . . . . . . . . . . . . 138 13.2. Методы нахождения оценок . . . . . . . . . . . . . . . . . . 142 14. Доверительные интервалы. 146 15. Статистические гипотезы. 151 16. Проверка статистических гипотез 156 16.1. Параметрические гипотезы . . . . . . . . . . . . . . . . . . . 156 16.2. Гипотеза о виде распределения. . . . . . . . . . . . . . . . . . 157 Приложение 162 Список литературы 169 4 Содержание Принятые обозначения и сокращения. [x] — целая часть числа x. exp x, exp{x} — экспонента аргумента x (exp x = exp{x} = ex ). e — основание натурального логарифма, e = 2, 718 281 828 459 . . . A, B, . . . , X — события. A, B, . . . X — отрицания событий A, B, . . . , X. B ⇔ C, B ⇐⇒ C — «из B следует C и из C следует B». ∃ x — «существует x». ∀ x — «для любого x». @ x — «не существует x». def = — «равно по определению». ≡ — «тождественно равно». J — начало решения. I — конец решения. n, m = n, n + 1, . . . , m при том, что n, m ∈ Z и n < m. N — множество натуральных чисел. Z — множество целых чисел. R — множество вещественных чисел. R+ — множество вещественных чисел. 5 1. Классическое определение вероятности Рассмотрим некоторый опыт с конечным числом n взаимоисключающих друг друга исходов, которые равновозможны. Пусть A — некоторое событие, связанное с этими исходами. Вероятность p (A) можно определить как долю тех исходов, в результате которых это событие осуществляется: n (A) p (A) = , (1) n где n — число всех исходов, а n (A) — число исходов благоприятных исходов, т. е. исходов, в результате которых осуществляется событие A. Вспомним некоторые формулы комбинаторики (более подробно см. [?]). Перестановки. Число перестановок n элементов равно (2) Pn = n! Составные наборы. Если имеется r групп элементов, причем i-я группа содержит ni элементов; i = 1, 2, . . . , n, то число способов, которыми можно выбрать r элементов по одному из каждой группы, равно N = n1 · n2 · . . . · nr . (3) Важное значение имеет частный случай (3) при n1 = . . . = nr = n: N = nr . (4) Число сочетаний — выбор без возвращения и без учета порядка. Число способов, которыми можно выбрать m из n различных элементов, равно n! . (5) Cnm = m! (n − m)! Число размещений — выбор без возвращения и с учетом порядка. Число способов, которыми можно выбрать и разместить по различным местам m из n различных элементов, равно m Am n = Cn · m! = n! . (n − m)! (6) 6 Число разбиений на группы. Число способов, которыми можно разбить n различных элементов на k групп, содержащих соответственно n1 , n2 , . . . , nk элементов, равно N= n! . n1 ! · n2 ! · . . . · nk ! (7) Пример 1. Из 120 сотрудников брокерской конторы 33 получили месячную премию. Какова вероятность получения месячной премии? J По классическому определению вероятности p (A) = n (A) , n где n — число всех исходов, а n (A) — число исходов благоприятных исходов. 33 n = 120, n (A) = 32, p (A) = = 0, 275. I 120 В задачах примеров 1—4 испытание состоит в случайном выборе числа из последовательности 100, 101, . . . , 299, 300, содержащую, очевидно, 201 число. В каждой задаче определено событие A, вероятность которого требуется найти. Поскольку в последовательности исходов нет одинаковых чисел, для вычисления вероятности будем пользоваться классическим определением вероятности, где вероятность события A определяется по формуле (1) при n = 201. I Пример 2. A = {Число читается одинаково как слева направо, так и справа налево}. J В заданном множестве благоприятными исходами будут числа, первый и третий разряды которых совпадают и равны либо 1, либо 2, а второй разряд принимает значения из множества {0, 1, . . . , 9}. Если первый и третий разряд равны 1, то таких исходов в точности 10: {101, 111, , . . . , 181, 191}. В случае, если первый и третий разряд равны 3, исходов тоже 10: {202, 212, . . . , 282, 292}. Таким образом, благоприятных исходов 20 или в формальной записи n (A) = 20. 20 p (A) = .I 201 Пример 3. A = {Число кратно 6}. 7 J Числа 100 и 101, очевидно, не кратны 6, а число 102 — кратно. Следовательно, кратны 6 числа 108, 114, . . . , 294, 300. Итак, последовательность 102, 108, . . . , 294, 300 содержит 300 − 108 + +1 = 34 элемента. Следовательно, число благоприятных 6 исходов n (A) равно 34. 34 .I p (A) = 201 Пример 4. A = {Число состоит из нечетных цифр}. J Поскольку число состоит только из нечетных цифр, то его запись включает лишь цифры 1, 3, 5, 7 или 9. Третий разряд может принимать только значение 1, поскольку число 300 — четное. Т. е. благоприятными исходами будут такие числа из данного по условию множества, что третий разряд содержит 1, а первый и второй составляют всевозможные комбинации цифр 1, 3, 5, 7 или 9. Первый разряд можно выбрать пятью способами, второй разряд — также пятью. По формуле (3) n (A) = 1 · 5 · 5 = 25. Следовательно, p (A) = 25 .I 201 В задачах примеров 5—8 испытание состоит в бросании двух игральных костей. Исходом в задаче будет являться пара чисел hc1 , c2 i, выпавших на костях. Например, пара h1, 6i означает, что выпали кости , пара h5, 2i — . Обращаем внимания читателя на то, что пара hc1 , c2 i является упорядоченной, т. е. hc1 , c2 i 6= hc2 , c1 i. Пара h3, 4i означает, что сначала выпала кость , а затем — . Требуется найти вероятность события A. Число всех исходов n равно 62 = 36. Пример 5. A = {Сумма выпавших очков равна 7}. J Перечислим благоприятные исходы: h1, 6i, h6, 1i, h5, 2i, h2, 5i, h4, 3i, h3, 4i. Как видно, всего их 6. p (A) = 6 1 = .I 36 6 Пример 6. A = {Сумма выпавших очков делится на 3}. 8 J Делятся на три суммы очков 3, 6, 9, 12. Запишем исходы для каждой из сумм в таблицу: P Исходы Количество исходов 3 h1, 2i, h2, 1i 2 6 h2, 4i, h4, 2i, h3, 3i, h5, 1i, h1, 5i 5 9 h6, 3i, h3, 6i, h4, 5i, h5, 4i 4 12 h6, 6i 1 Всего 12 благоприятных исходов. p (A) = 12 1 = .I 36 3 Пример 7. A = {Модуль разности выпавших очков 4}. J Благоприятные исходы: h6, 2i, h2, 6i, h5, 1i, h1, 5i. Их четыре. p (A) = 4 1 = .I 36 9 Пример 8. A = {На костях выпадет одно и то же число очков}. J Очевидно, благоприятных исходов 6: h1, 1i, h2, 2i, h3, 3i, h4, 4i, h5, 5i, h6, 6i. p (A) = 1 6 = .I 36 6 В задачах примеров 9—11 испытание состоит в случайном вынимании 5 карт из колоды в 36 карт. Требуется найти вероятность события A. 5 Число всех исходов равно C36 . Будем пользоваться формулой (5). Пример 9. A = {Все карты красной масти}. J Всего карт красной масти 18. Из колоды вынимается 5 карт, поэтому число благоприятных исходов — это число сочетаний из 18 по 5: 5 n (A) = C18 . 5 C18 p (A) = 5 . I C36 Пример 10. A = {Среди вынутых пяти карт два туза}. 9 J Всего тузов в колоде 4. Следовательно, остальные 3 карты будут вынуты из 32. 3 n (A) = C42 · C32 . p (A) = 3 C42 · C32 .I 5 C36 Пример 11. A = {Среди пяти карт хотя бы одна дама}. J Существует два пути решения задачи. Способ 1 (непосредственный). Дам в колоде 4. Условие означает, что из пяти карт дамами могут оказаться одна, две, три или четыре карты. Число 4 3 исходов, в которых дама одна, равно C41 · C32 . Если дамы две, то C42 · C32 и т. д. Сложив количества исходов всех четырех вариантов, имеем 4 3 2 3 4 3 2 3 n (A) = C41 ·C32 +C42 ·C32 +C43 ·C32 +C44 ·C32 = 4·C32 +6·C32 +4·C32 +1·C32 . 4 3 2 3 4 · C32 + 6 · C32 + 4 · C32 + 1 · C32 p (A) = . 5 C36 Способ 2 (через противоположное событие). Рассмотрим событие {Среди пяти карт ни одной дамы}. Благоприятных исходов этого со5 5 5 , следовательно, вероятность , всего исходов — C36 = C32 бытия C40 · C32 5 C рассматриваемого события равна 32 5 . Тогда событие A произойдет с вероC 36 5 C32 ятностью 1 − 5 . C36 N. B. Подобные задачи рекомендуется решать способом 2, поскольку он является более экономичным. I Для нахождения вероятностей в примерах 12—18 тоже можно использовать сочетания. Пример 12. В кредитном отделе банка работают 5 сотрудников и 3 стажера. Наугад выбирают 3 человек. Найти вероятность того, что среди них два сотрудника и один стажер. J Число всех исходов равно C83 = 56. n (A) = C52 · C31 = 30. p (A) = 30 15 = .I 56 28 10 Пример 13. На полке трудов лауреатов Нобелевских премий по экономике стоят 4 книги Хикса 1 и 3 книги Фридмана2 . Наугад берутся 2 книги. Найти вероятность того, что среди них хотя бы одна книга Хикса. J Всего исходов C72 = 21. Найдем число исходов для событий {Одна из выбранных книг — Хикса, другая — Фридмана} и {Обе книги — Хикса}, и сложим их. n (A) = C41 · C31 + C42 · C30 = 18. Следовательно, p (A) = 18 6 = .I 21 7 Пример 14. В супермаркете продают 12 сортов масла от разных производителей. Известно, что четверть сортов не соответствует стандарту. Случайно выбирают 3 сорта масла. Какова вероятность, что ровно два из них соответствуют стандарту? 3 J Число всех исходов равно C12 = 220. n (A) = C31 · C92 = 108. p (A) = 108 27 = .I 220 55 Пример 15. Среди продаваемых в салоне 22 автомобилей 5 имеют нарушенный комплект поставки. Случайно выбирают 4 автомобиля. Найти вероятность того, что все они недоукомплектованы. 4 . J Число всех исходов равно C22 0 n (A) = C54 · C17 = 5. p (A) = 5 4 .I C22 Пример 16. При подготовке к экзамену Ваня выучил 30 вопросов из 40. В билете 2 вопроса. Найти вероятность того, что ему попадется билет с двумя известными вопросами. 1 Джон Ричард Хикс (англ. John Richard Hicks; 1904—1989) — американский экономист, лауреат Нобелевской премии 1972 г. «за новаторский вклад в общую теорию равновесия и теорию благосостояния». 2 Ми́лтон Фри́дман (англ. Milton Friedman; 1912—2006) — американский экономист, лауреат Нобелевской премии 1976 г. «за достижения в области анализа потребления, истории денежного обращения и разработки монетарной теории, а также за практический показ сложности политики экономической стабилизации». 11 J Число билетов, содержащих всевозможные комбинации из двух вопро2 сов, равно C40 = 780. 2 0 n (A) = C30 · C10 = 435. 435 29 p (A) = = .I 780 52 Пример 17. Перед тем, как выпустить новый товар на рынок, многие компании проводят опрос потребителей для выяснения будущего успеха товара. Представитель компании, разрабатывающей новый йогурт с биодобавками, зашел в магазин, где в этот момент присутствовали 20 покупателей, наугад выбрал троих из них и предложил им попробовать продукт. Если предположить, что из 20 покупателей 5 вообще не употребляют йогурт, 7 не любят биодобавки, а 8 покупателям новый продукт понравился бы, какова вероятность того, что не меньше чем двое из троих опрошенных одобрят продукт? 3 = 1140. J Всего исходов C20 Если двое из троих опрошенных одобрят продукт, то благоприятных 1 = 12 · 28 = 336. Если новый йогурт понравится всем троим, исходов C82 · C12 то благоприятных исходов C83 = 56. Следовательно, n (A) = 336 + 56 = 392. 392 98 = .I p (A) = 1140 285 Пример 18. В коробке лежат 30 конфет, половина из них — с кофейной начинкой. Наугад берутся 3 конфеты. Найти вероятность того, что среди них не более одной конфеты с кофейной начинкой. 3 J Всего исходов C30 = 4060. Если конфета с кофейной начинкой одна, то благоприятных исходов 1 2 C15 · C15 = 15 · 105 = 1575. Если среди выбранных нет ни одной конфеты с 0 3 кофейной начинкой, то благоприятных исходов C15 · C15 = 1 · 105 = 455. Следовательно, n (A) = 1575 + 455 = 2030. 2030 1 = .I p (A) = 4060 2 В задачах примеров 19—22 испытание состоит в том, что из цифр 1, 2, . . . , 9 выбирают без возвращения и записывают в порядке выбора 4 цифры, образующие четырехзначное число. Найти вероятность события A. Поскольку испытание состоит в выборе без возвращения и с учетом порядка, всего исходов A49 = 3024. 12 Пример 19. A = {Записано число 9127}. J Благоприятный исход, очевидно, единственен — 9127, т. е. n (A) = 1. p (A) = 1 .I 3024 Пример 20. A = {На четырех местах стоят нечетные цифры}. J Нечетных цифр пять, отсюда n (A) = A45 = 120. p (A) = 120 5 = .I 3024 126 Пример 21. A = {Цифры 5 и 6 стоят рядом}. J Существует шесть вариантов соседнего размещения цифр 5 и 6 в четырехзначном числе. Остается лишь разместить оставшиеся 7 цифр на две позиции — это можно сделать A27 = 42 способами. n (A) = 6 · A27 = 252. p (A) = 252 1 = .I 3024 12 Пример 22. A = {В записи числа отсутствует цифра 2}. J Запись числа выполняется восемью цифрами, откуда, n (A) = A48 = 1680. p (A) = 1680 5 = .I 3024 9 Пример 23. В службе безопасности фирмы работают 12 охранников, 4 из которых являются выпускниками одного и того же учебного центра. Найти вероятность того, что при случайной группировке охранников по 3 человека в каждой группе будет выпускник данного центра. J При решении задачи будем пользоваться формулой (7). Сначала отыщем общее количество вариантов группировки: n= 12! 12! = . 3! · 3! · 3! · 3! (3!)4 13 Для подсчета числа благоприятных исходов найдем отдельно число n1 (A) способов распределения 4 юношей в 4 группы по одному и число n2 (A) способов распределения 8 девушек в 4 группы по двое: 4! = 4!, 1! · 1! · 1! · 1! 8! 8! n2 (A) = = . 2! · 2! · 2! · 2! (2!)4 3 · 8! n (A) = n1 (A) · n2 (A) = . 2! 3 · 8! · (3!)4 9 p (A) = = .I 2! · 12! 55 n1 (A) = Пример 24. Преподаватель для выполнения лабораторной работы разбивает на пары шесть человек, среди которых есть два друга — Олег и Сергей. Найти вероятность того, что Олег и Сергей окажутся в одной паре. J Сначала отыщем общее количество вариантов группировки: n= 6! 6! = = 6 · 5 · 3. 2! · 2! · 2! (2!)3 Если Олег и Сергей окажутся в первой паре, то остальные пары, очевид4! но, можно сформировать = 6 способами. Олег и Сергей могут также 2! · 2! оказаться во второй или в третьей паре, следовательно, 4! = 18. 2! · 2! 18 1 p (A) = = .I 6·5·3 5 n (A) = 3 · Пример 25. Какова вероятность, что в четырехзначном номере (от 0000 до 9999) все цифры различны? J Выбрать одну из 10 цифр 4 раза можно 104 способами. Выбрать 4 различных цифры из 10 можно уже A410 способами, поэтому A410 p (A) = 4 . I 10 Пример 26. Видеосалон располагает 20 фильмами, 6 из которых Семен уже видел. Сеанс включает 2 фильма. Если Семен случайным образом выберет сеанс, какова вероятность того, что оба фильма ему незнакомы? 14 2 J Всего у Семена C20 = 190 вариантов выбора фильмов. Случаев, когда 2 Семен выберет незнакомые фильмы, C14 = 91. 2 C14 p (A) = 2 . I C20 Пример 27. Карточки, на которых написаны буквы Т , Е , Л , Е , С , К , О , П , раскладывают в ряд. Какова вероятность, что полученное восьмибуквенное слово является осмысленным? J Из означенного ряда букв можно составить 8! различных слов, однако лишь два из них — «ЛЕПЕСТОК» и «ТЕЛЕСКОП», — являются осмысленными. Иными словами, всего имеем 8! исходов и лишь два благоприятных. 2 p (A) = . I 8! Пример 28. Было написано 4 письма и для них подписано 4 конверта. Затем письма наудачу вложили в конверты. Каковы вероятности того, что число правильно вложенных писем равно: 0, 1, 2, 3, 4? J Обозначим события: A0 = {Число правильно вложенных конвертов равно 0}, A1 = {Число правильно вложенных конвертов равно 1}, ... A4 = {Число правильно вложенных конвертов равно 4}. Всего вариантов вложения писем в конверты 4! = 24. Непосредственным перебором вариантов устанавливаем, что i n (Ai ) p (Ai ) 3 0 9 8 1 1 8 3 I 1 2 6 4 3 0 0 1 4 1 24 Пример 29. На клавиатуре банковского сейфа 10 цифр. Какова вероятность того, что злоумышленник откроет сейф, если ему априори3 известно, кто комбинация-пароль замка состоит из 8 цифр? 3 Априо́ри (лат. a priori) — букв. «от предшествующего»; знание, полученное до опыта. 15 J Всего злоумышленник может набрать 108 различных комбинаций, из них искомый пароль может встретиться ровно один раз. Следовательно, p (A) = 1 .I 108 Пример 30. Какова вероятность угадать 5 выигрышных номеров в тираже «Спортлото», отмечая на карточке пять чисел от 1 до 36? 5 штук. Благоприятный исход один. J Всего наборов по 5 номеров C36 p (A) = 1 5 .I C36 Пример 31. В урне имеется три шара: черный, красный и белый. Из урны 4 раза извлекали шар, причем после каждого извлечения шар возвращали обратно. Определить вероятность того, что 4 раза извлекали черный шар. J Всего исходов 34 = 81. Благоприятный исход один — тот, который доставляет извлечение черного шара при каждой из четырех попыток. p (A) = 1 .I 81 Пример 32. 100 сотрудников холдинга отвечали на тренинге на вопрос: «От чего, по Вашему мнению, в первую очередь зависит авторитет руководителя: 1. от его личных качеств; 2. от его компетентности как специалиста; 3. от его формального статуса?» Первый ответ выбрали 17 сотрудников, второй — 51 сотрудник, остальные предпочли третий ответ. Какова вероятность, что случайно выбранный из числа опрошенных сотрудник считает, что авторитет руководителя зависит в первую очередь от формального статуса? J Всего 100-17-51=32 сотрудника считают, что авторитет руководителя определяется его формальным статусом. 32 8 Отсюда очевидно, что p (A) = = .I 100 25 16 Задачи В задачах 1—3 испытание состоит в случайном выборе одной буквы из букв слова «ЭКОНОМИКА»; необходимо найти вероятность события A. 1. A = {Вынута буква «М»}. 2. A = {Вынута согласная буква, но не «М»}. 3. A = {Вынута гласная буква}. В задачах 4—7 испытание состоит в случайном выборе числа из последовательности 10, 11, . . . , 99; требуется найти вероятность события A. 4. A = {Сумма цифр числа равна 4}. 5. A = {Число делится на 2 и на 3}. 6. A = {Число состоит из четных цифр}. 7. A = {Число не кратно 12}. В задачах 8—11 испытание состоит в бросании двух костей. Найти вероятности событий: 8. A = {Сумма выпавших очков меньше 5}. 9. A = {Произведение выпавших очков делится на 3}. 10. A = {На обеих костях выпадет «6»}. 11. A = {Ни на одной из костей не выпадет «1»}. 12. В розыгрыше лотереи участвуют 100 билетов, среди которых 25 выигрышных. Какова вероятность остаться без выигрыша, приобретя 3 билета лотереи? 13. На склад дилера известной марки MP3-плееров поступила партия из 20 устройств, 6 из которых ввезены в страну нелегально. Инспекторы службы технического контроля проверяют только два плеера из партии. С какой вероятностью специалисты компании выявят хотя бы один «контрафактный» аппарат? 14. В коробке лежат 6 молочных шоколадных конфет и 8 конфет черного шоколада. Наудачу вынимаются 5 конфет. Найти вероятность того, что среди них не меньше 4 конфет молочного шоколада. 15. Из 5 студентов-математиков и 6 студентов экономического факультета выбирают сначала одного, потом еще двоих. Какова вероятность, что все трое учатся на одном факультете? 16. В конференции принимали участие 2 первокурсника, 5 второкурсников, 6 третьекурсников и 5 студентов четвертого курса, 17 причем список выступающих был составлен по алфавиту. Какова вероятность, что 5 первых докладов делали второкурсники? 17. В 25 экзаменационных билетах содержится по два не повторяющихся вопроса. Студент знает ответы только на 40 вопросов. Какова вероятность того, что ему достанется билет, в котором он оба вопроса знает? 18. В 25 экзаменационных билетах содержится по два не повторяющихся вопроса. Сколько вопросов надо выучить студенту при подготовке к экзамену, чтобы вероятность того, что ему достанется билет, в котором он оба вопроса знает, была бы не меньше 0,9? 19. Из девяти мобильных телефонов три — китайской сборки, два — венгерской. Какова вероятность, что среди выбранных случайно четырех телефонов поровну аппаратов китайской и венгерской сборки? 20. Среди двадцати купюр есть две фальшивые. Если взять случайно две купюры из двадцати, какова вероятность того, что среди них хотя бы одна фальшивая? 21. Из коробки, в которой лежат 10 испанских апельсинов и 6 — марокканских, наудачу вынимают 3 фрукта. Найти вероятность того, что образовалась пара, т. е. вынут один апельсин, выращенный в Испании, и один — из Марокко. В задачах 22—25 испытание состоит в том, что из цифр 2, 3, . . . , 8 выбирают без возвращения и записывают в порядке выбора 3 цифры, образующие трехзначное число. Найти вероятности событий: 22. {Записано число 545}. 23. {Записано число 546 или 547}. 24. {Все цифры четные}. 25. {В записи числа присутствуют цифры 4 и 8}. В задачах 26—29 испытание состоит в том, что из цифр 2, 3, . . . , 8 выбирают с возвращением и записывают в порядке выбора 3 цифры, образующие трехзначное число. Найти вероятности событий: 26. {Записано число 545}. 27. {Записано число 546 или 547}. 28. {Все цифры четные}. 29. {В записи числа присутствуют цифры 4 и 8}. 30. При проведении корпоративного обучения для специалистов компаний холдинга, группа, состоящая из 12 руководителей и 6 18 специалистов, делится случайным образом на три равные подгруппы. Найти вероятность того, что в каждой части число руководителей и специалистов одинаково. 31. Четыре книги Акунина4 , пять книг Лукьяненко5 и три книги Роулинг6 случайно раскладывают на 3 бандероли по 4 книги. Какова вероятность, что книги Роулинг окажутся в одной бандероли? 32. Тридцать студентов наудачу расходятся по трем аудиториям. Найти вероятность того, что в первой будет 12 человек, а во второй 5. 33. В автобус зашли 5 человек. Автобус делает 7 остановок. Найти вероятность того, что все пятеро выйдут на разных остановках. 34. В телефонном номере 6 цифр. Какова вероятность того, что все цифры различны? 35. В лотерее разыгрывается 1000 билетов. Среди них два выигрыша по 5000 руб., пять выигрышей по 2000 руб., десять выигрышей по 1000 руб. и 25 по 500 руб. Некто покупает один билет. а) выигрыша не менее 2000 руб., Найти вероятность: б) какого-либо выигрыша. 36. Семеро сотрудников становятся в очередь для получения заработной платы. Определить вероятность того, что два определенных человека стоят рядом. 37. На семинаре «Проблемы невозврата потребительских кредитов» 7 человек, среди которых были два представителя Торговопромышленной палаты, случайным образом разместились за круглым столом. Определить вероятность того, что представители Торгово-промышленной палаты сидят рядом. 38. На полке произвольным образом расставили 6 разных книг Астафьева7 . Какова вероятность, что две фиксированные книги окажутся стоящими рядом? 39. На полке стоят 30 книг, среди них шеститомник Каспаро8 ва . Какова вероятность, что тома Каспарова расположены в порядке возрастания номеров, но не обязательно рядом? 40. В группе из 15 студентов 7 родились в Красноярске, 4 — в Томске, 3 — в Новосибирске и 1 — в Норильске. Из группы выбирают 4 студентов. Какова вероятность, что среди них есть уроженцы всех 4 Борис Акунин (псевдоним, настоящее имя — Григорий Чхартишвили; р. 1956) — российский писатель. Сергей Лукьяненко (р. 1968) — российский писатель-фантаст. 6 Джоа́н Ро́улинг (англ. Joanne Rowling ; р. 1965) — английская писательница. 7 Виктор Астафьев (1924—2001) — российский писатель. 8 Каспаров, Г. М. Мои великие предшественники. Новейшая история развития шахматной игры: В 6 т. / Гарри Каспаров. М.: Рипол классик, 2005. 5 19 4 городов? 41. Карточки, на которых написаны буквы А , Ш , Ф , К , Л , Е , раскладывают в ряд. Какова вероятность, что получится слово «ФЛЕШКА»? 42. Карточки, на которых написаны буквы Г , А , С , Т , Р , О , Н , О , М , раскладывают в ряд. Какова вероятность, что они лягут в порядке «НОРМАГОСТ»? 43. На клавиатуре пишущей машинки 26 букв латинского алфавита. Ребенок 4 раза нажимает клавиши. Какова вероятность, что он напечатает слово “WORD”? 20 2. Основания теории вероятностей 2.1. Основные понятия Пространство элементарных событий Пространством элементарных событий Ω называется множество, содержащее все возможные результаты данного случайного эксперимента, из которых в эксперименте происходит ровно один. Элементы этого множества называют элементарными исходами и обозначают буквой ω. Событиями мы будем называть некоторые наборы элементарных исходов, то есть подмножества множества Ω. Говорят, что в результате эксперимента произошло событие A, если в эксперименте произошел один из элементарных исходов, входящих в данное множество. 1. Достоверное событие, наступающее при любом исходе, обозначается Ω. 2. Невозможное событие обозначается ∅. 3. A1 = A2 , если A1 ⊆ A2 и A2 ⊆ A1 . 4. A1 и A2 называются несовместными, если множества элементарных исходов {ωA1 } и {ωA2 } не пересекаются. Комбинации событий Суммой или объединением событий A1 , A2 называется событие A, состоящее в осуществлении хотя бы одного из A1 , A2 : A = A1 + A2 = A1 ∪ A2 . S Аналогично определяется A = Ak . k Произведением или пересечением событий A1 , A2 называется событие A, состоящее в осуществлении и A1 и A2 : A = A1 · A2 = A1 ∩ A2 . T Аналогично определяется A = Ak . k N. B. Часто знак умножения «·» опускается. Поэтому, в пособии за- писи A B и A · B означают одно и то же — произведение событий A и B. Разностью событий A1 , A2 называется событие A, которое означает, что происходит A1 , но не происходит A2 : A = A1 \ A2 . 21 2.1 Основные понятия Противоположным или дополнительным к событию A называется событие A, состоящее в том, что событие A не происходит: A = Ω \ A. Симметрической разностью событий A и B называется событие A1 4A2 = A1 A2 + A2 A1 . Свойства операций 1. 2. Сложение (+, ∪) Умножение ( · , ∩) A+B =B+A A·B =B·A (коммутативность) (A + B) + C = A + (B + C) (A · B) · C = A · (B · C) (ассоциативность) 3. A+A=A A·A=A 4. A+∅=A A·∅=∅ 5. A+Ω=Ω A·Ω=A 6. A+A=Ω A·A=∅ 7. A+B =A·B A·B =A+B 8. (A + B) · C = A · C + B · C 9. Ω=∅ 10. ∅=Ω (законы двойственности) (дистрибутивность умножения относительно сложения) В задачах примеров 33—36 описать Ω и подмножество Ω, соответствующее событию A. Пример 33. Монету подбрасывают 2 раза, A = {2 раза выпал герб}. J Выпадение «герба» будем обозначать буквой «Г», выпадение «решки» — буквой «Р». Ω = {ГГ, РГ, ГР, РР}. A = {ГГ}. I Пример 34. Каждый из двух экспертов независимо присваивает проекту ранг от 1 до 6 соответственно его актуальности. A = {сумма рангов равна 6}. J Как и раньше, ha, bi — упорядоченная пара. Ω = {ha, bi | a, b ∈ 1, 6}. A = {ha, bi | a + b = 6}. I 22 2.1 Основные понятия Пример 35. Студент 3 раза проходит тест, A = {первый успех был достигнут при третьей попытке}. J Успех будем обозначать единицей, неудачу — нулем. Ω = {ha, b, ci | a, b, c ∈ {0, 1}}. A = {h0, 0, 1i}. I Пример 36. Студент 3 раза проходит тест, A = {хотя бы один успех}. J Как и прежде, успех будем обозначать единицей, неудачу — нулем. Ω = {ha, b, ci | a, b, c ∈ {0, 1}}. A = {ha, b, ci | a + b + c > 1}. Выпишем множество A явно: A = {h0, 0, 1i, h0, 1, 0i, h1, 0, 0i, h0, 1, 1i, h1, 1, 0i, h1, 0, 1i, h1, 1, 1i}. I В задачах примеров 37—42 выразить событие D через A = {Алексеев получил премию}, B = {Васильев получил премию}, C = {Степанов получил премию}. Пример 37. D = {ровно один сотрудник из вышеперечисленных получил премию}. J D = A B C + A B C + A B C. I Пример 38. D = {ровно двое получили премию}. J D = A B C + A B C + A B C. I Пример 39. D = {хотя бы один получил премию}. J D = A + B + C = A B C. I Пример 40. D = {хотя бы один не получил премию}. J D = A + B + C = ABC. I Пример 41. D = {не менее двоих получили премию}. J D = A B C + A B C + A B C + A BC. I 23 2.1 Основные понятия Пример 42. D = {получили премию не более одного сотрудника}. J D = A B C + A B C + A B C + A BC. I Пример 43. Прибор состоит из n блоков. Событие Ai = {исправен i-й блок}. Описать события n [ i=1 J n [ Ai , n \ Ai , i=1 n [ i=1 Ai , n \ Ai . i=1 Ai = {Исправен хотя бы один блок}. i=1 n \ Ai = {Исправны все блоки}. i=1 n [ Ai = {Не исправен хотя бы один блок}. i=1 n \ Ai = {Не исправны все блоки}. I i=1 В задачах примеров 44—45 упростить выражения для событий. Пример 44. C = A + A B + A + B. J C = A + A B + A + B = A + A B + A B = A + A(B + B). Поскольку B + B = Ω, C = A + A = Ω. I Пример 45. C = (A + B)(A + B) + (A + B)(A + B). J C = (A + B)(A + B) + (A + B)(A + B) = = A A + B A + A B + B B + A A + A B + A B + B B. Поскольку B B = ∅, A A = ∅, C = B A + A B + B A + B A = B(A + A) + B(A + A) = B + B = Ω. I В задачах примеров 46—47 доказать тождества. Пример 46. A + B = (A \ (A B)) + B. 24 2.1 Основные понятия J Пусть x ∈ (A\(A B))+B ⇒ x ∈ A(A B)+B ⇒ x ∈ A(A+B)+B ⇒ x ∈ A B + B. Теперь положим x ∈ A + B ⇒ x ∈ A(B + B) + B(A + A) ⇒ x ∈ A B + A B + B A ⇒ x ∈ A B + B(A + A) ⇒ x ∈ A B + B. Тождество доказано. I Пример 47. A \ (B C) = (A \ B) + (A \ C). J Пусть x ∈ A \ (B C) ⇒ x ∈ A(B + C) ⇒ x ∈ A B + A C. Теперь положим x ∈ (A \ B) + (A \ C) ⇒ x ∈ A B + A C. Тождество доказано. I Пример 48. Доказать, что если A ⊂ B, то B ⊂ A. J Поскольку A ⊂ B, то если взять x ∈ A ⇒ x ∈ B. / B ⇒ x ∈ / A ⇒ x ∈ A. Итак, было Теперь положим x ∈ B ⇒ x ∈ показано, что A ⊂ B ⇒ B ⊂ A. I Пример 49. Показать, что если A и B несовместны, то A C и B C также несовместны. J A и B несовместны, следовательно, A B = ∅. Рассмотрим пересечение событий A C и B C: A C B C = A B C = ∅. Поэтому, A C и B C несовместны. I Пример 50. Выразить событие A + B + C как сумму несовместных событий. J Распишем сумму A, B и C как сумму трехчленных произведений. A + B + C = AB + AB + BC + BC + C B + C B = = A B C + A B C + A B C + A B C + A B C + A B C+ + ABC + ABC + ABC + ABC + ABC + ABC = = A B C + A B C + A B C + A B C + A B C + A B C + A B C. Непосредственной проверкой убеждаемся, что все семь произведений полученной суммы попарно несовместны. I Пример 51. Каково условие совместности событий A+B, A+B, A+B? 25 2.1 Основные понятия J События будут совместными, если их пересечение не пусто, т. е. (A + B)(A + B)(A + B) 6= ∅. Упростим это выражение. (A + B)(A + B)(A + B) = (A + A B + A B)(A + B) = A(A + B) = A B. Таким образом, условие совместности выглядит следующим образом: AB = 6 ∅. I Пример 52. Показать, что события A, AB, A + B образуют полную группу. J Для того, чтобы события A, AB, A + B составляли полную группу, необходимо и достаточно, чтобы выполнялось равенство A + AB + A + B = Ω и события попарно не пересекались. Рассмотрим сумму A + AB + A + B = A + AB + A + B = A + AB + AB = = A + A(B + B) = A + A = Ω. Теперь рассмотрим попарные пересечения событий. A A B = ∅. A(A + B) = A A B = ∅. A B(A + B) = A B A B = ∅. Итак, события A, AB, A + B образуют полную группу. I Задачи В задачах 44—48 описать Ω и подмножество Ω, соответствующее событию A. 44. Было совершено 3 сделки, A = {2 оказались прибыльными}. 45. Фирма обращается в банки для получения кредита пооочередно, то есть дожидается решения, и в случае отказа в кредитовании обращается в следующий банк. A = {только 4-й банк примет положительное решение о кредитовании}. 46. На каждом из двух постов находятся от 1 до 3 охранников. A = {На втором посту охранников больше, чем на первом}. 47. Четыре человека задумывают по цифре для шифра, A = {задуманы одинаковые цифры}. 48. Резюме размещают на двух сайтах, A = {хотя бы на одном сайте есть отклик}. 26 2.1 Основные понятия В задачах 49—53 выразить событие C через A = {первый банкомат работает}, B = {второй банкомат работает}. 49. C = {оба банкомата работают }. 50. C = {ни один банкомат не работает}. 51. C = {из двух банкоматов работает только первый}. 52. C = {из двух банкоматов работает только один}. 53. C = {из двух банкоматов работает хотя бы один}. В задачах 54—59 требуется описать, в чем состоят события. 54. Событие A = {будет дождь}, событие B = {будет ветер}. Описать события A + B, AB, A + B, A + B, B A. 55. Бракованные изделия могут иметь различные дефекты. Событие A состоит в том, что бракованное изделие имеет вмятину, событие B в том, что имеется царапина, событие C в том, что имеется скол. Пояснить, в чем состоят события A+B, AB, A+B+C, A+ C, A + B. 56. Оформлено десять накладных. Событие Ak = { k-я накладная оформлена неправильно}, k = 1, . . . , 10. Описать события A1 + A2 + A3 , A1 A2 A3 , A4 A6 , 10 [ Ai , i=1 10 \ Ai , i=1 8 \ Ai , i=1 5 [ Ai . i=1 57. Устройство состоит из 5 элементов. Событие Ai {неисправен i-й элемент, i=1, . . . , 5}. Описать события 5 [ i=1 Ai , 4 \ i=1 Ai , 3 [ i=1 Ai , 5 \ = Ai . i=1 58. Три стрелка стреляют по цели. Событие Ai = { i-й стрелок попадает в цель, i=1, 2, 3}. Описать события A1 A2 A3 , A1 + A3 , A1 A3 A3 , A2 + A1 , 3 \ Ai . i=1 59. В магазине «Лампы от Евлампии» суточная выручка сильно колеблется. Событие A состоит в том, суточная выручка магазина составляет не больше 40 тысяч рублей, событие B состоит в том, что суточная выручка составляет от 20 до 70 тысяч рублей. Описать события A + B, AB, A + B, A + B. 27 2.2 Геометрическое определение вероятности В задачах 60—62 упростить выражения для событий. 60. C = A + A B + B. 61. C = A + BA + B + ABA + A + B. 62. C = (B A + A B + B A)B. В задачах 63—64 доказать тождества. 63. A(B + C) = AB + AC. 64. A + B = A B. В задачах 65—66 проверить, верны ли следующие равенства. 65. (A \ B) = A 4 (A B). 66. A \ B = A \ B. В задачах 67—70 выяснить, обязаны ли совпадать события A и B, если: 67. 68. 69. 70. A = B. A + C = B + C, где C — некоторое событие. A C = B C, где C — некоторое событие. A \ B = ∅. 2.2. Геометрическое определение вероятности Рассмотрим некоторую ограниченную область Ω в евклидовом пространстве Rm (на прямой, на плоскости, в пространстве при m = 1, 2, 3 соответственно). Предположим, что «мера» Ω (длина, площадь и объем при m = 1, 2, 3) конечна. Пусть случайный эксперимент состоит в том, что мы наудачу бросаем в эту область точку, и событие A заключается в том, что точка попадает в область Λ ⊆ Ω. Если эксперимент удовлетворяет условиям «геометрического определения вероятности», т. е. его исходы можно изобразить точками некоторой области Ω в Rm так, что вероятность попадания точки в любую область Λ ⊆ Ω не зависит от формы или расположения Λ внутри Ω, а зависит лишь от меры области Λ, то: p (A) = µ (Λ) , µ (Ω) (8) где µ (Λ) — мера области Λ. В настоящем задачнике в основном используются геометрические определения вероятности на прямой и на плоскости, где мерой множеств являются соответственно длина L и площадь S. В этих случаях (8) запишется как L (Λ) p (A) = . (9) L (Ω) 28 2.2 Геометрическое определение вероятности p (A) = S (Λ) . S (Ω) (10) Пример 53. В центре квадратной площадки со стороной 20 м расположен низкий фонарь, освещающий круг радиуса 10 м. Поздно вечером, когда уже стемнело, где-то на площадке выронили телефон. Какова вероятность, что телефон не виден? 2 J Построим математическую модель задачи. 10 м примем за единицу. Телефон мал по сравнению с размерами площадки, и можно считать его «точкой». Тогда задача может быть переформулирована следующим образом. Внутри квадрата со стороной 2 наугад выбирают точку. Найти вероятность того, что расстояние её от центра квадрата больше 1. Воспользуемся геометрическим определением вероятности для плоскости. Множество всех исходов 2 Рис. 1. Ω = {hx, yi | 0 6 x 6 2, 0 6 y 6 2} — квадрат со стороной 2 (его площадь, очевидно, равна 4). Отыщем вероятность события A ={точка отстоит от центра квадрата более чем на 1} по формуле S(Λ) . p (A) = S(Ω) Множество Λ составляют все точки квадрата Ω за исключением тех, что принадлежат кругу, центр которого совпадает с центром квадрата, а радиус равен 1. На рис. 1 множество Λ заштриховано. Площадь такого круга равна πr2 = π. Таким образом, площадь S(Λ) = 4 − π. Тогда, p(A) = 4−π π = 1 − ≈ 0, 2146. I 4 4 Пример 54. В круг радиуса 1 вписан квадрат. Найти вероятность того, что точка, поставленная наудачу в круге, окажется вне квадрата. 29 2.2 Геометрическое определение вероятности J Поскольку 1 Ω = {hx, yi | x2 + y 2 6 1} — r = круг радиуса 1, S (Ω) = π. Множество Λ составляет множество Ω за исключением квадрата, вписанного в круг радиуса 1. По теореме Пифагора √ находим, что сторона квадрата составляет 2. Следовательно, S (Λ) = π − 2. Рис. 2. p (A) = 2 π−2 = 1 − ≈ 0, 3633. I π π Пример 55. Два сотрудника должны сдать отчеты с 10 до 13 часов. Какова вероятность того, что между моментами сдачи отчетов пройдет меньше часа? J Составим математическую модель задачи. Примем час за единицу, а точку отсчета (10 часов) за 0. Испытание состоит в выборе на отрезке AB длины 1 двух случайных точек: C и D. Найти вероятность того, что 1 |CD| < . 3 Множества исходов и благоприятных исходов будем изображать на плоскости (см. рис. 3). Вдоль оси абсцисс на отрезке [0, 1] станем изображать положение точки C, вдоль оси ординат на том же отрезке — положение точки D. Множество всех исходов Ω — квадрат со стороной 1, одна из вершин которого расположена в начале координат. Его площадь, очевидно, равна 1. xD Следовательно, вероятность описанноS (Λ) 1 го события составляет = S (Λ). 1 Изобразив множество Λ, найдем его площадь. Из рисунка видно, что Λ — это квадрат Ω без двух равных равносторонних прямоугольников с кате1 2 3 тами . Суммарная площадь этих тре3 2 1 2 4 xC угольников равна 2 · = . 2 3 9 1 1 0 3 30 Рис. 3. 2.2 Геометрическое определение вероятности Тогда S (Λ) = 5 = p (A). I 9 Пример 56. Испытание состоит в выборе на отрезке AB длины 1 двух случайных точек: C и D. Найти вероятность того, что средняя часть отрезка меньше левой части. J Пусть точка C расположена левее точки D на отрезке AB, т. е. y A x C D B |AC| < |AD|. Рис. 4. Положим AD = y, AC = x (см. рис. 4). Тогда условие задачи описывается системой неравенств y − x < x, y < 2x, ⇔ y > x. y > x. Рассмотрим теперь случай, когда точка D расположена левее точки C, т. е. |AD| < |AC|. x A y D C Рис. 5. шется: B При этом сохраним обозначения (см. рис. 5). Здесь условие задачи запи x − y < y, y > 12 x, ⇔ y < x. y < x. Взяв объединение рассмотренных выше систем, получим описание множества благоприятных исходов: ( ) 1 y < 2x, y > x, 2 Λ = hx, yi , или y < x. y>x при условии, что ω ∈ Ω ∀ω ∈ Λ. xD 1 ∆1 ∆2 0 1 2 xC 1 Построим геометрическую фигуру, которая соответствует множеству Λ. Будем считать, что вдоль оси абсцисс отложена xC = |AC| — координата точки C, а вдоль оси ординат — xD = |AD| — координата точки D. В этой системе координат построим квадрат со стороной 1 — множество Ω, 1 внутри него — прямые y = 2x, y = x, 2 31 2.2 Геометрическое определение вероятности y = x, ограничивающие множество благоприятных исходов. Заштрихуем его. Из рис. 6 видно, что S (Λ) = 1 − (S (∆1 ) + S (∆2 )). ∆1 и ∆2 — прямоугольные треугольники, поэтому их площади равны полупроизведению катетов. 1 1 1 ·1· = . 2 2 4 1 1 1 S (∆2 ) = · 1 · = . 2 2 4 1 Таким образом, S (Ω) = . 2 1 p (A) = . I 2 Пример 57. Два судна должны подойти к одному и тому же причалу. Время прихода обоих пароходов независимо и равновозможно от 12:00 до 15:00. Время стоянки первого парохода 30 минут, второго — 1 час. Найти вероятность того, что одному из пароходов придётся ожидать освобождения причала. S (∆1 ) = J Время будем измерять в минутах, отсчитывая 0 минут с 12:00. Тогда, моменту времени 15:00 соответствует 180 минут. Если обозначить время прихода первого парохода t1 , а второго — t2 , то множество всех исходов задачи можно описать следующим образом. t2 180 120 ∆1 0 Ω = {ht1 , t2 i | 0 6 t1 6 180, 0 6 t2 6 180}. ∆2 30 t1 60 Рис. 7. Если сначала к причалу приходит второй пароход, первый сможет подойти к пристани не раньше, чем через 60 минут. Во введенных нами определениях это 150 180 условие запишется неравенством t1 − t2 6 60. Аналогично выписываем условие стоянки второго парохода, если сначала придет первый: t2 − t1 6 30. 32 2.2 Геометрическое определение вероятности Теперь мы можем описать множество благоприятных исходов Λ. Λ = {ht1 , t2 i | t1 − t2 6 60, t2 − t1 6 30}. На рис. 7 множество Λ представлено заштрихованной фигурой. Отыщем ее площадь. Из рис. 7 видно, что S (Λ) = S (Ω) − (S (∆1 ) + S (∆2 )) . Вычислим площадь фигур Ω, ∆1 , ∆2 . S (Ω) = 1802 = 32400. 1502 S (∆1 ) = = 11250. 2 1202 S (∆2 ) = = 7200. 2 Теперь ясно, что S (Λ) = 13950, а, следовательно, p (A) = S (Λ) 13950 31 = = .I S (Ω) 32400 72 Задачи 71. Расчетное время выполнения проекта 92 ± 7 дней. Найти вероятность того, что проект будет закончен не более, чем за 90 дней. 72. Если среднедушевой доход населения районов Красноярского края представлен с точностью до 100 рублей, то какова вероятность того, что ошибка округления не превышает 30 рублей? 73. Вдоль улицы через каждые 250 метров расположены рекламные щиты. Каждый щит доступен для обозрения с расстояния 5—50 метров. Какова вероятность, что человеку, стоящему на улице, доступен для обозрения щит? 74. В А́банском9 лесхозе 134 тыс. гектаров занято хвойными породами и 85 тыс. гектаров занято мягколиственными породами. 9 А́бан — поселок городского типа, административный центр Абанского района Красноярского края. 33 2.2 Геометрическое определение вероятности На территории, покрытой лесной растительностью, случайно выбирается участок площадью 1 м2 . Какова вероятность при этом попасть на территорию, занятую хвойными деревьями? 75. В протоколе об административном правонарушении плохо пропечаталось 7 % текста. Какова вероятность, что пострадала первая буква фамилии? 76. Первоначальная масса моющего средства во флаконе равнялась 140 граммам. Средство тратилось равномерно и было истрачено за месяц. Найти вероятность того, что в случайный день месяца во флаконе было от 20 до 35 граммов. 77. Ураган повредил линию электропередачи на участке между 50-м и 55-м километрами. Найти вероятность того, что обрыв ЛЭП произошел между 51-м и 52-м километрами. 78. Стержень длиной 50 см ломается на две части. Найти вероятность того, что одна часть короче 10 см, если излом равновозможен в любом месте. 79. Через центр окружности случайным образом проводят два луча. Какова вероятность, что угол между ними меньше 40◦ ? 80. В круге радиуса R случайно выбирается точка. Какова вероятность, что она ближе к центру круга, чем к его границе? 81. На границе прямоугольника со сторонами 6 и 10 выбрана случайная точка. Найти вероятность того, что расстояние ее от какой-либо вершины прямоугольника меньше 1. 82. Охранник движется по границе прямоугольного участка со сторонами 130 м и 50 м. Найти вероятность того, что в случайный момент времени он будет находиться от любого угла на расстоянии, превышающем 10 м. 83. Чтобы добраться до места учебы, студент может воспользоваться автобусами маршрутов №№ 88 или 68. Интервалы движения автобусов 7,5 и 9 минут соответственно. Найти вероятность того, что ждать автобуса придется меньше 5 минут. 84. Испытание состоит в случайном выборе двух чисел x1 и x2 из отрезка [0, 10]. Найти вероятность события {|x1 − x2 | > 2}. 85. Из отрезка [−1, 2] выбирают два числа x1 и x2 . Найти вероятность события {x1 + x2 > 1, x1 x2 < 0}. 86. Испытание состоит в выборе на отрезке AB длины 1 двух случайных точек: C и D. Найти вероятность события {Точка C ближе к точке A, чем к точке D}. 87. Если случайно выбрать на отрезке AB произвольной длины две случайные точки C и D, то какова вероятность, что {|AD| < 34 2.2 Геометрическое определение вероятности |CB|}. 88. На 12-километровом участке водопровода между Академгородком и Ветлужанкой10 в двух местах происходит утечка воды. Найти вероятность того, что расстояние между местами повреждений меньше 3 км. 89. Студент заходит в электронный курс «Теория вероятностей и математическая статистика» для студентов экономического факультета в любое время между 19:00 и 19:30 и через 5 минут отправляет преподавателю вопрос по решению задачи. После этого студент еще 35 минут присутствует на сайте этого электронного курса. Преподаватель заходит в этот же курс в случайное время между 19.40 и 20.30, немедленно получает сообщение и отвечает через 10 минут. Какова вероятность, что студент получит сообщение до своего выхода с курса? 90. Инвестор встречается с двумя клиентами, которые приходят независимо друг от друга в интервале от 14 до 16 часов. Продолжительность каждой встречи — 30 минут. Найти вероятность того, что одному из клиентов придется ждать. 91. В диспетчерскую службу городских электрических сетей за 20 минут поступили 2 заявки на устранение аварии из разных районов города. Найти вероятность того, что промежуток времени между заявками меньше 3 минут. 92. Игорь Кузнецов и Олег Сергеев — ведущие специалисты конкурирующих авиационных фирм, — собираются посетить Международный аэрокосмический салон в один и тот же день, с 10 до 12 часов дня. Каждый из них проведет не меньше 30 минут на презентации новейшего многоцелевого истребителя. Какова вероятность, что они там встретятся? 93. Если условия предыдущей задачи распространяются на троих бывших однокурсников: Кузнецова, Сергеева, а также Илью Пономарева — сотрудника третьей конкурирующей фирмы, — то какова вероятность встречи всех троих на презентации? 94. Проект состоит из двух этапов, второй этап можно выполнять только по завершении первого. Расчетное время выполнения первого этапа 180 ± 10 дней, второго этапа 60 ± 5 дней. Найти вероятность того, что проект будет закончен не более, чем за 235 дней. 10 Академгородок и Ветлужанка — микрорайоны г. Красноярска. 35 3. Теоремы исчисления вероятностей 3.1. Теоремы сложения и умножения События A и B называются независимыми, если p (A B) = p (A) p (B). (11) События A1 , . . . , An называются независимыми (в совокупности), если для всех 1 6 i1 < i2 < . . . < im 6 n, m 6 n, ! m m \ Y Aik = p (Aik ). (12) p k=1 k=1 Условной вероятностью события A при условии, что произошло событие B, называется отношение p (A B) p (A/B) = , (p (B) > 0). p (B) Теорема сложения для двух событий. Для любых событий A и B p (A ∪ B) = p (A) + p (B) − p (A B). (13) Теорема сложения для n событий. Для любых событий A1 , . . . , An p n [ i=1 ! Ai = n X X p (Ai ) − i=1 p (Ai Aj )+ 16i<j6n + X p (Ai Aj Ak ) − . . . + (−1)n−1 p (A1 . . . An ). 16i<j<k6n N. B. По определению вероятности, если события A1 , . . . , An попарно несовместны, то ! n n [ X p Ai = p (Ai ). (14) i=1 i=1 Теорема умножения. Пусть p (B) 6= 0. Тогда p (A B) = p (A/B) p (B). Теорема умножения 0, . . . , p (An−1 ) 6= 0. Тогда для n событий. (15) Пусть p (A1 ) p (A1 A2 . . . An ) = p (A1 ) p (A2 /A1 ) . . . p (An /A1 A2 . . . An−1 ). 6= (16) 36 3.1 Теоремы сложения и умножения Пример 58. При опросе 100 красноярцев оказалось, что у 61 из них имеется сотовый телефон, у 34 — стационарный телефон, причем у 25 человек имелись и сотовый и стационарный телефоны. Являются ли наличие сотового и стационарного телефонов независимыми событиями? J Пусть A ={Наличие сотового телефона}, B ={Наличие стационарного телефона}, тогда AB = {наличие сотового и стационарного телефонов}. По условию, p (A) = 0, 61; p (B) = 0, 34, p (AB) = 0, 25. p (A B) = 0, 25 6= p (A) p (B) = 0, 61 · 0, 34 = 0, 2074, следовательно, события зависимы.I В примерах 59—62 найти вероятность события D, выраженного через события A, B, C, если A = {Алексеев получил премию}, B = {Васильев получил премию}, C = {Степанов получил премию}, события A, B, и C независимы и p (A) = 0, 4; p (B) = 0, 2, p (C) = 0, 7. Пример 59. D ={Ровно один сотрудник из вышеперечисленных получил премию}. J Как установлено в решении задачи примера 37, в данном случае D = A B C + A B C + A B C. Для вычисления вероятности можно использовать два способа. Способ 1. По теореме сложения для n событий (здесь n = 3), p (D) = p (A B C) + p (A B C) + p (A B C)− − p (A B C A B C) − p (A B C A B C) − p (A B C A B C)+ + p (A B C A B C A B C). 37 3.1 Теоремы сложения и умножения Поскольку A A = ∅, B B = ∅, C C = ∅, то p (A B C A B C) = p (A B C A B C) = p (A B C A B C) = = p (A B C A B C A B C) = p (∅) = 0, а, следовательно, p (D) = p (A B C) + p (A B C) + p (A B C). Так как события A, B и C независимы, p (A B C) = p (A) p (B) p (C) = p (A) [1 − p (B)] [1 − p (C)] = 0, 096; p (A B C) = p (A) p (B) p (C) = [1 − p (A)] p (B) [1 − p (C)] = 0, 036; p (A B C) = p (A) p (B) p (C) = [1 − p (A)] [1 − p (B)] p (C) = 0, 336. Итак, p (D) = 0, 468. Способ 2. Заметим, что события A B C, A B C, A B C попарно несовместны. По аксиоматическому определению, вероятность суммы несовместных событий равна сумме вероятностей этих событий, то есть p (D) = p (A B C) + p (A B C) + p (A B C) = 0, 468. I Пример 60. D ={Хотя бы один сотрудник получил премию}. J Из решения задачи примера 39 известно, что D = A B C. p (D) = p(A B C) = 1 − p (A B C) = = 1 − [1 − p (A)][1 − p (B)][1 − p (C)] = 0, 856. I Пример 61. D ={Хотя бы один сотрудник не получил премию} J При решении задачи примера 40 было установлено, что событие D ={из трёх событий A, B, C не произойдёт хотя бы одно событие} представимо в виде A + B + C = A B + C = A B C. Тогда p (D) = 1 − p (A B C). События A, B, C независимы, поэтому p (A B C) = p (A) p (B) p (C) = 0, 056, и p (D) = 0, 944. I Пример 62. D ={получили премию не более одного сотрудника}. 38 3.1 Теоремы сложения и умножения Событие D представимо в виде суммы A B C + A B C + A B C, отсюда p (D) = p (A B C) + p (A B C) + p (A B C). Пользуясь аналогией с решение предыдущих задач, получаем p (A B C) = 0, 084, p (A B C) = 0, 224, p (A B C) = 0, 024. В итоге, p (D) = 0, 332. I Пример 63. Отдел технического контроля проверяет изделия на стандартность. Вероятность того, что изделие стандартно, равна 0,8. Найти вероятность того, что из двух проверенных изделий хотя бы одно стандартное. J Проинтерпретируем задачу. Пусть A ={Первое изделие стандартно}; B ={Второе изделие стандартно}; p (A) = 0, 8; p (B) = 0, 8. Выразим событие D через A и B. Возможны различные представления. Способ 1. D = A + B. Тогда по теореме сложения для двух независимых событий имеем p (D) = p (A) + p (B) − p (A B) = 0, 8 + 0, 8 − 0, 64 = 0, 96. Способ 2. D = A B + A B + A B. p (D) = p (A B) + p (A B) + p (A B) = 0, 16 + 0, 16 + 0, 64 = 0, 96. Способ 3. D = A B. p (D) = p(A B) = 1 − 0, 2 · 0, 2 = 0, 96. I Пример 64. В жюри из трех человек двое независимо друг от друга принимают правильное решение с вероятностью p, а третий для вынесения решения бросает монету (окончательное решение выносят большинством голосов). Жюри из одного человека выносит справедливое решение с вероятностью p. Какое из этих жюри выносит справедливое решение с большей вероятностью? J Требуется найти вероятности событий A = {Жюри из трех человек принимает правильное решение}, B = {Жюри из одного человека принимает правильное решение} 39 3.1 Теоремы сложения и умножения и сравнить их. Введем события Ai = решение}, i = 1, 2, 3. Тогда {i-й член жюри принимает правильное A = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 + A1 A2 A3 . Применив теорему сложения для случая трех независимых событий, получаем, что 1 1 1 1 p (A) = (1 − p)p + p(1 − p) + p2 + p2 = p. 2 2 2 2 Вероятность события B, очевидно, равна p. Таким образом, жюри, состоящее из одного человека, и жюри, состоящее из трех человек, выносят правильные решения с одинаковой вероятностью. I Пример 65. Вероятность изготовить первосортную деталь на первом станке равна 0,9; на втором — 0,8. На первом станке изготовили 3 детали, на втором — 2. Какова вероятность того, что все детали первосортные? J Пусть Ai = {i-я деталь, изготовленная на первом станке, первосортна}, Bi = {i-я деталь, изготовленная на втором станке, первосортна}. Событие D ={На первом станке изготовили 3 детали, на втором — 2, и все они принадлежат к первому сорту} во введенных нами обозначениях запишется как A1 A2 A3 B1 B2 . Применив теорему умножения для независимых событий, имеем p (D) = 0, 93 0, 82 = 0, 5184. I Пример 66. Фирма одновременно обращается в несколько банков с заявлениеми о предоставлении кредита. Вероятность положительного решения 0,5. В какое число банков надо обратиться, чтобы вероятность, что хотя бы один банк примет положительное решение о кредитовании, была не меньше 0,99? J A ={Хотя бы один банк примет положительное решение о кредитовании}. Ai ={i-й банк примет положительное решение о кредитовании}. Тогда A = A1 + A2 + . . . + An , 40 3.1 Теоремы сложения и умножения где n — искомое количество банков. Как следует из свойств операций над событиями, A1 + A2 + . . . + An = A1 A2 . . . An . n 1 p (A) = 1 − . 2 Число банков определится из неравенства n 1 1− > 0, 99. 2 Решим это неравенство. n 1 > −0, 01; − 2 n 1 6 0, 01; 2 2n > 100; n > log2 100 ≈ 6, 64386; Таким образом, нужно обратиться по меньшей мере в 7 банков, чтобы вероятность получить хотя бы одно положительное решение о кредитовании была не меньше 0,99. I Задачи 95. Из 180 студентов 30 не сдали экзамен, 20 не сдали курсовую работу, 15 не сдали и то и другое. Пусть событие A = {студент сдал экзамен}, B = {студент сдал курсовую работу}. Являются ли эти события независимыми? 96. В условиях предыдущей задачи найти вероятность того, что студент не сдал экзамен, если известно, что он не сдал курсовую работу. 97. Человек имеет текущий счет с вероятностью 0,56, депозитный счет с вероятностью 0,42, и тот и другой с вероятностью 0,30. Являются ли события, состоящие в наличии счетов, независимыми? Какова вероятность, что имеется хотя бы один счёт? 98. В условиях предыдущей задачи найти вероятность того, что человек имеет текущий счет при наличии депозитного счета. 99. Два аудитора проверили 10 одних и тех же фирм. Первый аудитор обнаружил нарушения у 6 фирм, второй у 7 фирм, при этом 41 3.1 Теоремы сложения и умножения у 5 фирм нашли нарушения оба аудитора. Являются ли независимыми события, состоящие в обнаружении нарушений первым и вторым аудиторами? 100. Вероятность дозвониться в диспетчерскую горэлектросети равна 0,7. Какова вероятность, что удастся за два звонка соединиться с диспетчерской? 101. Событие Ai = {определенный товар присутствует в iм магазине}, события независимы, p (Ai ) = 0, 8, i = 1, 2, 3. Найти вероятности событий A1 A2 A3 , A1 + A3 , A1 A3 A3 , A2 + A1 , 3 \ Ai . i=1 102. Время обслуживания составляет от 10 до 20 минут. Событие A = {время обслуживания меньше 15 минут}, событие B = {время обслуживания от 13 до 17 минут}. Найти вероятности событий A + B, AB, A + B, A + B. 103. Устройство состоит из 5 элементов. Событие Ai = {неисправен i-й элемент, i = 1, . . . , 5}. Найти вероятности событий, если события независимы, и p (Ai ) = 0, 5 ∀i. 5 [ i=1 Ai , 4 \ i=1 Ai , 3 [ i=1 Ai , 5 \ Ai . i=1 В задачах 104—110 известно, что 60 % зрителей первой телепрограммы и 70% зрителей первой телепрограммы смотрят рекламные блоки. События A и B состоят в том, что зритель соответственно первой и второй программ увидит рекламный блок. Найти вероятность события C. 104. C = {Произойдут оба события A, B}. 105. C = {Не произойдет ни одного события из A, B}. 106. C = {Из двух событий A, B осуществится только A}. 107. C = {Из двух событий A, B осуществится ровно одно событие}. 108. C = {Из двух событий A, B осуществится хотя бы одно событие}. 109. C = {Зритель увидит рекламный блок только по второй программе}. 110. C = {Зритель не увидит рекламный блок хотя бы по одной программе}. 42 3.1 Теоремы сложения и умножения В задачах 111—118 события A, B, C обозначают, что сотрудники Пискунов, Прохоров и Ушаков выполняют дневной план работы. Вероятность каждого из этих событий равна 0,7. Требуется найти вероятности события D. 111. D = {Только один из троих сотрудников выполнит план}. 112. D = {Ровно два сотрудника выполнят план}. 113. D = {Хотя бы один сотрудник выполнит план}. 114. D = {Хотя бы один из сотрудников не выполнит план}. 115. D = {Из трех событий A, B, C произойдет не меньше двух событий}. 116. D = {Не более одного сотрудника выполнит план}. 117. D = {Из трех событий A, B, C не произойдет не больше одного события}. 118. D = {Только Пискунов и Прохоров выполнят план}. В задачах 119—124 события A, B, C, D обозначают, что состоялись выборы глав администрации соответственно в Ачинском, Балахтинском, Сухобузимском и Дзержинском районах Красноярского края. Известно, что p (A) = p (B) = 0, 9; p (C) = p (D) = 0, 8. Найти вероятность события G. 119. G ={Выборы состоятся во всех районах}. 120. G ={Выборы не состоятся только в Дзержинском районе}. 121. G ={Из четырех событий A, B, C, D осуществится ровно одно событие}. 122. G ={Выборы состоятся хотя бы в одном районе}. 123. G ={Из четырех событий A, B, C, D произойдёт больше одного события}. 124. G ={Выборы не состоятся хотя бы в одном районе}. 125. С вероятностью 0,25 здание нуждается в ремонте, с вероятностью 0,38 ремонт планируется. Найти вероятность того, что здание нуждается в ремонте и планируется ремонт. 126. Система контроля состоит из двух независимых проверок. В результате i-й проверки (i = 1, 2) бракованное изделие принимают с вероятностью αi . Изделие принимают, если оно прошло обе проверки. Найти вероятность того, что бракованное изделие будет отбраковано. 127. Система контроля состоит из двух независимых проверок. В результате i-й проверки (i = 1, 2) изделие, удовлетворяющее стандарту, отбраковывают с вероятностью βi . Изделие принимают, если оно прошло обе проверки. Найти вероятность того, что 43 3.2 Формула полной вероятности. Формула Байеса стандартное изделие будет принято. 128. В течение дня акция может подорожать с вероятностью 0,6 и подешеветь с вероятностью 0,4. Какова вероятность того, что акция будет дорожать три дня подряд, если считать ежедневнные изменения цены независимыми? 129. Студент выучил 25 вопросов из 30. Для получения зачета достаточно ответить на оба вопроса билета или на один вопрос билета и один дополнительный. Какова вероятность получения зачета? 130. Вероятность того, что накладная оформлена неправильно, равна 0,2. Какова вероятность, что из трех проверяемых накладных хотя бы одна оформлена неправильно? 131. Вероятность того, что накладная оформлена неправильно, равна 0,2. Сколько накладных потребуется взять для проверки, чтобы вероятность обнаружения неправльно оформленной накладной была не менее 0,8? 132. При приемке партии изделий подвергается проверке треть из них. Условие приемки допускает не более 1 % бракованных изделий. Определить вероятность того, что партия из 100 изделий, содержащая 5 % брака, будет принята. 133. В телевизионной рекламе из названия фирмы «КОКОС» последовательно выбираются 3 буквы, составляющие название товара (СОК). Какова вероятность, что это слово образуется при случайном выборе букв? 134. Партия товара состоит из 8 изделий первого сорта и 12 изделий высшего сорта. Первые 5 изделий оказались все высшего сорта. Какова вероятность, что следующее взятое изделие тоже высшего сорта? 135. В круге радиуса R случайно выбирают 3 точки. Какова вероятность, что все они ближе к центру круга, чем к его границе? 3.2. Формула полной вероятности. Формула Байеса Формула полной вероятности. Пусть A — случайное событие; H1 , H2 , . . . , Hn — попарно несовместные случайные события, p (Hi ) > n S 0иA⊆ Hi . Тогда справедлива формула i=1 p (A) = n X p ( Hi ) p (A/Hi ). (17) i=1 44 3.2 Формула полной вероятности. Формула Байеса Формула Байеса11 . Пусть A — случайное событие, H1 , H2 , . . . , Hn n S попарно несовместны, p (Hi ) > 0, p (A) > 0 и A ⊆ Hi . В этих условиях i=1 справедлива формула p (Hi ) p (A/Hi ) p (Hi /A) = P . n p (Hk ) p (A/Hk ) (18) k=1 Пример 67. Клиент с вероятностью 0,8 заключит сделку, если он получит денежный перевод в ближайшие три дня. Если он получит перевод позднее, но не позже, чем через неделю, вероятность заключения сделки равна 0,5. Вероятность того, что денежный перевод дойдет не дольше, чем за три дня, равна 0,3; не дольше, чем за неделю — 0,8. Какова вероятность заключения сделки? J Пусть A ={Заключение сделки}, H1 ={Денежный перевод в ближайшие три дня}, H2 ={Денежный перевод позднее, но не позже, чем через неделю}. p (H1 ) = 0, 3; p (H2 ) = 0, 8 − 0, 3 = 0, 5; p (A/H1 ) = 0, 8; p (A/H2 ) = 0, 5. По формуле полной вероятности p (A) = p (H1 )p (A/H1 ) + p (H2 )p (A/H2 ) = 0, 3 · 0, 8 + 0, 5 · 0, 5 = 0, 49. I Пример 68. Магазин получает батоны из трех хлебопекарен: 60 % батонов поступает из первой, 15 % из второй и 25 % из третьей. Батоны бывают непропеченными в одном случае из 30 для первой хлебопекарни, в одном случае из 50 для второй, в одном случае из 10 для третьей. Покупатель купил батон, который оказался непропеченным. Какова вероятность, что это продукция второй хлебопекарни? J Положим A ={Купленный батон оказался непропеченным}, H1 ={Батон испекли в первой хлебопекарне}, H2 ={Батон испекли во второй хлебопекарне}, H3 ={Батон испекли в третьей хлебопекарне}. 11 То́мас Ба́йес (Бейес, англ. Reverend Thomas Bayes; 1702—1761) — английский математик и священник. 45 3.2 Формула полной вероятности. Формула Байеса p (H1 ) = 0, 6; p (H2 ) = 0, 15; p (H3 ) = 0, 25; 1 1 1 p (A/H1 ) = ; p (A/H2 ) = ; p (A/H3 ) = . 30 50 10 По формуле Байеса получаем, что p (H2 ) p (A/H2 ) p (H2 /A) = 3 = P p (Hi ) p (A/Hi ) 60 100 · 1 30 + 15 100 15 100 · · 1 50 1 50 + 25 100 · 1 10 = i=1 = 2 100 + 3 1000 3 1000 + 5 200 = 3 1000 48 1000 = 1 .I 16 Пример 69. Аналитики оценили вероятность возвращения банку кредита: для финансовых структур эта вероятность составляет 0,99; для физических лиц 0,9; в остальных случаях 0,95. Найти вероятность невозвращения кредита, если кредиты, предоставляемые банком финансовым структурам, составляют 10 %, а физическим лицам — 60 % всех кредитов. J Пусть A ={Невозвращение кредита}, H1 ={Кредит предоставлен финансовой структуре }, H2 ={Кредит предоставлен физическому лицу}, H3 ={Кредит предоставлен прочим клиентам}. p (H1 ) = 0, 1; p (H2 ) = 0, 6; p (A/H1 ) = 0, 01; p (H3 ) = 1 − 0, 1 − 0, 6 = 0, 3; p (A/H2 ) = 0, 1; p (A/H2 ) = 0, 05. По формуле полной вероятности p (A) = p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) + p (H3 ) p (A/H3 ) = = 0, 1 · 0, 01 + 0, 6 · 0, 1 + 0, 3 · 0, 05 = 0, 076. I Пример 70. В условиях предыдущего примера кредит не был возвращен. Какова вероятность, что кредит был предоставлен финансовой структуре? J Воспользуемся формулой Байеса. p (H1 /A) = p (H1 ) p (A/H1 ) . p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 ) p (H1 /A) = 0, 1 · 0, 01 ≈ 0, 013. I 0, 1 · 0, 01 + 0, 6 · 0, 1 + 0, 3 · 0, 05 46 3.2 Формула полной вероятности. Формула Байеса Пример 71. Первый этап проекта будет выполнен в срок с вероятностью 0,7; с задержкой до 10 дней — с вероятностью 0,2; с задержкой от 10 до 15 дней — с вероятностью 0,1. Весь проект будет закончен своевременно с вероятностями 0,9; 0,7; 0,6 соответственно (т. е. проект будет закончен в срок с вероятностью 0,9, если первый этап будет выполнен вовремя и т. д.). Найти вероятность того, что проект не удастся закончить в срок. J Так же, как и раньше, вначале опишем событие A и гипотезы H1 , H2 , H3 . A ={Проект не удалось закончить в срок}, H1 ={Первый этап выполнен вовремя}, H2 ={Первый этап выполнен с задержкой до 10 дней}, H3 ={Первый этап выполнен с задержкой от 10 до 15 дней}. p (H1 ) = 0, 7; p (A/H1 ) = 0, 1; p (H2 ) = 0, 2; p (A/H2 ) = 0, 3; p (H3 ) = 0, 1; p (A/H2 ) = 0, 4. По формуле полной вероятности выходит, что p (A) = p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) + p (H3 ) p (A/H3 ) = = 0, 7 · 0, 1 + 0, 2 · 0, 3 + 0, 1 · 0, 4 = 0, 17. I Пример 72. Предварительные вероятности заключения трех независимых сделок оценивались как 0,6; 0,4; 0,7. Стало известно, что заключена только одна сделка из этих трех. Какова вероятность того, что это первая сделка? J A ={Заключена только одна сделка}, H1 ={Заключена только первая сделка}, H2 ={Заключена только вторая сделка}, H3 ={Заключена только третья сделка}. p (H1 ) = 0, 6 · 0, 6 · 0, 3 = 0, 108; p (H2 ) = 0, 4 · 0, 4 · 0, 3 = 0, 048; p (H3 ) = 0, 4 · 0, 6 · 0, 7 = 0, 168. p (A/H1 ) = p (A/H2 ) = p (A/H3 ) = 1. 47 3.2 Формула полной вероятности. Формула Байеса p (H1 /A) = p (H1 /A) = p (H1 ) p (A/H1 ) . p (H1 ) p (A/H1 ) + p (H2 ) p (A/H2 ) p (H3 ) p (A/H3 ) 0, 108 · 1 = 0, 108 · 1 + 0, 048 · 1 + 0, 168 · 1 1 0, 108 = ≈ 0, 3333. I = 0, 108 + 0, 048 + 0, 168 3 Пример 73. С вероятностью 0,6 договор находится в одной из трех папок. После просмотра двух папок договор не обнаружен. Какова вероятность того, что договор в третьей папке? J A ={После просмотра двух папок договор не обнаружен}; Hi ={Договор находится в i-й папке}, i = 1, 2, 3; H4 ={Договор находится не в папке, а в другом месте}. По условию задачи p (H1 ) = p (H2 ) = p (H3 ) = 0, 2; p (A/H1 ) = p (A/H2 ) = 0; p (H4 ) = 0, 4; p (A/H3 ) = p (A/H4 ) = 1. Тогда, по формуле Байеса, p (H3 /A) = p (H3 ) p (A/H3 ) 0, 2 · 1 = = 4 P 0, 2 · 0 + 0, 2 · 0 + 0, 2 · 1 + 0, 4 · 1 p (Hi ) p (A/Hi ) i=1 = 0, 2 1 = ≈ 0, 3333. I 0, 6 3 Задачи 136. Если размер детали отклоняется от установленного размера не более чем на 1 %, она признается стандартной. Если отклонение составляет не более 3 %, то вероятность того, что деталь будет признана стандартной, уменьшается до 0,5. А если отклонение составляет от 3 % до 5 %, вероятность равна 0,25. Если размер детали отклоняется от установленного размера более чем на 5 %, деталь считается нестандартной. Рассчитать вероятность того, 48 3.2 Формула полной вероятности. Формула Байеса что деталь будет признана стандартной, если размер может с равной вероятностью отклониться от установленного стандарта до 10 % в обе стороны. 137. В двух урнах находится соответственно 5 и 3 белых, 4 и 6 черных шаров. Из каждой урны вынимают наудачу по одному шару, а из них наудачу выбирают один. Какова вероятность того, что он белый? 138. В условиях предыдущей задачи вынутый шар оказался белым. Какова вероятность того, что его вынули из первой урны? 139. Соотношение числа кредитов, предоставляемых банком физическим и юридическим лицам, 3:2. Вероятности того, что взятый кредит не будет возвращён, составляют 0,05 для физических лиц и 0,02 для юридических лиц. Найти вероятность невозвращения кредита. 140. В условиях предыдущей задачи найти вероятность того, что невозвращенный кредит был предоставлен юридическому лицу. 141. Вероятность, что потребитель приобретет товар после того, как увидит его рекламу по телевизору, равна 0,01; а вероятность покупки товара потребителем, который не видел рекламы, 0,001. Если 40 % населения увидит рекламу, какая часть населения приобретет товар? 142. В условиях предыдущей задачи покупатель приобрел товар. Какова вероятность, что он видел рекламу? 143. Если общая вероятность, что потребитель приобретет товар, равна 0,03; вероятность покупки товара потребителем, который не видел рекламы, 0,001; и 20 % населения видели рекламу, то какова вероятность покупки товара потребителем, видевшим рекламу? 144. Среди проектов, отправляемых на экспертизу, 60 % пригодных. Экспертиза проектов иногда допускает ошибки. Неподходящие проекты экспертиза отвергает с вероятностью 0,8; а вероятность того, что подходящий проект будет назван непригодным, равна 0,1. Найти вероятность того, что проект будет отвергнут. 145. В условиях предыдущей задачи найти вероятность того, что проект пригоден, при условии, что экспериза его отвергла. 146. Три сотрудника фирмы (Артем, Зоя, и Илья) независимо сдают экзамен на получение сертификата. Вероятности добиться успеха для них соответственно равны 0,7; 0,8; 0,9. Сертификат получил только один сотрудник. Найти вероятность того, что это 49 3.2 Формула полной вероятности. Формула Байеса Артем. 147. Пусть B1 , B2 , B3 — несовместные события, составляющие полную группу: p (B1 ) = 0, 2; p (B2 ) = 0, 15; p (B3 ) = 0, 65. Рассмотрим событие A : p (A) = 0, 4. Если A не зависит от B1 , B2 , B3 , используя формулу Байеса, определить, верно ли равенство p (B1 /A) = p (B1 ) = 0, 2? 148. С вероятностью 0,8 преподаватель находится в данный момент в университете. Эта вероятность распределена следующим образом: с вероятностью 0,6 преподаватель на кафедре, а с вероятностью 0,2 в деканате. Студент, ищущий преподавателя, обнаружил, что на кафедре его нет. Как изменится с учетом этой информации вероятность того, что преподаватель в деканате? 149. Два независимых эксперта оценивают эффективность операции. Оценка эффективности является качественной и принимает 3 значения: «низкая», «средняя», «высокая». В среднем 30 % операций имеют «низкую» эффективность, 50 % — «среднюю», 20 % — «высокую». Первый эксперт ошибается в трех случаях из десяти, а второй — в одном случае из пяти. Первый оценил эффективность конкретной операции как «низкую», а второй, как «среднюю». Какова вероятность того, что оба они не правы? 150. В ящике лежало 10 шаров, которые могли быть черными или белыми. Все гипотезы о числе белых шаров равновероятны. В ящик добавили 1 белый шар. Какова вероятность после этого вынуть белый шар? 151. В условиях предыдущей задачи вынутый шар оказался белым. Какова вероятность того, что все шары в ящике белые? 152. На конвейер поступают однотипные детали, изготовляемые двумя рабочими. При этом первый поставляет 60 %, второй — 40 % общего числа изделий. Вероятность того, что изделие, изготовленное первым рабочим, окажется нестандартным, равна 0,002; для второго рабочего эта вероятность равна 0,05. Взятое наудачу с конвейера изделие оказалось нестандартным. Определить вероятность того, что оно изготовлено вторым рабочим. 50 4. Схемы испытаний 4.1. Схема Бернулли. Полиномиальная схема Схема Бернулли. Схема n независимых испытаний называется схемой Бернулли, если: 1) испытания одинаковы; 2) каждое испытание имеет два исхода: A (успех) и A (неудача); 3) вероятность успеха в каждом испытании постоянна, p (Ai ) = p, p (Ai ) = 1 − p = q, i = 1, . . . , n. Формула Бернулли. Вероятность осуществления ровно m успехов в n испытаниях равна pn (m) = Cnm pm q n−m . (19) Наивероятнейшее число успехов. m0 : pn (m0 ) = max pn (m). m m0 = {np + p, np + p − 1}, если np + p ∈ Z; [np + p], если np + p ∈ / Z. (20) Полиномиальная схема. Схема n независимых испытаний называется полиномиальной схемой, если: 1) испытания одинаковы; k S Ai = Ω; 2) каждое испытание имеет k исходов A1 , . . . , Ak , i=1 3) вероятность любого исхода в каждом испытании постоянна: p (Ali ) = pi , l = 1, . . . , n, i = 1, . . . , k, k X pi = 1. i=1 Полиномиальная формула. pn (m1 , . . . , mk ) = n! m2 mk 1 pm 1 · p2 · . . . · pk . m1 ! · m2 ! · . . . · mk ! (21) pn (m1 , . . . , mk ) = p {A1 произошло m1 раз, . . . , Ak произошло mk раз}. k X mi = n. i=1 51 4.1 Схема Бернулли. Полиномиальная схема Пример 74. Из карточной колоды в 36 листов три раза подряд случайным образом вынимают одну карту с возвращением ее в колоду. Какова вероятность того, что два раза удастся вынуть туза треф? J Вероятность извлечь туз треф из колоды в 36 карт составляет 1/36, откуда вероятность противоположного события равна 35/36. Поскольку всего испытаний три, т. е. m = 3, а число успехов n = 2, искомая вероятность найдется как 2 1 35 3 · 35 1 2 ≈ 0, 0022. I = p3 (2) = C3 36 36 363 Пример 75. По статистике в книжный магазин заходит поровну мужчин и женщин. Найти вероятность того, что из 10 посетителей магазина, находящихся в зале в данный момент, трое — женщины. J По условию задачи вероятность p встретить в магазине женщину равна 1/2 — ровно столько же шансов увидеть в зале мужчину (q = 1/2). Всего испытаний по схеме Бернулли десять (n = 10) из них благоприятных исходов три (m = 3), следовательно, 10 3 7 1 1 120 15 1 3 p3 (10) = C10 = 120 = = .I 2 2 2 1024 128 Пример 76. Найти вероятность того, что как минимум два студента группы Э-12, состоящей из 24 человек, получит на экзамене по курсу «Экономическая теория» оценку «хорошо», если считать, что по 25 % студентов получают оценку «неудовлетворительно», «удовлетворительно», «хорошо» и «отлично». J Испытание состоит в определении, какую оценку получил студент на экзамене. Успехом будет получение оценки «хорошо», т. е. по условию задачи p = 1/4, а q = 3/4. Искомая вероятность есть сумма p24 (2) + p24 (3) + . . . + p24 (24), вычисление которой представляется трудоемким, поэтому при решении подобных задач зачастую пользуются нижеизложенным приемом. Из свойств операций над событиями следует, что p24 (2) + p24 (3) + . . . + p24 (24) = 1 − [p24 (0) + p24 (1)]. 52 4.1 Схема Бернулли. Полиномиальная схема Такое представление позволяет легко и быстро получить результат: 0 24 1 3 324 0 p24 (0) = C24 = 24 , 4 4 4 1 23 1 3 24 · 323 1 p24 (1) = C24 . = 4 4 424 Итак, 24 3 p(A) = 1 − 9 · ≈ 0, 998. I 4 Пример 77. В мешке лежат три кубика: синий, оранжевый и белый. Из мешка кубики по одному извлекали 4 раза, причем после каждого извлечения кубик возвращался обратно в мешок. Определить вероятность того, что синий и оранжевый кубики извлекали не меньше, чем по одному разу каждый. J Определим три события A1 ={Извлекли синий кубик}, A2 ={Извлекли оранжевый кубик}, A3 ={Извлекли белый кубик}. Из условия задачи следует, что 1 p (A1 ) = p1 = p (A2 ) = p2 = p (A3 ) = p3 = . 3 Поскольку существует четыре варианта извлечения кубиков согласно условию задачи, искомая вероятность есть сумма p (1, 1, 2) + p (2, 1, 1) + p (1, 2, 1) + p (2, 2, 0), где 4! pα1 · pβ2 · pγ3 . α! · β! · γ! Здесь α, β, γ — количества извлечений синего, оранжевого и белого кубиков соответственно. Вычислим вероятность каждого исхода. 4 4! 1 4·3 4 = 4 = . p (1, 1, 2) = 1! · 1! · 2! 3 3 27 4 4! 1 4·3 4 p (2, 1, 1) = = 4 = . 2! · 1! · 1! 3 3 27 p (α, β, γ) = 53 4.1 Схема Бернулли. Полиномиальная схема 4 4 1 4·3 = 4 = . 3 3 27 4 4! 2 1 2·3 p (2, 2, 0) = = 4 = . 2! · 2! · 0! 3 3 27 4! p (1, 2, 1) = 1! · 2! · 1! Тогда искомая вероятность равна 4 4 4 2 14 + + + = ≈ 0, 518. I 27 27 27 27 27 Пример 78. Менеджер по кадрам подбирает кандидатуры сотрудников, которые могут общаться с иностранными клиентами фирмы и будут направлены на работу в центральный офис компании. Критерием отбора является знание сотрудником английского языка. Всего в фирме работает 150 человек, причем вероятность встретить среди ее сотрудников тех, кто знает английский язык, составляет 0,6. Каково наивероятнейшее число работников фирмы, которым следует ждать повышения? J Для решения этой задачи воспользуемся определением наивероятнейшего числа успехов. Здесь n = 150; p = 0, 6; следовательно, np + p = 90, 6 ∈ / Z. Вероятнее всего, 90 сотрудникам фирмы стоит ждать повышения по службе. I Задачи 153. Студент выполняет тест из 5 вопросов, требующих ответов «да» или «нет». Предположим, студент еще не изучал данную тему, и отвечает на вопросы случайным образом (вероятность правильного ответа на каждый вопрос равна 0,5). Найти вероятность того, что студент правильно ответит на: а) все вопросы; б) не меньше 4 вопросов; в) меньше 4 вопросов; г) не более 2; д) не менее 2 и не более 4. 54 4.1 Схема Бернулли. Полиномиальная схема 154. Решите предыдущую задачу в изменённых условиях: студент уже знаком с данной темой, и вероятность правильного ответа на каждый вопрос равна 0,8. 155. Вероятность того, что у студента группы Э-11 есть учебное пособие по теории вероятностей, равна 0,6. Какова вероятность, что из троих студентов этой группы пособие имеют двое? 156. В течение дня акция может подорожать с вероятностью 0,6 и подешеветь с вероятностью 0,4. Какова вероятность того, что акция будет дорожать пять дней из семи, если считать ежедневные изменения цены независимыми? 157. Вероятность того, что сделка окажется прибыльной, равна 0,8. Какова вероятность, что из 5 совершённых сделок прибыльными будут не меньше 4? 158. В условиях предыдущей задачи найдите наивероятнейшее число прибыльных сделок из 5 совершённых. 159. 80 % прибывших в аэропорт пассажиров сдают свой багаж, который проверяется, а остальные 20 % ожидают проверки в очереди. Если в час прибыло 4000 пассажиров, каково наивероятнейшее число пассажиров, которые будут ожидать проверки своего багажа? 160. Если четверть предприятий допускает нарушения налогового законодательства, то какова вероятность, что из 10 предприятий, проверяемых налоговой инспекцией, найдется хотя бы один нарушитель законодательства? 161. Каждый пятый компьютер некоторого известного производителя имеет дефекты. Закуплено семь компьютеров этой фирмы. Найдите вероятность того, что более одного из семи компьютеров будут иметь дефекты. 162. Вероятность того, что накладная оформлена неправильно, равна 0,2. Какова вероятность, что из пяти проверяемых накладных хотя бы одна оформлена неправильно? 163. В условиях предыдущей задачи найдите наивероятнейшее число неправильно оформленных накладных. 164. Фасовщица развешивает печенье в пакеты по 1 кг в пакет. Из каждых 5 пакетов один фасовщица недовешивает. Пакеты она складывает по 15 штук в коробку. Контролер берет из 3 произвольных коробок по одному пакету на проверку. Какова вероятность того, что проверка обнаружит недовешенный пакет? 165. Если при каждом спуске с горы на лыжах вероятность 55 4.1 Схема Бернулли. Полиномиальная схема упасть 0,2; то каково наивероятнейшее число падений за 7 спусков? 166. Если из 10 дней ясных бывает в среднем 6, то какова вероятность того, что из 3 дней, выбранных для проведения ярмарки, по крайней мере 2 — ясные? 167. Вероятность получить уступку при сделке равна 0,5. Что вероятнее, получить уступки в 3 сделках из 4 или в 5 из 8? 168. Инновационные проекты подвергаются двухэтапной экспертизе. Вероятность пройти первый этап равна 0,2; для прошедших первый этап вероятность пройти второй этап равна 0,4. В экспертную комиссию было подано 270 проектов. Найти наивероятнейшее число проектов, прошедших экспертизу. 169. Известно, что 7 % населения смотрит определенную телепрограмму, и что 30 % зрителей этой программы смотрят и рекламные блоки. Найти наивероятнейшее число лиц, смотрящих рекламные блоки в рамках этой телепрограммы на 1000 жителей. 170. При устной передаче сообщения в одном случае из пяти появляются ошибки. Какова вероятность того, что из четырех сообщений ровно два переданы точно? 171. Компьютерная фирма продает настольные компьютеры и ноутбуки, причем 80 % продаж составляют настольные компьютеры, и 20 % — ноутбуки. Найти вероятность того, что три из четырех проданных компьютеров — ноутбуки. 172. Пять договоров раскладывают случайным образом в четыре папки. Какова вероятность, что в первую и третью папки попадут по два договора, а вторая папка останется пустой? 173. В магазин поступили женские туфли одной известной марки размеров 37, 38, 40 (по две пары каждого размера). Если покупательницы спрашивают размер 37 с вероятностью 0,1; размер 38 — с вероятностью 0,2; размер 43 — с вероятностью 0,2; а с вероятностью 0,5 спрашивают прочие размеры, то какова вероятность, что две покупательницы подряд найдут в этом магазине туфли нужного им размера? 174. В интернет-магазине можно заказать доставку книг либо наземной почтой, либо авиапочтой, либо при помощи курьерской службы. Предположим, вероятности этих способов заказов равны соответственно 0, 3; 0, 6; 0, 1. Найти вероятность того, что из десяти клиентов двое закажут книги авиапочтой, трое предпочтут доставку наземным транспортом, пятеро будут ждать звонка курьера. 175. Проект состоит из пяти одновременно выполняемых эта56 4.2 Асимптотические формулы для схемы Бернулли пов, расчетное время выполнения каждого этапа от 65 до 75 дней, в этих пределах любое время окончания этапа равновероятно. Найдите вероятность того, что два этапа будут закончены за 65—67 дней, один — за 68 дней, и последние два этапа закончатся в срок от 69 до 75 дней. 176. 30 % студентов набирают по курсу «Теория вероятностей и математическая статистика» не меньше 85 баллов из 100, что соответствует оценке «отлично», 35 % — от 70 до 85 баллов (оценка «хорошо»), 20 % — от 55 до 70 баллов (оценка «удовлетворительно»), 15% студентов набирают менее 55 баллов из 100 (оценка «неудовлетворительно»). Какова вероятность того, что из пяти случайно выбранных студентов двое сдадут экзамен на «отлично», а трое — на «хорошо»? 4.2. Асимптотические формулы для схемы Бернулли При больших n и малых p можно использовать приближение Пуассона. Приближенная формула Пуассона. λm e−λ , pn (m) ≈ pλ (m) = m! где λ = np. Приближенную формулу Пуассона применяют при n > 30; p 6 0, 1; (22) 0, 1 6 λ = np 6 10. При больших n и не малых p, q можно использовать приближение Муавра — Лапласа. Локальная приближенная формула Муавра — Лапласа. ϕ (xm ) , pn (m) ≈ √ npq m − np xm = √ , npq (23) x2 1 где ϕ(x) = √ e− 2 . 2π Интегральная приближенная формула Муавра — Лапласа. m − np p x1 6 √ 6 x2 ≈ Φ (x2 ) − Φ (x1 ), (24) npq 57 4.2 Асимптотические формулы для схемы Бернулли 1 где Φ(x) = √ 2π Zx 2 − t2 e Zx dt = −∞ ϕ(t) dt. −∞ Следствия интегральной приближенной формулы. a − np b − np −Φ √ . p ( a 6 m 6 b) ≈ Φ √ npq npq p r r m n n α1 6 6 α2 ≈ Φ (α2 − p) − Φ (α1 − p) . n pq pq r r m n n p β1 6 − p 6 β2 ≈ Φ β2 − Φ β1 . n pq pq (25) (26) (27) Формулы Муавра — Лапласа применяют при n > 30; 0, 1 6 p 6 0, 9; npq > 9. Пример 79. Продукцию каждый час проверяют на наличие брака, случайно выбирая 100 изделий. Какова вероятность, что в выборке ровно 2 бракованных изделия, если вероятность того, что изделие бракованное, равна 0,01? J Здесь, очевидно, испытание состоит в проверке единицы продукции на наличие брака. Всего испытаний 100, вероятность успеха (обнаружения брака) равна 0,01. Поскольку n достаточно велико (n = 100), а p мало (p = 0, 01), для решения этой задачи можно применить приближенную формулу Пуассона при λ = 100 · 0, 01 = 1: 12 e−1 1 = .I 2! 2e Пример 80. В условиях предыдущей задачи найти вероятность того, что в выборке меньше 2 бракованных изделий. p100 (2) ≈ J Эта задача отличается от предыдущей лишь тем, что ее решением будет сумма вероятностей исходов, при которых обнаружено одно и два бракованных изделия, — p100 (0) + p100 (1). Вычислим члены этой суммы. 10 e−1 1 p100 (0) ≈ = . 0! e 58 4.2 Асимптотические формулы для схемы Бернулли 11 e−1 1 p100 (1) ≈ = . 1! e Итак, вероятность того, что в выборке окажется меньше двух бракованных изделий, составляет 2/e. I Пример 81. Замерщик пластиковых окон за год обслуживает 1 000 заказов. Вероятность того, что он ошибся в замерах одного окна составляет 0,01. Какова вероятность того, что по замерам этого работника будет за год изготовлено не меньше 3 бракованных окон? J Как и раньше, воспользуемся приближением Пуассона. Чтобы решить эту задачу, нужно найти сумму p1000 (3) + p1000 (4) + . . . + p1000 (1000), (28) однако, очевидно, что это очень трудоемкая процедура. Если же представить (28) в виде 1 − [p1000 (0) + p1000 (1) + p1000 (2)], вычисления не составят большого труда. 1 100 e−10 = 10 . p1000 (0) ≈ 0! e 1 −10 10 e 10 p1000 (1) ≈ = 10 . 1! e 2 −10 10 e 50 p1000 (2) ≈ = 10 . 2! e . Таким образом, искомая вероятность равна 1 − 61 e10 ≈ 0, 997. I Пример 82. Диспетчеру таксопарка за каждые 5 минут поступают в среднем 6 заказов. Найти вероятность того, что за три минуты не поступит ни одного заказа. J Здесь λ — среднее число событий, появляющихся в единицу времени. За 6 минут диспетчер принимает в среднем 5 заказов, следовательно, λ = 6/5. Будем пользоваться приближенной формулой Пуассона: (λt)m e−λt pt (m) ≈ . m! Требуется найти вероятность того, что за три минуты не поступит ни одного заказа: (3 · 6/5)0 e−3·6/5 1 p3 (0) ≈ = e−36/5 = 36/5 . I 0! e 59 4.2 Асимптотические формулы для схемы Бернулли Пример 83. Вероятность того, что книга, выпущенная тиражом 100 экземпляров, сброшюрована неправильно, составляет 0,1. Найти вероятность того, что тираж не содержит бракованных книг. J Здесь n = 100 > 30; 0, 1 6 p = 0, 1 6 0, 9; npq = 45 > 9; поэтому для решения задачи можно применить локальную приближенную формулу Муавра — Лапласа. Требуется найти вероятность того, что тираж не содержит бракованных книг, т. е. m = 0. 0−10 ϕ √100·0,1·0,9 def ϕ √109 √ = ≈ 0, 0015. I p500 (0) = √ 100 · 0, 1 · 0, 9 9 Пример 84. Некий милллиардер разделил свое состояние на равные доли, пожертвовав на благотворительность неделимый остаток, и положил деньги в 50 разных банков. Вероятность того, что любой из банков в скором времени ликвидируется, равна 0,3. Найти вероятность того, что миллионер лишится не более 20 долей своего капитала. J Здесь n = 50; p = 0, 3; q = 0, 7; np = 15; npq = 10, 5. В этих условиях справедлива формула (25) — следствие теоремы Муавра — Лапласа. Подсчитаем p (m 6 20). −15 20 − 15 −Φ √ = p (m 6 20) = p (0 6 m 6 20) ≈ Φ √ 10, 5 10, 5 = Φ (1, 54303) − Φ (−4, 6291) ≈ 0, 9382. I Пример 85. Сделки на электронной бирже осуществляются не чаще, чем раз в секунду. Каждую секунду в течение часа главный компьютер фиксирует одно из двух состояний: «проходит сделка» или «компьютер свободен». Вероятность зафиксировать сделку в любой момент времени равна 0,8. Найти вероятность того, что относительная частота регистрации сделки, вычисленнная за час, отклонится от ее вероятности не более, чем на 0,01. J Поскольку сделки на бирже осуществляются не чаще, чем раз в секунду в течение часа, всего испытаний 60 · 60 = 3 600. Следовательно, n = 3 600; p = 0, 8; q = 0, 2; np = 2 880; npq = 576. m Для подсчета p n − p 6 0, 01 = p −0, 01 6 m − p 6 0, 01 восn пользуемся формулой (27). 60 4.2 Асимптотические формулы для схемы Бернулли r r m 3 600 3 600 − p 6 0, 01 = Φ 0, 01 − Φ −0, 01 = p −0, 01 6 n 0, 16 0, 16 r 3 600 = 2Φ 0, 01 − 1 = 2Φ (1, 5) − 1 ≈ 0, 9332. I 0, 16 Задачи 177. Вероятность нарушения герметичности упаковки при перевозке равна 0,001. Найти вероятность того, что среди 1 000 перевезенных упаковок 3 окажутся негерметичными. 178. Если в фирме по организации праздников заказывают в среднем два конных свадебных экипажа в день, то какова вероятность, что за день поступит больше двух заказов? 179. На факультете 750 студентов. Найти вероятность того, что у 2 студентов день рождения придется на 1 января, cчитая, что вероятность рождения в фиксированный день равна 1/365. 180. В партии из 40 000 купюр 8 фальшивых. Из партии берут 1 000 купюр. Какова вероятность, что среди них хотя бы одна фальшивая? 181. На конвейер поступают однотипные детали, производимые автоматом. Вероятность того, что деталь, изготовленная автоматом, окажется нестандартной, равна 0,002. Какова вероятность, что из тысячи деталей более двух нестандартны? 182. В течение минуты оператору поступает в среднем 60 вызовов. Найти вероятность того, что за 2 секунды не поступит ни одного вызова. 183. Корректура в 400 страниц содержит 1 200 опечаток. Найти вероятность того, что число опечаток на странице отклонится от 3 не более чем на 1. 184. В среднем бракованные изделия составляют 0,5 %. Найти вероятность того, что из 100 изделий не будет ни одного бракованного. 185. Компания разрабатывает новую диетическую еду и проводит в сетевом магазине опрос 100 произвольно выбранных потребителей, в котором выявляются 2 наиболее ходовых товара. Обозначим x количество тех человек из 100, которые выбрали другой товар, кроме двух наиболее ходовых. Пусть при одном из опросов x = 40. Какова вероятность, что при таком же опросе, проводимом 61 4.2 Асимптотические формулы для схемы Бернулли параллельно в другом магазине этой сети, величина x примет значение больше 50? 186. Из группы в 1 000 человек были опрошены 100 человек, и оказалось, что 70 из них имеют депозитные счета. Какова вероятность, что в группе из 1 000 человек депозитные счета имеют от 680 до 720 человек? 187. Пусть известно, что среди выпускаемых заводом автомобилей 20 % некомплектны. Осмотрено 625 выпущенных автомобилей. Найти вероятность того, что наблюдаемая частота комплектных автомобилей отклонится по абсолютной величине от вероятности не более чем на 0,04. 188. Банк предоставил кредиты 400 клиентам. Для каждого клиента вероятность того, что взятый кредит будет возвращён в срок, равна 0,8. Найти вероятность того, что частота возвращения кредита будет находиться в пределах 0,8± 0,05. 189. Банк предоставил кредиты 400 клиентам. Для каждого клиента вероятность того, что взятый кредит будет возвращён в срок, равна 0,8. Найти такое положительное ε, что с вероятностью 0,995 абсолютная величина отклонения частоты возвращения кредита от вероятности 0,8 не превысит ε. 190. Новый клиент интернет-магазина с вероятностью 0,5 делает заказ. В некоторый день зарегистрировалось 100 человек. Найти вероятность того, что от них поступит от 45 до 55 заказов. 191. Новый клиент интернет-магазина делает заказ с вероятностью 0,5. Сколько новых клиентов должно зарегистрироваться, чтобы с вероятностью 0,92 можно было ожидать отклонение частоты заказов новых клиентов от теоретической вероятности 0,5 на абсолютную величину, меньшую чем 0,01? 62 5. Одномерные дискретные случайные величины Определение случайной величины и функции распределения Пусть (Ω, F, P) — вероятностное пространство. Случайной величиной ξ называется измеримая функция ξ = ξ (ω), отображающая Ω в R. Определение означает, что прообраз любого борелевского множества B {ω : ξ(ω) ∈ B} = ξ −1 (B) является множеством из σ-алгебры F. Простейшим примером случайной величины является индикатор события A: 1, ω ∈ A; IA (ω) = 0, ω ∈ / A. Пусть B — σ-алгебра на R. Говорят, что задано распределение вероятностей случайной величины ξ, если ∀B ∈ B определены вероятности Pξ (B) = P (ξ ∈ B). Распределение вероятностей порождает вероятностное пространство (R, B, Pξ ). Функцией распределения случайной величины ξ называется функция ∀x ∈ R . Fξ (x) = p ( ξ < x), (29) Свойства функции распределения. 1) Если x1 < x2 , то F (x1 ) 6 F (x2 ). 2) lim F (x) = 1, x→∞ lim F (x) = 0. x→−∞ 3) 0 6 F (x) 6 1. 4) p ( x 6 ξ < y) = Fξ (y) − Fξ (x). Дискретные случайные величины Случайная величина ξ имеет дискретное распределение, если ξ принимает конечное или счетное число различных значений с соответствующими вероятностями X pi = 1. p ( ξ = x i ) = pi , i 63 Дискретные случайные величины часто задаются рядом распределения ξ p x1 x2 . . . p1 p 2 . . . xn pn Для дискретных случайных величин Fξ (x) = p ( ξ < x) = X pi . (30) i : xi <x Пример 86. Случайная величина ξ равна числу попаданий в цель при двух выстрелах. Вероятность попадания при одном выстреле равна 0,7. Записать ряд распределения случайной величины ξ, найти Fξ (x). J Здесь ξ — это число попаданий за два выстрела, поэтому ξ ∈ {0, 1, 2}, следовательно, случайная величина ξ имеет дискретное распределение. Пусть A1 = {Пуля попала в цель при первом выстреле}, A2 = {Пуля попала в цель при втором выстреле}. Из условия задачи известно, что p (A1 ) = p (A2 ) = 0, 7; p (A1 ) = p (A2 ) = 0, 3. Тогда p (ξ = 0) = p A1 A2 = 0, 09; p (ξ = 1) = p A1 A2 + A1 A2 = 0, 42; p (ξ = 2) = p (A1 A2 ) = 0, 49. Получили ряд распределения ξ: ξ 0 1 2 p 0, 09 0, 42 0, 49 Выпишемфункцию распределения ξ. 0 при x 6 0; 0, 09 при 0 < x 6 1; Fξ (x) = I 0, 51 при 1 < x 6 2; 1 при x > 2. Пример 87. Проводят один опыт, в результате которого событие может произойти с вероятностью 0,4. Случайная величина ξ принимает значение 1, если событие произошло, и 0, если оно не произошло. Записать ряд распределения ξ, найти Fξ (x). 64 J В этой задаче мы будем иметь дело с дискретным распределением Бернулли B (1; 0, 4), ряд распределения ξ которого выглядит следующим образом: ξ 0 1 p 0, 6 0, 4 0 при x 6 0; 0, 6 при 0 < x 6 1; I Очевидно, что Fξ (x) = 1 при x > 1. Пример 88. Один раз бросают две игральные кости. Случайная величина ξ — сумма выпавших очков. Построить ряд распределения случайной величины ξ. J Сумма очков, выпадающих при броске двух игральных костей принадлежит множеству {2, 3, . . . , 12}, следовательно, ξ принимает значения из этого множества. Запишем ряд распределения случайной величины ξ, расчитывая pi при помощи классического определения вероятности: ξ 2 3 4 5 6 7 8 9 10 11 12 I p 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Пример 89. Из урны, содержащей три белых и два черных шара, три раза вынимают (с возвращением) шар. Случайная величина ξ — число вынутых черных шаров. Построить ряд распределения ξ, найти Fξ (x). J В данном случае случайная величина соответствует числу успехов в трех испытаниях, проводимых по схеме Бернулли, поэтому ξ имеет биномиальное распределение B (3; 0, 4). Построим ряд распределения ξ, расчитывая pi при помощи формулы Бернулли. ξ 0 1 2 3 p 0, 216 0, 432 0, 288 0, 064 Тогда функция распределения ξ запишется следующим образом. 0 при x 6 0; 0, 216 при 0 < x 6 1; Fξ (x) = 0, 648 при 1 < x 6 2; I 0, 936 при 2 < x 6 3; 1 при x > 3. Пример 90. Проводят три опыта, в результате каждого из которых событие может произойти с вероятностью p. Случайная величина ξ — число осуществлений события. Построить ряд распределения ξ. 65 J Здесь ξ вновь имеет биномиальное распределение B (3, p), поэтому задача решается аналогично предыдущей. ξ 0 1 2 3 I 3 2 2 p (1 − p) 3p (1 − p) 3p (1 − p) p3 Пример 91. При помощи поисковой системы хакер12 нашел в Интернете 15 сайтов по интересующей его тематике, причем злоумышленник обладает достаточными навыками, чтоб взломать 11 из них. Хакер последовательно проверил 5 сайтов на устойчивость к тем видам атак, на которые он способен, но затем в районе выключили электроэнергию. Записать ряд распределения случайной величины ξ — число взломанных сайтов из проверенных. J Легко видеть, что ξ имеет гипергеометрическое распределение с параметрами N = 15; M = 11; n = 5; ξ = 0, 1, . . . , 5. По формуле m · C45−m C11 p (m) = p11, 15 (m, 5) = 5 C15 расчитаем pi и запишем ряд распределения ξ: ξ 0 1 2 3 4 5 .I p 0 1/273 20/273 90/273 120/273 42/273 Задачи 192. Найдите функцию распределения величины ξ ≡ c (вырожденное распределение). 193. Найдите функцию распределения индикатора события A, вероятность которого равна 0,3. 194. Найдите функцию распределения индикатора события A, состоящего в том, что точка, поставленная наудачу в круге радиуса 1, окажется вне квадрата, вписанного в круг. 195. Испытание состоит в бросании двух костей. Запишите ряд распределения индикатора события A ={Произведение выпавших 12 Здесь «хакер» — компьютерный злоумышленник, хотя этот термин имеет и более широкое толкование: специалист, обладающий доскональными сведениями в каких-либо вопросах. 66 очков делится на 3}, и найдите его функцию распределения. 196. Пусть случайная величина ξ обозначает число прочитанных книг за последний месяц, и её функция распределения имеет вид: 0 при x 6 0, 1/9 при 0 < x 6 1, 1/3 при 1 < x 6 2, 2/3 при 2 < x 6 3, Fξ (x) = 7/9 при 3 < x 6 5, 8/9 при 5 < x 6 9, 1 при x > 9. Найдите ряд распределения и вероятность того, что случайным студентом прочитано 2 книги. 197. Пусть (Ω, F, P) — вероятностное пространство, ξ(ω) — вещественная функция, определенная на Ω. Обязательно ли ξ является случайной величиной, если случайной величиной является: а) ξ 2 ; б) ξ 3 ; в) sin ξ; г) eξ ; д) |ξ|? 198. Определить, могут ли следующие функции быть функциями распределения каких-либо случайных величин: 0, 2 при x 6 2, а) Fξ (x) = б) Fξ (x) ≡ 1. 1 при x > 2; 0 при x 6 0, 0, 2 при 0 6 x < 1, 0 при x 6 3, г) Fξ (x) = в) Fξ (x) = 0, 7 при 1 < x 6 2, 1 при x > 3. 1 при x > 2; 199. Определить, могут ли следующие таблицы задавать ряды распределения некоторой случайной величины. В случае положительного ответа найти подходящие значения константы c и функции распределения полученной случайной величины: a) б) ξ −10 0 5 ; 2 p 2c c(1 − c) (1 − c)2 √ ξ 0 π 2 1000 . p c 1 − c c2 3c 200. Найдите функцию распределения случайной величины ξ (ω), определенной на классическом вероятностном пространстве (Ω, F, P), если Ω = {−3, 1, 3} и ξ = ω. 201. Решите предыдущую задачу, если: 67 а) ξ = ω 2 ; б) ξ = ω −1 ; в) ξ = 2ω ; 0 г) ξ = 1 0 2 ω д) ξ = ω при ω = −3, при ω = 1, при ω = 3; при ω = ±3, при ω = 1. 202. Найдите функцию распределения случайной величины ξ (ω) = 2 ω, определенной на дискретном вероятностном пространстве (Ω, F, P) с Ω = {1, 2, 3}, если p (1) = 0, 2; p (2) = 0, 3; p (3) = 0, 5. 203. Случайная величина ξ принимает значение 1, если экзамен сдан, и 0, если не сдан. Предположим, вероятность сдать экзамен равна 0,8. Какое распределение имеет случайная величина ξ? Записать ряд распределения ξ, найти Fξ (x). 204. Какое распределение имеет случайная величина η, если η равняется числу тузов среди двух карт, вынутых без возвращения из колоды в 36 карт? Запишите ряд распределения. 205. Решите предыдущую задачу в условиях выбора с возвращением. 206. Игра состоит в набрасывании колец на колышек. Вероятность попадания при одном броске 0,6. Случайная величина ξ равна числу колец, израсходованных до первого попадания. Найдите закон распределения ξ. 207. Студент в поисках нужной информации заходит поочерёдно на три сайта. Найдя информацию, он прекращает поиски. Вероятность найти информацию на любом из этих сайтов равна 0,5. Случайная величина равна числу посещённых сайтов. Построить ряд распределения случайной величины ξ, найти Fξ (x). 208. В условиях предыдущей задачи число сайтов не ограничено. Каково распределение случайной величины, равной числу посещённых сайтов? 209. Один раз бросают две игральные кости. Случайная величина ξ — вычет суммы выпавших очков по модулю три. Построить ряд распределения случайной величины ξ, найти вероятность, что ξ = 2. 210. Число вызовов ξ, поступающих оператору в течение ми68 нуты, имеет пуассоновское распределение с параметром λ = 3. Найдите p (ξ > 2). 211. Если при наборе существует вероятность p = 0, 00001 того, что любая буква будет набрана неправильно, и случайная величина ξ равна числу опечаток в книге, имеющей 100 000 печатных знаков, то каково точное и приближённое распределение ξ? 212. Вероятность нарушения герметичности упаковки при перевозке равна 0,01; случайная величина ξ равна числу негерметичных упаковок среди 200 перевезённых. Как приближённо распределена случайная величина ξ? 213. Если при перевозке случится авария, вероятность нарушения герметичности упаковки равна 0,2. Случайная величина ξ равна числу негерметичных упаковок среди 10 перевезённых. Как распределена случайная величина ξ? 214. В условиях предыдущей задачи большое количество упаковок проверяют по очереди. Случайная величина ξ равна числу проверенных упаковок до первой встретившейся негерметичной. Каково распределение ξ? 215. Если в предыдущих условиях случайная величина ξ равна числу проверенных упаковок до третьей встретившейся негерметичной, как распределена случайная величина ξ? 216. В компьютерной игре для прохождения на следующий уровень необходимо сбить n мишеней. Вероятность попадания в цель при одном выстреле равна p. Случайная величина ξ — число произведенных выстрелов. Найдите закон распределения ξ. 217. В урне находится 5 белых и 10 красных шаров. Двое поочередно вынимают (с возвращением) шары до появления белого шара. Случайная величина ξ — число вынутых шаров. Найдите закон распределения ξ. 218. Из четырех ключей только один подходит к замку. Случайная величина ξ — число попыток при открывании замка. Найдите закон распределения ξ. 69 6. Непрерывные случайные величины 6.1. Одномерные непрерывные случайные величины Случайная величина ξ непрерывно распределена, если ее функция распределения допускает представление в виде Zx Fξ (x) = (31) fξ (t) dt. −∞ Подынтегральная функция fξ (x) называется плотностью распределения случайной величины ξ. Свойства плотности распределения. 1) Почти всюду fξ (x) = Fξ0 (x). 2) Почти всюду fξ (x) > 0. R∞ 3) fξ (t) dt = 113 . −∞ 4) 5) Rb fξ (t) dt = Fξ (b) − Fξ (a) = p ( a 6 ξ < b). a x+4x R fξ (t) dt = f (θ)4x, θ ∈ [x; x + 4x). x Пример 92. Случайная величина ξ задана функцией распределения 0, x 6 0; x2 , 0 < x 6 1; Fξ (x) = 1, 1 < x. Найти: а) плотность fξ (x); б) p (0, 25 6 ξ < 0, 75). J Пользуясь свойством 1) плотности распределения, дифференцируем Fξ (x) на полуотрезках (−∞; 0], (0; 1] и интервале (1, +∞): 0 при x 6 0; fξ (x) = 2x при 0 < x 6 1; 0 при 1 < x. Согласно свойству 4) p (0, 25 6 ξ < 0, 75) = Fξ (0, 75) − Fξ (0, 25) = = 0, 752 − 0, 252 = 0, 5. I 70 6.1 Одномерные непрерывные случайные величины Пример 93. Случайная величина ξ задана плотностью fξ (x) : 0, x 6 0, fξ (x) = sin x, 0 < x 6 C, 0, C < x. Найти: а) постоянную C; б) Fξ (x); в) p (1, 2 6 ξ < 1, 6). J По свойству 3) плотности распределения случайной величины Z+∞ fξ (x) dx = 1. −∞ Поскольку на промежутках (−∞; 0] и (C, +∞) функция fξ (x) = 0, ZC sin x dx = 1. 0 Интегрируя левую часть этого равенства, получим ZC C sin x dx = − cos x = − cos C + 1 0 0 Теперь подставим полученное выражение в исходное равенство: π − cos C + 1 = 1 ⇒ C = . 2 Пользуясь тем, что функция распределения случайной величины ξ представима в виде Zx Fξ (x) = fξ (t) dt, −∞ а fξ (t) известна, без труда найдем Fξ (x): Z x fξ (t) dt = Fξ (x) = −∞ Rx R0 0 dt + 0 dt при x 6 0; −∞ Rx sin t dt при 0 < x 6 −∞ 0 π/2 0 R R Rx π 0 dt + sin t dt + 0 dt при x > . 2 −∞ 0 π/2 π ; 2 71 6.1 Одномерные непрерывные случайные величины После необходимых вычислений имеем 0 при x 6 0; π 1 − cos x при 0 < x 6 ; Fξ (x) = 2 π 1 при x > . 2 Теперь найдём p (1, 2 6 ξ < 1, 6) = Fξ (1, 6) − Fξ (1, 2) = = 1 − [1 − cos 1, 2] ≈ 0, 3624. Заметим, что эту вероятность можно было найти и напрямую с помощью плотности: Z1,6 p (1, 2 6 ξ < 1, 6) = sin x dx ≈ 0, 3624. I 1,2 Пример 94. Случайная величина ξ имеет плотность fξ (x) : c , x ∈ R. fξ (x) = x e + e−x Найти: а) постоянную c; б) Fξ (x); в) p (0 6 ξ < 1). J Для решения этой задачи вновь воспользуемся свойством 3) плотности распределения случайной величины; в данном случае Z+∞ c dx = 1. ex + e−x −∞ По свойствам интеграла Z+∞ −∞ c dx = ex + e−x Z0 −∞ c dx + ex + e−x Z+∞ c dx. ex + e−x 0 Вычислим два интеграла, стоящие в правой части вышеприведенного равенства. Z0 −∞ 0 0 c x x dx = lim c arctg e = lim c arctg e = ζ→−∞ ζ→−∞ ζ ζ ex + e−x = c lim arctg 1 − arctg eζ = ζ→−∞ π = c lim [arctg 1 − arctg 0] = c . ζ→−∞ 4 72 6.1 Одномерные непрерывные случайные величины Z+∞ 0 ζ ζ c x x dx = lim c arctg e = lim c arctg e = ζ→+∞ ζ→+∞ 0 0 ex + e−x = c lim arctg eζ − arctg 1 = ζ→+∞ = c lim hπ ζ→−∞ Тогда Z+∞ πi π − =c . 2 4 4 π c dx = c . ex + e−x 2 −∞ и по свойству 3) плотности распределения c π 2 =1⇒c= . 2 π Теперь стало возможным найти функцию распределения случайной величины ξ. 2 Fξ (x) = π Zx x 2 1 2 x dx = lim arctg e = arctg ex . x −x ζ e +e π ζ→−∞ π −∞ В заключение, найдем p (0 6 ξ < 1): p (0 6 ξ < 1) = Fξ (1) − Fξ (0) = 2 2 arctg e1 − arctg e0 ≈ 0, 2756. I π π Пример 95. Время ожидания автобуса равномерно распределено на промежутке [1, 21]. Студент ждёт автобус уже 12 минут. Если автобус не придёт в ближайшие 4 минуты, студент опоздает на занятия. Какова вероятность, что он не опоздает? J Обозначим время ожидания автобуса ξ; по условию, ξ ∈ R[1, 21]. Известно, что ξ > 12, требуется при этом условии найти вероятность p (ξ 6 16). p (AB) По определению условной вероятности, p (A/B) = , то есть p (B) p (ξ 6 16, ξ > 12) p (12 < ξ 6 16) Fξ (16) − Fξ (12) p (ξ 6 16 ξ > 12) = = = . p (ξ > 12) p (ξ > 12) 1 − Fξ (12) 73 6.1 Одномерные непрерывные случайные величины Функция распределения R[1, 21] имеет вид 0, x 6 1; Fξ (x) = (x − 1)/20, 1 < x 6 21; 1, x > 21. Тогда p (ξ 6 16 ξ > 12) = 15 20 − 11 4 20 = . 9 1 − 11 20 Задачи 219. Автобусы приходят на остановку каждые 30 минут. Они могут опаздывать, но никогда не приходят раньше. Время задержки автобуса распределено равномерно и не превышает 20 минут. Найти вероятность того, что последний за день автобус опоздает более, чем на 19 минут. 220. Случайная величина ξ задана функцией распределения 0, x 6 0, Fξ (x) = x3 , 0 < x 6 1, 1, 1 < x. Найти: а) плотность fξ (x), б) p (0, 5 6 ξ < 1). 221. Случайная величина ξ задана плотностью 0, x 6 −C, fξ (x) = 0, 5 cos x, −C < x 6 0, 0, C < x. Найти: а) постоянную C; б) Fξ (x); в) p (−0, 5C 6 ξ < −0, 5C). 222. Случайная величина ξ имеет плотность распределения fξ (x) = A x exp ( −h2 x2 ), x > 0 (закон Рэлея14 ). Найти: а) постоянную A, б) Fξ (x), в) p (0 6 ξ < 1). 223. Случайная величина ξ задана плотностью распределения fξ (x) = A exp(−x/x0 ), x > 0, x0 — параметр. 74 6.1 Одномерные непрерывные случайные величины Найти: а) постоянную A, б) Fξ (x). 224. Случайная величина ξ имеет плотность распределения fξ (x) = c , 1 + x2 x ∈ R. Найти: а) постоянную c, б) Fξ (x), в) p (0 6 ξ < 1). 225. Случайная величина ξ задана плотностью распределения 0, при x 6 −1, c (x + 1) при −1 < x 6 0, fξ (x) = c при 0 < x 6 1, 0 при 1 < x. Найти: a) постоянную c, б) Fξ (x), в) p (−0, 2 6 ξ 6 0, 2). 226. Определить, могут ли следующие функции быть функциями распределения каких-либо случайных величин: 0 при x 6 0, x при 0 < x 6 1, а) Fξ (x) = 0 при x > 1; 0 при x 6 −1, −cx при −1 6 x 6 0, б) Fξ (x) = cx при 0 6 x < 1, 1 при x > 1; в) Fξ (x) = 1 − e−5x , x > 0; 0 при x 6 3, г) Fξ (x) = 1 при x > 3; 0 при x 6 3; д) Fξ (x) = (x − 4)/4 при 3 < x 6 7; 1 при x > 7. 227. Случайная величина ξ задана функцией распределения Fξ (x) = c + b · arctg x, x ∈ R. 75 6.1 Одномерные непрерывные случайные величины Найдите постоянные b, c и плотность. 228. В задании функции распределения 0 при x 6 −α, 1 1 x Fξ (x) = + arcsin при −α < x 6 α, 2 π α 1 при α < x. α является параметром или постоянной величиной? Найдите плотность этого распределения и p (−α/2 6 ξ 6 α/2). 229. Пачки печенья упаковывают автоматически. Масса пачки распределена по нормальному закону и имеет среднее значение 200 г, среднеквадратичное отклонение 5 г. Найти вероятность того, что вес случайно взятой пачки меньше 195 г. 230. Количество задач в параграфе имеет нормальное распределение N (25, 5) (со средним значением 25). Какова вероятность, что в параграфе будет не больше 30 задач? 231. Число посетителей сайта представляет собой случайную величину, распределённую по нормальному закону с параметрами a = 50, σ = 5. Найти вероятность того, что сайт посетит от 40 до 60 пользователей. 232. Случайная величина ξ распределена по нормальному закону с математическим ожиданием, равным 0, и дисперсией σ 2 . Каковы а) (−σ, σ); вероятности ее попадания в интервалы: б) (−2σ, 2σ); в) (−3σ, 3σ)? 233. Случайная величина ξ имеет распределение N (1, 2). Что больше, p (0 6 ξ < 1) или p (2 6 ξ < 4)? 234. Нормальное распределение с параметрами (0; σ) усечено значением 0, то есть 0 при x 6 0, fξ (x) = x2 A при x > 0. √ exp − 2 σ 2π Найти коэффициент A. 235. Рост человека имеет распределение N (a, σ). Если известно, что рост больше, чем a + σ, какова вероятность, что рост меньше, чем a + 2σ? 236. Продолжительность междугородного разговора имеет приближенно показательное распределение с параметром 76 6.2 Многомерные случайные величины 1/3 (мин−1 ). Найдите вероятность того, что очередной разговор будет продолжаться более 2 минут. 237. Время безотказной работы принтера является случайной величиной, распределенной по показательному закону с параметром 1/700 (1/час). Найдите вероятность того, что принтер проработает больше 700 часов. 238. Случайная величина ξ имеет показательное распределение с параметром 1. Что больше, p (1 6 ξ < 2) или p (2 6 ξ < 4)? 239. Длительность работы электрической лампочки подчиняется показательному закону с параметром λ = 0, 01 (1/день). Найти вероятность того, что лампочка проработает 100 дней. 240. В условиях предыдущей задачи, если лампочка проработала 100 дней, какова вероятность, что она перегорит за следующие 100 дней? 241. Будем считать, что длительность консультации распределена по показательному закону с параметром 1 (1/ч). Обычная длительность консультации — академический час (45 мин). Если консультация не закончилась за это время, какова вероятность того, что она закончится в ближайшие 15 мин? 242. Месячный доход налогоплательщика имеет распределение Парето с параметром p = 3. Найти вероятность того, что доход случайного налогоплательщика более, чем в два раза выше нижнего предела. 6.2. Многомерные случайные величины n-мерной случайной величиной называется вектор ξ(ω) = (ξ1 (ω), ξ2 (ω), . . . , ξn (ω)) , отображающий Ω в R n . Дискретные двумерные случайные величины часто задают таблицей распределения: η \ ξ x1 . . . xn y1 p11 . . . p1n .. .. .. .. . . . . ym pm1 . . . pmn Совместной функцией распределения n-мерной случайной величины ξ называется функция Fξ1 , ..., ξn (x1 , . . . , xn ) = p ( ξ1 < x1 , . . . , ξn < xn , ), ∀x ∈ Rn . (32) 77 6.2 Многомерные случайные величины n-мерная cлучайная величина ξ непрерывно распределена, если ее функция распределения допускает представление в виде Zx1 Zxn Fξ1 , ..., ξn (x1 , . . . , xn ) = ... fξ1 , ..., ξn (t1 , . . . , tn ) dt1 . . . dtn . (33) −∞ −∞ Подынтегральная функция fξ1 , ..., ξn (x1 , . . . , xn ) называется плотностью распределения n-мерной случайной величины ξ = (ξ1 , . . . , ξn ). Случайные величины ξ1 , . . . , ξn называются независимыми, если p ( ξ1 ∈ B1 , . . . , ξn ∈ Bn ) = p ( ξ1 ∈ B1 ) . . . p ( ξn ∈ Bn ), (34) где B1 , . . . , Bn — борелевские множества из R . Свойства независимых случайных величин. 1) Fξ1 , ..., ξn (x1 , . . . , xn ) = Fξ1 (x1 ) . . . Fξn (xn ). 2) Для дискретных случайных величин pξ1 , ..., ξn (x1 , . . . , xn ) = p ( ξ1 = x1 , . . . , ξn = xn ) = = p ( ξ1 = x1 ) . . . p ( ξn = xn ). 3) Для непрерывных случайных величин fξ1 , ..., ξn (x1 , . . . , xn ) = fξ1 (x1 ) . . . fξn (xn ). Вышеперечисленные свойства являются необходимыми и достаточными условиями независимости случайных величин. Система двух случайных величин. y Пусть (ξ, η) — двумерная непрерыв(X, Y ) но распределенная случайная величина, а Fξ, η (X, Y ) — ее функция распределения. x Геометрически Fξ, η (X, Y ) интепрети0 руется как как вероятность попадания случайной точки (ξ, η) в квадрант с вершиной (X, Y ), заштрихованный на рисунке 8. Плотность распределения выражается формулой Рис. 8. ∂ 2 F (x, y) fξ, η (x, y) = . ∂x ∂y Вероятность попадания случайной точки (ξ, η) в произвольную область D может быть найдена по формуле ZZ p ((ξ, η) ∈ D) = fξ, η (x, y) dx dy. D 78 6.2 Многомерные случайные величины y Вероятность попадания случайной точки (ξ, η) в прямоугольник R со сторонами, параллельными осям координат, включающий свою нижнюю и левую границы, но не включащий верхнюю и правую, можно найти по формуле d R c x 0 a b p ((ξ, η) ∈ R) = F (b, d)−F (a, d)−F (b, c)+F (a, c), где a, b, c, d — координаты вершин прямоугольника R (см. рис. 9). Рис. 9. Функция распределения двумерной случайной величины может быть выражена через ее плотность по формуле Zx Zy Fξ, η (x, y) = fξ, η (u, v) du dv −∞ −∞ (интегрируют сначала по v, затем — по u). Плотности распределения одномерных величин ξ и η, составляющих двумерную величину (ξ, η), находятся по формулам: Z+∞ fξ, η (x, y) dy, fξ (x) = (35) −∞ Z+∞ fη (y) = fξ, η (x, y) dx. (36) −∞ Пример 96. Дискретная двумерная случайная величина задана таблицей распределения η \ ξ x1 . . . xn y1 p11 . . . p1n .. .. .. .. . . . . ym pm1 . . . pmn Найти одномерные законы распределения ξ, η. J Поскольку p (ξ = x1 ) не зависит от η, то p (ξ = x1 ) = m X i=1 p (ξ = x1 /η = yi ) = m X pi1 . i=1 Пользуясь аналогичными соображениями для x2 , x3 , . . . , xn и y1 , y2 , . . . , ym , получим одномерные ряды распределения ξ и η: 79 6.2 Многомерные случайные величины ξ x1 x2 . . . xn m m m P P P pi1 pi2 . . . pin p i=1 i=1 i=1 η y1 y2 . . . ym n n n P P P p p1i p2i . . . pmi i=1 i=1 I i=1 В задачах примеров 97—98 с помощью совместной плотности заданы двумерные случайные величины (ξ, η). Требуется найти а) совместную функцию распределения Fξ, η (x, y), б) одномерные плотности fξ (x) и fη (y). Пример 97. fξ, η (x, y) = 4xye−(x 2 +y 2 ) x, y ∈ R + ∪ {0}. ; J Пользуясь формулой (33), вычислим Fξ, η (x, y). Zx Zy Fξ, η (x, y) = 0 2 4uve−(u +v 2 ) du dv. 0 Рассмотрим двойной интеграл Zx Zy 0 2 4uve−(u +v 2 ) Zx du dv = 0 0 2 4ue−u Zy 2 ve−v dv du. 0 v2 При помощи подстановки t = − вычислим неопределенный инте2 грал, соответствующий внутреннему: Z Z Z 2 1 1 t = − v2 , 2t −v 2 = − e dt = − e2t d(2t) = − e2t . e dv = dt = −v dv 2 2 Тогда Zy −v 2 ve dv = 0 1 −2 e 2 v2 2 y = 0 i 1 h −y2 0 − e −e 2 2 = 1 e−y − . 2 2 Вернемся к повторному интегралу: ! x Zx −y 2 −y 2 Z 1 e 1 − e 2 2 4ue−u − du = 4 · ue−u du. 2 2 2 0 0 80 6.2 Многомерные случайные величины Как доказано выше, Zx 2 2 ue−u 1 e−x du = − , 2 2 0 следовательно, 2 2 Fξ, η (x, y) = (1 − e−y )(1 − e−x ), x, y ∈ R + ∪ {0}. Теперь найдем плотность распределения случайной величины ξ по формуле (35). Z+∞ Z+∞ y2 2 2 2 2 t = − , 2 fξ (x) = 4xye−x −y dy = 4xe−x ye−y dy = = dt = −y dy 0 2 = −4xe−x 0 Z+∞ Z+∞ 1 2 e2t dt = − · 4xe−x 2 0 = −2xe−x 2 2 2 a −2 y2 e2t d(2t) = −2xe−x lim e a→+∞ = 0 h0 2 i 2 2 −a 0 lim e − e = −2xe−x [0 − 1] = 2xe−x . a→+∞ Аналогично, по формуле (36) находим, что Z+∞ 2 2 2 4xye−x −y dx = . . . = 2ye−y . I fη (y) = 0 Пример 98. fξ, η (x, y) = 1/3 при 0 6 x 6 3, 0 6 y 6 1 (плотность равна 0 при остальных x, y). J Разобьем координатную плоскость на 5 подобластей: y 3) 1) x 6 0 или y 6 0; 2) 2) x > 3 и y > 1; 1 3) 0 < x 6 3 и y > 1; 5) 0 4) 3 x 4) x > 3 и 0 < y 6 1; 5) 0 < x 6 3 и 0 < y 6 1. 1) Это разбиение представлено на рисунке 10. Будем находить совместную Рис. 10. функцию распределения Fξ, η (x, y) на каждом из этих 5 множеств отдельно, обозначая FM (x, y) — функцию распределения случайной величины (ξ, η) на множестве M ). 81 6.2 Многомерные случайные величины 1) Функция распределения (ξ, η) в каждой точке этой области равна нулю, поскольку Zx Zy F1 (x, y) = 0 du dv = 0. −∞ −∞ 2) Так как плотность распределения (ξ, η) равна нулю на всех множествах разбиения, кроме пятого, то Z0 Z0 F2 (x, y) = Z3 Z+∞ Z+∞Z1 0 du dv + 0 du dv + 0 du dv+ −∞ −∞ 0 1 Z3 Z1 1 du dv + 3 + 0 3 Zx Zy Z3 Z1 0 du dv = 3 0 0 1 0 1 du dv. 3 0 Этот интеграл легко вычисляется: Z3 Z1 Z3 Z1 1 1 du dv = dv du = 3 3 0 0 0 1 = 3 Z3 0 1 ([1 − 0] dv) du = 3 0 Z3 du = 1 · 3 = 1 = F2 (x, y). 3 0 3) Здесь F3 = p (ξ < x, η < +∞) = p (ξ < x) = Fξ (x). def Zx fξ (t) dt. Fξ (x) = −∞ Найдём fξ (x). Z1 fξ (x) = 1 1 dy = , 0 6 x 6 3. 3 3 0 Тогда Z0 (35) Fξ (x) = Zx 0 dt + −∞ 1 x dt = . 3 3 0 4) F4 = p (ξ < +∞, η < y) = p (η < y) = Fη (y). Z3 fη (y) = 1 dx = 1, 0 6 y 6 1. 3 0 82 6.2 Многомерные случайные величины def Zy Fη (y) = (36) fη (t) dt = −∞ Zy Z0 0 dt + −∞ 1 dt = y. 0 5) В данном случае Zx Zy F5 (x, y) = 0 xy 1 du dv = . . . = . 3 3 0 Таким образом, 0 (xy)/3 x/3 Fξ, η (x, y) = y 1 при при при при при Z1 fξ (x) = x 6 0 или y 6 0; 0 < x 6 3 и 0 < y 6 1; 0 < x 6 3 и y > 1; x > 3 и 0 < y 6 1; x > 3 и y > 1. 1 1 dy = . 3 3 0 Z3 fη (y) = 1 dx = 1. I 3 0 Задачи 243. Дискретная двумерная случайная величина (ξ, η) задана таблицей распределения η\ξ 0 1 2 −1 0 1 0, 1 x 0 0 3x 0 0 0, 1 0, 4 Найти x, одномерный закон распределения ξ, p (η > 0, 5). 244. Являются ли одномерные случайные величины ξ, η из предыдущей задачи независимыми? 245. По заданному совместному закону распределения двумерной случайной величины (ξ, η) найдите совместную функцию распре- 83 6.2 Многомерные случайные величины деления Fξ, η (x, y) и выясните, являются ли одномерные случайные величины ξ, η независимыми. η\ξ 1 2 3 4 0, 3 0, 4 0, 1 0, 2 246. Дискретная двумерная случайная величина ξ, η задана таблицей распределения η\ξ −1 0 1 0 1 2 0, 3 0 0 0 0, 3 0 0 0 0, 4 Докажите по определению, что ξ, η зависимы. Докажите тот же факт, используя функции распределения. 247. Дискретная двумерная случайная величина ξ, η задана таблицей распределения η\ξ 1 2 3 4 1/6 1/3 1/6 1/3 Докажите по определению, что ξ, η независимы. Докажите тот же факт, используя функции распределения. 248. Один раз бросают игральную кость. Случайная величина ξ — число выпавших единиц, а случайная величина η — число выпавших шестёрок. Построить таблицу распределения случайной величины (ξ, η). Что можно сказать про зависимость ξ, η? 249. Один раз бросают две игральные кости. Случайная величина ξ — число выпавших единиц, а случайная величина η — число выпавших шестерок. Найти вероятность p (ξ = 0, η = 0). Построить таблицу распределения случайной величины (ξ, η). 250. Два раза бросают игральную кость. Случайная величина ξ — сумма, а случайная величина η — модуль разности выпавших очков. Построить таблицу распределения случайной величины (ξ, η), найти вероятность p (ξ = 7, η 6 4). 251. Двумерная случайная величина задана с помощью совместной плотности fξ, η (x, y). Выразить через неё одномерные плотности компонент ξ, η. 252. Двумерная случайная величина задана с помощью сов84 6.2 Многомерные случайные величины местной плотности: fξ, η (x, y) = Cxy 2 при 0 < y < 1, 0 < x < 1; 0 — иначе. Найти постоянную C и одномерную плотность fξ (x). 253. В условиях предыдущей задачи найдите p (ξ + η > 1) и p (1/2 < ξ < 3/4). 254. Определить плотность вероятности двумерной случайной величины (ξ, η) по заданной функции распределения: (1 − e−2x )(1 − e−3y ) при x > 0, y > 0; Fξ, η (x, y) = 0 — иначе. В задачах 255—259 с помощью совместной плотности заданы двумерные случайные величины (ξ, η). Требуется выяснить зависимы ли ξ, η, и найти а) неизвестную постоянную C; б) совместную функцию распределения Fξ, η (x, y); в) одномерные плотности fξ (x), fη (y). 255. fξ, η (x, y) = C|x||y| exp −(x2 + y 2 ) . Cxy exp −(4x2 + y 2 ) при 0 < y < 1, 0 < x < 1; 256. fξ, η (x, y) = 0 — иначе. Cxy при 0 < y < 1, 0 < x < 2; 257. fξ, η (x, y) = 0 — иначе. 1 . 258. fξ, η (x, y) = C 1 + x2 + y 2 + x2 y 2 π π 259. fξ, η (x, y) = C cos x · cos y при 0 6 x 6 , 0 6 y 6 (плот2 2 ность равна нулю при остальных x, y). 260. В круге радиуса R случайно выбирают точку (ξ, η). Запишите плотность случайной величины (ξ, η). 261. В квадрате [0, 1] × [0, 1] случайно выбирают точку (ξ, η). Запишите функцию распределения случайной величины (ξ, η) и найдите p (2ξ > η). 262. Двумерная случайная величина (ξ, η) равномерно распределена в треугольнике D = {(x, y) : x > 0, y > 0, x + y 6 2.} Найдите p (ξ < η). 263. В условиях предыдущей задачи выясните, зависимы ли ξ, η. 264. Двумерная случайная величина (ξ, η) имеет плотность вероятности 1 A . fξ, η (x, y) = 2 · π (3 + x2 )(1 + y 2 ) 85 6.2 Многомерные случайные величины Найти величину A и p (0 < ξ < 1, 0 < η < 1). 86 7. Числовые характеристики одномерной случайной величины 7.1. Математическое ожидание Математическим ожиданием случайной величины ξ называется число Z∞ Z Mξ = ξ(ω) dP (ω) = x dFξ (x), (37) −∞ Ω при условии, что интеграл сходится абсолютно. Смысл математического ожидания — среднее значение случайной величины. Из определения (37) вытекают формулы (38) для дискретной случайной величины и (39) для непрерывной случайной величины. Формулы для вычисления математического ожидания. Математическое ожидание одномерной дискретной случайной величины ξ: ∞ X xi · p ( ξ = xi ). (38) Mξ = i=1 Математическое ожидание непрерывной одномерной случайной величины ξ: Z∞ Mξ = xfξ (x) dx. (39) −∞ Свойства математического ожидания. 1) 2) 3) 4) 5) M c = c, c = const. M cξ = cM ξ. M (ξ1 + ξ2 ) = M ξ1 + M ξ2 . M (η1 · η2 ) = M (η1 ) · M (η2 ), если η1 и η2 — независимые случайные вели |M ξ| 6 M |ξ|. Пример 99. Найти математическое ожидание случайной величины, заданной законом распределения: ξ P 0 1 2 3 0, 2 0, 3 0, 4 0, 1 J Воспользовавшись формулой (38), легко получим M ξ = 0 · 0, 2 + 1 · 0, 3 + 2 · 0, 4 + 3 · 0, 1 = 1, 4. I 87 7.1 Математическое ожидание Пример 100. Найти математическое ожидание геометрического распределения Gp . J Геометрическое распределение Gp задается следующим рядом. ξ 0 1 2 ... k ... , 2 k p p p(1 − p) p(1 − p) . . . p(1 − p) . . . где p (ξ = k) = (1 − p)k p. Обозначив q = 1 − p, вновь обратимся к формуле (38): ∞ ∞ ∞ X X X k kq k−1 = kq p = pq xk pk = Mξ = = pq ∞ X k=0 k=0 k=0 kq k−1 = pq ∞ X (q k )0 = pq !0 qk . k=1 k=1 k=1 ∞ X Используя формулу для суммы геометрической прогрессии ∞ X qk = k=1 q 1−q со знаменателем q(|q| < 1), находим 0 1 pq q 1(1 − q) − q(−1) q = pq = = .I M ξ = pq = pq 1−q (1 − q)2 (1 − q)2 p2 p Пример 101. Найти математическое ожидание отрицательного биномиального распределения B(r, p). J По условию задачи случайная величина ξ распределена так, что m pr q m для ξ = 0, 1, . . . , r. p (ξ = m) = Cm+r−1 Случайная величина ξ ∈ B(r, p) представима в виде суммы r величин, r P имеющих геометрическое распределение: ξ = ξi , ξi ∈ Gp . i=1 Из свойств математического ожидания получаем Mξ = r X i=1 M ξi = r X q i=1 p = rq .I p Пример 102. Найти математическое ожидание случайной величины, заданной с помощью плотности fξ (x) 2 cx при x ∈ [0, 2]; fξ (x) = 0 при x ∈ / [0, 2]. 88 7.1 Математическое ожидание J Пользуясь свойством нормировки плотности распределения случайной величины, найдем постоянную c. Z+∞ Z0 Z2 Z+∞ Z2 3 2 t 8 fξ (t) dt = 0 dt + ct2 dt + 0 dt = ct2 dt = c = c. 3 0 3 −∞ −∞ 0 2 0 Из уравнения 8c/3 = 1 находим, что c = 3/8. По определению математического ожидания непрерывной случайной величины 2 Z+∞ Z2 3 · 24 3 3 3 x4 3 Mξ = = .I xfξ (x) dx = x dx = · = 8 8 4 0 8·4 2 −∞ 0 Пример 103. Найти математическое ожидание гамма-распределения Γα, β . J Выпишем функцию плотности гамма-распределения. fξ (x) = αβ −αx β−1 e x при x > 0, где Γ (β) Z∞ Γ (β) = xβ−1 e−x dx. 0 Z+∞ Z+∞ Mξ = xfξ (x) dx = xfξ (x) dx = −∞ 0 αβ = Γ(β) +∞ Z+∞ β Z α xe−αx xβ−1 dx = e−αx xβ dx. Γ(β) 0 0 Сделаем замену переменной t = αx, dt = αdx: αβ Mξ = Γ(β) Z+∞ Z+∞ β β t dt α 1 1 −t β e t dt = Γ(β + 1). e−t β = α α Γ(β) αβ+1 αΓ(β) 0 0 Используем свойство гамма-функции: Γ(x + 1) = xΓ(x). Mξ = βΓ(β) β = .I αΓ(β) α 89 7.1 Математическое ожидание Пример 104. Доказать, что математическое ожидание распределения Коши не существует. Ka, λ . J Функция плотности распределения Коши имеет вид λ 1 fξ (x) = 2 . λ + (x − a)2 π Рассмотрим величину Z+∞ Z+∞ |x| λ |x|fξ (x) dx = · 2 dx = π λ + (x − a)2 −∞ −∞ Z+∞ |x| λ λ · 2 dx = π λ + (x − a)2 π −∞ Z+∞ dx λ2 −∞ |x| + (x−a)2 |x| . Полученный интеграл расходится, так как в знаменателе λ2 (x − a)2 + |x| |x| старшая степень x не превосходит 1. Следовательно, математическое ожидание не существует. I Задачи В задачах 265—272 требуется найти математические ожидания указанных случайных величин. 265. Вероятность попадания при одном выстреле равна 0,7. Случайная величина ξ равна числу попаданий в цель при двух выстрелах. 266. Проводят один опыт, в результате которого событие может произойти с вероятностью 0,4. Случайная величина ξ принимает значение 1, если событие произошло и 0, если оно не произошло. 267. Игра состоит в набрасывании колец на колышек. Игрок получает 3 кольца и бросает их до первого попадания. Вероятность попадания при одном броске 0,5. Случайная величина равна числу израсходованных колец. 268. В лотерее имеется ni выигрышей стоимостью mi , где i = 1, . . . , k. Всего билетов N . Случайная величина ξ — стоимость выигрыша на один билет. 269. Из четырех ключей только один подходит к замку. Случайная величина ξ — число попыток при открывании замка. 270. Партия из 8 деталей содержит 2 нестандартные. Наудачу отобраны 3 детали. Случайная величина ξ — число стандартных 90 7.1 Математическое ожидание среди трех отобранных. 271. Найти математическое ожидание биномиального распределения B (N, p). 272. Найти математическое ожидание распределения Пуассона Pλ . В задачах 273—287 требуется найти неизвестные постоянные коэффициенты и математическое ожидание случайных величин, заданных с помощью плотности fξ (x) или функции распределения Fξ (x) (или указать, что математическое ожидание не существует). 1/3 при x ∈ [1; 4], 273. fξ (x) = 0 при x ∈ [1; 4]. 3 cx при x ∈ [0; 1] 274. fξ (x) = 0 при x ∈ [0; 1]. 0 при x 6 0, 275. Fξ (x) = x2 при 0 < x 6 1, 1 при 1 < x. 0 при x 6 0, sin x при 0 < x 6 C, 276. fξ (x) = 0 при C < x. x2 277. fξ (x) = A exp − 2 , где x > 0, σ = const. 2σ a 278. fξ (x) = exp {−a|x − b|} , где a > 0. 2 279. Fξ (x) = c+ b · arctg x, где x ∈ R. 0 при x 6 −a 280. Fξ (x) = 1/2 + (1/π) arcsin (x/a) при −a < x 6 a 1 при a < x. m x 281. fξ (x) = A exp − , где x > 0, x0 = const. x0 3x2 (x3 − a)2 . 282. fξ (x) = √ exp − 2σ 2 σ 2π A 283. fξ (x) = x , где x ∈ R. e + e−x 284. Найти среднюю скорость молекул газа, если скорость подчиняется закону Максвелла: 3 4h 2 −v2 h2 √ v e при v > 0, f (v) = π 0 при v 6 0. 285. Найти математическое ожидание распределения Рэлея: f (x) = Ax exp −h2 x2 , где x > 0. 91 7.2 Другие числовые характеристики случайной величины 286. Найти математическое ожидание распределения Лапласа. 287. Найти математическое ожидание распределения Парето. 7.2. Другие числовые характеристики случайной величины Дисперсией ξ называется число Dξ = M (ξ − M ξ)2 . (40) Начальным моментом порядка k случайной величины ξ называется число αk = M (ξ)k . (41) Центральным моментом порядка k случайной величины ξ называется число µk = M (ξ − M ξ)k . (42) Среднеквадратическим отклонением ξ называется число p σ = Dξ. (43) Коэффициентом асимметрии называется число µ3 M (ξ − M ξ)3 A= 3 = p . σ (Dξ)3 (44) Коэффициентом эксцесса называется число µ4 M (ξ − M ξ)4 E = 4 −3= − 3. σ (Dξ)2 (45) Модой непрерывной случайной величины ξ называется значение mo , при котором плотность fξ (x) достигает максимума: fξ (m0 ) = max fξ (x). x (46) Модой дискретной случайной величины ξ называется значение mo , при котором p ( ξ = mo ) = max pi . (47) i 92 7.2 Другие числовые характеристики случайной величины Медианой непрерывной случайной величины ξ называется значение me , при котором Zme fξ (x) dx = 1/2, (48) −∞ то есть F (me ) = 1/2. Медианой дискретной случайной величины ξ называется значение me , при котором F (me ) 6 1/2, F (me + 0) > 1/2. (49) Квантилью порядка q (0 < q < 1) непрерывной случайной величины ξ называется значение xq , при котором Zxq fξ (x) dx = q, (50) −∞ то есть F (xq ) = q. Квантилью порядка q (0 < q < 1) дискретной случайной величины ξ называется значение xq , при котором F (xq ) 6 q, F (xq + 0) > q. (51) Пример 105. Случайная величина задана законом распределения: ξ p 0 1 2 3 0, 2 0, 3 0, 4 0, 1 Требуется найти ее дисперсию. J Легко найти M ξ = 1, 4. По формуле (40) Dξ = M ξ 2 − (M ξ)2 = = 02 · 0, 2 + 12 · 0, 3 + 22 · 0, 4 + 32 · 0, 1 − 1, 42 = 0, 84. I Пример 106. Найти дисперсию случайной величины, заданной с помощью плотности fξ (x): 2 cx при x ∈ [0, 2]; fξ (x) = 0 при x ∈ / [0, 2]. 93 7.2 Другие числовые характеристики случайной величины J Как установлено ранее, c = 3/8, M ξ = 3/2. Теперь вычислим M ξ 2 . Z+∞ Z2 5 2 3 x 3 · 25 12 3 2 2 4 Mξ = x fξ (x) dx = = . x dx = · = 8 8 5 0 8·5 5 −∞ 0 Зная M ξ и M ξ 2 , легко получим 2 12 3 3 Dξ = − = .I 5 2 20 Пример 107. Найти медиану и моду случайной величины, заданной с помощью плотности 0 при x 6 0, fξ (x) = sin x при 0 < x 6 C, 0 при C < x. J Воспользуемся тем, что Z+∞ fξ (t) dt = 1 −∞ (свойство нормировки функции плотности распределения случайной величины ξ). Z+∞ ZC Z+∞ Z0 ZC 0 dt = sin t dt = fξ (t) dt = 0 dt + sin t dt + −∞ −∞ 0 0 C = − cos t|C0 = − cos C + cos 0 = 1 − cos C. π + πk, k ∈ Z. 2 Поскольку функция fξ (t) > 0 почти всюду, то C = π/2. По определению мода — это число m0 такое, что 1 − cos C = 1 ⇔ cos C = 0 ⇔ C = fξ (m0 ) = max fξ (x). x Здесь max fξ (x) = 1 = fξ x π 2 , т. е. m0 = π . 2 94 7.2 Другие числовые характеристики случайной величины В силу того, что fξ (x) обращается в ноль во всех точках R, за исключением полуинтервала (0, π/2], медиана me случайной величины ξ расположена внутри указанного интервала. Поэтому Z+∞ Zme e fξ (t) dt = sin t dt = − cos t|m 0 = 1 − cos me . −∞ 0 Решая уравнение 1 − cos me = 1/2 на (0, π/2] получаем, что me = π/3. I Пример 108. Найти коэффициенты асимметрии и эксцесса равномерного распределения R[0; 1]. J Найдем сначала в общем виде центральные моменты µk . k Z 1 k k+1 1 1 (y − 1/2) 1 = = y− dy = µk = M (η − M η)k = M η − 2 2 k + 1 0 0 1 (−1)k+1 1 − (−1)k+1 (1/2)k+1 (−1/2)k+1 1 − = k+1 − = . = k+1 k+1 2 k+1 k+1 (k + 1)2k+1 µ3 Коэффициент асимметрии A = 3 . σ Поскольку µ3 = 0, A = 0. µ4 Коэффициент эксцесса E = 4 − 3. σ µ4 = 1 − (−1)4+1 2 1 = = , (4 + 1)24+1 5 · 32 80 1 1 1 √ = = . 16 · 9 144 (2 3)4 144 144 − 240 −96 6 E= −3= = = − = −1, 2 I 80 80 80 5 σ4 = Пример 109. Найти моду, медиану и децили15 случайной величины η, имеющей равномерное распределение R[0; 1]. 15 Децилями назваются квантили x0,1 , . . . , x0,9 . 95 7.2 Другие числовые характеристики случайной величины J Мода m0 : fη (m0 ) = maxx fη (x). Так как fη (x) = const, то f 0 (x) = 0. Значит, любая точка x ∈ [0, 1] будет точкой локального максимума. В этом случае считают, что моды нет (распределение амодальное). Медиана me : надо решить уравнение Fη (me ) = 21 . Fη (x) = x, значит, x = 1/2, me = 21 . Квантили xq : решая уравнение Fη (xq ) = q, получаем xq = q. Следовательно, квантили принимают такие значения: Квантиль x0,1 x0,2 x0,3 x0,4 x0,5 x0,6 x0,7 x0,8 x0,9 Значение 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 Замечание. Этот пример можно было решить без вычислений, исходя из смысла определений. I Задачи 288. Докажите, что k µk = M (ξ − M ξ) = k X (−1)k−i · Cki αi α1k−i . i=0 289. Найти дисперсию случайной величины, распределенной по закону Пуассона. 290. Найти α3 = M ξ 3 для случайной величины, имеющей биномиальное распределение с параметром p. 291. Найти моду и медиану распределения Коши. В задачах 292—303 требуется найти моду, медиану и дисперсию случайных величин, заданных с помощью плотности fξ (x) или функции распре- 96 7.2 Другие числовые характеристики случайной величины деления Fξ (x) (или указать, что они не существуют). 1/3 при x ∈ [1; 4], 292. fξ (x) = 0 при x ∈ [1; 4]. 3 cx при x ∈ [0; 1], 293. fξ (x) = 0 при x ∈ [0; 1]. 0 при x 6 0, x2 при 0 < x 6 1, 294. Fξ (x) = 1 при 1 < x. 0 при x 6 0, 295. fξ (x) = −x e при x > 0. x2 296. fξ (x) = A exp − 2 , где x > 0, σ = const. 2σ a 297. fξ (x) = exp {−a|x − b|} , где a > 0. 2 298. Fξ (x) = c+ b · arctg x, где x ∈ R. 0 при x 6 −a 299. Fξ (x) = 1/2 + (1/π) arcsin (x/a) при −a < x 6 a 1 при a < x. m x , где x > 0, x0 = const. 300. fξ (x) = A exp − x0 301. 3 4h 2 −x2 h2 √ xe при x > 0, f (x) = π 0 при x 6 0. 3x2 (x3 − a)2 . 302. fξ (x) = √ exp − 2σ 2 σ 2π A 303. fξ (x) = x , где x ∈ R. e + e−x 304. Найти коэффициенты асимметрии и эксцесса равномерного распределения R[a; b]. 305. Докажите рекуррентную формулу для моментов показательного распределения Eλ : µk+1 = (−1)k+1 (M ξ)k+1 + k+1 µk . λ 306. Найдите коэффициенты асимметрии и эксцесса показательного распределения Eλ . 307. Найти коэффициент асимметрии случайной величины, распределенной по закону Пуассона. 308. Найдите квантиль порядка 0,75 распределения Коши с па97 7.3 Математические ожидания и дисперсии некоторых важных распределений раметром a. 309. Найдите отношение квантилей порядков 0,8 и 0,2 случайной величины, имеющей равномерное распределение R[a; b]. 310. Случайная величина ξ распределена нормально с M ξ = 100. Известно, что x0,05 = 90. Найти σ. 7.3. Математические ожидания и дисперсии некоторых важных распределений При решении задач этого подпараграфа удобно пользоваться таблицей 7 Приложения. Пример 110. Проводят три испытания по схеме Бернулли с вероятностью появления события в одном испытании p. Случайная величина ξ — число появления события в трех испытаниях. Известно, что Dξ = 0, 75. Найти p. J Случайная величина ξ имеет биномиальное распределение B (3, p), поэтому Dξ = 3pq = 3p(1 − p). Решая квадратное уравнение 3p(1 − p) = 0, 75; получим два равных корня p = p1 = p2 = 0, 5. I Задачи 311. Производят 5 выстрелов по мишени. Вероятность попадания при одном выстреле p = 0, 4. Найти математическое ожидание и дисперсию числа промахов. 312. Число вызовов ξ, поступающих оператору в течение минуты, имеет пуассоновское распределение с параметром λ = 3. Найдите M ξ, Dξ. 313. Если при наборе существует вероятность p = 0, 00001 того, что любая буква будет набрана неправильно, и случайная величина ξ равна числу опечаток в книге, имеющей 400000 печатных знаков, то каково M ξ? 314. Вероятность нарушения герметичности упаковки при перевозке равна 0,001, и случайная величина ξ равна числу негерметичных упаковок среди 1000 перевезенных. Найдите M ξ, Dξ. 315. В условиях предыдущей задачи упаковки проверяют по очереди. Случайная величина ξ равна числу проверенных упаковок до 98 7.3 Математические ожидания и дисперсии некоторых важных распределений первой встретившейся негерметичной. Найдите M ξ, Dξ. 316. Если в предыдущих условиях случайная величина ξ равна числу проверенных упаковок до третьей встретившейся негерметичной, найдите среднее значение ξ и дисперсию ξ. 317. В компьютерной игре для прохождения на следующий уровень необходимо сбить n мишеней. Вероятность попадания в цель при одном выстреле равна p. Случайная величина ξ — число произведенных выстрелов. Найдите M ξ, Dξ. 318. В урне находится 5 белых и 10 красных шаров. Двое поочередно вынимают (с возвращением) шары до появления белого шара. Случайная величина ξ — число вынутых шаров. Найдите M ξ, Dξ. 319. В условиях предыдущей задачи шары вынимают без возвращения. Найдите M ξ, Dξ. 320. Число посетителей сайта представляет собой случайную величину, распределенную по нормальному закону с параметрами a = 50, σ = 5 Каково среднее число посетителей? 321. Средняя продолжительность междугородного разговора равна 3 минутам. Если считать, что продолжительность междугородного разговора имеет приближенно показательное распределение, какова вероятность того, что очередной разговор будет продолжаться более 2 минут? 99 8. Линейная зависимость между случайными величинами 8.1. Линейная зависимость двух величин Ковариацией двумерной случайной величины (ξ, η) называется центральный смешанный момент второго порядка cov (ξ, η) = M [(ξ − M ξ) · (η − M η)] = M (ξ · η) − M ξ · M η. (52) Коэффициентом корреляции между случайными величинами ξ, η называется число cov (ξ, η) M [(ξ − M ξ) · (η − M η)] p = . (53) ρξ, η = σξ ση D(ξ)D(η) Свойства коэффициента корреляции. 1. |ρ| 6 1. 2. Если ξ, η независимы, то ρξ, η = 0. 3. ρξ,η = ±1 ⇐⇒ ξ, η линейно зависимы16 Из свойств 1—3 следует, что коэффициент корреляции есть мера линейной зависимости между ξ, η. Уравнением линейной регрессии η на ξ называется линейное уравнение η̂ = aξ +b, параметры которого минимизируют остаточную дисперсию M (η − η̂)2 : ση η̂ − M η = ρξ, η (ξ − M ξ). (54) σξ 2 ση2 (1 − ρ2ξ, η ). Остаточная дисперсия равна Sост Пример 111. Дискретная двумерная случайная величина (ξ, η) задана таблицей распределения: ξη 1 3 5 0 0 0, 1 0, 4 2 0, 1 0, 3 0 4 0 0, 1 0 Найти коэффициент корреляции, уравнение линейной регрессии η на ξ, остаточную дисперсию. 16 Случайные величины ξ, η линейно зависимы, если существуют такие a 6= 0 и b, что ξ = aη + b с вероятностью 1. 100 8.1 Линейная зависимость двух величин J Найдем одномерные законы распределения. ξ 0 2 4 p 0, 5 0, 4 0, 1 η 1 3 5 p 0, 1 0, 5 0, 4 Вычислим числовые характеристики. M ξ = 1, 2; M η = 3, 6; 2 Dξ = 3, 2 − 1, 2 = 0, 61; Dη = 14, 6 − 3, 62 = 1, 64; √ √ ση = 1, 64 ≈ 1, 28. σξ = 1, 76 ≈ 1, 33; Ряд распределения ξ · η выглядит следующим образом: ξ·η 0 2 6 12 p 0, 5 0, 1 0, 3 0, 1 M (ξ · η) = 2 · 0, 1 + 6 · 0, 3 + 12 · 0, 1 = 3, 2. По формуле (53) вычисления коэффициента корреляции имеем ρξ,η = 3, 2 − 1, 2 · 3, 6 ≈ −0, 659. 1, 33 · 1, 28 Используя формулу (54), получим уравнение линейной регрессии η̂ − 3, 6 = −0, 659 · 1, 28 (ξ − 1, 2); 1, 33 η̂ = −0, 634 · ξ + 4, 361. Наконец вычислим остаточную дисперсию 2 Sост = 1, 64(1 − 0, 6592 ) ≈ 0, 928. I Пример 112. Найти ρξ, ξ 4 , если случайная величина ξ задана законом распределения ξ −1 0 1 p 0, 2 0, 6 0, 2 J Очевидно, M ξ = 0. Выпишем формулу для вычисления ρξ, ξ 4 . ρξ, ξ 4 M (ξ · ξ 4 ) − M (ξ) · M (ξ 4 ) M (ξ 5 ) − M (ξ) · M (ξ 4 ) = = . σξ σξ 4 σξ σξ 4 Найдем закон распределения ξ 5 : ξ 5 −1 0 1 p 0, 2 0, 6 0, 2 101 8.1 Линейная зависимость двух величин M ξ 5 = M (ξ) · M (ξ 4 ) = 0, так как M ξ = 0. Поэтому M (ξ 5 ) − M (ξ) · M (ξ 4 ) ρξ,ξ 4 = = 0. I σξ σξ 4 Задачи В задачах 322—324 заданы совместные законы распределения двумерных случайных величин (ξ, η). Требуется найти: а) коэффициент корреляции ρξ, η ; б) уравнение линейной регрессии η на ξ и остаточную дисперсию; в) уравнение линейной регрессии ξ на η и остаточную дисперсию. 322. ξη 1 2 3 −2 0 0, 2 0 0 0, 1 0, 2 0, 1 2 0 0, 1 0, 1 4 0 0, 1 0, 1 323. ξη 0 1 2 −1 0, 2 0, 1 0 0 0 0, 1 0, 1 2 0 0, 3 0, 2 324. ξη 0 1 −1 0, 3 0 0 0 0, 3 1 0 0, 4 2 0 0 0 325. Найти коэффициент корреляции между числом выпадений «единиц» и числом выпадений «шестерок» при одном бросании игральной кости. 326. Найти коэффициент корреляции между числом выпадений «единиц» и числом выпадений «шестерок» при n независимых бросаниях игральной кости. 327. Найти коэффициент корреляции между случайными величинами ξ и 7 − 4ξ; 5 − 2ξ и 5 + 3ξ. 328. Случайные величины ξ1 , ξ2 , ξ3 независимы, одинаково распределены и имеют конечную дисперсию. Найти коэффициент кор102 8.2 Числовые характеристики многомерной случайной величины реляции между случайными величинами ξ1 + ξ2 и ξ2 + ξ3 . 329. Случайные величины ξ1 , ξ2 , ξ3 , ξ4 , ξ5 независимы, одинаково распределены и имеют конечную дисперсию. Найти коэффициент корреляции между случайными величинами ξ1 + ξ2 + ξ3 + ξ4 и ξ2 + ξ3 + ξ4 + ξ5 . 330. Случайные величины ξ и η независимы и одинаково распределены с математическим ожиданием a и дисперсией σ 2 . Найти коэффициент корреляции случайных величин 2ξ + 3η, 2ξ − 3η. 331. Может ли двумерная случайная величина (ξ, η) иметь следующие характеристики: Dξ = 4, Dη = 6, cov (ξ, η) = 5? 332. Двумерная случайная величина (ξ, η) имеет характеристики: M ξ = 0, M η = 2, Dξ = 2, Dη = 1, 1 ρ = −√ . 2 Найти математическое ожидание и дисперсию случайной величины 2ξ − 3η. 333. Пусть ξ — случайная величина с симметричным относительно нуля распределением и конечной дисперсией. Найти коэффициент корреляции случайных величин ξ и |ξ|. 8.2. Числовые характеристики многомерной случайной величины Уравнение множественной линейной регрессии. Ковариационной матрицей случайных величин ξ1 , . . . , ξn называется матрица K размерности n × n с конечными элементами cov (ξi , ξj ): cov (ξ1 , ξ2 ) . . . cov (ξ1 , ξn ) σ12 cov (ξ2 , ξ1 ) σ22 . . . cov (ξ2 , ξn ) . K= (55) ... ... ... ... cov (ξn , ξ1 ) cov (ξn , ξ2 ) . . . σn2 Наряду с ковариационной матрицей рассматривают и корреляционную матрицу R, составленную из коэффициентов корреляции ρij = ρξi , ξj : 1 ρ12 ρ13 . . . ρ1n ρ21 1 ρ22 . . . ρ2n R= (56) ... ... ... ... ... . ρn1 ρn2 ρn3 . . . 1 103 8.2 Числовые характеристики многомерной случайной величины Корреляционная матрица R симметрична, (то есть ρij = ρji ). Рассмотрим случайные величины ξ0 , ξ1 , . . . , ξn с математическими ожиданиями M ξ0 = a0 , M ξi = ai , ai < ∞, i = 0, 1, . . . , n, дисперсиями Dξ0 = σ02 , Dξi = σi2 , i = 1, 2, . . . , n и корреляционной матрицей R. Уравнением линейной регрессии ξ0 на ξ1 , . . . , ξn называется уравнение ξb0 = b0 + b1 ξ1 + · · · + bn ξn , где bo , b1 , . . . , bn — параметры, минимизирующие остаточную дисперсию M (ξ0 − ξb0 )2 . Центрированная форма множественной линейной регрессии задается уравнением ξb0 = a0 + n X bi (ξi − ai ), (57) i=1 где |R0i | σ0 R0i σ0 · = (−1)i+1 (58) · . R00 σi |R00 | σi Здесь и далее через Rij обозначено алгебраическое дополнение элемента aij матрицы R, |Rij | — определитель Rij . 2 Остаточная дисперсия Sост = M (ξ0 − ξb0 )2 равна bi = − 2 Sост = σ02 · |R| . R00 (59) Виды коэффициентов корреляции. Частный коэффициент корреляции используется как мера линейной зависимости между двумя какими-либо случайными величинами из ξ1 , . . . , ξn после вычитания эффекта, обусловленного взаимодействием этих двух величин с некоторым непустым подмножеством из оставшихся n − 2 случайных величин. Пусть l и h — две какие-либо величины из набора ξ1 , . . . , ξn и c — некоторое непустое подмножество из оставшихся n − 2 величин. Определим величины τ1 = l − µl.c и τ2 = h − µh.c . Здесь µl.c = l(c) , µh.c = h(c) — 104 8.2 Числовые характеристики многомерной случайной величины соответственно условные ожидаемые значения l и h при данном c. Частный коэффициент корреляции между τ1 и τ2 при фиксированных значениях переменных из c есть ρlh.c = ρτ1 τ2 , (60) где ρτ1 τ2 — парный коэффициент корреляции между τ1 и τ2 . Если в c содержится k переменных, то соответствующий частный коэффициент корреляции называется коэффициентом k-го порядка. Частные коэффициенты корреляции могут быть вычислены на основе рекуррентных соотношений следующим образом: ρlh − ρld · ρhd , ρlh.d = p (1 − ρ2ld )(1 − ρ2hd ) (61) где все величины в правой части — парные коэффициенты корреляции. Далее, последовательно применяя рекуррентную формулу ρlh.c − ρld.c · ρhd.c ρlh.cd = p , (1 − ρ2ld.c )(1 − ρ2hd.c ) (62) где c — любое подмножество оставшихся переменных, можно получить частные коэффициенты корреляции любого порядка. При рассмотрении линейной регрессии ξ0 на ξ1 , . . . , ξn особое значение имеет частный коэффициент корреляции между ξ0 и ξi за вычетом влияния остальных n − 1 величин из набора ξ1 , . . . , ξn , исключая ξi . Он равен −R0i (−1)i+1 |R0i | ρ0i.1, ..., n = √ = p . (63) R00 Rii |R00 ||Rii | Множественным коэффициентом корреляции ρξ0 (ξ1 , ..., ξn ) называется парный коэффициент корреляции между ξ0 и линейной регрессией ξ0 на ξ1 , . . . , ξn . Этот коэффициент является мерой линейной зависимости между ξ0 и набором переменных (ξ1 , . . . , ξn ), причем 0 6 ρξ0 (ξ1 , ..., ξn ) 6 1. Нулевое значение множественного коэффициента корреляции указывает на отсутствие линейной зависимости, а значение 1 — на то, что переменная ξ0 точно равна линейной комбинации переменных ξ1 , . . . , ξn . Множественный коэффициент корреляции, как и парный, инвариантен относительно невырожденных линейных преобразований исходных переменных. Множественный коэффициент корреляции вычисляется с помощью корреляционной матрицы следующим образом: s |R| . (64) ρ0(1, ..., n) = 1 − |R00 | 105 8.2 Числовые характеристики многомерной случайной величины Пример 113. Для случайных величин ξ0 , ξ1 , ξ2 известна корреляционная матрица 1 0, 3 0, 9 R = 0, 3 1 0, 2 , 0, 9 0, 2 1 а также известны M ξ0 = 2, M ξ1 = 4, M ξ2 = 1, Dξ0 = 5, Dξ1 = 3, Dξ2 = 7. Найти уравнение линейной регрессии ξ0 на ξ1 , ξ2 и остаточную дисперсию. J Уравнение линейной регрессии ξ0 на ξ1 , ξ2 здесь запишется как ξb0 = M ξ0 + 2 X bi (ξi − M ξi ), (*) i=1 где bi = (−1)i+1 |R0i | σ0 · . |R00 | σi Вычислим параметры b1 , b2 . 0, 3 0, 9 √ √ 0, 2 1 |R | σ 5 0, 12 5 01 0 ·√ = b1 = (−1)1+1 = · · √ ≈ 0, 161. 1 0, 2 |R00 | σ1 3 0, 96 3 0, 2 1 |R | σ 02 0 2+1 b2 = (−1) · = − |R00 | σ2 0, 3 0, 9 √ √ 1 0, 2 5 −0, 84 5 ·√ =− · √ ≈ 0, 7395. 0, 96 1 0, 2 7 7 0, 2 1 Возвращаясь к (*), получим ξb0 = 2 + 0, 161(ξ1 − 4) + 0, 7395(ξ2 − 1) или, что то же, ξb0 = 0, 6165 + 0, 161ξ1 + 0, 7395ξ2 . Остаточная дисперсия равна 2 Sост = σ02 · |R| 0, 168 =5· ≈ 0, 875. I |R00 | 0, 96 106 8.2 Числовые характеристики многомерной случайной величины Пример 114. Для случайных величин ξ0 , ξ1 , ξ2 известна корреляционная матрица 1 0, 3 0, 9 R = 0, 3 1 0, 2 , 0, 9 0, 2 1 а также M ξ0 = 2, M ξ1 = 4, M ξ2 = 1, Dξ0 = 5, Dξ1 = 3, Dξ2 = 7. Найти частный коэффициент корреляции ρ01.2 и множественнный коэффициент корреляции ρ0(1, 2) . J Чтобы вычислить частный коэффициент корреляции ρ01.2 , воспользуемся формулой (63). 0, 3 0, 9 0, 2 1 0, 12 (−1)1+1 |R01 | = s ρ01.2 = p = √0, 96 · 0, 19 ≈ 0, 281. |R00 ||R11 | 1 0, 2 1 0, 9 0, 2 1 · 0, 9 1 А в нахождении множественного коэффициента корреляции ρ0(1, 2) нам поможет формула (64): s r |R| 0, 168 ρ0(1, 2) = 1 − = 1− ≈ 0, 908. I |R00 | 0, 96 Задачи 334. Может ли матрица K быть ковариационной матрицей? 10 11 K= . 11 12 335. По заданной ковариационной матрице K найти корреляционную матрицу R. 9 8 10 K = 8 16 18 . 10 18 25 336. По заданной корреляционной матрице R и известным дисперсиям случайных величин Dξ1 = 4, Dξ2 = 9, Dξ3 = 16 найти ковариационную матрицу K. 1 −0, 4 0, 9 R = −0, 4 1 −0, 5 . 0, 9 −0, 5 1 107 8.2 Числовые характеристики многомерной случайной величины В задачах 337—338 для случайных величин ξ0 , ξ1 , ξ2 известна корреляционная матрица R, а также M ξ0 , M ξ1 , M ξ2 , Dξ0 , Dξ1 , Dξ2 . Найти: а) уравнение линейной регрессии ξ0 на ξ1 , ξ2 ; б) остаточную дисперсию. 337. 338. 1 0, 2 0, 6 R = 0, 2 1 0, 4 , 0, 6 0, 4 1 M ξi = i, Dξi = i + 1, i = 0, 1, 2. 1 −0, 1 0, 5 R = −0, 1 1 0, 7 , 0, 5 0, 7 1 M ξi = 0, Dξi = 1, i = 0, 1, 2. В задачах 339—340 для случайных величин ξ0 , ξ1 , ξ2 известна корреляционная матрица R, а также M ξ0 , M ξ1 , M ξ2 , Dξ0 , Dξ1 , Dξ2 . Найти: а) уравнение линейной регрессии ξ2 на ξ0 , ξ1 ; б) остаточную дисперсию. 339. 340. 1 −0, 4 0, 9 1 −0, 5 , R = −0, 4 0, 9 −0, 5 1 M ξ0 = 1, M ξ1 = M ξ2 = 2, Dξ0 = 4, Dξ1 = Dξ2 = 1. 1 0, 5 0, 8 R = 0, 5 1 0, 7 , 0, 8 0, 7 1 M ξ0 = 0, M ξ1 = 1, M ξ2 = 3, Dξ0 = 1, Dξ1 = 4, Dξ2 = 9. 341. По заданной ковариационной матрице K найти уравнение линейной регрессии ξ0 на ξ1 , ξ2 и остаточную дисперсию, если 4 −2, 4 7, 2 K = −2, 4 9 −6 ; 7, 2 −6 16 108 8.2 Числовые характеристики многомерной случайной величины M ξ0 = 1, M ξ1 = 2, M ξ2 = 2. 342. По заданной ковариационной матрице K найти все частные коэффициенты корреляции. 9 8 10 K = 8 16 18 . 10 18 25 В задачах 343—344 для случайных величин ξ0 , ξ1 , ξ2 известна корреляционная матрица R. Найти: а) частный коэффициент корреляции ρ01.2 ; б) множественнный коэффициент корреляции ρ0(1, 2) . 343. 344. 1 0, 2 0, 6 R = 0, 2 1 0, 4 . 0, 6 0, 4 1 1 −0, 1 0, 5 1 0, 7 . R = −0, 1 0, 5 0, 7 1 В задачах 345—346 известна корреляционная матрица R случайных величин ξ0 , ξ1 , ξ2 . Найти: а) частный коэффициент корреляции ρ21.0 ; б) множественнные коэффициенты корреляции ρ0(1, 2) и ρ2(1, 0) . 345. 346. 1 −0, 4 0, 9 R = −0, 4 1 −0, 5 . 0, 9 −0, 5 1 1 0, 5 0, 8 R = 0, 5 1 0, 7 . 0, 8 0, 7 1 109 9. Условные распределения 9.1. Условные законы распределения Условная функция распределения определяется как Ry Fη/ξ=x (y) = fξ,η (x, y) dy −∞ fξ (x) (65) , где fξ (x) — частная плотность распределения, причем Z∞ fξ (x) = fξ,η (x, y) dy −∞ Условная плотность распределения fη/ξ=x (y) = ∂Fη/ξ=x (y) fξ,η (x, y) = . ∂y fξ (x) Условное математическое ожидание Z∞ Z∞ y dF (y/x) = M (η/x) = M (η/ξ = x) = −∞ yfη/ξ=x (y) dy. (66) −∞ Для дискретной случайной величины условное математическое ожидание равно X M (η/x) = yi p (η = yi /ξ = x). (67) i Пример 115. Дискретная двумерная случайная величина (ξ, η) задана таблицей распределения: ξη −1 0 1 0 0, 1 0, 1 0 1 0 0, 3 0 2 0 0, 1 0, 4 Найти условные законы распределения η/ξ = 0 и ξ/η = 0. 110 9.1 Условные законы распределения J Легко видеть, что η /ξ = 0 −1 0 p 0, 5 0, 5 ξ /η = 0 0 1 2 I p 0, 2 0, 6 0, 2 Пример 116. Случайная величина (ξ, η) распределена равномерно в треугольнике {(x, y) : 0 < y < 1 − |x|}. Найти fξ, η (x, y), fξ (x), fη (y), fξ/η=y (x), fη/ξ=x (y). J Обозначим через T множество точек (x, y), лежащих в треугольнике: y 1 T = {(x, y) : 0 < y < 1 − |x|}. T −1 x 1 0 Поскольку случайная величина (ξ, η) распределена в T равномерно, fξ, η (x, y) = 1 1 = = 1, S (T ) 1 (x, y) ∈ T. Рис. 11. Найдем одномерные функции распределения случайных величин η и ξ, пользуясь формулами (36) и (35) соответственно. Z∞ fξ,η (x, y) dy = fξ (x) = −∞ = x+1 R 0 1−x R dy = x + 1 при −1 < x 6 0, = 1 − |x|. dx = −x + 1 при 0 < x < 1 0 Z1−y dx = 1 − y − (−1 + y) = 2 − 2y. fη (y) = −1+y Вычислим условные плотности распределения η/ξ = x и ξ/η = y. fη/ξ=x (y) = fξ/η=y (x) = 1 fξ, η (x, y) = , fξ (x) 1 − |x| fξ, η (x, y) 1 = , fη (y) 2(1 − y) (x, y) ∈ T ; (x, y) ∈ T. I 111 9.1 Условные законы распределения Задачи В задачах 347—350 дана совместная плотность распределения fξ, η (x, y) двумерной случайной величины (ξ, η). Найти обе условные плотности fη/ξ=x (y) и fξ/η=y (x). 1 1 · . π 2 1 + x2 + y 2 + x2 y 2 −(x2 +y 2 ) 348. fξ, η (x, y) = 4xye , x > 0, y > 0. 1/3 при 0 6 x 6 3, 0 6 y 6 1; 349. fξ, η (x, y) = 0 — иначе. cos x · cos y при 0 6 x 6 π/2, 0 6 y 6 π/2; 350. fξ, η (x, y) = 0 — иначе. 347. fξ, η (x, y) = В задачах 351—354 найти условные плотности fη/ξ=x (y) и fξ/η=y (x). 351. Двумерная случайная величина (ξ, η) представляет из себя координаты точки, случайно выбранной в квадрате [0, 1] × [0, 1]. 352. Точку (ξ, η) случайно выбирают в круге радиуса R. 353. Двумерная случайная величина (ξ, η) равномерно распре2 2 делена в эллипсе xa2 + yb2 = 1. 354. Двумерная случайная величина (ξ, η) равномерно распределена в треугольнике D = {(x, y) : x > 0, y > 0, x + y 6 2.} 355. Случайные величины ξ и η независимы и одинаково распределены: p (ξ = m) = p (η = m) = (1 − p)m−1 p, m = 1, 2, . . . Найти: а) p (ξ = η); б) p (ξ > η); в) p (ξ < η); г) p (ξ = k/ξ > η); д) p (ξ = k/ξ < η); е) p (ξ = k/ξ = η). 356. Случайная величина ξ имеет геометрическое распределение. Найти p (ξ = n + k/ξ > k), k, n = 0, 1, . . . 357. Случайные величины ξ и η независимы и имеют одно и тоже геометрическое распределение. Найти p (ξ = k/ξ + η = n), k = 0, 1, . . . , n. 358. Случайные величины ξ и η независимы и имеют распределения Пуассона с параметрами λ1 , λ2 . Найти p (ξ = k/ξ + η = n), k = 0, 1, . . . , n. 112 9.2 Регрессия 9.2. Регрессия Регрессией η на ξ называется случайная величина r (ξ), равная условному математическому ожиданию случайной величины η относительно ξ r (ξ) = M (η/ξ). (68) Линия регрессии — кривая y = r (x), где r (x) = M (η/ξ = x). Основное свойство регрессии. Регрессия r (ξ) минимизирует среднеквадратичное отклонение: min M (η − g(ξ))2 = M (η − r(ξ))2 . g (69) 2 Корреляционным отношением θη, ξ называется выражение M (r (ξ) − M η)2 . = ση2 2 θη, ξ (70) Свойства корреляционного отношения. 2 1. 0 6 θη, ξ 6 1. 2 2 2. θη, ξ >ρ . 2 2 3. θη, ξ = ρ ⇐⇒ r (ξ) = âξ + b̂. 2 4. θη, ξ = 0 ⇐⇒ r (ξ) = b = const. Пример 117. Дискретная двумерная случайная величина (ξ, η) задана таблицей распределения ξη 0 1 2 −1 0 1 0 0, 1 0 0, 3 0 0 0, 2 0 0, 4 Найти регрессию r(ξ). J Найдем условные законы распределения η/ξ. η /ξ = 0 p −1 0 1 0 1 0 M (η/ξ = 0) = 0. 113 9.2 Регрессия η /ξ = 1 p −1 0 1 1 0 0 M (η/ξ = 1) = −1. η /ξ = 2 p −1 0 1 1/3 0 2/3 M (η/ξ = 2) = 1/3. 0 при ξ = −1, r (ξ) = −1 при ξ = 0, 1/3 при ξ = 1. Запишем ряд распределения r (ξ), пользуясь тем, что r (ξ) принимает значение 0 ровно тогда, когда ξ = 0, следовательно, p (r (ξ) = 0) = p (ξ = 0); и аналогичными утверждениями для r (ξ) = −1 и r (ξ) = 1/3. r (ξ) p 0 −1 1/3 I 0, 1 0, 3 0, 6 Пример 118. Дан закон распределения случайной величины (ξ, η). 2 Найти корреляционное отношение θη, ξ. ηξ 10 20 30 1 0, 2 0, 3 0 2 0 0, 2 0, 1 3 0, 1 0 0, 1 J Найдем условные законы распределения η/ξ. η/ξ = 10 1 2 3 p 2/3 0 1/3 M (η/ξ = 10) = 1 · 2 1 5 +3· = . 3 3 3 η/ξ = 20 1 2 3 p 3/5 2/5 0 M (η/ξ = 20) = 1 · 3 4 4 +2· = . 5 5 5 114 9.2 Регрессия η/ξ = 30 1 2 3 p 0 1/2 1/2 1 1 5 +3· = . 2 2 2 Теперь вычислим регрессию η на ξ. 5/3 при ξ = 10, r (ξ) = 7/5 при ξ = 20, 5/2 при ξ = 30. M (η/ξ = 30) = 2 · Так как r (ξ) принимает значение 5/3 ровно тогда, когда ξ = 10, p (r (ξ) = 5/3) = p (ξ = 10). Аналогичное утверждение справедливо для r (ξ) = 7/5 и r (ξ) = 5/2, следовательно, ряд распределения r (ξ) запишется следующим образом. r (ξ) 5/3 7/5 5/2 p 0, 3 0, 5 0, 2 Из формулы (70) следует, что для нахождения корреляционного отношения необходимо вычислить M η и ση2 . Запишем ряд распределения случайной величины η. η 1 2 3 p 0, 5 0, 3 0, 2 M η = 1, 7; M η 2 = 3, 5; ση2 = Dη = 0, 61. M (r (ξ) − M η)2 = = 0, 3 · (5, 3 − 1, 7)2 + 0, 5 · (7/5 − 1, 7)2 + 0, 2 · (5/2 − 1, 7)2 = 0, 173(3). Итак, 2 θη, ξ = 0, 173(3) ≈ 0, 284. I 0, 61 Задачи В задачах 359—361 заданы совместные законы распределения двумерных случайных величин (ξ, η). Требуется найти: а) регрессии η на ξ и ξ на η; б) корреляционные отношения η на ξ и ξ на η. 115 9.2 Регрессия 359. ξ\η 1 −2 0 0 0, 1 2 0 4 0 2 3 0, 2 0 0, 2 0, 1 0, 1 0, 1 0, 1 0, 1 360. ξ\η 0 1 2 −1 0, 2 0, 1 0 0 0 0, 1 0, 1 2 0 0, 3 0, 2 361. ξ\η −1 0 1 0 1 0, 3 0 0 0, 3 0 0, 4 2 0 0 0 362. Может ли двумерная случайная величина (ξ, η) иметь следующие характеристики: Dξ = 4, Dη = 16, cov (ξ, η) = 4, 2 θξ,η = 0, 2? 116 10. Закон больших чисел, центральная предельная теорема 10.1. Неравенства и закон больших чисел Неравенство Маркова. Для любой случайной величины ξ и для любых k > 0, ε > 0 M |ξ|k p (|ξ| > ε) 6 . εk Неравенство Чебышева. Для любой случайной величины ξ и для любого ε > 0 Dξ p (|ξ − M ξ| > ε) 6 2 . ε p Последовательность {ξn } сходится по вероятности к ξ (ξn → ξ), если для любого ε > 0 lim p (|ξn − ξ| > ε) = 0. n→∞ Пусть ϕ(x) — непрерывная функция. Тогда, если последовательность {ξn } сходится по вероятности к ξ, то и последовательность {ϕ(ξn )} сходится по вероятности к ϕ(ξ): p p ξn → ξ ⇒ ϕ(ξn ) → ϕ(ξ). Закон больших чисел. Говорят, что для последовательности случайных величин {ξn } с математическими ожиданиями M ξi = ai , ai < ∞ и дисперсиями Dξi = σi2 , i = 1, 2, . . . выполняется закон больших чисел, если n n P P ξi ai p i=1 i=1 → . n n Согласно определению сходимости по вероятности, это означает, что для любого ε > 0 Pn Pn i=1 ξi a i i=1 > ε = 0. lim p − n→∞ n n Закон больших чисел в форме Чебышева. Если ξ1 , ξ2 , . . . – последовательность независимых случайных величин, дисперсии которых ограничены в совокупности σi2 6 C = const, i = 1, 2, . . . , то для нее выполняется закон больших чисел: n n P P ai ξi p i=1 i=1 → . n n 117 10.2 Центральная предельная теорема Закон больших чисел в форме Бернулли. Пусть осуществляется серия из n независимых опытов, проводимых по схеме Бернулли с параметром p. Пусть m – число успехов, m n – частота успехов в данной серии испытаний. Тогда m p → p. n Закон больших чисел в форме Пуассона. Пусть осуществляется серия из n независимых опытов, причем вероятность успеха в k-м опыте равна pk . Пусть m – число успехов, m n – частота успехов в данной серии испытаний. Тогда n P pk m p k=1 → . n n Закон больших чисел в форме Хинчина. Пусть ξ1 , ξ2 , . . . – последовательность независимых одинаково распределенных случайных величин с M ξn = a. Тогда n P ξk p k=1 → a. n Закон больших чисел в форме Маркова. Пусть последовательность случайных величин ξ1 , ξ2 , . . . такова, что ! n X 1 D ξi → 0 при n → ∞. n2 i=1 Тогда n P k=1 n n P ξk p → M ξk k=1 n . 10.2. Центральная предельная теорема Центральная предельная теорема для независимых одинаково распределенных случайных величин. Если случайные величины ξ1 , ξ2 , . . . независимы, одинаково распределены и имеют конечные математические ожидания и дисперсии M ξi = a, Dξi = σ 2 , то при n → ∞ P n ξ − na i=1 i → Φ(x), √ < x P σ n где Φ(x) – функция стандартного нормального распределения. 118 10.2 Центральная предельная теорема Задачи 363. Пусть ξ такова, что p(0 < ξ < 1) = 1. Доказать, что Dξ < M ξ. 364. Пусть ξ, η независимы и имеют конечные дисперсии. Доказать, что Dξη > Dξ · Dη. 365. Пусть ξ, η имеют конечные дисперсии. Доказать, что p p p p ( Dξ − Dη)2 6 D(ξ + η) 6 ( Dξ + Dη)2 . 366. Среднее потребление энергии за месяц равно 360000 квт·ч. Оценить вероятность того, что среднее потребление энергии за месяц превзойдет 1000000 квт·ч. Оценить эту же вероятность, если известно, что среднее квадратичное отклонение равно 40000 квт·ч. 367. Оценить вероятность того, что частота появления герба при ста бросаниях монеты отклонится от вероятности не более, чем на 0,1; сравнить с вероятностью, полученной с помощью применения интегральной теоремы Муавра-Лапласа. В задачах 368–373 исследовать последовательность независимых случайных величин {ξn }, заданных законами распределения на cходимость по вероятности. 368. ξn 1 0 1 p 1 − √n √1n 369. ξn p 370. 0 1 nα 1 1 − n1α √ ξn − n 0 1 p 1− n √ 2 n n 1 n 371. ξn −nα 0 nα 1 p 1 − n12 2n1 2 2n2 119 10.2 Центральная предельная теорема 372. √ √ ξn − ln n ln n 1 1 p 2 2 373. ξn en 0 1 p n 1− p 1 n p 374. Пусть ξn −→ a, ηn −→ b. Доказать, что p ξn + ηn −→ a + b. В задачах 375–382исследовать, подчиняется ли закону больших чисел последовательность независимых случайных величин ξ1 , ξ2 , . . . , заданных законами распределения. 375. ξn 0 1 . 1 p 1 − √2 √12 376. ξn p 377. 0 1 n3 1 . 1 − n13 √ ξn − n 0 1 p 1− n √ 2 n n 1 n . 378. ξn −3n 0 2n . p 2n1 2 1 − n12 2n1 2 379. √ √ ξn − ln n ln n . 1 1 p 2 2 380. ξn 0 p 1− 381. 2n 1 n 1 n . ξn 0 2n . p n1 1 − n1 120 10.2 Центральная предельная теорема 382. ξn 100 1000 . p 1/2 1/2 383. Дисперсия каждой из 4500 независимых, одинаково распределенных случайных величин равна 5. Найти вероятность того, что среднее арифметическое этих случайных величин отклонится от своего математического ожидания не более чем на 0,04. 384. Случайная величина η является средней арифметической 3200 независимых и одинаково распределенных случайных величин с математическим ожиданием, равным 3, и дисперсией, равной 2. Найти вероятность того, что η примет значение в промежутке (2,95; 3,075). 385. В результате медицинского осмотра 900 призывников установлено, что средний вес призывников на 1,2 кг больше веса призывников за один из предшествующих периодов. Можно ли это отклонение объяснить случайностью, если среднее квадратическое отклонение веса призывников равно 8 кг? 386. Случайная величина η является средней арифметической независимых и одинаково распределенных случайных величин, дисперсия каждой из которых равна 5. Сколько нужно взять таких величин, чтобы случайная величина η с вероятностью, не меньшей 0,9973, имела отклонение от своего математического ожидания, не превосходящее 0,01? 387. Случайная величина η является средней арифметической независимых и одинаково распределенных случайных величин, среднее квадратическое отклонение каждой из которых равно 2. Какое максимальное отклонение величины η от ее математического ожидания можно ожидать с вероятностью, не меньшей 0,9544? 388. Найти приближенное значение для вероятности того, что число успехов при n = 100 испытаниях Бернулли с вероятностью успеха = 0, 4 лежит в пределах 35 и 45; 38 и 53. При каких значениях n вероятность того, что частота успеха находится в пределах [0, 35, 0, 45], будет больше 0,998? 389. В условиях предыдущей задачи каково должно быть число испытаний n, чтобы с вероятностью 1 − α частота успеха отличалась от вероятности успеха не более, чем на ε > 0? Решить задачу при α = 0, 05, ε = 0, 01. 390. Цех завода производит шарики для подшипников. За смену производится n = 20000 шариков. Вероятность того, что один ша121 10.2 Центральная предельная теорема рик окажется дефектным, равна 0,01. Причины дефектов для отдельных шариков независимы. Продукция проходит контроль сразу после изготовления, причем дефектные шарики бракуются и ссыпаются в бункер, а небракованные отправляются в цех сборки. Определить, на какое количество шариков должен быть рассчитан бункер, чтобы с вероятностью 0,99 после смены он не оказался переполненным. 391. Условия предыдущей задачи изменены в том отношении, что причины брака являются в значительной степени общими для различных шариков, так что вероятность одному шарику, изготовленному в течение данной смены, быть дефектным, при условии, что другой шарик (любой) уже был дефектным, равна 0,08. Считаем, что известно, что закон распределения суммарного числа дефектных шариков является приближенно нормальным. 122 11. Случайная выборка 11.1. Основные понятия Генеральная совокупность рассматривается как случайная величина ξ, а выборкаX = (X1 , . . . , Xn ) — как n-мерная случайная величина (ξ1 , . . . , ξn ), компоненты которой независимы и одинаково распределены (так же, как ξ). Статистическая модель hFi — это класс допустимых функций распределения исходной случайной величины. Если функции распределения из класса hFi заданы с точностью до значений параметра θ с множеством возможных значений Θ, то такая модель обозначается hFθ i и называется параметрической. Если модель hFθ i такова, что можно дифференцировать по θ интегралы на выборчном пространстве X , меняя порядок дифференцирования и интегрирования, то она называется регулярной. Одно из наиболее существенных условий регулярности — то, что выборочное пространство X не должно зависеть от параметра θ. Вариационный ряд конкретной реализации выборки x = (x1 , . . . , xn ) — последовательность упорядоченных по возрастанию значений x∗1 , x∗2 , . . . , x∗n (x∗1 6 x∗2 6 . . . 6 x∗n ). Если через Xk∗ обозначить случайную величину, которая для каждой реализации x выборки X принимает значение x∗k , k = 1, . . . , n, то Xk∗ называется k-ой порядковой статистикой выборки, а X1∗ и Xn∗ – экстремальными значениями выборки. Порядковые статистики удовлетворяют неравенствам X1∗ 6 X2∗ 6 . . . 6 Xn∗ . Последовательность X1∗ , X2∗ , . . . , Xn∗ называют вариационным рядом выборки. Эмпирической функцией распределения Fn (x), соответствующей выборке X, называется случайная функция от x, вычисляемая по формуле νn Fn (x) = , n где νn — число элементов выборки X = (X1 , . . . , Xn ), значения которых меньше x. Пример 119. Какая статистическая модель применима для выборки, полученной следующим образом: 10 раз измерялось число вызовов ξ, поступающих оператору АТС в течение минуты? J Поскольку число абонентов АТС велико, а вероятность для каждого из них позвонить в данную минуту мала, можно применить модель пуассоновского распределения hPλ i. I 123 11.1 Основные понятия Пример 120. Какая статистическая модель применима для выборки цен на один и тот же товар в 100 различных магазинах в один и тот же момент времени? J Поскольку выборка достаточно велика, то можно пробовать применить нормальную модель hN (a, σ)i. Если при этом цены меняются мало, возможно и применение равномерной модели. I Пример 121. По данной выборке X = (2, 1, 1, 2, −1, 2, 2, 4, 1) построить вариационный ряд, найти эмпирическую функцию распределения. J Для нахождения вариационного ряда надо упорядочить элементы выборки по возрастанию: X ∗ = (−1, 1, 1, 1, 2, 2, 2, 2, 4). 0 при x 6 −1, 1/9 при −1 < x 6 1, 4/9 при 1 < x 6 2, F9 (x) = 8/9 при 2 < x 6 4, 1 при x > 4. I Задачи 392. Какая статистическая модель применима для выборки, полученной следующим образом: 10 раз измерялось число попаданий в цель при трех независимых выстрелах, произведенных одним и тем же стрелком? 393. Какая статистическая модель применима для выборки, полученной следующим образом: 8 раз измерялось число черных шаров, вынутых за три вынимания с возвращением из урны, которая содержит два белых и два черных шара? 394. Какая статистическая модель применима для выборки, полученной следующим образом: у 100 студенток первого курса измерен рост? 395. Какая статистическая модель применима для выборки, полученной измерением на 10 опытных делянках урожайности культуры, если известно, что урожайность культуры составляет 35 центнеров с гектара? 396. Какая статистическая модель применима для выборки, полученной измерением 100 раз времени ожидания автобуса? 124 11.2 Группировка выборки. Графические характеристики В задачах 397–400 по данной выборке X = (X1 , . . . , Xn ) построить вариационный ряд, найти эмпирическую функцию распределения. 397. X = (1, 1, 2, 1, 2, 4). 398. X = (−1, 1, 2, 1, 2, 3, 4, 1). 399. X = (1, 0, 0, 2, 2, 1). 400. X = (5, 6, 1, 4, 5, 7, 3, 5, 5, 6). 401. Дан статистический ряд величины X: X 0 2 4 6 . ni 3 8 10 2 Построить вариационный ряд. 402. Можно ли восстановить по эмпирической функции распределения, приведенной на рис. 12, вариационный ряд, если n = 60? Можно ли восстановить выборку? 403. Существует ли выборка (X1 , . . . , Xn ) объёма 10 с графиком эмпирической функции распределения, изображённым на рис. 12? Какому условию должен удовлетворять объём выборки? 404. Пусть на рис. 12 представлен график эмпирической функции распределения выборки (X1 , . . . , Xn ). Нарисуйте график эмпирической функции распределения выборки а) (X1 + 2, . . . , Xn + 2); б) (2X1 , . . . , 2Xn ). Fn∗ (x) 1 6 - 1 2 3 4 5 6 x Рис. 12. Эмпирическая функция распределения 11.2. Группировка выборки. Графические характеристики Метод группировки выборки объема n. Число интервалов k реmin . комендуется брать из условия 2k−1 ∼ n. Длина интервала h = xmax −x k Границы интервалов группировки: x0 = xmin , xi = x0 + hi, i = 1, ..., k, далее подсчитываается, сколько элементов выборки попало в каждый интервал, и в группировочной таблице заполняется столбец "Численность ni ". Остальные столбцы рассчитываются по столбцу численностей. Они приго- 125 11.2 Группировка выборки. Графические характеристики дятся при построении графических характеристик. ni Pi nj № ni nni nh 1 n 1 [x0 − x1 ) 2 [x1 − x2 ) ... ... Таблица 1. Таблица группировки Гистограмма — это фигура, состоящая из прямоугольников, построенных на интервалах группировки как на основаниях, и имеющих плоni . Полигон — это щади nni , для чего берут высоту прямоугольника равную nh ломаная линия, проходящая через середины верхних границ прямоугольni , где x∗i — середина i−го ников гистограммы (соединяющая точки (x∗i ; nh интервала). Полигон и гистограмма являются статистическими аналогами теоретической плотности. Для удобства при построении можно брать еди1 ницу масштаба, равную nh . Кумулята — это ломаная линия, соединяющая i−1 P nj точки (xi ; n ). Кумулята дает представление о графике функции распределения. 1 Пример 122. Произвести группировку выборки: 87, 8 104, 5 90, 9 92, 4 86, 3 85, 0 75, 0 91, 5 100, 4 109, 7 52, 7 96, 6 91, 6 84, 2 108, 6 77, 5 103, 8 84, 5 90, 6 113, 5 96, 8 111, 5 103, 8 106, 8 89, 4 84, 7 93, 4 101, 3 100, 9 81, 3 96, 1 84, 6 89, 4 90, 9 89, 6 66, 5 111, 7 90, 2 87, 9 81, 1 80, 4 77, 7 79, 3 96, 2 84, 2 93, 2 112, 7 86, 8 82, 6 89, 1 88, 9 97, 9 74, 3 105, 7 87, 6 89, 2 101, 1 80, 5 118, 7 86, 3 120, 4 88, 1 94, 1 79, 8 78, 0 71, 7 75, 0 92, 0 76, 0 82, 2 112, 4 80, 8 74, 5 86, 6 95, 8 101, 4 103, 4 90, 6 88, 0 79, 9 82, 6 90, 0 86, 1 80, 3 92, 8 113, 7 94, 3 90, 7 70, 7 93, 5 91, 8 82, 2 86, 9 100, 3 100, 1 99, 3 105, 0 92, 7 96, 7 82, 8 83, 7 84, 6 80, 7 102, 3 104, 2 100, 4 86, 8 70, 4 91, 9 98, 3 103, 3 85, 0 69, 1 82, 2 101, 8 87, 6 104, 2 81, 4 81, 6 115, 7 89, 8 88, 1 110, 9 109, 0 84, 8 87, 5 68, 1 107, 7 95, 5 88, 6 J 1. Упорядочим выборку (получим вариационный ряд). 126 11.2 Группировка выборки. Графические характеристики 52, 7 66, 5 68, 1 69, 1 70, 4 70, 7 71, 7 75, 0 76, 0 77, 5 77, 7 78, 0 79, 3 79, 8 80, 5 80, 7 80, 8 81, 1 81, 3 81, 4 81, 6 82, 6 82, 6 82, 8 83, 7 84, 2 84, 2 84, 5 84, 8 85, 0 85, 0 86, 1 86, 3 86, 3 86, 6 87, 5 87, 6 87, 6 87, 8 87, 9 88, 0 88, 1 89, 1 89, 2 89, 4 89, 4 89, 6 89, 8 90, 0 90, 7 90, 9 90, 9 91, 5 91, 6 91, 8 91, 9 92, 8 93, 2 93, 4 93, 5 94, 1 94, 3 95, 5 96, 6 96, 7 96, 8 97, 9 98, 3 99, 3 100, 1 100, 9 101, 1 101, 3 101, 4 101, 8 102, 3 103, 3 104, 2 104, 2 104, 5 105, 0 105, 7 106, 8 107, 7 110, 9 111, 5 111, 7 112, 4 112, 7 113, 5 113, 7 74, 3 79, 9 82, 2 84, 6 86, 8 88, 1 90, 2 92, 0 95, 8 100, 3 103, 4 108, 6 115, 7 74, 5 80, 3 82, 2 84, 6 86, 8 88, 6 90, 6 92, 4 96, 1 100, 4 103, 8 109, 0 118, 7 75, 0 80, 4 82, 2 84, 7 86, 9 88, 9 90, 6 92, 7 96, 2 100, 4 103, 8 109, 7 120, 4 2.Минимальный элемент выборки равняется xmin = 52, 7, а максимальный xmax = 120, 4. Определим сначала число интервалов k. Рекомендуется брать k такое, k−1 что 2 ∼ n. В данном примере n = 130. 27 = 128 ∼ 130; k − 1 = 7, k = 8. Выберем число интервалов k = 8. 3. Определим длину интервала h. xmax − xmin . h= k Находим 120, 4 − 52, 7 ≈ 8, 4567. h= 8 4. Найдем границы интервалов группировки x0 = xmin , xi = x0 + hi, i = 1, ..., k: x0 = 52, 7, x1 = 61, 2, x2 = 69, 6, x3 = 78, 1, x4 = 86, 5, x5 = 95, 0, x6 = 103, 4, x7 = 111, 9, x8 = 120, 4. 5. Составим таблицу группировки и внесем границы интервалов в столбец «Интервал»: Pi nj № Интервал ni nni 1 n 1 [52, 7 − 61, 2) 2 [61, 2 − 69, 6) 3 [69, 6 − 78, 1) 4 [78, 1 − 86, 5) 5 [86, 5 − 95, 0) 6 [95, 0 − 103, 4) 7 [103, 4 − 111, 9) 8 [111, 9 − 120, 4) 127 11.2 Группировка выборки. Графические характеристики 6. Подсчитаем, сколько элементов выборки попало в каждый интервал и заполним в таблице столбец «Численность ni »: Pi nj № Интервал ni nni 1 n 1 [52, 7 − 61, 2) 1 2 [61, 2 − 69, 6) 3 3 [69, 6 − 78, 1) 11 4 [78, 1 − 86, 5) 31 5 [86, 5 − 95, 0) 40 6 [95, 0 − 103, 4) 22 7 [103, 4 − 111, 9) 15 8 [111, 9 − 120, 4) 7 По столбцу численностей рассчитаем остальные столбцы таблицы: Pi nj ni № Интервал ni 1 n n 1 [52, 7 − 61, 2) 1 0, 008 0, 008 2 [61, 2 − 69, 6) 3 0, 023 0, 031 3 [69, 6 − 78, 1) 11 0, 085 0, 115 4 [78, 1 − 86, 5) 31 0, 238 0, 354 5 [86, 5 − 95, 0) 40 0, 308 0, 662 6 [95, 0 − 103, 4) 22 0, 169 0, 831 7 [103, 4 − 111, 9) 15 0, 115 0, 946 8 [111, 9 − 120, 4) 7 0, 054 1 I Задачи 405. Произвести группировку выборки: 20, 2; 19, 2; 16, 9; 19, 3; 17, 1; 17, 8; 16, 6; 16, 3; 15, 2; 18, 0; 16, 8; 20, 0; 17, 7; 16, 6; 19, 0; 17, 5; 17, 8; 20, 6; 17, 2; 18, 0; 17, 1; 18, 4; 17, 4; 15, 8; 19, 4; 17, 8; 19, 8; 19, 6; 16, 3; 20, 0; 17, 4; 19, 3; 19, 3; 16, 5; 18, 8; 17, 2; 18, 7; 18, 6; 19, 2; 16, 2; 18, 2; 17, 4. 406. По выборке, данной в виде статистического ряда, постройте гистограмму, полигон и кумуляту. X 0 − 6 6 − 12 12 − 18 18 − 24 . ni 1 8 10 6 128 11.2 Группировка выборки. Графические характеристики В задачах 407, 408постройте по выборке гистограмму и полигон, и по их виду подберите статистическую модель. 407. P ni ni ni № ni n nh n 1 0, 01 − 0, 98 260 0, 260 0, 252 0, 260 2 0, 98 − 1, 94 340 0, 340 0, 329 0, 600 3 1, 94 − 2, 91 192 0, 192 0, 186 0, 792 4 2, 91 − 3, 88 101 0, 101 0, 098 0, 893 5 3, 88 − 4, 85 63 0, 063 0, 061 0, 956 . 6 4, 85 − 5, 81 20 0, 020 0, 019 0, 976 7 5, 81 − 6, 78 16 0, 016 0, 015 0, 992 8 6, 78 − 7, 75 3 0, 003 0, 003 0, 995 9 7, 75 − 8, 72 4 0, 004 0, 004 0, 999 10 8, 72 − 9, 68 0 0, 000 0, 000 0, 999 11 9, 68 − 10, 65 1 0, 001 0, 001 1, 000 408. № 1 2 3 4 5 6 7 8 9 10 11 0, 00 − 0, 09 0, 09 − 0, 18 0, 18 − 0, 27 0, 27 − 0, 36 0, 36 − 0, 45 0, 45 − 0, 54 0, 54 − 0, 63 0, 63 − 0, 72 0, 72 − 0, 81 0, 81 − 0, 90 0, 90 − 0, 99 ni 80 81 93 85 87 87 87 106 99 89 106 ni n ni nh 0, 080 0, 081 0, 093 0, 085 0, 087 0, 087 0, 087 0, 106 0, 099 0, 089 0, 106 0, 007 0, 007 0, 008 0, 008 0, 008 0, 008 0, 008 0, 010 0, 009 0, 008 0, 010 P ni n 0, 080 0, 161 0, 254 0, 339 0, 426 . 0, 513 0, 600 0, 706 0, 805 0, 894 1, 000 409. По двумерной выборке найти выборочные распределения компонент, построить для каждой из них гистограмму и полигон, подобрать статистическую модель. XY [−0.9; 0) [0; 0.9) [0.9; 1.8) [1.8; 2.7) [2.7; 3.6) [3.6; 4.5) [4.5; 5.4] [−1.53; −0.75) 0 0 4 0 0 0 0 [−0.75; 0.03) 0 5 1 3 3 2 0 [0.03; 0.81) 0 2 6 7 6 0 1 [0.81; 1.59) 2 3 9 10 6 1 1 [1.59; 2.37) 0 0 4 5 4 4 1 [2.37; 3.15) 1 0 5 1 0 1 0 [3.15; 3.93) 0 0 0 0 1 1 0 129 11.2 Группировка выборки. Графические характеристики 410. Могут ли графики (1) и (2) (рис. 13) являться гистограммами одной и той же выборки? 6 6 8/75 0.1 0 1 2 3 4 5 6 7 8 9 10 x 0 1 2 3 4 5 6 7 8 9 10 x Рис. 13. Гистограммы (1) и (2) 411. Приведите (если это возможно) примеры выборок, для которых а) приведенный на рис. 13 график (1) является гистограммой, а график (2) не является; б) график (1) не является гистограммой, а график (2) является гистограммой. 130 12. Числовые характеристики выборки 12.1. Выборочные характеристики Пусть X = (X1 , . . . , Xn ) – выборка объема n из распределения F и x = (x1 , . . . , xn ) — наблюдавшееся значение X. Выборочным Pn начальным 1 моментом порядка k называют случайную величину ak = n i=1 Xik . Величину Pn a1 называют выборочным средним и обозначают символом X : X = центральным моментом порядка k называют случайi=1 Xi . ВыборочнымP 1 ную величину mk = n ni=1 (Xi − X)k , (см. табл. 2). При k = 2 величину m2 называют выборочной дисперсией и обозначают S 2 . Выборочную дисперсию часто рассчитывают по формуле 2 1 X 2 1X Xi − X̄ = Xi − X̄ 2 , n n 2 P 2 1 а исправленная выборочная дисперсия равна S = n−1 Xi − X̄ . Вы√ борочное среднеквадратичное отклонение S = S 2 . Теоретические характеристики Выборочные характеристики P a = Mξ X = n1 ni=1 Xi математическое ожидание выборочное среднее P 2 σ = Dξ S 2 = n1 ni=1 (Xi − X)2 дисперсия выборочная дисперсия P k αk = M ξ ak = n1 ni=1 Xik начальный k-й момент начальный выборочный k-й момент P µk = M (ξ − ξ)k mk = n1 ni=1 (Xi − X)k центральный k-й момент центральный выборочный k-й момент b = m33 A = σµ33 A S коэффициент асимметрии выборочный коэффициент асимметрии b = m44 − 3 E = σµ44 − 3 E S коэффициент эксцесса выборочный коэффициент эксцесса S2 = Таблица 2. Соответствие выборочных и теоретических характеристик Свойства выборочного среднего и выборочной дисперсии. M X = M ξ = α1 ; 1 µ2 σ2 DX = Dξ = = ; n n n (n − 1)µ2 (n − 1)σ 2 2 MS = == ; n n 131 12.1 Выборочные характеристики (n − 1)2 DS = n3 2 (n − 3) 2 µ . µ4 − n−1 2 Выборочной модой называется значение mo , чаще всего наблюдающееся: ni (m0 ) = max ni . i Выборочной медианой называется значение me , равное среднему члену вариационного ряда: me = x∗[ n ]+1 . 2 Выборочной квантилью порядка q, 0 < q < 1, называется значение xq , равное члену вариационного ряда с номером [nq] + 1. Нахождение выборочных медианы, моды и квантилей по группированной выборке. Медианным называется интервал, в котором накопленная сумма частот впервые достигает 12 . Выборочной группированной медианойназывается значение m∗e : m∗e = xe + n/2 − (n1 + . . . + nme −1 ) · h, nme где n — объем выборки, h — длина интервала группировки, xe — левая граница медианного интервала, ni — численность i-го интервала, nme — численность медианного интервала. Модальным называется интервал, имеющий наибольшую численность. Выборочной группированной модойназывается значение m∗0 : m∗0 = x0 + h · nm0 − nm0 −1 , 2nm0 − nm0 −1 − nm0 +1 где x0 — левая граница модального интервала, nm0 — численность модального интервала, nm0 −1, , nm0 +1 — численности интервалов слева и справа от модального. Квантильным порядка q интервалом называется интервал, в котором сумма накопленных частот впервые достигает значения q. Выборочной группированной квантилью называется значение x∗q : x∗q = x(q) + h · nq − (n1 + · · · + n(q)−1 , n(q) где x(q) — левая граница квантильного интервала, n(q) — численность квантильного интервала, n1 , · · · , n(q)−1 — численности интервалов, предшествующих квантильному. 132 12.1 Выборочные характеристики Пример 123. По выборке {3, 1, 2, 0, 2, 4} найти выборочное среднее и моду. J n 1X 12 1 X= Xi = (3 + 1 + 2 + 0 + 2 + 4) = = 2. n i=1 6 6 Выборочная мода mo = 2, так как значение «2» имеет наибольшую частоту. I Пример 124. По выборке {3, 1, 2, 0, 2, 4} найти выборочную дисперсию, выборочное среднеквадратичное отклонение и исправленную выборочную дисперсию. 10 5 (3 − 2)2 + (1 − 2)2 + 2 · (1 − 2)2 + (0 − 2)2 + (4 − 2)2 = = . 6 3 Другой способ нахождения S 2 : 1X 2 1 17 5 S2 = Xi − X̄ 2 = · 34 − 22 = −4= . n 6 3 3 √ Выборочное среднеквадратичное отклонение S = S 2 ≈ 1, 3. Исправленная выборочная дисперсия равна J S2 = 1 6 2 S = n 6 5 S 2 = · = 2. n−1 5 3 I Пример 125. По группированной выборке, полученной в примере (122) найти выборочную моду. Pi nj ni № Интервал ni 1 n n 1 [52, 7 − 61, 2) 1 0, 008 0, 008 2 [61, 2 − 69, 6) 3 0, 023 0, 031 3 [69, 6 − 78, 1) 11 0, 085 0, 115 4 [78, 1 − 86, 5) 31 0, 238 0, 354 5 [86, 5 − 95, 0) 40 0, 308 0, 662 6 [95, 0 − 103, 4) 22 0, 169 0, 831 7 [103, 4 − 111, 9) 15 0, 115 0, 946 8 [111, 9 − 120, 4) 7 0, 054 1 J Медианным является интервал № 5, так как в нем впервые накопленная 1 сумма частот, равная 0,662, достигает . 2 m∗e = 86, 5 + 130/2 − (1 + 3 + 11 + 31) · 8, 4567 ≈ 90, 517. 40 133 12.2 Статистики Задачи I 412. Выборочная дисперсия, рассчитанная по выборке объема 25, равна 9. Найдите исправленную выборочную дисперсию. 413. По выборке {1, 1, 2, 1, 2, 4} найти выборочную дисперсию. 414. По выборке {−1, 1, 2, 1, 2, 3, 4, 1} найти моду, выборочное среднеквадратичное отклонение. 415. По выборке {1, 0, 0, 2, 2, 1} найти выборочные центральные моменты 2-го и 3-го порядков. 416. Дан статистический ряд величины X: X 0 2 4 6 . ni 3 8 10 2 Найти выборочное среднее и выборочную дисперсию. 417. Дан статистический ряд величины X: X −1 0 1 2 . ni 5 7 4 1 найти выборочные начальные моменты 2-го и 3-го порядков. 418. Дан группированный статистический ряд величины Х: X 0 − 6 6 − 12 12 − 18 18 − 24 . ni 2 7 5 6 Найти приближенно моду, медиану, выборочную дисперсию. 419. Найти a3 по выборке (5, 6, 1, 4, 5, 7, 3, 5, 5, 6). 420. По эмпирической функции распределения найдите выборочное среднее. 0 при x 6 1, 1/3 при 1 < x 6 2, Fn (x) = 1/2 при 2 < x 6 3, 1 при x > 3. 12.2. Статистики Статистикой можно назвать любую функцию элементов выборки T (X) = T (X1 , . . . , Xn ), которая не зависит от параметров распределения. Распределением хи-квадрат χ2n с n степенями свободы называется гамма-распределение с параметрами α = 12 , β = n2 . 134 12.2 Статистики Сумма квадратов n независимых случайных величин, распределенных по нормальному закону N (0, 1), имеет распределение χ2n . Распределением Стьюдента Tn с n степенями свободы называется распределение случайной величины ξ tn = q χ2n n ξ = q Pn 2 i=1 ξi , n где ξ, ξi ∈ N (0, 1) и независимы. Распределением Фишера (Фишера–Снедекора, Fраспределением) с n, m степенями свободы называется распределение случайной величины fn,m = χ2n n . χ2m m Пусть X , . . . , Xn — выборка из распределения N (a, σ). Тогда 1) ве√1 (X−a) n nS 2 личина имеет нормальное распределение N (0, 1); 2) величина σ σ2 2 2 имеет распределение χn−1 ; 3) X, S независимы (теорема Фишера); t = √ n − 1 X−a S имеет распределение Tn−1 . Пусть X1 , . . . , Xn и Y1 , . . . , Ym – независимые выборки из распределения N (a, σ), а q X, Ȳ , S 2 (X), S 2 (Y ) – выборочные средние и дисперсии, тогда √ 2 X−Ȳ 2 имеет распределение Стьюдента с величина t = mn(m+n−2) m+n nS (X)+mS (Y ) m + n − 2 степенями свободы. Если же имеются две выборки X1 , . . . , Xn и Y1 , . . . , Ym из различных нормальных распределений N (a1 , σ1 ), N (a2 , σ2 ), то случайная величина 2 2 2 S (X) F = n(m−1)σ распределена по закону Фишера-Снедекора Fn−1, m−1 . В m(n−1)σ12 S 2 (Y ) частном случае, когда дисперсии совпадают, величина F не зависит от неизвестного параметра σ и имеет распределение Fn−1, m−1 . Пример 126. Найти распределение статистики Z: Z = X12 + X22 , X ∈ N (, 1). J Поскольку сумма квадратов n независимых случайных величин, распределенных по нормальному закону N (0, 1), имеет распределение χ2n , имеем распределение χ22 . I Пример 127. Найти распределение статистики Z: Z = 2X1 + 3X4 , X ∈ N (a, σ). 135 12.2 Статистики J Линейное преобразование нормально распределенной величины дает опять нормальное распределение. Сумма независимых нормально распределенных величин также распределена по нормальному закону. Параметры этого закона мы можем найти с помощью математического ожидания и дисперсии. M Z = 2M X1 + 3M X4 = 5a. DZ = 4DX1 + 9DX4 = 13σ 2 . √ Таким образом, Z ∈ N (5a, σ 13). I Задачи 421. Нарисовать на одном чертеже графики плотности распределения N (0, 1) и плотности распределения Стьюдента. 422. Нарисовать на одном чертеже графики плотности распределений Стьюдента Tn1 , Tn2 при n1 < n2 . 423. Доказать, что t2n = f1,n ; χ21 = u2 , где u ∈ N (0, 1). 424. Найти распределение статистик: Z1 = X1 , Z2 = X1∗ , X ∈ N (a, σ). 425. Найти распределение статистики Z = Xi −X, X ∈ N (a, σ). 426. Найти распределение статистики Z: Z= X1 + X 2 , X ∈ N (a, σ). 2 427. Найти распределение статистики Z = aX1 + bXn , X ∈ N (a, σ). 428. Найти распределение статистик: Z1 = Xn∗ ; Z2 = X1∗ , X ∈ R[a, b]. 429. Найти распределение статистики: Z1 = X1∗ , если выборка взята из совокупности с плотностью f (x) = eα−x , x > α. 430. Найти распределение статистики Z: Z = X − Y − (aX − aY ), X ∈ N (aX , σ), Y ∈ N (aY , σ), X и Y независимы. 431. Найти распределение статистики Z: 2 2 (n1 − 1)S X + (n2 − 1)S Y Z= , n1 + n2 − 2 X ∈ N (a1 , σ), Y ∈ N (a2 , σ), X и Y независимы. 432. Пусть X1 , . . . , Xn — выборка из распределения N (a, σ) и функция от выборочных среднего и дисперсии Z определена равен136 12.2 Статистики √ ством Z = n X−a . Докажите, что величина Z имеет распределение S̄ Tn−1 . 433. hF i — непрерывная модель. Найти распределение статистики n X G=− ln F (xi ). i=1 434. Доказать, что если s2 = 1 n n P (Xi − X̄)2 , то M s2 = i=1 n−1 2 n σ . 435. Найдите плотность распределения Стьюдента. 436. Найдите плотность распределения Фишера. 437. Найдите k-й начальный момент распределения Фишера. 137 13. Статистические оценки 13.1. Критерии качества оценок Выборочная числовая характеристика (статистика) θ̂ = g(X1 , . . . , Xn ), применяемая для оценивания неизвестного параметра θ генеральной совокупности, называется его точечной оценкой. Статистика θ̂ = g(X1 , . . . , Xn ) называется несмещенной оценкой для параметра θ, если ∀θ ∈ Θ M θ̂ = θ. Статистика θ̂ = g(X1 , . . . , Xn ) называется состоятельной оценкой θ, если ∀θ ∈ Θ p θ̂ −→ θ. Если α̂ – состоятельная оценка α, а f – непрерывная функция, то f (α̂) – состоятельная оценка f (α). Несмещенная оценка θb параметра θ называется оптимальной оцен∼ ∼ кой, если Dθb 6 Dθ, ∀θ ∈ Θ, где θ — произвольная несмещенная оценка θ. Информационным количеством Фишера называется величина I, равная 2 ∂ ln f (x1 , x2 , . . . , xn , θ) . I=M ∂θ В регулярной модели для дисперсий несмещенных оценок параметра θ справедливо неравенство Рао-Крамера: 1 Dθ̂ > . I Несмещенная оценка θ̂ параметра θ называется эффективной оценкой θ, если ∀θ ∈ Θ Dθ̂ = I1 . Эффективная оценка является оптимальной. Обратное, вообще говоря, не верно. Для проверки эффективности оценок удобно использовать следующие формулы информационного количества Фишера I: 2 ∂ ln f (x, θ) I = nM ; ∂θ 2 ∂ ln f (x, θ) I = −nM , ∂θ2 где f (x, θ) — одномерная плотность. Для дискретной случайной величины вместо f (x) используется p (ξ = x). 138 13.1 Критерии качества оценок Пример 128. Предположим, время, проведенное покупателем в магазине, имеет нормальное распределение N (a, σ) с неизвестными параметрами. Требуется оценить параметр a. Два стажера решают эту задачу так: первый отмечает время, проведенное в магазине для каждого покупателя, и находит среднее арифметическое. Второй (более ленивый) отмечает время только у десяти покупателей, выбранных случайно, и тоже находит среднее арифметическое. Будут ли эти оценки параметра а) несмещенными; б) состоятельными? J Оценка â1 , полученная первым стажером, представляет собой среднее выборочное X̄. Это несмещенная оценка, так как M â1 = M X̄ = n P 1 Xi = a. Найдем математическое ожидание оценки, полученной втоnM i=1 рым стажером: 10 X 1 M â2 = M Xi = a. 10 i=1 Таким образом, обе эти оценки несмещены. Проверим состоятельность. Заметим, что оценка â1 = X̄ зависит от n. â1 — состоятельная оценка a, если p â1 сходится по вероятности к a (â1 → a), то есть если для любого ε > 0 lim p (|â1 − a| > ε) = 0. n→∞ По неравенству Чебышева p (|â1 − a| > ε) 6 Dâ1 , ε2 (71) но как мы знаем, 1 µ2 σ2 DX̄ = Dξ = = . n n n Таким образом, правая часть (71) стремится к нулю, и оценка â1 состоятельна. Оценка â2 , полученная вторым стажером, не зависит от n и поэтому p (|â2 − a| > ε) тоже не зависит от n, соответственно, не может стремиться к нулю при стремлении n к бесконечности. Оценка â2 не является состоятельной. I Пример 129. Число поломок банкоматов имеет распределение Пуассона Pλ . Предлагается следующая оценка параметра λ : λ̂ = X̄. Доказать, что эта оценка эффективна. J Надо проверить выполнение равенства: 1 Dλ̂ = . I 139 13.1 Критерии качества оценок DX λ = . n n Для нахождения информационного количества Фишера I используем формулу: 2 ∂ ln p (ξ = x) I = −nM . ∂λ2 Dλ̂ = DX̄ = λx e−λ , то ln p (ξ = x) = x ln λ − λ − ln x! и Поскольку p (ξ = x) = pλ (x) = x! ∂ 2 ln p (ξ = x) x = − 2. 2 ∂λ λ Тогда x n I = −nM − 2 = . λ λ Получили, что Dλ̂ = I1 , то есть оценка X̄ является эффективной.I Задачи 438. Исследовать на несмещенность оценки параметров a, σ нормального распределения N (a, σ) : â = X̄, σb2 = s2 . 439. Исследовать на несмещенность оценку параметра λ распределения Пуассона Pλ : λ̂ = X. 440. Исследовать на несмещенность оценку параметра p биномиального распределения с параметрами N, p : Pn Xi X p̂ = i=1 = . nN N 441. Исследовать на несмещенность оценку параметра a нормального распределения N (a, σ) : â = 1/5(X1 + 2X2 + 3X3 ). 442. Исследовать на несмещенность оценку параметра λ распределения Пуассона Pλ : λ̂ = X + 1/7(X1 + 2X5 + 4X6 ). 443. Исследовать на несмещенность оценку параметра a нормального распределения N (a, σ) : â = aX1 + bX2 , a + b = 1. 444. Исследовать на несмещенность оценки параметров a, b равномерного распределения R[a, b] : b̂ = Xn∗ ; â = X1∗ . 445. В статистической модели h R[a, b] i исследовать на несме[ X1∗ +Xn∗ = . щенность оценки функций параметров: b[ −aP = Xn∗ − X1∗ ; a+b 2 2 n 446. Найти k, при котором оценка σ̂ = k i=1 |Xi −a| параметра 140 13.1 Критерии качества оценок σ является несмещенной в N (a, σ). 447. Найти k, при котором оценка σ̂ = k|X1 − a| параметра σ является несмещенной в N (a, σ). P 448. Найти k, при котором оценка σ̂ = k ni=1 |Xi − X| параметра σ является несмещенной в N (a, σ). P 2 449. Найти k, при котором оценка σb2 = (k ni=1 |Xi − a|) является несмещенной в N (a, σ). 450. Найти k, при котором оценка σ b = k|X1 − X2 | параметра σ является несмещенной в N (a, σ), если n = 2. 451. Исследовать на несмещенность оценку α̂ = X1∗ , если f (x) = eα−x , x > α. 452. Предложить три несмещенные оценки параметра a в распределении N (a, σ). 453. Предложить три различные несмещенные оценки параметра p биномиального распределения с параметрами N, p. 454. Предложить четыре различные несмещенные оценки параметра λ распределения Пуассона. 455. Доказать, что если M α̂ = α и Dα̂ → 0 при n → ∞, то α̂ – состоятельная оценка α. 456. Доказать, что если M α̂ → α при n → ∞ и Dα̂ → 0 при n → ∞, то α̂ – состоятельная оценка α. 457. Исследовать на состоятельность оценку â = X в N (a, σ). 458. Исследовать на состоятельность оценку σb2 = s2 в N (a, σ). 459. Исследовать на состоятельность оценку λ̂ = X в распределении Пуассона Pλ . X̄ 460. Исследовать на состоятельность оценку p̂ = N в биномиальном распределении B(N, p). 461. Исследовать на состоятельность оценку b̂ = Xn∗ в R [a, b]. 462. Исследовать на эффективность оценку â = X в N (a, σ). 463. Исследовать на эффективность оценку σb2 = s2 в N (a, σ). 464. Исследовать на эффективность оценку λ̂ = 1/2(X1 + X2 ) в распределении Пуассона Pλ . X в биноми465. Исследовать на эффективность оценку p̂ = N альном распределении B(N, p). 466. Исследовать на эффективность оценку b̂ = Xn∗ в R [a, b]. 467. Исследовать на оптимальность оценку â = X в N (a, σ). 468. Исследовать на оптимальность оценку λ̂ = X в распределении Пуассона Pλ . 469. λ̂ = X1 в распределении Пуассона Pλ . Доказать, что оценка является несмещенной, но не является эффективной и состоятель141 13.2 Методы нахождения оценок ной. 13.2. Методы нахождения оценок Метод максимального правдоподобия. Для непрерывной случайной величины функция L(x1 , . . . , xn , θ) = f (x1 , θ) · . . . · f (xn , θ) рассматриваемая при фиксированных (x1 , . . . , xn ) как функция параметра θ, называется функцией правдоподобия. Функция правдоподобия для дискретной случайной величины определяется в виде L(x1 , . . . , xn , θ) = p (ξ = x1 ) · . . . · (ξ = xn ). Оценка θ∗ , обеспечивающая по параметру θ максимум функции правдоподобия, называется оценкой максимального правдоподобия параметра θ (о.м.п.) Вместо отыскания максимума функции L часто удобнее находить максимум функции ln L и решать уравнение правдоподобия ∂ ln L = 0. ∂θ В результате решения уравнения правдоподобия мы найдем критическую точку, необходимо еще убедиться, что это точка максимума. Свойства оценок максимального правдоподобия 1. Cвойство инвариантности. Если оценивается некоторая взаимно однозначная параметрическая функция τ (θ), то ее оценка максимального b правдоподобия τd (θ) = τ (θ). 2. Оценки максимального правдоподобия асимптотически несмещены, состоятельны и обычно асимптотически нормальны. 3. Если оценки максимального правдоподобия асимптотически нормальны, то они и асимптотически эффективны, то есть Dθ̂ → I1 . Метод моментов. Приравнивая выборочные и теоретические моменты, получаем уравнения относительно θ. Решая эти уравнения, получаем оценку параметра θ̂. Эта оценка называется emphоценкой метода моментов и обозначается emphо.м.м. Оценки метода моментов состоятельны. 142 13.2 Методы нахождения оценок Пример 130. Найдем о.м.п. параметра распределения Пуассона. J n Y P e−λn λ xi L= Pλ (xi ) = Q . (x !) i i=1 X Y ln L(X, λ) = −λn + xi lnλ − ln (xi !). Найдем max ln L(X, λ). ∂ ln L(X, λ) = −n + ∂λ Получаем λ̂ = P xi n P xi = 0. λ = x̄. Очевидно, это точка максимума, так как ∂ 2 ln L <0 ∂λ2 x̄ — о.м.п. λ. I =⇒ Пример 131. Найдем в условиях предыдущего примера оценку максимального правдоподобия функции параметра λ2 . J По свойству инвариантности b 2 = (x̄)2 . I λb2 = (λ) Рассмотрим нахождение оценки параметра методом максимального правдоподобия в нерегулярной модели. Пример 132. Найдем о.м.п. параметра θ = (a, b) в распределении R[a, b]. J L= n Y f (xi ) = i=1 n Y i=1 1 1 = . b − a (b − a)n ∂ ln L ∂θ не обращается в 0. Но функция L монотонна по a и b. Поэтому она достигает своего наибольшего значения при минимально возможном значении b и максимально возможном значении a. Таким образом, о.м.п. будут â = ymin = x∗1 , b̂ = xmax = x∗n . I Пример 133. Найти методом моментов оценки параметров распределения Γα, β . 143 13.2 Методы нахождения оценок J Тогда β , α β . α2 Mξ β = αM ξ =⇒ Dξ = α Mξ = Dξ = Mξ (M ξ)2 α= ,β= . Dξ Dξ Мы получили оценки X α̂ = 2 , S x̄2 β̂ = 2 . I S Пример 134. Найти методом моментов оценки параметров распределения R[a, b]. J (b − a)2 12 (b − M ξ)2 a = 2M ξ − b =⇒ Dξ = . 3 √ √ Отсюда b = M ξ + σ 3, a = M ξ − σ 3. Окончательно: √ √ â = X − s 3, b̂ = X + s 3. I Mξ = a+b , 2 Dξ = Задачи 470. Найти оценки максимального правдоподобия параметров a, σ в N (a, σ). 471. Найти оценку максимального правдоподобия функции a2 + a в N (a, σ). 472. Найти оценку максимального правдоподобия параметра p в B(N, p). Найти оценку максимального правдоподобия функции P3 473. i i=0 p в B(N, p). 474. Найти оценку максимального правдоподобия параметра λ в Pλ . 475. Найти оценки максимального правдоподобия параметров a, b в R[a, b]. 476. Найти оценку максимального правдоподобия параметра α, если f (x) = eα−x , x > α. 477. Найти оценку максимального правдоподобия параметра 144 13.2 Методы нахождения оценок −|x| e α, если f (x) = 2(1−e −α ) , |x| 6 α. 478. Найти оценку максимального правдоподобия параметра α в Γ(α, β). 479. √ Найти оценку максимального правдоподобия параметра a в N (a, 2a). Исследовать полученную оценку на состоятельность. 480. Найти методом моментов оценки параметров a, σ в N (a, σ). 481. Найти методом моментов оценку параметра λ в Pλ . 482. Найти методом моментов оценки параметров a, b в R[a, b]. 483. Найти методом моментов оценку параметра p в B(N, p) при известном N . 484. Найти методом моментов оценки параметров N, p в B(N, p). Найти методом моментов оценку параметра n в χ2n . (χ2n = Pn 485. 2 ξi ∈ N (0, 1), ξi независимы.) i=1 ξi , 145 14. Доверительные интервалы. Две статистики I1 (X), I2 (X) (I1 (X) < I2 (X)) называют доверительным интервалом значимости α для параметра θ (0 < α < 1), если выполняется условие p (I1(X) < θ < I2(X ) = 1 − α. (72) Число 1 − α называется доверительной вероятностью, а I1 (X), I2 (X) — нижней и верхней доверительными границами. Для построения доверительного интервала параметра θ надо взять статистику G(X, θ), такую, что она сама монотонно зависит от параметра θ, а ее распределение от θ не зависит, записать уравнение p (g1 < G(X, θ) < g2 ) = 1 − α, и разрешить неравенство под знаком вероятности относительно параметра θ. Доверительные интервалы для параметров нормального распределения: S S Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ; n n ! 2 2 nS nS . , 2 Iσ2 = 2 χn−1,1− α χn−1, α 2 2 Доверительный интервал для параметра a нормального распределения N (a, σ) при известном σ: σ σ Ia = X − √ · u1− α2 , X + √ · u1− α2 . n n Параметр произвольного распределения можно оценить так же, как параметр нормального распределения, если известно распределение некоторой статистики, зависящей от параметра и его оценки. Другой способ связан с использованием асимптотического метода. Если θ̂ асимптотически нормальна и несмещена, (например, является о.м.п.), то θ̂ − θ d p → u ∈ N (0, 1). Dθ̂ ! θ̂ − θ 1 − α = p u α2 < p < u1− α2 . Dθ̂ Разрешая относительно θ, получим доверительный интервал значимости α. 146 Пример 135. Федеральные Центры оздоровительного питания изучают потребление населением биологически активных добавок (БАД). Было опрошено 4 группы по 100 покупателей каждая. В среднем из ста опрошенных встречалось 60 человек употребляющих БАД, причем σ = 10. Каков доверительный интервал значимости α = 0, 05 для числа людей, употребляющих БАД на сто опрошенных? J Требуется найти доверительный интервал значимости α = 0, 05 для параметра a нормального распределения N (a, σ) при известном σ = 10; воспользуемся вышеприведенной формулой: σ σ Ia = X − √ · u1− α2 ; X + √ · u1− α2 = n n 10 10 = 60 − √ · u0,975 ; 60 − √ · u0,975 = 4 4 10 10 · 1, 96; 60 − · 1, 96 = = 60 − 2 2 = (60 − 9, 8; 60 + 9, 8) = (50, 2; 69, 8). I Пример 136. В условиях предыдущего примера как изменился бы доверительный интервал, если бы те же данные были получены по 25 группам, численностью в 100 человек каждая? J Ia = σ σ X − √ · u1− α2 ; X + √ · u1− α2 n n = 10 10 = 60 − √ · u0,975 ; 60 − √ · u0,975 = 25 25 10 10 = 60 − · 1, 96; 60 − · 1, 96 = 5 5 = (60 − 3, 92; 60 + 3, 92) = (56, 08; 63, 92). Длина интервала равна 3, 92 · 2 = 7, 84, а в предыдущем примере длина доверительного интервала равнялась 9, 8 · 2 = 19, 6, то есть новый интервал в 2,5 раза короче. I Пример 137. Найти доверительный интервал значимости α = 0, 01 для курса английского фунта стерлингов по данным за 100 дней17 . 17 Курс английского фунта стерлингов за период 18.11.2005 г. – 25.02.2006 г. 147 № Значения № Значения № Значения № Значения 1 48,9231 26 49,5273 51 49,7769 76 50,1459 2 49,0009 27 49,5319 52 49,8113 77 50,1484 3 49,0009 28 49,5642 53 49,8743 78 50,1792 4 49,0009 29 49,5757 54 49,8743 79 50,1969 5 49,0676 30 49,5757 55 49,8743 80 50,2041 6 49,1057 31 49,5757 56 49,8806 81 50,2253 7 49,1104 32 49,5908 57 49,8913 82 50,2253 8 49,1591 33 49,6426 58 49,9032 83 50,2253 9 49,1915 34 49,6436 59 49,908 84 50,2366 10 49,1957 35 49,6949 60 49,9485 85 50,2681 11 49,1957 36 49,7218 61 49,9562 86 50,2743 12 49,1957 37 49,7218 62 49,961 87 50,3392 13 49,2786 38 49,7218 63 49,9704 88 50,4789 14 49,2786 39 49,7218 64 49,9861 89 50,5537 15 49,2892 40 49,7218 65 49,9921 90 50,5914 16 49,2892 41 49,7218 66 50,029 91 50,5914 17 49,2892 42 49,7218 67 50,0655 92 50,5914 18 49,3908 43 49,7218 68 50,0655 93 50,6346 19 49,3933 44 49,7218 69 50,0655 94 50,6346 20 49,4365 45 49,7218 70 50,0779 95 50,6346 21 49,449 46 49,7218 71 50,0779 96 50,6985 22 49,5006 47 49,7297 72 50,0779 97 50,7337 23 49,5191 48 49,7297 73 50,1117 98 50,7971 24 49,5273 49 49,7297 74 50,1117 99 50,816 25 49,5273 50 49,7301 75 50,1117 100 50,9521 J Для нахождения доверительного интервала необходимо сначала рассчитать выборочные характеристики X и S: X = 49, 8388 и S = 0, 4703. Используем формулу: S S Ia = X − √ · tn−1, 1− α2 , X + √ · tn−1, 1− α2 ; n n найдем по таблице квантилей распределения Стьюдента tn−1, 1− α2 = t99, 0,995 = 2, 58. Тогда 0, 4703 0, 4703 · 2, 58; 49, 8388 + √ · 2, 58 = (49, 717; 49, 960) . I Ia = 49, 8388 − √ 100 100 Задачи 486. Найти доверительный интервал для a в N (a, σ) при извест148 ном σ. 487. Найти доверительный интервал для a в N (a, σ) при неизвестном σ. 488. Пусть по 16 измерениям величины ξ, имеющей нормальное распределение, найдено среднее значение X = 4, 1. Оценить неизвестное математическое ожидание случайной величины ξ по выборочной средней при помощи доверительного интервала с доверительной вероятностью 0,95, если среднее квадратическое отклонение величины ξ известно и равно единице. 489. В условиях предыдущей задачи найти доверительный интервал для неизвестного математического ожидания случайной величины ξ с доверительной вероятностью 0,95, если среднее квадратическое отклонение неизвестно, а выборочное среднее квадратическое отклонение величины S = −1. 490. Найти в нормальной модели доверительные интервалы для a и σ по данным: x̄ = 103, S 2 = 16, n = 26, α = 0, 1. 491. Найти доверительный интервал для σ в модели N (2, σ) по выборке: 2, 3, 3, 1, 1, 2, 4, 2, 1, 3 при α = 0, 1. 492. При проведении рекламной акции за первые четыре дня распространители раздали соответственно 2470, 2490, 2580 и 2520 рекламных проспектов. Считая применимой нормальную модель, найти доверительные интервалы для дисперсии и для среднего квадратического отклонения числа раздаваемых в день рекламных проспектов. 493. Найти 95%-ый доверительный интервал для числа пассажиров пригородного поезда, если среднее число пассажиров, рассчитанное за 25 рабочих дней, равно 500, а σ = 20. 494. По результатам 25 наблюдений цены товара в различных магазинах был определен доверительный интервал для математического ожидания цены при α = 0, 3 : Ia = [23, 84; 24, 37] (σ не известно). Найдите доверительный интервал при доверительной вероятности 0,95. 495. Средняя длительность оборота (в днях) оборотных средств, рассчитанная по 36 торговым фирмам, составляет 47 дней, причем σ = 2, 1. Найти 95%-ый и 99%-ый доверительные интервалы для средней длительности оборота. 496. Найти доверительный интервал для p в B(N, P ) при известном N . 497. Найти доверительный интервал для λ в Pλ . ∗ 498. Показать, что интервал (Xn∗ , nX√nα ) является доверитель149 ным интервалом для b значимости α в модели R[0, b]. 499. В равномерном распределении R[a, 0] найти доверительный интервал для a. 500. Найти доверительный интервал для θ в N (θ, θ). 150 15. Статистические гипотезы. Статистической гипотезой (или просто гипотезой) называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистическая гипотеза называется простой, если однозначно фиксирует распределение наблюдений. Иначе это сложная гипотеза. Проверяемая гипотеза называется нулевой (H0 ). Любая гипотеза о распределении наблюдаемой случайной величины, которая может оказаться истинной, но отличается от основной гипотезы, называется альтернативной гипотезой. Правило, согласно которому проверяют гипотезу H0 (принимают или отвергают), называется статистическим критерием проверки гипотезы H0 . Статистическая гипотеза называется параметрической, если она представляет из себя предположение о том, что неизвестный параметр распределения (дисперсия, математическое ожидание и т.п.) имеет наперед заданное значение или множество значений. В процессе проверки H0 можно принять правильное решение или совершить ошибку. Вероятностью ошибки первого рода называется вероятность отклонить H0 , когда H0 верна. Эта вероятность совпадает с уровнем значимости критерия α. Очевидно, α = p (Hd = H1 /H0 ) = p (T (x) ∈ V /H0 ), (α равняется вероятности того, что значение статистики T принадлежит критической области V при условии, что верна H0 ). Вероятностью ошибки второго рода называется вероятность принять H0 , когда H0 не верна. Вероятность ошибки второго рода обозначается β. Очевидно, β = p (Hd = H0 /H1 ) = p (T (x) ∈ V /H1 ), (β равняется вероятности того, что значение статистики T не принадлежит критической области V при условии, что верна H1 ). Величину 1 − β будем называть мощностью критерия K и обозначать M (K). Понятие мощности критерия введено для случая простых H0 , H1 ; существенно, что множество Θ1 состоит из единственной точки θ1 . Наилучшие критические области (НКО). Теорема Неймана - Пирсона. Пусть H0 : θ = θ0 , H1 : θ = θ1 . Тогда НКО заданного уровня значимости α состоит из точек выборочного про151 странства, удовлетворяющих неравенству L(x, θ1 ) > cα , L(x, θ0 ) где cα – константа, зависящая от α, L – функция правдоподобия. Теорема Неймана–Пирсона применима и к простым гипотезам о виде распределения. Пример 138. Найти наилучшую критическую область для проверки гипотезы H0 : R[−a, a] против гипотезы H1 : N (0, σ) по одному наблюдению (n = 1) при уровне значимости α = 0, 1. J L(x, H1 ) = L(x, H0 ) 2 x √1 e− 2σ2 σ 2π x2 − 2σ 2 √1 e σ 2π : 1 2a , x ∈ [−a, a], : 0 = ∞, x ∈ / [−a, a]. (73) НКО V заданного уровня значимости α состоит из точек выборочного пространства, удовлетворяющих неравенству (??): L(x, θ1 ) > cα , L(x, θ0 ) следовательно, надо разрешить (73) относительно x. Разрешая, получаем: V = {x : |x| > a} ∪ {x : |x| 6 d}, где d – некоторая константа. Значение константы d найдем из определения α: α = P (Z ∈ V /H0 ). P (Z ∈ V /H0 ) = P (|x| 6 d/H0 ) и, поскольку H0 : R[−a, a], эта вероятность равна площади прямоугольника 1 с высотой, равной плотности равномерного распределения 2a , и с основанием 2d. Таким образом, d α = P (|x| 6 d/H0 ) = . a Отсюда d = aα, и получен окончательный вид НКО: V = {x : |x| > a} ∪ {x : |x| 6 aα}. Следовательно, если наблюдаемое значение x больше a, или не больше aα, гипотеза о равномерном распределении отвергается (в пользу нормального распределения); если же x ∈ (aα; a], гипотеза о равномерном распределении не отвергается.I 152 Пример 139. В условиях предыдущего примера найти мощность полученного критерия. J Мощность критерия численно равна площади над критической областью, рассчитанной на основе распределения Z при альтернативной гипотезе H1 . Решение принимается по одному наблюдению, то есть распределение Z совпадает с распределением X. Таким образом, M (K) равна площади криволинейной трапеции с основанием V , ограниченной сверху графиком плотности N (0, σ). Основание трапеции состоит из трех несвязанных интервалов: (−∞; −a) ∪ [−aα; aα] ∪ (a; ∞). Площадь под графиком плотности выражается через функцию распределения, и M (K) = Φ0,σ (−a) + (Φ0,σ (aα) − Φ0,σ (−aα)) + (1 − Φ0,σ (a). Замечание. Последнее выражение легко упрощается. M (K) можно (и нужно) выразить через функцию Φ(x). При решении задач с числовыми данными подставляются табличные значения функции Φ(x). I Задачи В задачах 501–503 даны оценки за контрольную работу первой и второй групп X = (x1 , . . . , xn ), Y = (y1 , . . . , ym ), которые можно рассматривать как выборки из генеральных совокупностей оценок. Сформулировать нулевую и альтернативную гипотезы для получения ответа на вопрос: 501. «Учится ли первая группа по этому предмету лучше второй?» 502. «Одинаково ли успешно учатся по этому предмету первая и вторая группа?» 503. «Можно ли считать, что первая и вторая группа учатся по этому предмету одинаково ровно?» В задачах 504–506 даны числа ежедневных покупок, совершенных в магазине в течение одного месяца до раздачи рекламных листовок и в течение месяца после раздачи рекламных листовок. Сформулировать нулевую и альтернативную гипотезы для получения ответа на вопрос: 504. «Изменяет ли раздача листовок число покупок?» 505. «Увеличивает ли раздача листовок число покупок?» 506. «Уменьшился ли разброс числа покупок?» В задачах 507–509 даны результаты измерений артериального давления у одних и тех же людей до и после приема лекарства. Сформулировать нулевую и альтернативную гипотезы для получения ответа на вопрос: 507. «Повышает ли это лекарство давление?» 508. «Понижает ли это лекарство давление?» 509. «Это лекарство увеличивает разброс давления у пациен153 тов?» 510. Имеются данные о солнечной активности и о заболеваемости дифтеритом за ряд лет. Сформулировать нулевую и альтернативную гипотезы для проверки содержательной гипотезы: «Увеличение солнечной активности понижает заболеваемость дифтеритом18 ». 511. Для каждой из двух книг имеются данные о частотах, с которыми встречаются в тексте различные служебные слова и знаки препинания. Сформулировать нулевую и альтернативную гипотезы для проверки содержательной гипотезы: «Эти две книги написаны одним автором». 512. Найти наилучшую критическую область в модели N (a, σ) для проверки гипотезы H0 : a = a0 против гипотезы H1 : a = a1 по выборке объема n = 25, если σ = 5, a0 = 1, a1 = 3, уровень значимости α = 0, 05. Найти мощность критерия. 513. В статистической модели f (x) = λe−λx , x > 0 найти наилучшую критическую область для проверки гипотезы H0 : λ = 1 против гипотезы H1 : λ = 4 по выборке объема n = 1 при уровне значимости α = 0, 1. Найти мощность критерия. 514. В статистической модели N (a, σ) найти наилучшую критическую область для проверки гипотезы H0 : σ 2 = 4 против гипотезы H1 : σ 2 = 9, если объем выборки n = 25, а уровень значимости α = 0, 05. 515. Найти наилучшую критическую область для проверки гипотезы H0 : f (x) = 12 при |x| 6 1 против гипотезы H1 : ξ ∈ N (0, 1) по одному наблюдению (n = 1), α = 0, 05. Найти мощность критерия. 516. Найти наилучшую критическую область для проверки гипотезы H0 : ξ ∈ N (0, 1) против гипотезы H1 : f (x) = 21 при |x| 6 1 по одному наблюдению (n = 1), если α = 0, 05. Найти мощность критерия. 517. Найти наилучшую критическую область для проверки гипотезы H0 : R[− 21 , 12 ] против гипотезы H1 : N (0, 0, 16) по одному наблюдению n = 1 при уровне значимости α = 0, 1. Найти мощность критерия. 518. В статистической модели B(N, p) найти наилучшую критическую область для проверки гипотезы H0 : p = 14 против гипотезы H1 : p = 12 , N = 10, если объем выборки n = 25, уровень значимости α = 0, 1. 519. В статистической модели Γ(α, 1) найти наилучшую кри18 Гипотеза Чижевского. 154 тическую область для проверки гипотезы H0 : α = 1 против гипотезы H1 : α = 3 при n = 16, α = 0, 05. 520. Найти наилучшую критическую область для проверки гипотезы H0 : λ = 1 против гипотезы H1 : λ = 2 в статистической модели Pλ , n = 9, α = 0, 05. 521. Сколько наблюдений необходимо, чтобы мощность критерия для проверки гипотезы H0 : a = 0 против гипотезы H1 : a = 2 в статистической модели была не меньше 0, 9, если уровень значимости α = 0, 05? 155 16. Проверка статистических гипотез 16.1. Параметрические гипотезы Алгоритм проверки параметрической гипотезы. 1. Сформулировать статистическую параметрическую модель, нулевую и альтернативную гипотезы, задать уровень значимости α. 2. Выбрать статистику Z(x), такую, что она сама зависит от параметра θ, а ее распределение при верной H0 от θ не зависит, и различается при H0 и при H1 . 3. Найти критическую область V . 4. Рассчитать по выборке значение статистики Zв . 5. Если Zв попадает в критическую область V , то нулевая гипотеза отвергается (в пользу альтернативной). Если Zв не попадает в критическую область V , то нулевая гипотеза не отвергается. 6. Сформулировать ответ в терминах вопроса. Замечание. Гипотеза H0 отвергается или не отвергается с уровнем значимости α. Критерии для гипотез о параметрах нормального распределения. Гипотеза о дисперсии. H0 : σ = σ 0 . Статистическая модель hN (a0 , σ)i Статистика Z Z/H0 P (xi −a0 )2 χ2n (σ 0 )2 nS 2 (σ 0 )2 hN (a, σ)i χ2n−1 Гипотеза о среднем. H0 : a = a0 Статистическая модель hN (a, σ0 )i hN (a, σ)i Статистика Z √ 0 (x̄−a ) n σ0 √ (x̄−a0 ) n s̄ Z/H0 N (0, 1) Tn−1 Критерии для гипотез о параметрах двух независимых нормальных распределений. Гипотеза о дисперсии. H0 : σ1 = σ2 . Статистическая модель hN (a0 , σ)i, hN (a, σ)i Статистика Z Z/H0 (s̄1 )2 (s̄2 )2 , s1 > s2 . Fn1 −1,n2 −1 156 16.2 Гипотеза о виде распределения. Замечание. Критерий, использующий данную статистику для проверки данной гипотезы, называется критерием Фишера. Гипотеза о средних. H0 : a1 = a2 Статистическая модель Статистика Z hN (a, σ0 )i (известны r x̄−ȳ 2 2 σ1 σ2 n1 + n2 σ1 , σ2 ) x̄−ȳ hN (a, σ)i(σ1 , σ2 неиз- r 2 s̄1 (n1 −1)+s̄2 2 (n2 −1) ( 1 + 1 ) n1 +n2 −2 n1 n2 вестны, но гипотеза H0 : σ1 = σ2 не отвергается) hN (a, σ)i(σ1 , σ2 неиз- r x̄−ȳ s̄2 s̄2 1 2 n1 + n2 вестны, и гипотеза H0 : σ1 = σ2 отвергается) Z/H0 N (0, 1) √ Tn1 +n2 −2 Tν, s̄2 1 n1 где s̄2 s̄2 1 2 n1 + n2 !2 n1 +1 + ν ≈ 2 s̄2 2 n2 !2 −2 n2 +1 Замечание. Критерий, использующий статистику, отмеченную галочкой √ ( ), называется критерием Стьюдента. Гипотеза о средних для парных совокупностей. Гипотеза H0 : a1 = a2 . ∼ H0 : ad = 0. Статистическая модель Статистика Z P √ √ d d¯ n P i n−1 P hN (a, σ)i s̄d = n d2 −( di )2 i Z/H0 Tn−1 Замечание. Этот критерий называется критерием Стьюдента для парных выборок. 16.2. Гипотеза о виде распределения. H0 : F (x) = F0 (x). Критерии, проверяющие гипотезу о виде распределения, называются критериями согласия. Критерий согласия Колмогорова. Пусть x = (x1 , . . . , xn ) – выборка из генеральной совокупности с неизвестной функцией распределения F (x). Выдвинута простая гипотеза H0 : F (x) = F0 (x), где F0 (x) задана. Критерий согласия Колмогорова применяют для непрерывных функций распределения F (x). В качестве статистики критерия выбирают величину Dn = Dn (x) = sup |(Fn (x) − (F (x)|, (74) x 157 16.2 Гипотеза о виде распределения. а в качестве критической области – область вида V = (t∗ , ∞), (75) где t∗ табулировано. Так, t∗ = t∗α = 1, 3581 при α = 0, 05; t∗α = 1, 6276 при α = 0, 01. Таким образом, при заданном уровне значимости α правило проверки гипотезы H0 при n > 20 сводится к следующему: если значение статистики t̂ = Dn (x) = maxx |Fn∗ (x) − F0 (x)| удовлетворяет неравенству √ n · t̂ > t∗ , то H0 отвергают, в противном случае делают вывод, что статистические данные не противоречат гипотезе. Критерий согласия χ2 Пирсона. Критерий согласия χ2 Пирсона также проверяет гипотезу H0 : F (x) = F0 (x), но его можно применять для любых распределений. Чтобы воспользоваться этим критерием, выборочные данные предварительно группируют. Пусть ni – число значений, попавших в i-й интервал, i = 1, . . . , k, n – объем выборки, pi — теоретическая вероятность попадания одного элемента выборки в i-й интервал. Однако в теоретическом распределении могут быть неизвестные параметры (θ1 , . . . , θr ), что обычно и встречается на практике. Тогда по выборке (x1 , . . . , xn ) первоначально находят оценки (θ1∗ , . . . , θr∗ ) и затем по F (x, θ1∗ , . . . , θr∗ ) вычисляют теоретические вероятности pi . Статистика критерия: Z= k X (ni − npi )2 i=1 npi ∼ χ2ν , (76) где ν = k − r − 1 – число степеней свободы. Ограничения: n > 50 и npi > 4. Критическую область задаем в виде V = (t∗ , ∞), значение t∗ – квантиль распределения χ2ν порядка (1 − α). Таким образом, вид критерия согласия χ2 : если значение статистики Zв удовлетворяет неравенству Zв > t∗ , гипотезу H0 отвергают, в противном случае гипотеза H0 не противоречит условиям испытаний. Пример 140. Проверить гипотезу о том, что среднеквадратичное отклонение цены на товар σ = 1, 4, если по 101 наблюдению S = 1, 2. J 1. Можно использовать нормальную модель, а уровень значимости α зададим равным 0,05. Сформулируем гипотезы: H0 : σξ = σ0 = 1, 4; H1 : σξ = σ1 < 1, 4 158 16.2 Гипотеза о виде распределения. 2. Воспользуемся статистикой nS 2 Z= 2 , σ0 при условии H0 статистика Z имеет распределение χ2n−1 . 3. Найдем критическую область V . Так как σ1 < σ0 , то при верной 2 принимает меньшие значения, чем при гипотезе H1 статистика Z = nS 2 σ0 верной гипотезе H0 , следовательно, критическая область левосторонняя: V = {x : Z(x) 6 χ2α }. Из таблиц находим граничное значение Zкрит. = χ2100;0,05 = 77, 929. Таким образом, критическая область V = [0, 77, 929]. 4. Рассчитаем по выборке значение статистики Zв : 101 · (1, 2)2 nS 2 ≈ 74, 2 Zв = 2 = σ0 (1, 4)2 5. Поскольку Zв = 74, 2 < 77, 929 = Zкрит. , то Zв попадает в критическую область V , следовательно нулевая гипотеза отвергается в пользу альтернативной с уровнем значимости α = 0, 05. 6. Таким образом, нельзя считать, что среднеквадратичное отклонение цены на товар σ = 1, 4. Следует признать, что оно меньше.I Пример 141. Было проведено 1000 измерений случайной величины η, равной времени ожидания ответа на запрос, измеренному в долях от теоретически возможного максимального времени, принятого за единицу. Требуется выяснить распределение этой величины. J Сгруппируем данные: № 1 2 3 4 5 6 7 8 9 10 11 Интервал Численность ni 0, 00 − 0, 09 80 0, 09 − 0, 18 81 0, 18 − 0, 27 93 0, 27 − 0, 36 85 0, 36 − 0, 45 87 0, 45 − 0, 54 87 0, 54 − 0, 63 87 0, 63 − 0, 72 106 0, 72 − 0, 81 99 0, 81 − 0, 90 89 0, 90 − 0, 99 106 ni n ni nh P ni 0,080 0,081 0,093 0,085 0,087 0,087 0,087 0,106 0,099 0,089 0,106 0,007 0,007 0,008 0,008 0,008 0,008 0,008 0,010 0,009 0,008 0,010 0,080 0,161 0,254 0,339 0,426 0,513 0,600 0,706 0,805 0,894 1,000 n По рассмотрению таблицы группировки можно выдвинуть гипотезу о равномерном распределении. Параметры этого распределения найдем с помощью оценивания: â = ymin = x∗1 = 0, b̂ = xmax = x∗n ≈ 1. 159 16.2 Гипотеза о виде распределения. H0 : Fη (y) = FR[0,1] (y). Применим критерий согласия χ2 Пирсона. В качестве статистики критерия возьмем величину Z= k X (ni − npi )2 i=1 npi , где pi — теоретическая вероятность попадания одного элемента выборки в i-й интервал, равная 0,1. После вычислений получаем Zв = 9, 25. Критическая область Vk = (χ2k−r−1,1−α , +∞), где r — число параметров, оцененных в выборке. У нас r = 2, в таблице значений квантилей распределения χ2 находим χ28,0.95 = 15, 51. Так как значение Zв не попало в критическую область, то гипотеза H0 не отвергается, то есть статистические данные не противоречат гипотезе о том, что величина η имеет распределение R[0, 1]. I. Пример 142. В условиях предыдущего примера проверим гипотезу с помощью критерия согласия Колмогорова. J H0 : Fη (y) = FR[0,1] (y). В качестве статистики критерия возьмем величину √ Dn = n · max Fn∗ (y) − FR[0,1] (y) y После вычислений мы получили Dn = 1, 22. Так как критическая область для α = 0, 05 равна Vk = (1, 36; +∞), a значение Dn не попадает в критическую область, то гипотеза H0 не отвергается, то есть можно считать, что величина η имеет распределение R[0, 1] I. Задачи Замечание. Если в условиях не указан уровень значимости α, следует задать его самим. 522. Средние по отрасли издержки на производство единицы некоторого товара составляют a0 = 13, а по 26 предприятиям корпорации выборочное среднее издержек равно x̄ = 11, S = 2. Можно ли считать, что издержки в данной корпорации ниже, или отклонение следует считать случайным? (α = 0, 05). 523. В условиях примера 137 проверить гипотезу о том, что математическое ожидание курса английского фунта стерлингов за 160 16.2 Гипотеза о виде распределения. упомянутый период равно a = 50. 524. Урожайность культуры составляет 35 центнеров с гектара; на 10 опытных делянках x̄ = 38 центнеров с гектара, s2 = 49. Случайно ли превышение урожайности? 525. При измерении производительности двух агрегатов получены следующие результаты: A : 14, 1 10, 1 14, 7 13, 7 14, 0; B : 14.0 14, 5 13, 7 12, 7 14, 1. Различна ли их производительность? 526. Одинаково ли потребление сырья для производства продукта при двух технологиях, если n1 = 16, S̄12 = 8, x̄ = 6; n2 = 36, S̄22 = 15, ȳ = 7? 527. Указаны выборочные дисперсии размеров прибыли при производстве товаров двух групп: n1 = 21, S̄12 = 25; n2 = 31, S̄22 = 16. Можно ли считать, что прибыль при производстве товаров первой группы колеблется сильнее, или различия следует считать случайными? (α = 0, 1). 528. Производительность труда в дневную смену описана данными n1 = 16, x̄ = 14, 5, S̄12 = 4; в ночную смену n2 = 16, ȳ = 13, S̄22 = 3. Можно ли считать, что ночная работа менее эффективна? 529. Пусть X — производительность при работе с перерывом, Y — производительность при работе без перерыва, измеренная у одних и тех же 8 человек: H1 : ay < ax . X 40 35 41 55 46 60 51 43 . Y 30 30 38 21 49 53 31 27 530. Можно ли считать равномерным распределение студентов по знакам Зодиака? № знака 1 2 3 4 5 6 ni 12 13 23 11 9 10 № знака 7 8 9 10 11 12 ni 15 7 15 9 7 3 531. Проверить гипотезу H0 : F = Pλ ; m 0 1 2 3 4 5 ni 13 17 12 5 3 1 161 Приложение. x2 1 Таблица 3. Значения функции ϕ (x) = √ e− 2 2π x 0, 0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 1, 0 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1, 7 1, 8 1, 9 2, 0 2, 1 2, 2 2, 3 2, 4 2, 5 2, 6 2, 7 2, 8 2, 9 3, 0 x 3 Сотые доли x 4 5 39862 39844 39505 39448 38762 38667 37654 37524 36213 36053 34482 34294 32506 32297 30339 30114 28034 27798 25647 25406 23230 22988 20831 20594 18494 18265 16256 16038 14146 13943 12188 12001 10396 10226 08780 08628 07341 07207 06077 05960 04980 04879 04041 03955 03246 03174 02582 02522 02033 01984 01585 01545 01223 01191 00935 00910 00707 00687 00530 00514 00393 00381 Десятые доли x 0 1 2 3 4 5 00443 00327 00238 00172 00123 00084 0 39894 39695 39104 38139 36827 35207 33322 31225 28969 26609 24197 21785 19419 17137 14973 12952 11092 09405 07895 06562 05399 04398 03548 02833 02240 01753 01358 01042 00792 00595 00443 1 39892 39654 39024 38023 36678 35029 33121 31006 28737 26369 23955 21546 19186 16915 14764 12758 10915 09246 07754 06438 05292 04307 03470 02768 02186 01710 01323 01014 00770 00578 00430 2 39886 39608 38940 37903 36526 34849 32918 30785 28504 26129 23713 21307 18954 16694 14556 12566 10741 09089 07614 06316 05186 04217 03394 02705 02134 01667 01289 00987 00748 00562 00417 3 39876 39559 38853 37780 36371 34667 32713 30563 28269 25888 23471 21069 18724 16474 14350 12376 10567 08933 07477 06195 05082 04128 03319 02643 02083 01625 01256 00961 00727 00545 00405 6 39822 39387 38568 37391 35889 34105 32086 29887 27562 25164 22747 20357 18037 15822 13742 11816 10059 08478 07074 05844 04780 03871 03103 02463 01936 01506 01160 00885 00668 00499 00370 7 39797 39322 38466 37255 35723 33912 31874 29659 27324 24923 22506 20121 17810 15608 13542 11632 09893 08330 06943 05730 04682 03788 03034 02406 01889 01468 01130 00861 00649 00485 00358 8 39767 39253 38361 37115 35553 33718 31659 29431 27086 24681 22265 19886 17585 15395 13344 11450 09728 08183 06814 05618 04586 03706 02966 02349 01842 01431 01100 00837 00631 00471 00348 9 39733 39181 38251 36973 35381 33521 31443 29200 26848 24439 22025 19652 17360 15183 13147 11270 09566 08038 06687 05508 04492 03626 02899 02294 01797 01394 01071 00814 00613 00457 00337 6 7 8 9 00061 00043 00029 00020 Замечание. В таблице даны значения, округленные до пятого знака после запятой. Указание. Пусть необходимо получить значение ϕ (0, 62). На пересечении столбца 2 («Сотые доли x») и строки 0, 6 («x») получаем значение 32918, т. е. ϕ (0, 62) = 0, 32918. 162 1 Таблица 4. Значения функции Φ0 (x) = √ 2π Zx t2 e− 2 dt 0 x 0, 0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 1, 0 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1, 7 1, 8 1, 9 2, 0 2, 1 2, 2 2, 3 2, 4 2, 5 2, 6 2, 7 2, 8 2, 9 3, 0 x 3 0 0, 0000 03983 07920 11791 15542 19146 22575 25804 28814 31594 34134 36433 38493 40320 41924 43319 44520 45543 46407 47128 47725 48214 48610 48928 49180 49379 49535 49653 49744 49813 49865 1 00399 04380 08317 12172 15910 19497 22907 26115 29103 31859 34375 36650 38686 40490 42073 43447 44630 45637 46485 47193 47778 48257 48645 48956 49202 49396 49547 49664 49752 49819 49869 2 00798 04776 08700 12552 16276 19847 23237 26424 29389 32121 34614 36864 38877 40658 42220 43574 44738 45728 46562 47257 47831 48300 48679 48983 49224 49413 49560 49674 49760 49825 49874 0 49865 1 2 49903 49931 Сотые доли x 3 4 5 01197 01595 01994 05117 05567 05962 09095 09483 09871 12930 13307 13683 16640 17003 17365 20194 20540 20884 23565 23891 24215 26731 27035 27337 29673 29955 30234 32381 32639 32894 34850 35083 35314 37076 37286 37493 39065 39251 39435 40824 40988 41149 42634 42507 42647 43699 43822 43943 44845 44950 45053 45819 45907 45994 46638 46712 46784 47320 47381 47441 47882 47932 47982 48341 48382 48422 48713 48745 48778 49010 49036 49061 49245 49266 49286 49430 49446 49461 49573 49586 49598 49683 49693 49702 49767 49774 49781 49830 49836 49841 49878 49882 49886 Десятые доли x 3 4 5 49952 49966 49977 6 02392 06356 10257 14058 17724 21226 24537 27637 30511 33147 35543 37698 39617 41309 42786 44062 45154 46080 46856 47500 48030 48461 48809 49086 49305 49477 49609 49711 49788 49846 49889 7 02790 06749 10642 14431 18082 21566 24857 27935 30785 33398 35769 37900 39796 41466 42922 44179 45254 46164 46926 47558 48077 48499 48839 49111 49324 49491 49621 49720 49795 49851 49893 8 03188 07142 11026 14803 18439 21904 25175 28230 31057 33646 35993 38100 39973 41621 43056 44295 45352 46246 46995 47615 48124 48537 48870 49134 49343 49506 49632 49728 49801 49856 49897 9 03586 07535 11409 15173 18793 22241 25490 28524 31328 33891 36214 38298 40148 41774 43189 44408 45449 46327 47062 47671 48169 48574 48899 49158 49361 49520 49643 49737 49807 49861 49899 6 7 8 9 49984 49989 49993 49995 Замечание. В таблице даны значения, округленные до пятого знака после запятой. Указание. Пусть необходимо получить значение Φ0 (1, 57). На пересечении столбца 7 («Сотые доли x») и строки 1, 5 («x») получаем значение 44179, т. е. Φ0 (1, 57) = 0, 44179. 163 164 ξ = 0, 1, . . . , min (M, n) ξ = 0, 1, . . . ξ = 0, 1, . . . Gp — Геометрическое B (r, p) — Отрицательное биномиальное (Паскаля) ξ = 0, 1, . . . ξ = 0, 1, . . . , N ξ = 0, 1 p (ξ = 1) = p 1 n λm e−λ , m! m6M m = 0, 1, . . . ; r > 0; 0 < p < 1 m p (ξ = m) = Cr+m−1 pr (1 − p)m , 0<p<1 p (ξ = m) = p(1 − p)m , n 6 N, m n−m CM CN −M pM, N (m, n) = , CNn p (ξ = m) = pM, N (m, n); p (ξ = m) = pλ (m) = λ>0 m = 0, 1, . . . , N ; N ∈ N; 0<p<1 p (ξ = m) = CNm pm (1 − p)N −m . p (ξ = 0) = 1 − p, p (ξ = xi ) = p (ξ = c) = 1 ξ≡c ξ = xi ; i = 1, 2, . . . , n Закон распределения Значения GG (N, M, n) — Гипергеометрическое Pλ — Пуассона B (N, p) — Биномиальное B (1, p) — Бернулли Дискретное равномерное Вырожденное Обозначение Интерпретация Если r ∈ Z, то m — число неудач до r-го успеха Число неудач до первого успеха Из совокупности N предметов, среди которых M предметов первого вида и (N − M ) предметов второго вида, производят выборку без возвращения n предметов, где 1 6 n 6 N . Случайная величина — число предметов первого вида в выборке Число маловероятных успехов в бесконечном ряду испытаний (λ — среднее число успехов) Число успехов в N испытаниях, проводимых по схеме Бернулли Число успехов в одном испытании Величина с равновероятными значениями Случайная величина — постоянная c Таблица 5. Некоторые важные дискретные распределения 165 α > 0, p>0 β>0 Парето Логистическое σ>0 σ>0 β>0 λ>0 λ>0 a, a, σ>0 λ>0 a > 0, a, a<b Параметры Лапласа [частный случай распределения Кэптейна при g (x) = ln x] Логарифмически нормальное Кэптейна Γα, β — Γ-распределение Ca, λ — Коши Eλ — Показательное (экспоненциальное) N (0, 1) — стандартное нормальное распределение, причем fξ (x) = ϕ (x), Fξ (x) = Φ (x) N (a, σ) — Нормальное R [a, b] — Равномерное Обозначение 0 при x < 0 Γ−1 (β)αβ xβ−1 e−αx при x > 0 λ 1 · 2 π λ + (x − a)2 0 при x < 0, λe при x > 0 −λx −(p+1) 0 при x < 1, px при x > 1. n o x−α exp − β 1 · n o2 β 1 + exp − x−α β λ exp {−λ|x − α|} 2 o n 2 g 0 (x) √ exp − (g (x)−a) 2σ 2 σ 2π n o 1 x−a)2 √ exp − (ln 2σ , x>0 2 σ 2πx o n 1 (x−a)2 √ · exp − 2σ2 = ϕa, σ (x) σ 2π Плотность распределения 0 при x ∈ / [a, b], 1/(b − a) при x ∈ [a, b] Таблица 6. Некоторые важные непрерывные распределения Таблица 7. Матем. ожидания и дисперсии некоторых важных распределений Распределение Mξ Dξ Бернулли B (1, p) p q Биномиальное B (N, p) Np N pq λ λ M N nM (N − M )(N − n) N 2 (N − 1) Пуассона Pλ Гипергеометрическое Gm, n (M, N ) n Геометрическое Gp q p q p2 Паскаля19 B (r, p) rq p rq p2 Равномерное R[a, b] a+b 2 (b − a)2 12 Нормальное N (a, σ) a σ2 Показательное Eλ 1 λ 1 λ2 Коши Ca, λ не ∃ не ∃ Γ (Гамма) Γα, β β α β α2 α 2 λ2 Лапласа 166 Таблица 8. Греческий алфавит Буква A α B β Γ γ ∆ δ E ε Z ζ H η Θ ϑ I ι K κ Λ λ M µ N ν Ξ ξ O o Π π P ρ Σ σ T τ Υ υ Φ ϕ X χ Ψ ψ Ω ω Название альфа бета гамма дельта эпсилон дзета эта тета йота каппа лямбда мю ню кси омикрон пи ро сигма тау ипсилон фи хи пси омега 167 168 5686 3106 9359 2057 6177 7707 6751 2651 6607 2362 2213 8361 2598 3915 4138 1727 6131 0114 9953 0159 2200 2104 4215 9375 1271 0762 2755 3047 4022 9051 0480 2428 8481 9849 2673 9380 2901 0453 0774 4662 1426 9635 2369 9275 5470 4545 7562 1429 3080 4901 6540 5764 2557 7899 0919 9902 2399 3918 7592 3032 7788 0802 0405 7058 8140 2118 4452 0447 0122 8535 3275 3519 7804 7155 3461 2623 2350 4244 5112 5957 1650 2902 5011 1125 2109 4886 4865 8024 4841 0754 8112 9029 0521 7888 5528 6489 9755 9965 7310 2377 4318 3603 2580 4114 4971 8745 2304 2373 4874 1033 0477 6377 4863 9745 6623 6411 4690 2660 4398 7366 7106 9213 5003 6553 5676 2462 0848 5513 5329 5937 4867 0528 9567 1127 1022 3458 1133 1631 3586 3341 8857 0486 0046 4625 3532 6247 6470 2820 0748 9750 2475 9383 5206 3665 7496 7126 0731 5023 3278 6981 9839 8784 0221 8185 1683 5978 6430 8907 0122 0414 7103 0695 8555 5763 0434 9721 1297 1021 8446 3502 0500 1972 6641 0605 3844 5896 6269 5266 5679 5282 0820 7197 3262 5727 8172 8004 3845 6339 Таблица 9. Таблица случайных чисел 3594 4070 2302 2436 7573 4269 0404 4640 1823 3985 1120 7521 5041 1106 2140 3854 5182 7577 1376 8602 0659 3377 1020 4488 8433 6435 7426 0022 0735 8692 4407 3105 5436 8488 2108 9223 5291 2940 1185 8631 3459 2457 0499 3780 3531 2365 3299 2646 3188 3860 0888 7712 5914 7210 8921 6854 1813 5629 8499 3500 1493 0759 6778 9134 3671 0366 4296 9633 5987 0295 0187 1580 3504 9832 7545 5375 6457 9203 4235 6982 3653 8685 3425 5430 6917 0099 2771 4746 Список литературы [1] Булдык, Г. М. Теория вероятностей и математическая статистика: Учебное пособие. — /Г. М. Булдык. — Минск: Вышейш. шк., 1989. [2] Вентцель, Е. С. Теория вероятностей: Учебное пособие. — Изд. 6-е, перераб. и доп. / Е. С. Вентцель, Л. А. Овчаров. — М.: Наука. Гл. ред. физ.-мат. лит., 1969. [3] Володин, Б. Г. Сборник задач по теории вероятностей, математической статистике и теории случайных функций. Учебное пособие. / Б. Г. Володин, М. П. Ганин, И. Я. Динер, Л. Б. Комаров, А. А. Свешников, К. Б. Старобин; под ред. А. А. Свешникова. — М.: Наука. Гл. ред. физ.-мат. лит., 1970. [4] Емельянов, Г. В. Задачник по теории вероятностей и математической статистике: Учебное пособие. / Г. В. Емельянов, В. П. Скитович. — Ленинград: Изд-во Ленинградского университета, 1967. [5] Гнеденко, Б. В. Курс теории вероятностей: Учебник. — Изд. 6-е, перераб. и доп. / Б. В. Гнеденко. — М.: Наука. Гл. ред. физ.-мат. лит., 1988. [6] Кибзун, А. И. Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами: Учебное пособие. / А. И. Кибзун, Е. Р. Горяинова, А. В. Наумов, А. Н. Сиротин. — М.: ФИЗМАТЛИТ, 2002. [7] Колемаев, В. А. Теория вероятностей и математическая статистика: Учебное пособие. —/В. А. Колемаев, В. Н. Калинина. — М.: ИНФРА-М, 2000. [8] Козлов, М. В. Элементы теории вероятностей в примерах и задачах: Учебное пособие. / М. В. Козлов. — М.: Изд-во МГУ, 1990. [9] Крупкина, Т. В. Теория вероятностей, математическая статистика и эконометрика: Учеб. пособие. В 2-х кн. Кн. 1. / Т. В. Крупкина, А. К. Гречкосеев. — Красноярск: Красноярский гос. ун-т, 1999. [10] Крупкина, Т. В. Теория вероятностей и математическая статистика: Учеб. пособие. В 2-х ч. Ч. 1. / Т. В. Крупкина, В. П. Малый. — Красноярск: Красноярский гос. ун-т, 1991. [11] Пугачев, В. С. Теория вероятностей и математическая статистика: Учебное пособие. / В. С. Пугачев. — М.: ФИЗМАТЛИТ, 2002. [12] Феллер, В. Введение в теорию вероятностей и ее приложения: Учебник. — Изд. 2-е, перераб. и доп. В 2-х т. Т. 1. / Вильям Феллер. — М.: Мир, 1964. 169 Учебное издание Татьяна Валерьевна КРУПКИНА Антон Игоревич ПЫЖЕВ Сергей Валерьевич БАБЕНЫШЕВ Екатерина Сергеевна КИРИК ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ПРИМЕРАХ И ЗАДАЧАХ Учебное пособие Редактор — А. А. Назимова Корректор — Т. Е. Бастрыгина Лицензия ЛР № 020372 от 29.01.1997 Печать офсетная. Подписано в печать 00.00.07. Формат 60 × 84 / 16. Бумага типографская. Гарнитура литературная. Усл. печ. л. 0,0. Уч.-изд. л. 0,0. Тираж 000 экз. Заказ № 0000. Цена договорная. Издательский центр Института естественных и гуманитарных наук Сибирского федерального университета. 660041 Красноярск, пр. Свободный, 79. Модуль 2 Основы эконометрики Тема 2.1 Методологические основы курса Семинар 2.1.1. Расчет основных описательных статистик. Знакомство с пакетом STATISTICA. Задача 1 «Стоимость жилья» В результате обследования 20 квартир, получены следующие данные: Таблица 1 Характеристики и цена на 1-комнатные квартиры № Общая площадь, м2, Х1 30 32,3 32 29 38 39 29 32 33 31,6 34 35,4 30 21,1 29 29 30 33 32 29 Жилая Кухня 2 площадь, м , площадь, м2 , Х2 Х3 17,8 6,7 12,3 9 17 7 13 7 20 9 19 6 15 6 18,8 6 15,5 6 18,7 5,8 18 6 17,5 9,2 18 7 16,9 5,5 16 6 16 6 18 6 19 8 21 6 18 6 Цена, у.е. , Y 65 57 55 50 70 65 55 58 50 70 68 80 70 80 58 57 65 52 45 62 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Задания: 1. Подумайте, какой из представленных показателей наиболее существенно влияет на цену? Какие, важные по Вашему мнению, факторы остались без внимания исследователя? 2. Рассчитайте основные описательные статистики для первых десяти наблюдений Y: среднюю, дисперсию, среднеквадратическое 1 отклонение, коэффициент вариации, коэффициент ассиметрии, коэффициент эксцесса. 3. Сделайте выводы об однородности выборки и о близости ее к нормальному закону распределения. Задания для самостоятельной работы Упражнения 1. Задан ряд наблюдений за переменной Х=(3;0;4;2;1). Подсчитать основные статистики данного ряда: среднее арифметическое, медиану, моду, дисперсию, показатель асимметрии и эксцесса, размах вариации выборки. 2. Мода больше медианы. Где лежит среднее? 3. Утверждается, что среди всех характеристик центра распределения средняя арифметическая является той точкой, сумма квадратов отклонения которой от элементов совокупности минимальна. Обоснуйте данное утверждение. Семинар 2.1.2 Работа в пакете STATISTICA. Визуализация данных. Определение степени однородности выборки. Проверка данных на близость к нормальному закону распределения. Построение корреляционной матрицы Задача 2 По данным задачи 1 «Стоимость жилья».(семинар 2.1.1): Задания для работы в пакете STATISTICA: 1. создайте новый файл; 2. введите данные; 3. рассчитайте основные описательные статистики, 4. использование графического редактора для построения гистограмм и функций распределения данных. 5. Визуализация данных. Определение степени однородности выборки. Проверка данных на близость к нормальному закону распределения. 6. Построение поля корреляции. 7. Построение корреляционной матрицы. Задача 3. По приведенным ниже данным вычислите оценку парного линейного коэффициента корреляции между переменными X и Y. 2 10 10 ∑ xi = 9; ∑ xi2 = 908; i =1 i =1 10 ∑ yi = 68, i =1 10 ∑x y i =1 i 10 i = 664. ∑ y i2 = 496. i =1 Задача 4. По результатам обследования n = 8 промышленных предприятий получена следующая информация ( X 1 — себестоимость продукции, X 2 — объем выработки, X 3 — фондоотдача.): Таблица 2 X1 30 20 40 35 45 25 50 30 X2 20 30 50 70 80 20 90 25 X3 20 25 20 15 10 30 10 20 Определите: 1. значения средних квадратических отклонений ( S х ), где j= 1, 2, 3; 2. значения парных коэффициентов корреляции r12 , r13 и r23 . Генеральная совокупность, предполагается нормально распределенной. j Задания для самостоятельной работы. Задача 5. По данным n=10 машиностроительных предприятий, методами корреляционного анализа исследуется взаимосвязь между следующими показателями: Х1 — рентабельность (%); Х2 — премии и вознаграждения на одного работника; Х3 — фондоотдача. Таблица 3 № п/п Х1 Х2 Х3 1 13,26 1,23 1,45 2 10,16 1,04 1,30 3 13,72 1,80 1,37 4 12,82 0,43 1,65 5 10,63 0,88 1,91 6 9,12 0,57 1,68 7 25,83 1,72 1,94 8 23,39 1,70 1,89 9 14,68 0,84 1,94 10 10,05 0,60 2,06 Постройте матрицу выборочных парных линейных коэффициентов корреляции. 3 Задача 6 Ниже приведены данные о количестве потребляемого пива(Q) и ценах на этот продукт(P). Таблица 4 год Q P 1 34.4 90.6 2 35.8 85.3 3 36.7 81.8 4 38.3 78.9 5 39.1 73.9 6 40.1 74.3 7 40.7 71.5 8 40.3 68.4 9 41.4 66.4 10 41.7 65.9 Задания: 1. Вычислите среднюю, дисперсию для каждого ряда, ковариацию и коэффициент корреляции между ними. 2. Сделайте выводы о характере и тесноте связи. Тема 2.2 Корреляционный анализ Семинар 2.2.1. Работа в пакете STATISTICA. Анализ адекватности корреляционных связей. Формирование более однородной выборки. Оценка адекватности результатов по скорректированной выборке. Формирование отчета в программе Excel Задача 7 «Успеваемость» Провести анализ корреляционных связей между успеваемостью студента в средней школе и его успеваемостью в высшей школе. В группе проводится сбор информации по каждому студенту: Х1 — средний балл успеваемости по школьному аттестату; Х2 — сумма набранных баллов при поступлении в университет; Х3 — средний балл успеваемости за первый курс; Х4 – пол студента (мужской – 0, женский – 1) Х5 – тип среднеобразовательного учебного заведения, которое окончил студент ( школа – 0, гимназия – 1) Работа в пакете STATISTICA: 1. ввод данных; 2. визуализация данных; 3. построение корреляционной матрицы, анализ адекватности корреляционных связей. 4. Корректировка данных: формирование более однородной выборки. 5. Оценка адекватности результатов по скорректированной выборке. 6. Формирование отчета в программе Excel. 4 Задания для самостоятельной работы. Задача 8. Исследуйте взаимосвязи между средним душевым доходом, индексом человеческого развития и индексом человеческой бедности. Имеются следующие данные: Таблица 5 Страна Душевой Индекс Индекс доход*, человеческого человеческой долл., развития (ИЧР), бедности (ИЧБ), у х1 х2 ОАЭ 1600 0,866 14,9 Таиланд 7100 0,833 11,7 Уругвай 6750 0,883 11,7 Ливия 6130 0,801 18,8 Колумбия 6110 0,848 10,7 Иордания 4190 0,730 10,9 Египет 3850 0,514 34,8 Марокко 3680 0,566 41,7 Перу 3650 0,717 22,8 Шри-Ланка 3280 0,711 20,7 Филиппины 2680 0,672 17,7 Боливия 2600 0,589 22,5 Китай 2600 0,626 17,5 Зимбабве 2200 0,513 17,3 Пакистан 2150 0,445 46,8 Уганда 1370 0,328 41,3 Нигерия 1350 0,393 41,6 Индия 1350 0,446 36,7 * По паритету покупательной способности валют 5 Задания: 1. Проведите визуализацию данных. Сделайте заключение об однородности и близости выборки к нормальному распределению. 2. Постройте поля корреляций Y, X1 и Y, X2. Сформулируйте гипотезу о форме связи. 3. Постройте корреляционную матрицу, дайте анализ связям. Семинар 2.2.2. Проверка статистической значимости парного коэффициента корреляции. Построение корреляционной матрицы с расчетными уровнями значимости. Выполнение расчетно-графического задания (РГЗ) №1: п. I.,п. II. Задача 9 По данным n=10 машиностроительных предприятий, методами корреляционного анализа исследуется взаимосвязь между следующими показателями: Х1 — рентабельность (%); Х2 — премии и вознаграждения на одного работника; Х3 — фондоотдача. Таблица 6 № п/п Х1 Х2 Х3 1 13,26 1,23 1,45 2 10,16 1,04 1,30 3 13,72 1,80 1,37 4 12,82 0,43 1,65 5 10,63 0,88 1,91 6 9,12 0,57 1,68 7 25,83 1,72 1,94 8 23,39 1,70 1,89 9 14,68 0,84 1,94 10 10,05 0,60 2,06 Задания: 1. Проверьте при α=0,05 значимость парного коэффициента корреляции ρ12 ; 2. найдите его интервальную оценку с доверительной вероятностью γ=0,95. Задача 10. 6 Ниже приведены данные об объемах продаж Кока-колы (Q) и ценах на этот продукт (P). Таблица 7 год 1 2 3 4 5 6 7 8 9 10 Q 34.4 35.8 36.7 38.3 39.1 40.1 40.7 40.3 41.4 41.7 P 90.6 85.3 81.8 78.9 73.9 74.3 71.5 68.4 66.4 65.9 Определите, начиная с какого уровня значимости можно утверждать, что связь между ценой и количеством потребляемой Кока-колы существует? Задача 11 По данным задачи 1 «Стоимость жилья» (семинар 2.1.1): 1. Подумайте, какой из представленных показателей наиболее существенно влияет на цену? 2. Какие, важные по Вашему мнению, факторы остались без внимания исследователя? 3. Постройте корреляционную матрицу. 4. Проанализируйте корреляционные связи. Оправдались ли Ваши ожидания (п.1)? Задача 12 По данным задачи 7 «Успеваемость» (семинар 2.2.1). 1. Проверьте значимость коэффициентов корреляции на уровнях: 1% ,5% ,10%. 2. Постройте корреляционную матрицу с расчетными уровнями значимости, используя пакет STATISTICA. 3. Отчета сформируйте в программе Excel. Выполнение расчетно-графического задания (РГЗ) №1: п. I.,п. II. Расчетно-графическое задание №1. Содержание работы: I. Визуализация данных. 1.1. Постройте диаграмму рассеивания для исследуемого показателя (Y). 1.2. Проверьте исходные данные на близость к нормальному закону распределения. Постройте гистограмму (Y) и график (Y) на нормальной вероятностной бумаге. II. Корреляционный анализ. 7 2.1. Постройте поля корреляций показателя (Y) с каждым из факторов Хj . Сделайте предположение о характере связи между показателями. 2.2. Постройте корреляционную матрицу, определите уровни значимости коэффициентов корреляции. 2.3. Выделите факторы, оказывающие значимое (на уровне ≤0,05) влияние на результирующий показатель (Y). 2.4. Проанализируйте наличие мультиколлинеарности между объясняющими переменными. 2.5. Дайте экономическую интерпретацию корреляционным связям. III. Регрессионный анализ. 3.1. Постройте парное линейное регрессионное уравнение. Отбор фактора обоснуйте с помощью корреляционной матрицы. 3.1. 1. Приведите в отчете полученную модель. Охарактеризуйте её качество, используя критерии Фишера и Стьюдента, R2, R2adj . 3.1. 2. Приведите графики остатков в зависимости от объясняющей переменной, а также графики остатков на нормальной вероятностной бумаге. Проанализируйте выполнение условий ГауссаМаркова. 3.2. Постройте адекватное нелинейное регрессионное уравнение. Отбор факторов осуществите с помощью пошаговых процедур. 3.2. 1. Приведите в отчете полученную модель. Охарактеризуйте её качество, используя критерии Фишера и Стьюдента, , R2, R2adj . 3.2. 2. Приведите графики остатков в зависимости от объясняющей переменной, а также графики остатков на нормальной вероятностной бумаге. Проанализируйте выполнение условий ГауссаМаркова. IV.Экономическая интерпретация полученных результатов. 4.1. Рассчитайте коэффициенты эластичности факторов, входящих в модели линейно. 4.2. Дайте экономическую интерпретацию соответствующих линейных коэффициентов регрессии. Таблица 8 № пп 1 2 У1 9,26 9,38 У2 204,2 209,6 У3 13,26 10,16 Х4 0,23 0,34 Х5 0,78 0,75 Х6 0,4 0,26 Х7 1,37 1,49 Х8 1,23 1,04 Х9 0,23 0,39 8 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 № п/п 12,1 1 10,8 1 9,35 9,87 8,17 9,12 5,88 6,3 6,22 5,49 6,5 6,61 4,32 7,37 7,02 8,25 8,15 8,72 Х10 1 1,45 2 1,3 3 1,37 4 5 1,65 1,91 6 1,68 7 8 1,94 1,89 9 10 1,94 2,06 11 12 13 1,96 1,02 1,85 222,6 13,72 0,19 0,68 0,4 1,44 1,8 0,43 236,7 62 53,1 172,1 56,5 52,6 46,6 53,2 30,1 146,4 18,1 13,6 89,8 62,5 46,3 103,5 73,3 12,85 10,63 9,12 25,83 23,39 14,68 10,05 13,99 9,68 10,03 9,13 5,37 9,86 12,62 5,02 21,18 25,17 0,17 0,23 0,43 0,31 0,26 0,49 0,36 0,37 0,43 0,35 0,38 0,42 0,3 0,32 0,25 0,31 0,26 0,7 0,62 0,76 0,73 0,71 0,69 0,73 0,68 0,74 0,66 0,72 0,68 0,77 0,78 0,78 0,81 0,79 0,5 0,4 0,19 0,25 0,44 0,17 0,39 0,33 0,25 0,32 0,02 0,06 0,15 0,08 0,2 0,2 0,3 1,42 1,35 1,39 1,16 1,27 1,16 1,25 1,13 1,1 1,15 1,23 1,39 1,38 1,35 1,42 1,37 1,41 0,43 0,88 0,57 1,72 1,7 0,84 0,6 0,82 0,84 0,67 1,04 0,66 0,86 0,79 0,34 1,6 1,46 0,18 0,15 0,34 0,38 0,09 0,14 0,21 0,42 0,05 0,29 0,48 0,41 0,62 0,56 1,76 1,31 0,45 Х11 2600 6 2393 5 2258 9 2122 0 7394 1158 6 2660 9 7801 1158 7 9475 1081 1 6371 2676 Х12 167,6 9 Х13 Х14 Х15 Х16 Х17 47750 6,4 166,32 10,08 17,72 186,1 220,4 5 50391 7,8 92,88 14,76 18,39 43149 9,76 158,04 6,48 169,3 39,53 41089 14257 7,9 5,35 93,96 21,96 22,37 173,88 11,88 28,13 40,41 102,9 6 37,02 22661 9,9 162,3 52509 14903 4,5 4,88 88,56 11,52 21,92 101,16 8,28 19,52 45,74 40,07 25587 16821 3,46 3,6 166,32 11,52 23,99 140,76 32,4 21,76 45,44 41,08 136,1 19459 12973 50907 3,56 5,65 4,28 128,52 11,52 25,68 177,84 17,28 18,13 114,48 16,2 25,74 12,6 26,46 17,55 9 14 15 0,88 0,62 16 17 18 1,09 1,6 1,53 19 20 1,4 2,22 1 4210 3557 1414 8 9872 5975 1666 2 9166 4 42,39 37,39 101,7 8 47,55 32,61 103,2 5 38,95 6920 5736 8,85 8,52 93,24 13,32 21,21 126,72 17,28 22,97 26705 20068 11487 7,19 4,82 5,46 91,8 69,12 66,24 9,72 16,38 16,2 13,21 24,84 14,48 32029 18946 6,2 4,25 67,68 50,4 14,76 13,38 7,56 13,69 У1 — производительность труда У2 — индекс снижения себестоимости продукции У3— рентабельность Х4 — трудоемкость единицы продукции Х5 — удельный вес рабочих в составе промышленнопроизводственного персонала Х6 — удельный вес покупных изделий Х7 — коэффициент сменности оборудования Х8 — премии и вознаграждения на одного работника Х9 — удельный вес потерь от брака Х10 — фондоотдача Х11 — среднгодовая численность промышленнопроизводственного персонала Х12 — среднегодовая стоимость основных производственных фондов Х13 — среднегодовой фонд заработной платы промышленнопроизводственного персонала Х14 — фондовооруженность труда Х15 — оборачиваемость нормируемых оборотных средств Х16 — оборачиваемость ненормируемых оборотных средств Х17 — непроизводственные расходы Задания для самостоятельной работы. Задача 13. При приеме на работу семи кандидатам было предложено два теста. Результаты тестирования приведены в таблице: Таблица 9 Тест Результаты тестирования кандидатов (в баллах) 1-й 2-й 3-й 4-й 5-й 6-й 7-й 10 1. 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26 Вычислить коэффициент ранговой корреляции Спирмена между результатами тестирования по двум тестам. 2. На уровне α=0,05 оценить его значимость. Задача 14. По данным n=15 предприятий, каждое из которых характеризуется по трем показателям: х1 – объем сменной выработки, х2 – себестоимость продукции и х3 – фондоотдача; получена матрица парных коэффициентов корреляции: −0, 6 0,8 ⎤ ⎡ 1 ⎢ R = ⎢ −0, 6 1 −0, 6 ⎥⎥ ⎢⎣ 0,8 −0, 6 1 ⎥⎦ 1. Определите оценку частного коэффициента корреляции r23.1. 2. Проверьте при α=0,05 значимость частного коэффициента корреляции r23.1. 3. Найдите точечную оценку множественного коэффициента корреляции, характеризующего тесноту связи между себестоимостью и остальными переменными. 4. При α=0,05 проверить значимость множественного коэффициента корреляции r2.13. 5. Определите, какая доля дисперсии х2 объясняется влиянием показателей х1 и х3. Тема 2.3 Модели и методы регрессионного анализа Семинар 2.3.1. Парная линейная регрессионная модель. Пример 1 Покажите, что b 1 = r X Y *S Y /S X , где r X Y — выборочный коэффициент корреляции между X и Y, а S Y , S X — стандартные отклонения Y и X соответственно. Пример 2 Для наблюдений: Таблица 10 11 Y X 2 1 5 3 3 2 4 3 6 4 Вычислите следующие величины: 1. коэффициент детерминации R 2 в регрессии Y t на X t при наличии свободного члена; 2. коэффициент детерминации R 2 в регрессии Y t на X t при отсутствии свободного члена; 3. коэффициент детерминации R 2 в регрессии y t на x t при наличии свободного члена, где y t и x t — отклонения переменных Y t и X t от их средних значений; 4. коэффициент детерминации R 2 в регрессии y t на x t при отсутствии свободного члена. Пример 3. Рассмотрим модель регрессии на константу Y t = β 0 + ε t . t = 1,…,n. 1. Найдите оценки метода наименьших квадратов для β 0 2 и σ (дисперсии ошибок). 2. Чему равен коэффициент детерминации R 2 ? Пример 4. Рассмотрим модель регрессии без константы Y t = β 1 *Y t + ε t . , t = 1,…,n. Формула для МНК-оценки в регрессии без константы: b1 = ∑ X tYt ∑ X t2 Приведите примеры данных, для которых: 1. значение коэффициента R 2 , рассчитанное по формуле R 2 = RSS/TSS, отличается от значения R 2 , рассчитанного по формуле R 2 = 1 — ESS/TSS; 2. значение коэффициента R 2 , рассчитанное по формуле R 2 = RSS/TSS, больше 1; 3. значение R 2 , рассчитанное по формуле R 2 = 1 — ESS/TSS, меньше 0. Пример 5. 12 Исследуйте зависимость между производительностью труда одного занятого Y и фондом оплаты труда X по n = 10 косметическим салонам. Таблица 11 № 1 2 3 4 5 6 7 8 9 10 п/п X 8 11 12 9 8 8 9 9 8 12 Y 5 10 10 7 5 6 6 5 6 8 Пример 6. По данным примера 5 оцените производительность труда одного занятого для салонов с фондом оплаты труда 8 (у.е); Пример 7 Наблюдения 5 пар (X,Y) дали следующие результаты: ∑Y 2 = 90; ∑Y = 20, ∑Х 2 = 39, ∑Х = 13 ∑ХY = 59, Оцените регрессию Y t = β 0 + β 1 *X t + ε t . Пример 8. По приведенным ниже данным: n = 12 Χ = 200 ∑X = 2400 Υ = 173,92 ∑Y = 2087 ∑Y 2 = 364741 ∑X 2 = 483236 ∑XY = 419782 Вычислите парную регрессию Y на Х Пример 9. По данным годовых отчетов, десяти (n=10) машиностроительных предприятий, оцените линейную регрессионную модель зависимости производительности труда Y (млн. руб. на чел.), от объёма производства X (млрд. руб.): Y = β0 + β1X + ε. Таблица 12 Nп/п (i) Y X 3 2,1 1 4 2,8 2 5 3,2 3 5 4,5 4 5 4,8 5 5 4,9 6 13 7 8 9 10 5,5 6,5 12,1 15,1 6 7 15 20 Задача 15 «Производительность». Имеются следующие данные: Таблица 13 Производительность труда (Y) 1,6 2,4 2,8 3,2 № п/п Фонд оплаты труда (Х) 1 1 2 3 3 6 4 8 Задания: 1. Найдите точечную оценку условного математического ожидания производительности труда при фонде оплаты труда равном 10, если генеральное уравнение регрессии — линейное. 2. Проверьте значимость генерального коэффициента корреляции ρХУ на уровнях 1%, 5%, 10%. 3. Проверьте качество уравнения регрессии с помощью: • Средней ошибки аппроксимации; • Стандартной ошибки регрессии; • Коэффициента детерминации. 4. Сформулировать задачу, обратную данной ( Х — результирующий показатель, У — объясняющая переменная). 5. Выполнить п. 2-3 для обратной задачи. Какие статистики в прямой и обратной задачах совпадают, а какие разные? Работа в пакете STATISTICA: Задача 16 По данным задачи 15 «Производительность» выполните: 1. Ввод данных; 2. Расчеты в модуле Multiple Regression. 3. Анализ таблиц: Regression Summary, ANOVA. 4. Анализ таблиц: Regression Summary, ANOVA в задачи, обратной к задаче «Производительность». 5. Отчет в программе Excel. 14 Задача 17 По данным задачи 7 «Успеваемость» (семинаре 2.2.1): 1. Постройте регрессионную модель зависимости среднего балла успеваемости студента за первый курс (Х3) от среднего балла по аттестату (Х1). 2. Проведите анализ качества уравнения. Задача 18 По данным задачи 1 «Стоимость жилья» (семинар 2.1.1). 1. Постройте регрессионную модель зависимости стоимости квартиры (У) от размера жилой площади (Х2). 2. Проведите анализ качества уравнения. Задания для самостоятельной работы. Упражнения. 1. Построить уравнения прямой, обратной и ортогональной регрессии: а) Х: 1 2 3 Y: 1 0 5 б) Х: 0 2 0 2 Y: 0 0 2 2 в) Х: 0 1 1 2 Y: 1 0 2 1 г) Х: 0 2 0 2 0 Y: 0 0 2 2 2 д) Х: 0 3 0 3 Y: 0 0 2 2 е) Х: 1 2 5 7 Y: 5 7 1 3 1 7 2. Пусть в наблюдениях упражнения №1 единицы измерения Y уменьшились в 10 раз. Как изменятся уравнения прямой и обратной регрессии? 3. Могут ли матрицы: ⎡ 2 3⎤ ⎡4 3⎤ а) ⎢ ⎥ ; б) ⎢2 3⎥ ⎣ 3 4⎦ ⎣ ⎦ являться ковариационными матрицами переменных, для которых строятся уравнения регрессии? Ответ обоснуйте. 4. Дисперсии двух переменных совпадают, корреляция отсутствует. Изобразить на графике — в пространстве переменных — линии прямой, обратной и ортогональной регрессий. Ответ обосновать. 5. Дисперсии выпуска продукции и количества занятых по предприятиям равны 10 и 20, их ковариация равна 12. чему равен коэффициент детерминации в регрессии выпуска по занятым, коэффициент зависимости выпуска от занятых по прямой, обратной регрессии. 15 6. Дисперсии временных рядов индекса денежной массы и сводного индекса цен равны 150 и 200, их ковариация равна 100. Чему равен параметр влияния денежной массы на цены по модели прямой регрессии и доля объясненной дисперсии в дисперсии индекса цен? 7. По заданной матрице ковариации двух переменных ⎡14 / 3 5 / 3⎤ ⎢ 5 / 3 2 / 3⎥ найти остаточную дисперсию уравнения регрессии ⎣ ⎦ первой переменной по второй. 8. В регрессионной модели Y = b0 + b1X + e, где Y = (5, 3, 7, 1) получены оценки b1 = 2, b0 = 1, а коэффициент детерминации оказался равным 100%. Найдите X. 9. В регрессии Y = b0 + b1X + e, где Y = (5, 3, 7, 1) коэффициент детерминации оказался равным 50%. Найдите сумму квадратов остатков Σ еi² . 10. Две регрессии построены на одних и тех же данных: Y = aX + b, X = cY + d. Т — коэффициент детерминации в первой регрессии, S — во второй. Напишите соотношение между Т и S. 11. Возможна ли ситуация, когда угловые коэффициенты в уравнениях прямой и обратной регрессии соответственно равны 0,5 и 3,0. Почему? 12. Докажите, что линия ортогональной регрессии находится между линиями прямой и обратной регрессии. 13. Какая из двух оценок коэффициента зависимости выпуска продукции от количества занятых в производстве больше другой: по прямой или ортогональной регрессии. Ответ обосновать. 14. Какая из двух оценок коэффициента зависимости спроса от цены больше другой: по прямой или ортогональной регрессии. Ответ обосновать. 15. Оценка парной регрессии ведется в стандартизированной шкале. Как связан коэффициент детерминации и коэффициент регрессии (угловой)? 16. Какой вид будет иметь оценка уравнения регрессии Y = β0 + β1 * Х + ε, если фактическое значение коэффициента детерминации равно нулю, среднее значение у и х, соответственно равны 1 и 3? 17. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7, 1). Могут ли остатки быть равными (1, -2, 2, -1). Обосновать. 18. В модели Y = b0 + b1 * Х + e фактор Х равен (1, 3, 7, 2). Могут ли остатки быть равными (1, -2, 1, -1). Обосновать. 19. Оцените модель Y = b0 + b1 * Х + e используя следующие данные: 16 Y X Таблица 14 5 4 3 1 8 3 3 1 5 2 Вычислите остатки (еt) и покажите, что: а) Σ et = 0 б) Σ Хtet = 0 20. Что геометрически означает R2 = 0 и R2 = 1? 21. Докажите, что коэффициент детерминации не зависит от выбора масштаба измерения переменных. Задача 19. Имеются следующие данные об уровне механизации работ Х (%) и производительности труда Y (т/ч) для 14 однотипных предприятий: Таблица 15 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Xi 32 30 36 40 41 47 56 54 60 55 61 67 69 76 Уi 20 24 28 30 31 33 34 37 38 40 41 43 45 48 Необходимо: а) оценить тесноту и направление связи между переменными с помощью линейного парного коэффициента корреляции; б) оценить линейную модель У по X. Задача 20. При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные: X = 16,2; Y = 4000 (усл. ед.); S x2 = 4; S y2 = 500; Cov(X, Y)=40. Необходимо: а) построить линейное уравнение регрессии Y по X; б) найти среднее значение индекса при цене на нефть 16,5 ден. ед. Задача 21. На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за 1992 г., приведенных в таблице и предположения, что генеральное регрессии имеет вид: Yˆ = β 0 + β 1 х. Таблица 16 страны У Х Япония 3,5 4,3 США 3,1 4,6 Германия 2,2 2,0 17 2,7 3,1 Франция 2,7 3,0 Италия 1,6 1,4 Великобритания 3,1 3,4 Канада 1,8 2,6 Австралия 2,3 2,6 Бельгия 2,3 2,4 Нидерланды Требуется определить оценки вектора b и остаточной дисперсии S ост 2 . Задача 22. 1. В регрессии Χ = αΖ + β + ε матрица вторых начальных моментов регрессоров равна 9 2 2 1 Найти матрицу вторых центральных моментов. Семинар 2.3.2. Проверка значимости уравнения регрессии. Проверка значимости коэффициентов регрессии. Проверка выполнения условий Гаусса — Маркова (предпосылок регрессионного анализа). Пример 10. Наблюдения 5 пар (X,Y) дали следующие результаты: ∑Y 2 = 90; ∑Y = 20, ∑Х 2 = 39, ∑Х = 13 ∑ХY = 59, Используя результаты примера 7 из семинара 5, проверьте гипотезу, что коэффициент β 1 (Y t = β 0 + β 1 *X t + ε t ) равен 1. Пример 11. 18 По приведенным ниже данным и результатам примера 8 (семинар 5): n = 12 Χ = 200 ∑X = 2400 Υ = 173,92 ∑Y = 2087 ∑Y 2 = 364741 ∑X 2 = 483236 ∑XY = 419782 2 2 2 Вычислите S ост , S b , S b 0 1 Пример 12. По условию и результатам примера 2 (семинар 6): 1. Проверьте на 5%-уровне значимость коэффициентов β 0 и β 1 . 2. Вычислите коэффициент детерминации, используя равенство 2 R = RSS/TSS и R 2 = 1 – ESS/TSS. Пример 13. По условию и результатам примера 9 (семинар 5) проведите статистический анализ полученного уравнения регрессии: 1. Определите абсолютные и относительные ошибки аппроксимации. 2. Проверьте значимость уравнения регрессии на 5% уровне. 3. Проверьте значимость коэффициентов регрессии на 1%, 5%, 10% уровнях значимости. Пример 14. По следующим данным о производительности труда одного занятого Y и фонде оплаты труда X по n = 10 косметическим салонам. Таблица 17 № п/п 1 2 3 4 5 6 7 8 9 10 X 8 11 12 9 8 8 9 9 8 12 Y 5 10 10 7 5 6 6 5 6 8 построено уравнение регрессии Y по X: yˆ = 2,75 + 1,016 x . (Результаты примера 5, семинар 5) 1. Оцените на уровне α = 0,05 значимость уравнения регрессии Y по X. 2. Найдите коэффициент детерминации и поясните его смысл. 19 Задача 23 По результатам задачи 16 «Производительность» (семинар 2.3.1): 1. Проверить качество уравнения регрессии с помощью: • средней ошибки аппроксимации; • коэффициента детерминации; • стандартной ошибки регрессии. 2. Проверить значимость коэффициента корреляции на 5% уровне. 3. Проверить значимость уравнения регрессии на 5% уровне. 4. Проверить значимость параметров уравнения регрессии на 5% уровне. 5. Проверить выполнение условий ГауссаМаркова (в программе STATISTICA). 6. Постройте задачу, обратную данной. 7. Выполните пункты 1-5 для обратной задачи. Выполнение РГЗ №1 (формулировка заданий и данные приведены в семинаре 2.2.2) п. III, 3.1. (в программе STATISTICA). Задания для самостоятельного решения. Задача 24 На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за 1992 г., приведенных в таблице и предположения, что генеральное регрессии имеет вид: Y€ = β 0 + β1 х. Таблица 18 страны У Х 3,5 4,3 Япония 3,1 4,6 США 2,2 2,0 Германия 2,7 3,1 Франция 2,7 3,0 Италия 1,6 1,4 Великобритания 3,1 3,4 Канада 1,8 2,6 Австралия 2,3 2,6 Бельгия 20 Нидерланды 2,3 2,4 Требуется: а) определить оценки вектора b и остаточной дисперсии 2 S ост ; б) при α =0,05 проверить значимость уравнения регрессии; в) при α =0,05 проверить значимость коэффициентов уравнения; Задача 25 Четырёхфакторное уравнение регрессии оценено по 20 наблюдениям. В каком случае отношение оценки коэффициента регрессии к её стандартной ошибке имеет распределение tСтьюдента? Сколько степеней свободы (в этом случае) имеет эта статистика. Задача 26 Оценки МНК в регрессии по 20-ти наблюдениям равны (2, -1), а ковариационная матрица этих оценок равна 9 2 2 1 Найти статистики Стьюдента для этих коэффициентов. Задача 27 В регрессии Χ = αΖ + β + ε переменная Ζ равна (1, 2, 3), сумма квадратов остатков равна 6. Найдите ковариационную матрицу оценок параметров регрессии. Задача 28 В регрессии Χ = αΖ + β + ε по 5-ти наблюдениям коэффициент детерминации равен 0,5. Проверьте гипотезу Η 0 : α = 0 . Задача 29 Оценка углового коэффициента регрессии равна 4, а дисперсия этой оценки равна 4. Начиная с какого уровня коэффициент значим, если 5%-я критическая граница равна 2.4, а 10%-я критическая граница равна 1.9? Задача 30. МНК-оценка параметра регрессии, полученная по 16 наблюдениям, равна 4, оценка его стандартной ошибки – 1. Можно ли утверждать с вероятностью ошибки не более 5%, что истинное значение параметра равно 5.93? Ответ обосновать. Задача 31. По 5-ти наблюдениям построена линейная 2-х факторная регрессия с константой. При этом коэффициент 21 детерминации равен 0.5. Чему равна F-статистика Фишера для уравнения регрессии? Семинар 2.3.3 Построение нелинейного регрессионного уравнения. Проверка качества и адекватности нелинейного уравнения регрессии. Проверка выполнения условий Гаусса — Маркова для нелинейной регрессионной модели. Множественная регрессионная модель. Пример 15. Могут ли следующие уравнения быть преобразованы в уравнения, линейные по параметрам? а) Y i = α * exp(βX i )*ε i , б) Y i = α * exp(-βX i ) + ε i , в) Y i = exp(α + βX i + ε i ), г) Y i = α / (β - X i ) + ε i . Обозначения α и β введены вместо традиционных β 0 и β 1 соответственно. Пример 16. Имеются данные (условные) о сменной добыче угля на одного рабочего Y(т), мощности пласта Χ 1 (м) и уровне механизации работ Χ 2 (%), характеризующие процесс добычи угля в 10 шахтах. Таблица 19 x i1 xi 2 yi x i1 xi 2 yi i i 1 8 5 5 6 8 8 6 2 11 8 10 7 9 6 6 3 12 8 10 8 9 4 5 4 9 5 7 9 8 5 6 5 8 7 5 10 12 7 8 Предполагая, что между переменными Y, Χ 1 и Χ 2 существует линейная корреляционная зависимость, найти ее аналитическое выражение (уравнение регрессии Υ по Χ 1 и Χ 2 ). 22 Пример 17. По данным примера 2 оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6%. Пример 18. По данным примера 2 определить множественный коэффициент детерминации и проверить значимость полученного уравнения регрессии Y по X 1 и X 2 на уровне α =0,05. Пример 19. Регрессия зависимой переменной Y на три независимые переменные на основе n = 30 наблюдений дала следующие результаты: Таблица 20 Ŷ= 25,1 + 1,2Х 1 + 1,0Х 2 - 0,50Х 3 (2,1) (1,5) (1,3) (0,060) Стандартные ошибки Sbj t-значения (11,9) ( ) ( ) ( ) 95%-доверительные (±4,3) ( ) ( ) ( ) границы A. Заполните пропуски. B. Истинный или ложны следующие утверждения ( если ложны, исправьте их): 1. Оценка коэффициента при Х1 есть 1,2. Другие исследователи могут собрать другие данные и построить другие оценки этого коэффициента. 2. Распределение этих оценок сосредоточенно вокруг истинного значения 1,2. Поэтому оценка называется несмещенной. 3. Если есть априорная уверенность в том, что Х1 не влияет на Y, то представляется разумным отвергнуть нулевую гипотезу H0: β1 = 0 на 5%-уровне значимости. 4. Если есть априорная уверенность в том, что Х2 влияет на Y, то представляется более разумным использовать оценку 1,0, чем принимать нулевую гипотезу H0: β2 = 0. Пример 20. 23 Бюджетное обследование 5 случайно выбранных семей дало следующие результаты (в тыс.руб.): Таблица 21 Семья Накоплен Доход, Имущест ия, S Y во, W 1 3,0 40 60 2 6,0 55 36 3 5,0 45 36 4 3,5 30 15 5 1,5 30 90 1. Оцените регрессию S на Y и W. 2. Спрогнозируйте накопления семьи, имеющей доход 40тыс.руб. и имущество стоимостью 25тыс.руб. 3. Предположим, что доход семьи возрос на 10тыс.руб., в то время как стоимость имущества не изменилась. Оцените, как возрастут её накопления. 4. Оцените, как возрастут накопления семьи, если её доход вырос на 5тыс. руб., а стоимость имущества увеличилась на 15тыс.руб. 5. Найдите сумму квадратов остатков и постройте оценку дисперсии регрессии. Пример 21. Рассмотрим регрессию S t = β 1 + β 2 y t + β 3 ω t + ε t из предыдущего примера А) Постройте 95%-доверительный интервал для 1. β2; 2. β3; Б) Проверьте с 5%-уровнем значимости следующие гипотезы: 1. β 3 = 0 (стоимость имущества несущественна); 2. β 2 = 0 (величина дохода несущественна); 3. β 2 = 1 (таким мог быть ответ вашего коллеги на вопрос о зависимости накопления от дохода). 4. β 2 = 1.57 (такое значение коэффициента β 2 могло быть с высокой степенью надежности установлено для другой стороны, и вас интересует вопрос, верно ли это для вашей страны). В) Пусть некоторая семья имеет доход Y = 30тыс.руб. и имущество стоимостью V = 52,5тыс.руб. 1. Чему равна прогнозная величина её накопления? 24 2. В каком смысле эта семья может рассматриваться как средняя между семьями 4 и 5 (задача 3.5)? Почему прогнозная величина её накоплений не есть среднее между 3,5 и 1,5тыс.руб.? 3. Постройте 95 %-доверительный интервал для прогнозной величины накопления этой семьи. Работа в программе STATISTICA Задача 32 По данным задачи 1 «Стоимость жилья». (семинар 2.1.1): 1. Подберите нелинейное уравнение регрессии, описывающие связь Y и Х 2 . 2. Проанализируйте качество нелинейного уравнения и сравните с качеством линейной модели. 3. Проверьте значимость параметров уравнения регрессии и значимость уравнения в целом на уровне 5%. Задача 33 По данным задачи 7 «Успеваемость». (семинар 2.2.1): 1. Подберите нелинейное уравнение регрессии, описывающие связь Х 1 и Х 3 . 2. Проанализируйте качество нелинейного уравнения и сравните с качеством линейной модели. 3. Проверьте значимость параметров уравнения регрессии и значимость уравнения в целом на уровне 5%. Выполнение РГЗ №1 (формулировка заданий и данные приведены в семинаре 2.2.2) п. III, 3.2. (в программе STATISTICA). Задания для самостоятельного решения Упражнения 22. Оценить линейную регрессию Х = Z1α1 + Z2α2 + β + ε по МНК для каждой из следующих групп данных (ниже расположенные величины показывают, что данные находятся в отклонениях от среднего значения) 25 а) Х: 3 2 8 3 5 Z1: 3 1 5 2 4 Z2: 5 4 6 4 6 2 2 б) Σ Z1 = 10; Σ Z2 = 5; Σ Z1Z2 = 5; Σ Z1X = 8; Σ Z2X = 6; 2 ΣX = 10; N = 23 в) Σ Z12 = 20; Σ Z22 = 10; Σ Z1Z2 = 15; Σ Z1X = -10; Σ Z2X = 15; Σ X2 = 102,5; N= 33 23. Регрессия X = α0 + α1Z1 + α2Z2 + ε оценивается по 3-м наблюдениям. Чему равен коэффициент детерминации? 24. На основании ежегодных данных за 10 лет с помощью МНК была сделана оценка параметров производственной функции типа Кобба — Дугласа. Чему равна несмещённая оценка дисперсии ошибки, если вектор остатков это e. 25. Четырёхфакторное уравнение регрессии оценено по 20 наблюдениям. В каком случае отношение оценки коэффициента регрессии к её стандартной ошибке имеет распределение tСтьюдента? Сколько степеней свободы (в этом случае) имеет эта статистика. 26. На основе годовых отчётов за 1973—1992 годы о затратах на продукты питания (Q), располагаемом доходе(Y), индексе цен на продукты питания (PF) и индексе цен на непродовольственные товары (PNF) группа исследователей получила различные регрессионные уравнения для функции спроса на продукты питания: log Q = 3.87 – 1.34 log PF (1.45) (-4.54) R 2 = 0.56 log Q = 2.83 – 0.92 log PF + 1.23 logY (1.25) (-2.70) (1.99) 2 R = 0.76 log Q = 2.35 – 0.52 log PF + 0.95 logY + 1.54 log PNF (1.54) (-1.80) (0.79) (1.45) 2 R = 0.84 В скобках приведены значения t-статистики. Прокомментируйте полученные оценки коэффициентов и t-статистики, объясните, почему значения могут различаться в трёх уравнениях. Можете ли вы предложить решение проблемы статистической незначимости коэффициентов в последнем уравнении? 27. Используя приведённые ниже данные, которые являются суммами квадратов и ковариации величин отклонений от средних значений, оцените параметры модели и, делая все необходимые предположения, проверьте статистическую значимость коэффициента α 2 . Χ t = β + α 1 Ζ1t + α 2 Ζ 2t + et 26 а) ∑ z12 = 10 ; ∑ z 22 = 5 ; ∑ z1 z 2 = 5 ; ∑ z1 x = 5 ; ∑ z 2 x = 6 б) ∑ z12 = 20 ; ∑ z 22 = 10 ; ∑ z1 z 2 = 10 ; ∑ z1 x = 15 ; ∑ z 2 x = −10 28. По 5-ти наблюдениям построена линейная регрессия с 2мя факторами и константой. При этом коэффициент детерминации равен 0,5. Чему равна F-статистика Фишера для уравнения регрессии? Задача 34. Анализ годовых данных (21 наблюдений) о спросе на некоторый товар привёл к результатам, указанным в следующей таблице: Таблица 22 Средние Стандартное Коэффициент отклонение корреляции x = 51.843 y = 8.313 T = 0.000 S X = 9.205 S Y = 1.780 S T = 6.057 R XY = −0.9158 RYT = −0.8696 R XT = 0.9304 где x — потребление на душу населения, y — цена с учётом дефлятора, T — время (годы). а) Найдите коэффициент при времени в оценённой регрессии y по x и T. б) Проверьте, будет ли этот коэффициент значимо отличен от нуля. в) Кратко объясните экономический смысл включения в регрессию времени в качестве объясняющей переменной. Задача 35 Имеются следующие данные о выработке литья на одного работающего х1(т), браки литья х2(т) и себестоимости х1т литья у (руб.) по 25 литейным цехам заводов: Таблица 23 I X1i X2i Yi i X1i X2i Yi i X1i X2i Yi 1 14.6 4.2 239 10 25.3 0.9 198 19 17.0 9.3 282 2 13.5 6.7 254 11 56.0 1.3 170 20 33.1 3.3 196 3 21.5 5.5 262 12 40.2 1.8 173 21 30.1 3.5 186 4 17.4 7.7 251 13 40.6 3.3 197 22 65.2 1.0 176 5 44.8 1.1 158 14 75.8 3.4 172 23 22.6 5.2 238 6 111.9 2.2 101 15 27.6 1.1 201 24 33.4 2.3 204 7 20.1 8.4 259 16 88.4 0.1 130 25 19.7 2.7 205 8 28.1 1.4 186 17 16.6 4.1 251 9 22.3 4.2 204 18 33.4 2.3 195 27 Необходимо: а). найти множественный коэффициент детерминации и пояснить его смысл; б). найти уравнение множественной регрессии y по x1 и x2? Оценить значимость этого уравнения и его коэффициентов на уровне а =0,05; в) сравнить раздельное влияние на зависимую переменную каждой из объясняющих переменных, используя стандартизованные коэффициенты регрессии и коэффициенты эластичности; г) найти 95%-ные доверительные интервалы для коэффициентов регрессии, а так же для среднего и индивидуальных значений себестоимости 1т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья — 40% Задача 36 Имеются следующие данные о годовых ставках месячных доходов по трем акциям за шестимесячный период: Таблица 24 Акция Доходы по месяцам, % А 5.4 5.3 4.9 4.9 8.4 6.0 B 6.3 6.2 6.1 5.8 5.7 5.7 C 9.2 9.2 9.1 9.0 8.7 8.7 Есть основания предполагать, что доходы y по акции с зависят от доходов х1 и х2 по акциям А и В. Необходимо: а) составить уравнение регрессии у по х1 и х2; б) найти множественный коэффициент детерминации R2 и пояснить его смысл; в) проверить значимость полученного уравнения регрессии на уровне а=00,5; г) оценить средний доход по акции С если доходы по акциям A и B составили соответственно 5,5 и 6,0% Семинар 2.3.4. Экономический смысл линейных коэффициентов регрессии. Коэффициент эластичности. Доверительный интервал для линии регрессии. Доверительный интервал для прогнозного значения. Пример 22. № п/п X Y 1 2 3 4 8 11 12 9 5 10 10 7 По данным таблицы 25: 5 8 5 6 8 6 7 9 6 8 9 5 Таблица 25 9 10 8 12 6 8 28 А также используя результаты примера 5 из семинара 5: 1) оцените производительность труда одного занятого для салонов с фондом оплаты труда 8 (у.е); 2) найдите 95% -ные доверительные интервалы для индивидуального и среднего значений производительности труда для таких же салонов; 3) найдите с надежностью 0,95 интервальные оценки коэффициента регрессии β 1 и дисперсии σ². Пример 23. По результатам примера 9 (семинар 5) и примера 4 (семинар 6) определите интервальные оценки коэффициентов регрессии с доверительной вероятностью γ=0,95. Задача 37 По результатам задач 16 и 23 «Производительность» (семинары 2.3.1 и 2.3.2): 1. Дайте экономическую интерпретацию коэффициентам регрессии. 2. Определите коэффициент средней эластичности производительности труда от изменения фонда оплаты труда. 3. Постройте доверительный интервал среднего значения производительности труда , если ФОТ составит 10 ед. 4. Постройте доверительный интервал индивидуального значения производительности труда , если ФОТ составит 10 ед. Выполнение РГЗ №1 (формулировка заданий и данные приведены в семинаре 2.2.2) п. IV. (в программе STATISTICA) Задания для самостоятельного решения. Задача 38 По данным 30 нефтяных компаний получено следующее уравнение регрессии между оценкой Y (ден. ед.) и фактической стоимостью X (ден. ед.) этих компаний: ух = 0,8750* + 295. Найти: 95%-ные доверительные интервалы для среднего и индивидуального значений оценки предприятий, фактическая стоимость которых составила 1300 ден. ед., если коэффициент корреляции между переменными равен 0,76, а среднее квадратическое отклонение S x = 29 270 ден. ед. Задача 39 На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за 1992 г., приведенных в таблице и предположения, что генеральное регрессии имеет вид: Y€ = β 0 + β1 х. Таблица 26 страны У Х 3,5 4,3 Япония 3,1 4,6 США 2,2 2,0 Германия 2,7 3,1 Франция 2,7 3,0 Италия 1,6 1,4 Великобритания 3,1 3,4 Канада 1,8 2,6 Австралия 2,3 2,6 Бельгия 2,3 2,4 Нидерланды Требуется: 1. с доверительной вероятностью γ =0,9 построить интервальные оценки β 0 и β1 ; 2. с доверительной вероятностью γ =0,9 построить интервальные оценки уравнения регрессии в точках, ⎛1 ⎞ ⎛1 ⎞ определяемых вектором начальных условий x 0 = ⎜⎜ ⎟⎟ ; x 0 = ⎜⎜ ⎟⎟ . ⎝ 3⎠ ⎝5⎠ Задача 40 По 10 наблюдениям дана оценка 4 одному из коэффициентов двухфакторной регрессии. Дисперсия ошибки этого коэффициента рана 4. Построить 99% доверительный интервал для этого коэффициента. Задача 41 МНК-оценка параметра регрессии, полученная по 16 наблюдениям, равна 4, оценка его стандартной ошибки – 1. Можно ли утверждать с вероятностью ошибки не более 5%, что истинное значение параметра равно 5.93? Ответ обосновать. 30 Семинар 2.3.5 Защита расчетно-графического задания №1. Семинар 10. Построение трендовых моделей. Построение линейного тренда. Построение нелинейного тренда. Анализ качества и адекватности трендовых моделей. Год, t Спрос, Y Пример 1. Провести сглаживание временного ряда Y по данным : Таблица 27 1 2 3 4 5 6 7 8 213 171 291 309 317 362 351 361 методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания m = 3 года. Пример 2. Выявить на уровне значимости 0,05 наличие автокорреляции возмущений e t для временного ряда Y t по данным: Год, t Спрос,Y 1 213 2 171 3 291 4 309 5 317 6 362 Таблица 28 7 8 351 361 Пример 3. По данным и результатам предыдущего примера, полагая, что тренд линейный, а возмущения удовлетворяют требованиям классической модели: 1. Дайте точечную оценку прогноза среднего значения спроса на момент t=9 (девятый год). 2. Дайте интервальную (с надежностью 0,95) оценку прогноза среднего значения спроса на некоторый товар на момент t=9 (девятый год). 3. Постройте доверительный интервал (с надежностью 0,95) для индивидуального значения Yt=9. Работа в пакете STATISTICA Задача «Потребление Кока-колы». 31 Имеются ежегодные данные о ценах и объемах потребления кока-колы. Таблица 29 T Q P 1 34,4 90,6 2 35,8 85,3 3 36,7 81,8 4 38,3 78,9 5 39,1 73,9 6 40,1 74,3 7 40,7 71,5 8 40,3 68,4 9 41,4 66,4 10 41,7 65,9 1. Проведите визуализацию данных; 2. Постройте трендовые модели разных видов; 3. Проведите анализ качества и адекватности моделей. Выполнение расчетно-графического задания №2 п.I, п.III. Расчетно-графическое задание №2. Содержание работы: 1. Визуализация данных. 1.1. Постройте диаграмму рассеивания для исследуемого показателя (Yt). 1.2. Проверьте исходные данные на близость к нормальному закону распределения. Постройте гистограммы и графики на нормальной вероятностной бумаге. 2. Автокорреляция уровней временного ряда. 2.1. Для указанных в варианте задания лабораторной работы показателей вычислите коэффициенты автокорреляции с различными лагами τ = 1, 2, ……q, величину q определите самостоятельно. 2.2. Приведите в отчете полученные коррелограммы и по виду графика сделайте заключение о структуре временных рядов. Объясните вид полученных коррелограмм с экономической точки зрения. Сделайте рекомендации относительно того, какие модели целесообразно использовать для описания каждого временного ряда. 3. Построение трендовой модели. 3.1. Для исследуемого временного ряда (Yt) подберите несколько трендовых моделей. Одна из них должна быть линейной. В качестве второй модели выберите одну из нелинейных зависимостей. Для третьей модели подберите полином соответствующей степени. 32 3.2. Приведите в отчете все три модели. Выберите из них наиболее адекватную. Обоснуйте свой выбор, используя критерии Фишера и Стьюдента. Приведите графики квадратов остатков в зависимости от объясняющей переменной, а также графики остатков на нормальной вероятностной бумаге. Проверьте выполнение условий Гаусса-Маркова. 3.3. Рассчитайте средние уровни Yt на 3 последних периода и сравните с реальными данными. Сделайте точечный и интервальный прогноз среднего уровня показателя Yt на перспективный период, а также постройте доверительный интервал для прогнозного значения. Интерпретируйте результаты. 4. Корреляция и лаговая корреляция временных рядов. 4.1. Приведите ряды к стационарному виду. Примените необходимые для этого преобразования, однако, следите, чтобы преобразований было как можно меньше. 4.2. Исследуйте корреляционные связи между показателями. Выделите, какие факторы и с каким периодом запаздывания влияют на ваш исследуемый признак (Yt). 4.3. Приведите в отчете коррелограммы рядов после преобразований, а также графики перекрестной корреляции. 5. Регрессия временных рядов. 5.1. Постройте модель, адекватно описывающую исследуемый показатель Yt. При необходимости включите в уравнение, помимо объясняющих переменных, трендовые и лаговые компоненты. 5.2. Приведите в отчете полученную модель. Охарактеризуйте ее качество, используя критерии Фишера и Стьюдента. Приведите графики квадратов остатков в зависимости от объясняющей переменной, а также графики остатков на нормальной вероятностной бумаге. Проверьте выполнение условий Гаусса-Маркова. 5.3. Спрогнозируйте средние уровни объясняющих переменных (Х) по адекватным трендам на 3 последних периода и на перспективу. Рассчитайте средний уровень Yt по уравнению регрессии на 3 последних периода и на перспективу, учитывая расчетные значения объясняющих переменных. Постройте доверительные интервалы для прогнозного значения и для среднего уровня Yt. Сравните с расчетами, полученными по трендовой модели и с реальными данными. Варианты работ: 33 Вариант 1. Рассмотрите показатели, приведенные в табл. 1. Проанализируйте Инвестиции в основной капитал (Yt), Объем промышленного производства (X1t), Оборот розничной торговли (X2t), Внешнеторговый оборот (Х3t), Среднемесячная начисленная заработная плата (Х4t) по предложенной выше схеме. Таблица 30 Период, месяц Инвестици ив основной капитал, млрд. руб. Объем промышле нн. производст ва, млрд. руб. Оборот розничной торговли, млрд. руб. Внешнетор го-вый оборот, млрд. $ Общая численност ь безработны х, млн. чел. 1 41,9 169,5 110,0 8,9 9,3 2 64,2 204,8 136,5 10,8 9,6 3 28,5 187,6 119,7 7,3 10,0 4 31,8 197,8 120,9 7,9 10,4 5 36,5 238,7 132,0 9,3 10,0 6 36,9 236,6 133,1 9,8 9,6 7 41,4 225,9 136,5 8,0 9,1 8 52,8 246,7 139,8 9,3 8,8 9 56,2 256,8 143,3 9,5 8,7 10 61,8 272,8 154,9 9,3 8,7 11 67,6 291,7 158,5 9,7 8,8 12 66,5 308,5 164,4 10,3 8,9 13 72,0 321,6 167,4 11,1 9,1 14 118,4 365,5 196,7 13,7 8,9 15 46,1 331,7 167,0 9,9 8,7 16 55,8 350,8 164,9 11,5 8,6 17 63,9 387,5 176,6 13,0 8,2 18 64,5 359,2 174,8 11,5 7,8 Среднемеся чная начисленна я заработная плата, руб на 1 занятого 116 4 148 2 116 7 119 9 138 5 142 3 147 2 162 6 161 8 160 8 168 4 171 6 178 9 228 3 183 0 183 9 201 8 203 34 19 75,8 361,1 176,6 11,8 7,4 20 95,7 384,5 181,6 12,2 7,3 21 99,0 391,6 186,5 12,2 7,2 22 112,9 407,7 198,9 12,9 7,1 23 118,3 417,6 201,6 12,6 7,1 24 114,6 442,7 209,8 13,2 7,0 25 123,1 451,9 215,5 14,5 7,0 26 195,5 476,2 252,9 15,1 7,0 27 70,9 436,4 209,4 11,6 7,1 28 82,3 430,2 211,0 11,8 7,1 29 91,7 482,0 229,3 13,2 6,8 30 93,4 467,2 232,6 13,1 6,4 31 112,8 468,1 239,1 13,3 6,1 32 132,7 477,5 242,7 14,0 6,1 33 135,7 491,8 245,2 12,7 6,1 34 153,3 503,2 260,7 13,7 6,1 35 158,7 494,1 260,9 12,6 6,2 36 153,8 530,6 272,4 13,2 6,2 9 210 1 229 4 230 2 228 9 236 7 242 5 250 8 302 5 273 3 265 5 296 4 292 3 305 4 328 4 336 4 337 6 340 5 351 5 Вариант 2. Рассмотрите показатели, приведенные в табл. 1. Проанализируйте Объем промышленного производства (Yt), Инвестиции в основной капитал (X1t), Оборот розничной торговли (X2t), Внешнеторговый оборот (Х3t), Общая численность безработных (Х4t) по предложенной выше схеме. Вариант 3. Рассмотрите показатели, приведенные в табл. 30. Проанализируйте Оборот розничной торговли (Yt), Объем 35 промышленного производства (X1t), Инвестиции в основной капитал (X2t), Внешнеторговый оборот (Х3t), Среднемесячная начисленная заработная плата (Х4t), Общая численность безработных (Х5t) по предложенной выше схеме. Вариант 4. Рассмотрите показатели, приведенные в табл. 30. Проанализируйте Внешнеторговый оборот (Yt), Объем промышленного производства (X1t), Инвестиции в основной капитал (X2t), Оборот розничной торговли (Х3t), Среднемесячная начисленная заработная плата (Х4t) по предложенной выше схеме. Вариант 5. Рассмотрите показатели, приведенные в табл. 30. Проанализируйте Среднемесячная начисленная заработная плата (Yt), Объем промышленного производства (X1t), Инвестиции в основной капитал (X2t), Общая численность безработных (Х3t), Оборот розничной торговли (Х4t) по предложенной выше схеме. Вариант 6. Рассмотрите показатели, приведенные в табл. 31. Проанализируйте Индекс оборота розничной торговли (Yt), Индекс потребительских цен (X1t), Индекс реальной среднемесячной заработной платы (X2t), Индекс стоимости потребительской корзины (набора из 25 основных продуктов питания) (Х3t) по предложенной выше схеме. Перио д, месяц 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Yt * 80,0 86,9 91,0 97,6 100,2 100,7 100,0 106,5 108,0 102,1 105,0 116,0 82,5 97,9 90,0 98,1 X1t X2t 108,4 104,1 102,8 103,0 102,2 101,9 102,8 101,2 101,5 101,4 109,8 103,0 102,3 101,0 114,0 118,0 86,0 99,1 111,7 100,0 106,0 107,7 96,9 98,1 103,1 107,0 103,0 124,4 91,0 99,4 100,5 109,8 Таблица 31 X3t 101,9 106,3 103,6 102,9 105,5 103,2 100,2 100,1 96,1 95,4 101,9 103,1 102,5 100,4 100,0 100,1 36 17 99,4 109,0 109,5 18 100,9 102,6 106,4 19 101,4 101,8 98,8 20 100,2 106,0 98,5 21 116,0 121,0 114,7 22 112,0 102,1 117,0 23 101,2 116,8 116,4 24 117,2 119,0 118,8 * Все данные представлены в процентах к предыдущему периоду. 103,1 104,4 101,8 96,1 97,0 101,0 132,0 103,5 Вариант 7. Рассмотрите показатели, приведенные в табл. 31. Проанализируйте Валовой национальный продукт РФ (Yt), Объем промышленного производства (X1t), Объем продукции сельского хозяйства (X2t), Объем строительства (Х3t), по предложенной выше схеме. Период месяц 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Yt * 236 309,8 378,9 408,1 334,0 340,6 360,6 361,6 322,9 346,4 401,5 382,5 319,5 341,1 372,6 419,8 389,1 443,7 503,7 479,0 435,2 461,1 X1t X2t Таблица 32 X3t 72.8 92,6 101,2 120,3 111,4 102,4 94,4 106,5 106,8 104,6 106,7 94,5 104,1 100,1 98,1 131,7 132,7 143,6 146,3 144,9 158,1 155,2 4.9 10,5 52,6 21,2 9,8 11,6 52,4 19,4 7,3 9,8 54,5 17,6 7,1 9,9 49,0 13,0 11,4 18,1 80,4 24,0 14,9 18,5 16.5 26,7 33,1 36,5 24,1 30,0 30,6 32,4 22,5 28,3 32,1 32,2 20,7 27,5 30,1 24,6 21,8 27,3 31,8 30,5 21,7 29,4 37 23 532,5 158,3 80,8 37,8 24 476,1 149,5 19,9 37,1 25 437,4 150,4 14,7 24,2 26 481,4 153,8 19,5 31,9 27 576,1 158,7 93,4 42,3 28 505,5 119,9 8,7 66,1 * Все данные приведены в млрд. рублей, в сопоставимых ценах (с учетом инфляции). Вариант 8. Рассмотрите показатели, приведенные в табл. 33. Проанализируйте Доходы бюджета (Yt), Объем промышленного производства (X1t), Инвестиции в основной капитал (X2t), Общая численность безработных (Х3t), Экспорт (Х4t) по предложенной выше схеме. П Доходы ериод Бюджет , а, млрд. месяц руб. Инвестиции в основной капитал, млрд. руб. 1 2 3 4 5 6 7 8 9 1 35,0 38,9 46,4 52,6 51,5 50,1 49,9 46,9 47,3 52,7 22,1 23,7 26,1 25,5 26,6 31,8 32,9 35,4 39,3 37,6 Объем промышлен ного. производств а, млрд. руб. 129,3 128,5 141,8 132,1 117,7 135,0 115,7 112,8 140,0 158,6 1 63,6 41,9 1 122,2 1 Таблица 33 Экспор Численн т, ость безработ млн. $. ных, млн. чел. 5,911 5,885 6,758 6,236 6,119 6,511 6,305 5,828 5,992 6,083 8,3 8,4 8,5 8,5 8,3 8,1 8,3 8,3 8,6 8,9 169,5 5,965 9,4 64,2 204,8 7,291 9,6 49,0 28,5 187,6 4,602 10,0 1 50,3 31,8 197,8 5,029 10,4 1 72,6 36,5 238,7 5,929 10,0 0 1 2 3 4 5 38 1 92,1 36,9 236,6 6,519 9,6 1 85,9 41,4 225,9 5,097 9,1 1 98,7 52,8 246,7 5,358 8,8 1 102,2 56,2 256,8 6,307 8,7 2 107,9 61,8 272,8 6,193 8,7 2 100,6 67,6 291,7 6,462 8,8 2 108,8 66,5 308,5 6,930 8,9 2 138,3 72,0 321,6 7,560 9,1 2 191,1 118,4 365,5 9,679 8,9 2 102,0 46,1 331,7 6,960 8,7 2 115,4 55,8 350,8 8,114 8,6 2 149,1 63,9 387,5 9,290 8,2 2 168,5 64,5 359,2 8,110 7,8 2 182,7 75,8 361,1 8,316 7,4 3 170,7 95,7 384,5 8,583 7,3 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 Вариант 9. Рассмотрите показатели, приведенные в табл. 34. Проанализируйте Рыночную цену акций ОАО «Иркутскэнегро» (Yt), Курс доллара (X1t), Котировка на покупку (открытие) (X2t), Котировка на покупку (закрытие) (Х3t), Объем торгов (Х4t) по предложенной выше схеме. Дата 10.03.00 11.03.00 12.03.00 13.03.00 * Yt 0,09419 0,09588 0,09469 0,09747 ** X1t 28,53 28,51 28,50 28,43 * X2t 0,0885 0,0950 0,0925 0,0935 * X3t 0,0960 0,0900 0,0960 0,0935 Таблица 34 X4t* 254300 543230 73125 124625 39 14.03.00 0,09411 28,39 0,0880 0,0860 15.03.00 0,09382 28,38 0,0885 0,0940 16.03.00 0,09479 28,36 0,0950 0,0990 17.03.00 0,10003 28,34 0,1000 0,1000 18.03.00 0,10815 28,33 0,1025 0,1010 19.03.00 0,10066 28,31 0,0975 0,0975 20.03.00 0,10006 28,29 0,0950 0,0970 21.03.00 0,09656 28,27 0,0975 0,0915 22.03.00 0,09507 28,46 0,0885 0,0950 23.03.00 0,09329 28,60 0,0955 0,0905 24.03.00 0,09345 28,78 0,0895 0,0935 25.03.00 0,09012 28,76 0,0925 0,0850 26.03.00 0,08993 28,72 0,0860 0,0900 27.03.00 0,08772 28,68 0,0910 0,0880 28.03.00 0,09087 28,66 0,0885 0,0925 29.03.00 0,09203 28,63 0,0915 0,0885 30.03.00 0,09193 28,59 0,0900 0,0900 31.03.00 0,09221 28,53 0,0870 0,0900 01.04.00 0,09121 28,60 0,0865 0,0850 02.04.00 0,09095 28,78 0,0875 0,0875 03.04.00 0,09123 28,59 0,0915 0,0930 04.04.00 0,09103 28,55 0,0930 0,0890 05.04.00 0,09101 28,53 0,0900 0,0915 06.04.00 0,09467 28,53 0,0920 0,0940 07.04.00 0,09440 28,46 0,0900 0,0882 08.04.00 0,09531 28,43 0,0905 0,0950 * Данные приведены в $ США. ** Курс доллара США приведен в рублях за 1 доллар. 128375 9700 145325 579889 481275 176450 25000 146750 60450 87950 108600 148250 22750 145375 163550 329530 70150 83825 42650 97725 47250 22875 70125 143750 94000 105950 Вариант 10. Рассмотрите показатели, приведенные в табл. 35. Проанализируйте Курс доллара США (Yt), Валовой внутренний продукт (X1t), Общий объем инвестиций (X2t), Валовой национальный продукт (Х3t), Объем промышленного производства (Х4t) по предложенной выше схеме. Обратите внимание на особенности динамики курса доллара. Период, квартал I * Yt рубл.за 1$ X1t млрд. рубл. 4,854 459 * X2t млр д. рубл. 57,8 Таблица 35 X3t X4t* * * млр д. рубл. 334 * млр д. рубл. 111, 40 4 II 5,108 509 75,2 340, 6 III 5,396 570 85,2 102, 4 360, 94,4 361, 106, 6 IV 5,56 611 157, 8 I 5,726 539 6 73,2 5 322, 9 II 5,782 594 85,4 8 346, 4 III 5,86 697 108, 9 IV 5,96 667 I 6,106 401, 141, 564 6,198 382, 94,5 319, 104, 5 71,9 632 83,9 1 341, 1 III 16,065 699 107, 6 IV 20,65 846 24,18 143, 867 1 372, 98,1 419, 131, 8 96,8 7 389, 1 II 24,22 1108 131, 1 III 25,08 1358 27,00 28,46 28,07 28,75 28,16 28,74 29,07 476, 244, 2116 149, 5 437, 4 338, 9 158, 3 1 9 II 532, 433, 1886 155, 2 5 2 I 461, 330, 1956 158, 1 1 2 IV 435, 236, 2004 144, 9 2 0 III 479, 165, 1642 146, 3 0 8 II 503, 256, 1461 143, 6 7 9 I 443, 185, 1424 132, 7 7 9 IV 100, 6 7 I 106, 7 5 II 104, 6 5 3 106, 150, 4 481, 4 153, 8 41 III 29,39 2543 447, 7 IV 30,14 2496 576, 158, 1 568, 7 505, 119, 0 5 * Данные приведены в номинальном выражении. ** Данные приведены в сопоставимых ценах. 9 Вариант 11. Рассмотрите показатели, приведенные в табл. 36. Проанализируйте Индекс объемов производства в целлюлознобумажной промышленности (Yt), Индекс цен в металлургии (X1t), Индекс объемов производства в химическом машиностроении (X2t), Индекс цен на электроэнергию. (Х3t) по предложенной выше схеме. Меся ц Таблица 36. Индексы производства в промышленности. Металлургия Лесозаго Деревоо Целл Машиностроение б.Черная Алюми Метал Химич Авто ниевая товител рабаты бума лурес-кое моби ь-ная ваюж- гическ льщая ная ое ное 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,05 1,01 1,04 1,09 1,09 0,93 1,04 0,98 1,01 1,22 1,00 1,05 0,97 0,87 0,96 1,00 1,05 1,95 1,01 1,04 1,02 0,84 0,86 0,99 1,05 1,86 0,95 1,03 0,85 0,84 0,86 0,94 0,95 2,02 0,97 0,97 1,02 0,74 0,94 1,10 1,05 2,23 1,04 1,12 1,01 0,82 1,04 1,03 1,08 1,22 0,97 1,10 1,37 0,85 1,02 1,07 1,10 0,66 0,87 1,07 1,38 0,80 0,89 0,97 1,08 0,88 0,90 1,08 1,36 0,79 0,92 0 1,03 1,11 1,04 0,95 1,12 1,16 0,83 0,94 1,00 1,12 1,09 1,00 1,15 1,57 0,91 1,05 0,95 1,07 1,00 0,98 1,08 0,99 0,79 1,04 1,00 1,10 0,95 1,02 1,14 1,33 0,86 1,16 1,04 1,06 1,14 0,96 1,10 0,99 0,90 1,02 0,95 1,08 2,13 1,05 1,11 1,06 0,77 1,00 1 2 3 4 5 6 42 0,98 1,06 1,91 0,98 1,10 0,80 0,77 0,89 1,00 0,98 2,03 1,01 1,05 0,96 0,68 0,97 7 8 Месяц Металл ургия 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1,00 1,04 1,04 1,02 1,03 1,02 1,02 1,01 1,01 1,03 1,02 0,99 0,99 1,01 1,02 1,01 1,03 1,03 Таблица 37. Индексы цен в промышленности Маши Химиче Деревообр Электро ностроение ская абатываю энергети щая ка 1,00 1,00 1,00 1,00 1,02 1,02 1,02 1,01 1,03 1,03 1,04 1,05 1,03 1,05 1,05 1,04 1,05 1,11 1,07 1,03 1,08 1,17 1,08 1,08 1,10 1,21 1,10 1,19 1,12 1,22 1,10 1,17 1,14 1,22 1,10 1,20 1,15 1,22 1,10 1,20 1,15 1,23 1,09 1,25 1,16 1,25 1,10 1,29 1,17 1,26 1,11 1,29 1,19 1,28 1,13 1,31 1,20 1,30 1,15 1,33 1,21 1,29 1,16 1,35 1,24 1,30 1,16 1,35 1,25 1,36 1,17 1,41 Вариант 12. Рассмотрите показатели, приведенные в табл. 36-37. Проанализируйте Индекс объемов производства в Химическом машиностроении (Yt), Индекс цен в химической промышленности (X1t), Индекс цен в машиностроении (X2t), Индекс цен на электроэнергию. (Х3t) по предложенной выше схеме. Вариант 13. Рассмотрите показатели, приведенные в табл. 3637. Проанализируйте Индекс объемов производства в деревообрабатывающей промышленности (Yt), Индекс цен в деревообрабатывающей (X1t), Индекс объемов производства в лесозаготовительной промышленности (X2t), Индекс цен на электроэнергию. (Х3t) по предложенной выше схеме. 43 Вариант 14. Рассмотрите показатели, приведенные в табл. 3637. Проанализируйте Индекс объемов производства в металлургическом машиностроении (Yt), Индекс цен на электроэнергию (X1t), Индекс объемов производства в алюминиевой металлургии (X2t), Индекс цен в металлургии (Х3t), Индекс объемов производства в черной металлургии (X4t) по предложенной выше схеме. Вариант 15. Рассмотрите показатели, приведенные в табл. 3637. Проанализируйте Индекс объемов производства в алюминиевой металлургии (Yt), Индекс цен на электроэнергию (X1t), Индекс объемов производства в химическом машиностроении (X2t), Индекс цен в машиностроении (Х3t), Индекс объемов производства в автомобильном машиностроении (X4t) по предложенной выше схеме. Задания для самостоятельной работы. Упражнения. 1. Параметры 3-х - факторного уравнения регрессии оценены по 20 наблюдениям. S1 S2 - остаточные дисперсии по 1-й и 2й половинам временного ряда. В каком случае гипотезы о гомоскедастичности следует отвергнуть? 2. Оценивается регрессия по 10 наблюдениям. Известно, что дисперсия ошибок для первых 5 наблюдений ровно в 2 раза больше, чем дисперсия ошибок остальных 5 наблюдений. Опишите процедуру оценивания этой регрессии. 3. Обсудите последствия гетероскедастичности для оценок, получаемых простым методом наименьших квадратов. Проиллюстрируйте ответ следующими данными и моделью: Xt = αZt + et, t = 1, 2,…,6 E(et) = 0 σ2Zt2, t = s E(etes) = 0, t ≠ s Таблица 38 t: 1 2 3 4 5 6 Zt 8 6 10 12 4 5 Xt 16 14 18 24 6 10 Используя МНК оцените коэффициент α. 44 4. Пусть х1 = ziα + εi (i = 1, 2), ε1 ~ N(0, σ2), ε2 ~ N(0, 2σ2), причем ε1 и ε2 статистически независимы. Пусть х1 = +1 и х2 = -1. найдите взвешенную оценку наименьших квадратов для и ее дисперсию. 5. Чему равна статистика Дарбина – Уотсона, если коэффициент корреляции между et и et-1 (t = 1,…,Т) равен минус 1. 6. Статистика Дарбина – Уотсона в регрессии равна 0.5. Что это означает? Какое преобразование следует применить к этой модели (запишите формулу)? Задачи Задача 2 Имеются следующие данные об урожайности винограда y t за 10 лет: Таблица 39 1 2 3 4 5 6 7 8 9 10 t yt 16,3 20,2 17,1 7,7 15,3 16,3 19,9 14,4 18,7 20,7 1. Найти уравнение тренда временного ряда y t , полагая, что он линейный, и проверить его значимость на уровне 0,05. 2. Провести сглаживание временного ряда y t методом скользящих средних, используя простую среднюю арифметическую с интервалом сглаживания: а) m = 3; б) m = 5. Задача 3 В таблице представлены данные, отражающие динамику роста доходов на душу населения y t (ден. ед.) за восьмилетний период: Таблица 40 1 2 3 4 5 6 7 8 t yt 1133 1222 1354 1389 1342 1377 1491 1684 Полагая, что тренд линейный и условия классической модели выполнены: а) найти уравнение тренда и оценить его значимость на уровне 0,05; б) дать точечный и с надежностью 0,95 интервальный прогнозы среднего и индивидуального значений доходов на девятый год. Семинар 3.1.2 Анализ автокорреляционной функции временного ряда. Типы автокорреляционных зависимостей. Коррелограммы. 45 Пример 4 По данным таблицы для временного ряда Yt найти среднее значение, среднее квадратическое отклонение, коэффициенты автокорреляции (для лагов τ=1;2) и частный коэффициент автокорреляции 1-го порядка. Таблица 41 Г 1 2 3 4 5 6 7 8 од, t С 2 1 2 3 3 3 3 3 прос,Y 13 71 91 09 17 62 51 61 Работа в пакете STATISTICA Задача 4 По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1): 1. Постройте коррелограммы автокорреляционных функций; 2. Сделайте выводы о наличии тенденций во временных рядах; Выполнение вариантов (1-15) РГЗ №2 п. 2. (формулировка заданий и данные приведены в семинаре 2.2.2) в программе STATISTICA. Семинар 3.1.3 Анализ корреляционных связей временных рядов. Проверка выполнения предпосылок корреляционного анализа. Устранение основной тенденции временного ряда с помощью метода последовательных разностей. Анализ лаговых корреляционных связей. Работа в пакете STATISTICA Задача 5 По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1): 1. Приведите ряды Qt и Pt к стационарному виду. При необходимости используйте процедуру «взятие последовательных разностей». 46 2. Проведите анализ корреляционных связей между Qt и Pt . 3. Проведите анализ лаговых корреляционных связей между Qt и Pt . Выполнение вариантов (1-15) РГЗ №2 п. 4. (формулировка заданий и данные приведены в семинаре 2.2.2) в программе STATISTICA. Семинар 3.1.4 Построение факторной динамической модели. Обоснование включения трендовых, лаговых, авторегрессионных составляющих. Анализ качества и адекватности факторной динамической модели. Построение прогнозных значений результирующего показателя. Построение доверительного интервала для среднего и прогнозного значений. Пример 5 Менеджер цветочного магазина не уверен в правильности выбранной цены на гвоздики, поэтому в течение 12 недель он варьирует цену и записывает количество проданных цветов. Полученные данные приведены в табл.1.1 (t – номер недели, Q t – количество проданных цветов, P t – цена одной гвоздики (руб.)). Таблица 42 t Pt Qt t Pt Qt 1 7,65 495 7 7,9 414 2 7,25 615 8 6,45 880 3 7 665 9 7,6 551 4 7,5 592 10 7,75 479 5 8,25 285 11 8 325 6 7,75 344 12 6,75 701 А) оцените параметры модели lnQ t = β 0 +β 1 *lnP t + ε t , t = 1,…,12 Б) используя полученные оценки коэффициентов, найдите оптимальную (в смысле максимума выручки от продаж) цену гвоздики. Пример 6 47 Так называемая кривая Филипса описывает связь темпа прироста зарплаты и уровня безработицы. А именно, Тω t = β 0 + β 1 *1/U t + ε t где ω t – уровень заработной платы, Тω t = 100(ω t - ω t - 1 ) / ω t - 1 – темп прироста зарплаты (в процентах) и U t – процент безработных в год t. Теория предполагает, что β 0 < 0 и β 1 > 0. Используя данные для некоторой страны из табл.1.2, ответьте на следующие вопросы: А) Найдите оценки коэффициентов уравнения и проверьте наличие значимой связи между Тω t и U t . Б) Найдите «естественный уровень безработицы», т.е. такой уровень безработицы, при котором Tω t = 0. В) Когда изменения в уровне безработицы оказывали наибольшее (наименьшее) влияние на темп изменения зарплаты? Г) Найдите 95%-доверительные интервалы для β 0 и β 1 . Таблица 43 t Wt Ut t Wt Ut 1 1,932 1,345 10 2,628 2,01 2 1,82 1,63 11 2,916 2,01 3 1,796 1,25 12 2,74 1,725 4 2,052 1,725 13 2,836 1,63 5 2,308 1,25 14 2,684 2,105 6 2,196 1,44 15 3,004 1,345 7 2,124 1,725 16 3,124 1,725 8 2,452 1,345 17 3,244 1,535 9 2,556 1,535 18 3,364 1,63 Пример 7 Предположим, что вы оцениваете линейную функцию потребления от дохода С t = β 0 + β 1 Y t + ε t среди t=1,2,..n участников. 1. Как учесть возможный сдвиг этой функции при переходе от городского к сельскому потребителю, если вы считаете, что предельная (маргинальная) склонность к потреблению постоянна, в то время как средняя склонность к потреблению может меняться? 48 2. Как проверить гипотезу о том, что предельные (маргинальные) склонности к потреблению участников с доходом выше и ниже Y* отличаются? Пример 8 Предположим, что некоторые ежегодные данные удовлетворяют соотношениям: Y t = β 0 + β 1 X t + β 2 T + ε t (истинная модель), причем выполнены все условия классической регрессии. Однако оценивается «неправильная» модель без временного тренда: Yt = β0 + β1Xt + ut . a) Какие из условий классической регрессии не выполнены для модели без временного тренда? b) Будет ли равна нулю сумма остатков для этой регрессии? Как это связано с ошибочным предположением, что E(u t ) = 0? Задача 6 По данным задачи 1 «Потребление Кока-колы» (семинар 3.1.1): 1. Постройте факторное уравнение регрессии для Qt (потреблениеe кока-колы) в зависимости от цен Pt. 2. Включите в уравнение регрессии лаговую компоненту Pt-τ. Величину τ обоснуйте результатами корреляционного анализа (семинар 12). 3. Включите в уравнение регрессии трендовую составляющую. 4. Выберите уравнение наиболее адекватно описывающее поведение спроса на кока-колу. 5. Постройте трендовую модель, адекватно описывающую развитие Pt. Сделайте прогноз цен на 8,9,10,11 периоды 6. Сделайте прогноз объема потребления на 3 последних (t=8,9,10) периода и на перспективу учитывая расчетные значения цен (п.5). Сравните с расчетами Qt, сделанными по трендовым моделям. Какая модель дает прогнозы объема потребления, более близкие к реальным значениям показателя? 7. В каких границах будут находиться (с доверительной вероятностью 0,95) среднее и реальное значения показателя Qt в 11-м периоде? 49 Выполнение вариантов (1-15) РГЗ №2 п. 5. (формулировка заданий и данные приведены в семинаре 2.2.2) в программе STATISTICA. Задания для самостоятельного решения Упражнения 7. На основе годовых данных 1959-1983 годов были оценены следующие функции спроса на продовольственные товары. log Qt = 2.83 – 0.47 log PFt + 0.64 log Yt (6.69) (-3.94) (24.48) 2 R = 0.987 DW = 0.627 log Qt = 1.87 – 0.36 log PFt + 0.38 logYt + 0.44log Qt-1 (3.24) (-2.79) (3.20) (24.10) 2 R = 0.990 DW = 1.65 где Q – спрос на продукты питания, PF – цены на продукты питания, Y – доход, в скобках приведены значения t – статистики. Проверьте каждое уравнение на наличие автокорреляции ошибок первого порядка и дайте короткий комментарий результатов. 8. Пусть x1,….,xn – независимые случайные величины с одинаковым средним α и дисперсионной матрицей σ2V, где vij = 1 (i = 1, 2,…,n), vij = ρ, (0<ρ<1; i,j = 1, 2,…,n; i≠j).Найдите обобщенную оценку наименьших квадратов для α и покажите, что она совпадает с оценкой наименьших квадратов, полученным обычным образом. 9. Пусть остатки в регрессии Xi = α + βZi + εi равны (1, 2, 0, -1,2). Опишите первый шаг метода Кочрена – Оркарта. Задача 7 В таблице приведены данные по 18 наблюдениям модели пространственной выборки: Таблица 44 i x e i x e 2 i 1 2 1,3 2 i 2 ,3 2 2,6 3 2 i 0 5 ,6 3 1 7 1,5 1 1 1 i 3,8 7 4 5,7 5,7 1 2 7 3 50 2,7 4 2,8 4 1,9 5 1 0,1 4 3,8 6 6,9 4,0 9,7 9 1,9 6 7,8 9,7 5 8,9 9 6,9 1 8 9,8 0,8 7 4 8 1 1 6,8 0,7 6 5 8 1 2 6,9 9,8 5 5 7 1 2 5 8,9 4 3,9 4,7 7 1 1 5 8 3 4,6 9,7 6,0 1 1 4 7 2 8 7,8 8 9 7,0 7,5 Предполагая, что ошибки регрессии представляют собой нормально распределенные случайные величины, проверить гипотезу о гомоскедастичности, используя тест Голдфелда–Квандта. Задача 8 При оценивании модели пространственной выборки обычным методом наименьших квадратов получено уравнение: y€ = 3 + 0,6 x1 − 1,2 x 2 Уравнение регрессии квадратов остатков на квадраты регрессоров имеет вид: 2 e€2 = 2 + 0,3x12 + 0,1x 22 ; R =0,2. Зная, что объем пространственной выборки n=200, проверить гипотезу Уайта о гомоскедастичности модели. Задача 9 При оценивании модели пространственной выборки с помощью обычного метода наименьших квадратов получено уравнение: y€ = 12 + 3,43 x1 − 0,45 x 2 ; d =1,2. t = (0,1) (0,4) (0,1) При осуществлении регрессии квадратов остатков на квадраты регрессоров получено уравнение вида: e€2 = 4 + 2 x12 + 0,4 x 22 . t= (0,7) (0,3) Объем выборки n =3000. С какими из перечисленных ниже выводов следует согласиться: а) полученные значения коэффициентов модели с большой вероятностью близки к истинным; б) регрессор X2 может быть незначимым; 51 в) так как значение статистики Дарбина-Уотсона d далеко от двух, следует устранить автокорреляцию остатков? Задача 10 При оценивании модели временного ряда получены следующие результаты. Уравнение модели имеет вид: y€ = 2 − 1,2t ; d =1,9. t= (0,7) С какими из перечисленных ниже выводов следует согласиться: а) так как значение статистики Дарбина-Уотсона d близко к двум, автокорреляция остатков отсутствует; б) коэффициент модели при t значим; в) если объем выборки достаточно велик, значение коэффициента при t в любом случае с большой вероятностью близко к истинному; г) применение теста Бреуша-Голдфри может выявить автокорреляцию остатков между отдаленными наблюдениями? Задача 11 При оценивании модели временного ряда методом наименьших квадратов получены следующие результаты: y€t = 12 − 0,2t ; d =1,8. t= (0,01) Известно, что количество наблюдений n =150. С помощью теста Льюинга-Бокса проверить гипотезу об отсутствии автокорреляции первого порядка. Задача 12 Применение теста Льюинга-Бокса дает следующие результаты: Таблица 45 r(τ) rчаст(τ Qp P(Q> ) Qp) 0,34 0,33 21,45 0,00 0,2 0,11 24,12 0,00 0,01 0,00 24,13 0,00 0,00 0,00 24,13 0,00 Ряд остатков идентифицируется с помощью модели ARMA (p,q). Какие значения p и q целесообразно выбрать на основе полученных результатов тестирования? 52 Семинар 3.1.5 Защита расчетно-графического задания №2. Семинар 3.1.6 Контрольная работа. Примерный вариант контрольной работы: Задание 1. По результатам обследования 25 промышленных предприятий была получена матрица парных коэффициентов корреляции: У Х Х 1 2 1 0 0 ,58 ,67 0 1 0 1 ,58 ,96 0 0 1 2 ,67 ,96 Какое утверждение верно? Варианты ответов: 1. между Х1 и Х2 наблюдается мультиколлинеарность; 2. между У и Х1 связь обратная; 3. между У и Х2 связь несущественная; 4. ни одно, среди указанных. Задание 2. В чем состоит условие гомоскедастичности остатков в регрессионной модели? Что гарантирует выполнение этого условия? Задание 3. При исследовании зависимости среднего балла успеваемости студента (У) от объема прочитанной литературы (Х1) и количества пропущенных занятий (Х2) по данным n=20 наблюдений получено уравнение регрессии: У = 3 + 0,3Х1 – 1,6Х2. Среднеквадратические отклонения коэффициентов регрессии Sb1 = 0,2 и Sb2 = 0,8. Начиная с какого уровня значимости α можно утверждать, что средний балл успеваемости зависит от объема прочитанной литературы? (t0.2;17 = 1,33; t0.1;17 = 1,74; t0.05;17 = 2,11; t0.01;17 = 2,90; tα;ν) Варианты ответов: 1. 10%; 2. 20%; 53 3. 4. 5%; ни один среди указанных. Задание 4. По данным задания 3 с доверительной вероятностью 99% приблизительно определите, на какую величину максимально может измениться средний балл успеваемости студента, при увеличении объема прочитанной литературы на единицу? Варианты ответов: 1. 0,3; 2. 0,88; 3. 1,2; 4. ни один среди указанных. Задание 5. По результатам исследования 35 наблюдений получены две эконометрические модели со следующими характеристиками: модель №1: R2 = 0,76; расчетное значение коэффициента Дарбина-Уотсона d = 2,01 ; модель №2: R2 = 0,99; расчетное значение коэффициента Дарбина-Уотсона d = 0,93. Какая модель является более адекватной? Варианты ответов: 1. модель №1; 2. модель №2; 3. обе модели адекватные; 4. ни один среди указанных Семинар 3.1.7 Разбор решений задач контрольной работы. Доклады студентов по результатам расчетно-графического задания №2. Тема 3.2 Системы линейных одновременных уравнений Семинар 3.2.1 Модель спроса и предложения. Косвенный метод наименьших квадратов. Пример 9 54 Для оценки параметров какого из следующих уравнений системы можно применить косвенный МНК. Х1=β12Х2 + α11Z1 + α12Z2 + γ1 + ε1 Х2=β21Х1 + γ2 + ε2 Ответ обосновать. Пример 10 Система уравнений имеет вид: Х1=а12Х2 + b11Z1 Х2=а21Х1 Какое из уравнений неидентифицировано, почему? Пример 11 Для оценки параметров какого из следующих уравнений системы можно применить косвенный МНК? Х1=β12Х2 + α11Z1 + α12Z2 + с1 + ε1 Х2=β21Х1 + ε2 Ответ обосновать. Задача 13 Рассматривается простая Кейнсианская модель: С=α+β*Y+ε Y=C+I Где Y - доход, C – потребление, I – инвестиции. Система уравнений приведенной формы следующая: α β 1 + ε I+ 1− β 1− β 1− β α 1 1 + ε Y= I+ 1− β 1− β 1− β С= Ошибки в приведенной форме для С и Y таковы: η1 = η2 = 1 1 1 ε= ε= ε, 1− β 1 − 0,8 0, 2 т.е. в модели в приведенной форме η1 и η2 распределены нормально. В таблице 46 приводятся 20 значений (данные условные) для I и нормально распределенные ошибки η.Получены данные для C и Y из 55 уравнений приведенной формы, используя значения параметров α = 2 и β = 0,8. Таблица 46 № I C Y η1 = η2 п/п 1 2,00 18,19 20,19 0,193 2 2,00 17,50 19,50 -0,504 3 2,20 16,48 18,68 -2,318 4 2,20 19,06 21,26 0,257 5 2,40 21,38 23,78 1,784 6 2,40 21,23 23,63 1,627 7 2,60 21,11 23,71 0,708 8 2,60 22,65 25,25 2,252 9 2,80 20,74 23,54 -0,462 10 2,80 19,85 22,65 -1,348 11 3,00 22,23 25,23 0,234 12 3,00 22,23 25,23 0,226 13 3,20 23,43 26,63 0,629 14 3,20 23,04 26,24 0,244 15 3,40 23,03 26,43 -0,569 16 3,40 24,45 27,85 0,853 17 3,60 26,63 30,23 2,227 18 3,60 24,47 28,07 0,074 19 3,80 24,67 28,47 -0,527 20 3,80 26,00 29,80 0,804 В реальной ситуации существуют только значения I, C, Y. Значения ошибки в модели и значения α и β неизвестны. Используя данные таблицы 46, оцените уравнение приведенной формы для объема потребления и дохода. Задача 14 Используя данные задачи 13 посчитайте косвенные МНКоценки для α и β из: 1. уравнения приведенной формы для объема потребления; 2. уравнения приведенной формы для дохода. Идентичны ли косвенные МНК-оценки, полученные из обоих уравнений приведенной формы? Задача 15 Используя данные задачи 13 определите простые МНК-оценки для α и β и сравните их с косвенными МНК-оценками из задачи 14. Задача 16 56 Используя данные задачи 13 для I и используя значения параметров α = 2 и β = 0,8 составьте 100 выборок для C и Y. Задача 17 Используя результаты задачи 16: 1. Примените простой МНК к каждому уравнению системы для 100 выборок. 2. Посчитайте среднее 100 оценок α и β. 3. Проверьте степень эмпирического смещения. структурному Задача 18 Используя результаты задачи 16: 1. Определите: А. косвенные МНК-оценки для α и β для 100 выборок; Б. среднее 100 оценок α и β; В. степень смещения в маленьких выборках – размером по 20 наблюдений. 2. Сравните смещение косвенных МНК-оценок со смещением обычных МНК-оценок. Задача 19 Используя результаты задачи 16, объедините пары выборок так, чтобы получились 50 выборок по 40 наблюдений. 1. Определите: А. косвенные МНК-оценки для α и β для этих 50 выборок; Б. среднее и проверьте смещение оценок. 2. Будут ли эмпирические смещения в этом случае меньше, чем рассчитанные из 100 выборок по 20 наблюдений? Семинар 3.2.2 Трехшаговый метод наименьших квадратов. Пример 12 Почему двухшаговый МНК не применим для оценивания неидентифицированных уравнений? Задача 20 Имеются следующие данные: Таблица 47 N 1 Z1 1 Z2 3,06 Z3 1,34 Z4 8,48 Z5 28,00 X1 359,27 X2 102,96 X3 578,49 57 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3,19 3,30 3,40 3,48 3,60 3,68 3,72 3,92 4,15 4,35 4,37 4,59 5,23 6,04 6,36 7,04 7,81 8,09 9,24 1,44 1,54 1,71 1,89 1,99 2,22 2,43 2,43 2,31 2,39 2,63 2,69 3,35 5,81 6,38 6,14 6,14 6,19 6,69 9,16 9,90 11,02 11,64 12,73 13,88 14,50 15,47 16,61 17,40 18,83 20,62 23,76 26,52 27,45 30,28 25,40 28,84 34,36 35,00 37,00 36,00 29,00 47,00 50,00 35,00 33,00 40,00 38,00 37,00 56,00 88,00 62,00 51,00 29,00 22,00 38,00 41,00 415,76 435,11 440,17 410,66 530,33 557,15 472,80 471,76 538,30 547,76 539,00 677,60 943,85 893,42 871,00 793,93 850,36 967,42 1102,61 114,38 118,23 120,45 116,25 140,27 143,84 128,20 126,65 141,05 143,71 142,37 173,13 223,21 198,64 191,89 181,27 180,56 208,24 235,43 650,86 684,87 680,47 642,19 787,41 818,06 712,16 722,23 811,44 816,36 807,78 983,53 1292,99 1179,64 1134,78 1053,16 1085,91 1246,99 1401,94 Таблица 47 содержит векторы наблюдений Z1, Z2 , Z3, Z4, Z5 и X1, X2, X3 которые представляют выборку, полученную из модели: Х1 = β12 Х2 + β13 Х3 + α11Z1 + ε1, Х2 = β12 Х1 + α21Z1 + α22Z2 + α23Z3 + α24Z4 + ε2, Х3 = β32 Х2 + α31Z1 + α32Z2 + α35Z5 + ε3, Или в матричной форме: XB = ZA + ε, где εi – нормально распределенные векторы. Гипотетические структурные матрицы коэффициентов В, А и ковариационная матрица Σ следующие: ⎡60 −40 10 ⎤ ⎢ 4 −80 ⎥⎥ ⎡ 0 0, 2 0 ⎤ ⎡ 227,55 8,91 −56,89 ⎤ ⎢0 ⎢ ⎥ В = ⎢ −10 −1 2 ⎥ , А = ⎢ 0 0, 66 −1,88 ⎥⎥ 6 0 ⎥ , ∑ = ⎢⎢ 8,91 ⎢ ⎥ ⎢⎣ 2,5 0 −1⎥⎦ ⎢⎣ −56,89 −1,88 15, 76 ⎥⎦ ⎢ 0 −1,5 0 ⎥ ⎢⎣ 0 0 −5 ⎥⎦ Матрица коэффициентов в гипотетической модели следующая: приведенной форме для ⎡ −142,50 11,50 13, 00 ⎤ ⎢ 110, 00 18, 00 116, 00 ⎥ ⎢ ⎥ D = AB −1 = ⎢ 15, 00 −3, 00 −6, 00 ⎥ ⎢ ⎥ 0, 75 1,50 ⎥ ⎢ −3, 75 ⎢⎣ 6, 25 1, 25 7,50 ⎥⎦ 58 В реальной ситуации B, A, Σ, D были бы неизвестны, доступны были бы только наблюдения в таблице 47 . Оцените матрицу параметров приведенной формы D = (ZTZ)1 T Z Х. Задача 21 По данным задачи 20 примените простой МНК к каждому структурному уравнению системы и оцените матрицы В и А. Задача 22 По данным задачи 20 используя косвенный МНК, оцените параметры второго строго идентифицированного уравнения. Задача 23 По данным задачи 20: 1. Найдите b2 и a2, решая систему: D2 = D−2b2 + T2A′ a2 2. Сравните с результатом задачи 22. Задача 24 По данным задачи 20: 1. Найдите минимальный корень λ из уравнения: W l − λW = 0 2. Используя формулу метода наименьшего дисперсионного отношения при k = λ, оцените параметры в каждом из трех структурных уравнений. Задача 25. По данным задачи 20, используя формулу двухшагового метода наименьших квадратов при k = 1, сравните оценки матрицы D, полученные на основе оценок простым МНК, МНДО и 2МНК, с исходными гипотетическими матрицами параметров приведенной формы. Задача 26. По данным задачи 20, используя формулу 3МНК, оцените параметры первого и третьего структурных уравнений совместно. Задача 27. Имеем модель Клейна, в которой 59 C = α P + β (W + V ) + χ P−1 + δ + ε1 I = ϕ P + γ P−1 + η K −1 + π + ε 2 , где W = μ (Y + T − V ) + θ (Y−1 + T−1 − V−1 ) + ψ t + ζ + ε 3 С – функция потребления, I – функция инвестиционного спроса, W – функция спроса на труд. Выполняются следующие макроэкономические соотношения: Y + T = C + I + G, Y = W + V + P, K = K-1 + I где С – потребительские расходы; I – инвестиционные расходы; G – государственные расходы; P – прибыль; W – спрос на труд негосударственного сектора; V – спрос на труд государственного сектора; K – капитал; T – налоги; t – время; Y – чистый доход от налогов. Таблица 48 № t C P W I K-1 V G T п/п 1 1920 39,8 12,7 28,8 2,7 180,1 2,2 2,4 3,4 2 1921 41,9 12,4 25,5 -0,2 182,8 2,7 3,9 7,7 3 1922 45,0 16,9 29,3 1,9 182,6 2,9 3,2 3,9 4 1923 49,2 18,4 34,1 5,2 184,5 2,9 2,8 4,7 5 1924 50,6 19,4 33,9 3,0 189,7 3,1 3,5 3,8 6 1925 52,6 20,1 35,4 5,1 192,7 3,2 3,3 5,5 7 1926 55,1 19,6 37,4 5,6 197,8 3,3 3,3 7,0 8 1927 56,2 19,8 37,9 4,2 203,4 3,6 4,0 6,7 9 1928 57,3 21,1 39,2 3,0 207,6 3,7 4,2 4,2 10 1929 57,8 21,7 41,3 5,1 210,6 4,0 4,1 4,0 11 1930 55,0 15,6 37,9 1,0 215,7 4,2 5,2 7,7 12 1931 50,9 11,4 34,5 -3,4 216,7 4,8 5,9 7,5 13 1932 45,6 7,0 29,0 -6,2 213,3 5,3 4,9 8,3 14 1933 46,5 11,2 28,5 -5,1 207,1 5,6 3,7 5,4 15 1934 48,7 12,3 30,6 -3,0 202,0 6,0 4,0 6,8 16 1935 51,3 14,0 33,2 -1,3 199,0 6,1 4,4 7,2 17 1936 57,7 17,6 36,8 2,1 197,7 7,4 2,9 8,3 18 1937 58,7 17,3 41,0 2,0 199,8 6,7 4,3 6,7 19 1938 57,5 15,3 38,2 -1,9 201,8 7,7 5,3 7,4 20 1939 61,6 19,0 41,6 1,3 199,9 7,8 6,6 8,9 21 1940 65,0 21,1 45,0 3,3 201,2 8,0 7,4 9,6 22 1941 69,7 23,5 53,3 4,9 204,5 8,5 14 12 60 На основе данных таблицы 48: 1. Оцените параметры модели Клейна простым методом наименьших квадратов; 2. Оцените параметры модели Клейна двухшаговым методом наименьших квадратов; 3. Покажите величину смещения оценок. Задача 28 Экономическая модель описана следующими уравнениями: Х1 = α10 + α11Z1 + β12 Х2 + ε1, Х2 = α20 + β21 Х1 + ε2, где Х1 и Х2 – эндогенные переменные, Z1 – экзогенная переменная, ε1 и ε2 – случайные ошибки. Определите направление смещения оценки для β21, если для оценивания второго уравнения используется метод наименьших квадратов. Задача 29 Дана следующая макроэкономическая модель: Y = C + I + G – макроэкономическое тождество, C = α10 + β11 Y – функция потребления, I = α20 + β21 Y - β22 R – функция инвестиций, (M/P) = β31 Y – β32 R – уравнение денежного рынка, где эндогенными переменными являются доход Y, потребление C, инвестиции I и процентная ставка R. Переменные: государственные расходы G, реальная денежная масса (M/P)– экзогенные. Проверьте, является ли данная система идентифицируемой, и перепишите модель в приведенной форме. Задача 30 Дана следующая модель краткосрочного равновесия для малой открытой экономики (модель Манделла – Флеминга): Y = C + I + nX – макроэкономическое тождество, C = α11 + β11 Y + ε1– функция потребления, I = α21 - α21 R + β21 Y + ε2 – функция инвестиций, nX = α31 – β31 Y - β32 ec + ε3 – функция чистого экспорта, (M/P) = β41 Y – α41 R + ε4– уравнение денежного рынка, Где эндогенными переменными являются: доход Y, потребление C, инвестиции I, чистый экспорт nX и валютный курс ec. Переменные: процентная ставка R, значение которой формируется на общем уровне и реальная денежная масса (M/P) – экзогенные; ε1,.,ε4 случайные ошибки. Задания: 61 1. Запишите общие условия для определения структурных параметров каждого уравнения модели. 2. Какие уравнения модели точно идентифицируемы? 3. Перепишите модель Манделла – Флеминга в приведенной форме. Тема 3.3 Основные понятия и модели дисперсионного анализа Семинар 3.3.1 Исследование тесноты связи количественных и качественных переменных. Однофакторный дисперсионный анализ. Пример 13 Статистическая совокупность разбита по факторному признаку на 4 группы (А, В, С, Д). Рассчитаны следующие показатели по результативному признаку: Таблица 49 Группы Групповые средние Средние Численность в квадратические группах отклонения А 20 10 30 В 25 5 30 С неизвестно 6 25 Д 22 7 15 Общая средняя величина результативного признака совокупности равна 22,8 его размерности. Определите эмпирическое корреляционное отношение. в Задача 31 В результате обследования 20 квартир, получены следующие (условные) данные: Таблица 50 № Тип дома Район города Цена квартары 1 2 3 4 5 6 К К П П П Н Ц С С Ц Ц А 65 57 55 50 70 65 62 7 Н А 55 8 К Ц 58 9 П С 50 10 Н А 70 11 Н А 68 12 К Ц 80 13 К Ц 70 14 П А 80 15 П А 58 16 П С 57 17 К Ц 65 18 П С 52 19 П С 45 20 К Ц 62 К – кирпичный дом; П – панельный дом; Н – дом новой планировки. А –район Академгородка; Ц – центральный район; С- район Солнечный. Задание: 1. Проведите однофакторный дисперсионный анализ между стоимостью квартиры и типом дома. 2. Наблюдается ли связь между стоимостью квартиры и типом дома? Задача 32 По данным задачи 31: 1. Проведите однофакторный дисперсионный анализ между стоимостью квартиры и районом города, где находится дом. 2. Наблюдается ли связь между стоимостью квартиры и районом города? Задача 33 Дополните выборку задачи 7 «Успеваемость» (семинар 2.2.1) данными Х 4 – пол студента (муж/жен) Проведите однофакторный дисперсионный анализ. Наблюдается ли связь между полом (муж/жен) студента и его средним баллом за первый курс? Задача 34 Дополните выборку задачи 7 «Успеваемость» (семинар 2.2.1) данными Х 5 – тип среднего образовательного учреждения (школа/гимназия). 63 Проведите однофакторный дисперсионный анализ. Наблюдается ли связь между типом образовательного учреждения, которое окончил студент и его средним баллом за первый курс? Семинар 3.3.2 Двухфакторный дисперсионный анализ Задача 35 По данным задач 7 «Успеваемость» (семинар 2.2.1), 33 и34 (семинар 3.3.1) проведите двухфакторный дисперсионный анализ между Х 3 , Х 4 ,Х 5 . Можно ли утверждать, что «вчерашние» гимназистки имеют более ощутимые успехи в СФУ, чем их однокурсники? Задача 36 По данным задач 31 и 32 (семинар 3.3.1): 1. Проведите двухфакторный дисперсионный анализ между стоимостью квартиры, типом дома и районом города, где находится дом. 2. Действительно ли что, квартиры в кирпичных домах в центре города более дорогие? 64