Теория вероятностей и математическая статистика Лекция 4 2.7. Сходимость последовательностей случайных величин Рассмотрим последовательность случайных величин 1 ,, n , . Различают несколько типов сходимости. Последовательность величин 1 ,, n , сходится к случайной величине по P вероятности n , если______________________________________________ Последовательность величин 1 ,, n , сходится к случайной величине .н. почти наверное (с вероятностью 1) n п , если_________________________ Последовательность величин 1 ,, n , сходится к случайной величине по F распределению n , если____________________________________________ 2.8. Закон больших чисел Законы больших чисел являются одними из наиболее важных утверждений теории вероятностей. Пусть 1 ,, n , – независимы и имеют конечные дисперсии. Тогда выполняется закон больших чисел в форме Чебышева: ___________________________________________________ Если все случайные величины 1 ,, n , имеют одно и то же распределение, закон больших чисел обретает следующую форму. Пусть 1 ,, n , – независимы, имеют конечные дисперсии и M i a , тогда: ___________________________________________________ В действительности, это утверждение верно в более общей ситуации, а именно, предположение о существовании дисперсии не является необходимым. Имеет место так называемый закон больших чисел в форме Хинчина. 1 ,, n , – последовательность независимых одинаково Пусть распределенных случайных величин, у которых существует математическое ожидание M i a . Тогда ___________________________________________________ 2.9. Центральная предельная теорема Различные формы центральной предельной теоремы отличаются между собой условиями, накладываемыми на распределение случайных слагаемых, образующих сумму. Здесь приведен без доказательства вариант ЦПТ для независимых одинаково распределенных слагаемых. Центральная Предельная Теорема: 1 ,, n , – последовательность независимых одинаково Пусть распределенных случайных величин с конечной дисперсией. Обозначим M i a и D i 2 0 . Тогда _______________________________________ где x – функция распределения стандартного нормального закона. 1 Теория вероятностей и математическая статистика n Лекция 4 Если обозначить Sn i . Тогда MS n na , DS n n 2 . Следовательно, i 1 утверждение ЦПТ можно записать в виде _______________________________________ Существуют обобщения ЦПТ на случай независимых разнораспределенных слагаемых. При этом на отдельные слагаемые i накладываются условия, обеспечивающие их «пренебрежимо малый» вклад в сумму S n при n . 3. Методы математической статистики 3.1. Основные задачи математической статистики ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 1. Задача определения закона распределения случайной величины по статистическим данным. ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 2. Задача нахождения неизвестных параметров распределения ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 3. Задача проверки правдоподобия гипотез ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ 3.2. Первичная обработка данных Отправной точкой любого статистического анализа являются данные, полученные экспериментатором в результате опыта. Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты (случайной величины). Иногда проводят сплошное обследование, т. е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, 2 Теория вероятностей и математическая статистика Лекция 4 сплошное обследование применяют сравнительно редко. Чаще случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению. Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов. Генеральной совокупностью называют совокупность объектов, из которых производится выборка. При составлении выборки можно поступать двумя способами: Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. На практике обычно пользуются бесповторным случайным отбором. Для того чтобы по данным выборки можно было достаточно уверенно судить о случайной величине, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). Статистическое распределение выборки Обычно полученные наблюдаемые данные представляют собой множество расположенных в беспорядке чисел. Просматривая это множество чисел, зачастую бывает трудно выявить какую-либо закономерность их изменения. Для изучения закономерностей (если таковые вообще имеются) изменения значений случайной величины опытные данные подвергают обработке. Если случайная величина является дискретной, то ________________________ ________________________________________________________________________ Если случайная величина является непрерывной, то_______________________ ________________________________________________________________________ Для этого определяем размах выборки: R xнаиб xнаим . Выбираем число интервалов R R V (от 7 до 11). Длина частичного интервала h или h . За начало V 1 3.322lg n первого интервала рекомендуется брать величину xнач xнаим 0.5h . Конец последнего интервала выбирается из условия: xкон h xнаиб xкон . Просматриваем результаты наблюдений и определяем, сколько значений попало в каждый интервал. Выборочной (эмпирической) функцией распределения называется функция, задающая для каждого значения x относительную частоту события x : Функцию распределения генеральной теоретической функцией распределения. совокупности F x называют 3 Теория вероятностей и математическая статистика Лекция 4 Если в выборке нет повторяющихся значений, то эмпирическая функция 1 распределения имеет n разрывов. Величина скачка в точке разрыва равна . n 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -1 0 1 2 3 4 5 6 7 8 Математическое ожидание эмпирической функции распределения равно теоретической функции распределения: MFn x F x . Теорема Гливенко. С ростом объема выборки эмпирическая функция распределения Fn x сходится к теоретической функции F x равномерно по x с вероятностью 1: ________________________________________________________________________ Наблюдаемые данные можно изобразить графически, используя не только функцию распределения. Для изображения дискретного вариационного ряда обычно используют полигон частот. Для изображения интервальных вариационных рядов служит гистограмма. Основания прямоугольников равны длинам частичных интервалов h, а высоты – частотам mi. 18 16 16 14 14 12 12 10 10 8 8 6 6 4 4 2 2 0 0 2 4 6 8 0 6.67 6.69 6.71 6.73 6.75 6.77 6.79 6.81 6.83 Выборочные числовые характеристики вычисляются по следующим формулам. Выборочное среднее: n 1 n x mi xi i xi , n i 1 i 1 если ряд дискретный, то xi – наблюдаемые значения, если ряд интервальный, то xi – середина i-го интервала. Выборочная дисперсия n 1 n 2 s mi xi x i xi x 2 x 2 x 2 . n i 1 i 1 2 Среднеквадратичное отклонение (выборочное): s s2 . 4