Математическая статистика. Учебно

Министерство образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования «Новгородский государственный университет имени Ярослава Мудрого» ________________________________________________________________ МАТЕМАТИЧЕСКАЯ СТАТИСТИКА УЧЕБНО-МЕТОДИЧЕСКОЕ ПОСОБИЕ ВЕЛИКИЙ НОВГОРОД 2012 2 УДК 517.5 Печатается по решению РИС НовГУ Рецензент доктор физико-математических наук, профессор Т.Г. Сукачева Математическая статистика: Учебно-методическое пособие /Н.В. Манова, С.В. Неустроева; Т.С.Афанасьева, НовГУ им. Ярослава Мудрого. Великий Новгород, 2012. - 52с. Изложены программа, основные понятия математической статистики, предложено много примеров, поясняющих основные теоретические вопросы, а также даны варианты контрольных работ. Предназначено для студентов очного и заочного отделений гуманитарных специальностей. © Новгородский государственный университет, 2012 © Н.В. Манова, С.В. Неустроева, Т.С.Афанасьева, 2012 3 СОДЕРЖАНИЕ Введение………………………………………………………………………… …4 Программа курса «Математическая статистика»………...........................................5 1. Статистическое распределение выборки…………………………………………6 2. Эмпирическая функция распределения…………………………………………..8 3. Полигон и гистограмма……………………………………………………… …10 4. Точечные оценки параметров распределения……………………………. ..….16 5. Интервальные оценки параметров распределения …………………… …...…20 6. Решение типовых задач по математической статистике……………… …...…24 7. Элементы теории корреляции……………………………………………....…...30 Задачи для контрольной работы……………………………………………………34 Контрольные вопросы………………………………………………………………42 Приложения……………………………………………………………………….…43 Рекомендуемая литература……………………………………………………....…50 4 ВВЕДЕНИЕ Данные методические указания предназначены для студентов очных и заочных отделений гуманитарных вузов. Работа содержит программу, методические указания для выполнения контрольных работ, задачи для контрольных работ, большое количество примеров. Основной формой обучения студента-заочника является самостоятельная работа над учебным материалом. В конце работы предложена литература по математической статистике. Хочется порекомендовать следующие замечательные книги [8] и [9], в которых студент сможет найти ответы на все вопросы изучаемого курса математической статистики. В каждом параграфе приведены примеры, поясняющие изучаемые вопросы. Надеемся, что рассмотрение этих примеров поможет студентам при решении контрольных заданий. Номера задач одного варианта оканчиваются на одну и ту же цифру, совпадающую с последней цифрой номера зачетной книжки. Например, если номер зачетной книжки оканчивается на 6, то нужно решать задачи всех групп, номера которых оканчиваются на 6: №№ 1.6; 2.6; 3.6; ... При оформлении контрольной работы решения задач следует излагать по порядку, подробно, предварительно полностью переписав задание. Работа оформляется на листах формата A 4 с одной стороны. 5 ПРОГРАММА КУРСА « МАТЕМАТИЧЕСКАЯ СТАТИСТИКА» 1. Статистическое распределение выборки. 2. Эмпирическая функция распределения. 3. Несмещенные, эффективные и состоятельные оценки. 4. Выборочные средняя и дисперсия. 5. Точность оценки, доверительная доверительный интервал. 6. Элементы теории корреляции. вероятность (надежность), 6 1. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ Определение 1. Генеральной совокупностью называется множество единиц, из которых производится отбор. Определение 2. Выборкой (выборочной совокупностью) называется множество отобранных для обследования единиц. На практике наибольшее значение получили следующие виды: случайная, механическая, типическая, серийная, комбинированная выборки. Пусть для изучения количественного (дискретного или непрерывного) признака X из генеральной совокупности извлечена выборка, причем значение x1 наблюдалось n1 раз, значение x 2 наблюдалось n2 раз, …, значение x k наблюдалось nk раз. Наблюдаемые значения xi i  1,2,..., n  признака X называют вариантами, а последовательность всех вариант, записанных в возрастающем порядке, – вариационным рядом. Числа наблюдений n i называют частотами, их сумма  ni  n ─ объем выборки. Отношения частот к объему выборки ni  Wi есть относительные частоты (сумма всех относительных частот n равна 1). Статистическим распределением выборки называют перечень вариант x i вариационного ряда и соответствующих им частот n i или относительных частот Wi . Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал). Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их 7 вероятностями, а в математической статистике – соответствие между наблюдаемыми вариантами и их частотами (или относительными частотами). Пример. Задано распределение частот выборки: xi 2 6 12 ni 3 10 7 В данной выборке получены следующие варианты: x1  2 ; x 2  6 ; x3  12 , соответствующие им частоты n1  3; n2  10; n3  7 . Требуется написать распределение относительных частот. Решение. Определим относительные частоты, для чего найдем объем выборки  ni  n  3  10  7  20 . относительные частоты находятся по формуле: Wi  W1  W2  ni , n n1 3   0,15; n 20 n2 10 1    0,50; n 20 2 W3  n3 7   0,35. n 20 Напишем распределение относительных частот: xi 2 6 12 Wi 0,15 0,50 0,35 Контроль: сумма всех относительных частот Wi равна единице: Wi  W1  W2  W3  0,15  0,50  0,35  1 . 8 2. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Пусть известно статистическое распределение частот количественного признака X . Введем обозначения: n x ─ число наблюдений, при которых наблюдалось значение признака меньше x; n – общее число наблюдений (объем выборки). Ясно, что относительная частота события X  x равна nx . Если x n изменяется, то, вообще говоря, изменится и относительная частота, то есть относительная частота nx n есть функция от x . Так как статистическое распределение выборки находится эмпирическим (опытным) путем, то эту функцию называют эмпирической. Определение 1. Эмпирической функцией распределения (функцией распределения выборки) называется функция F  (x ) , определяющая для каждого значения x относительную частоту события X  x . F * ( x)  nx , n где n x ─ число вариант, меньших x; n – объем выборки. В отличие от эмпирической функции распределения выборки функцию распределения F (x) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F (x) определяет вероятность события X  x , а эмпирическая функция F  (x ) определяет относительную частоту этого же события. Доказано, что относительная частота F  (x ) события X  x стремится по вероятности к вероятности F (x) этого события. Другими словами, при больших значениях n числа F  (x ) и F (x) мало отличаются одно от другого в том смысле, что 9 lim P[| F ( x)  F * ( x) |  ]  1, (  0) . n Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности. Такое заключение подтверждается и тем, что F  (x ) обладает всеми свойствами F (x) . Из определения функции F  (x ) вытекают следующие ее свойства: 1) значения эмпирической функции принадлежит отрезку 0;1 ; 2) F  (x ) – неубывающая функция; 3) если x1 ─ наименьшая варианта, то F  ( x)  0 при x  x1 ; 4) если x k ─ наибольшая варианта, то F  ( x)  1 при x  x k . Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности. Пример. Построить эмпирическую функцию по данному распределению выборки: Варианты x i 2 6 10 Частоты n i 12 18 30 Решение. Найдем объем выборки (сумма всех частот n i ): n  n1  n2  n3  12  18  30  60 . 1. Наименьшая варианта равна 2  x1  2 , следовательно, F  ( x)  0 при x  2 (по свойству 3 функции F  (x ) ). 2. Значения, меньшие 6 x  6 , а именно x1  2 , наблюдались n1  12 раз, следовательно, F * ( x)  3.Значения x  10 , nx n 12  F * ( x)  1   0,2 при 2  x  6 . n n 60 а именно x1  2, x 2  6 n1  n2  12  18  30 раз, следовательно, F * ( x)  наблюдались 30  0,5 при 6  x  10 . 60 10 4. Так как x  10 – наибольшая варианта, то F * ( x)  1 при x  10 (по свойству 4 функции F * ( x ) ). Искомая эмпирическая функция имеет вид: 0, 0,2,   F ( x)   0,5, 1, при x  2, при 2  x  6, при 6  x  10, при x  10. Ниже (рис. 1) приведен график полученной эмпирической функции. На графике на соответствующих осях отложены значения функции F * ( x ) и значения вариант F  (x ) 1 0,5 0,2 0 2 6 10 14 x Рис. 1. График эмпирической функции. 3. ПОЛИГОН И ГИСТОГРАММА Для наглядности строят различные графики статистического распределения, в частности, полигон и гистограмму. Определение 1. Полигоном частот называют ломаную, отрезки которой соединяют точки  x1 ; n1 ,  x2 ; n2 , ...,  xk ; nk  . Для построения полигона частот на оси абсцисс откладывают варианты x i , а на оси ординат – соответствующие им частоты n i . Точки  xi ; ni  соединяют отрезками прямых и получают полигон частот. 11 Определение 2. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки  x1 ;W1 ,  x2 ;W2 , ...,  xk ;Wk  . Для построения полигона относительных частот на оси абсцисс откладывают варианты x i , а на оси ординат относительные частоты Wi . Точки ( xi ;Wi ) соединяют отрезками прямых и получают полигон относительных частот. На рисунке 2 изображен полигон относительных частот следующего распределения: x 1,5 3,5 5,5 7,5 W 0,1 0,2 0,4 0,3 Wi 0,4 0,3 0,2 0,1 0 1,5 3,5 5,5 7,5 xi Рис. 2. Полигон относительных частот. В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длины h и находят для каждого частичного интервала n i – сумму частот вариант, попавших в i - ый интервал. Определение 3. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h , а высоты равны отношению ni / h (плотность частоты). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс, на расстоянии ni / h и строят соответствующие прямоугольники. 12 Площадь i - го частичного прямоугольника равна h  (ni / h)  ni ─ сумме частот вариант i - го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, то есть объему выборки n . Пример 1. Дано распределение частот непрерывного признака (табл.1). Таблица 1 Частичный интервал, длиною h  5 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 30 – 35 34 – 40 Сумма частот вариант частичного интервала n i 4 6 16 36 24 10 4 Плотность частоты ni / h 0,8 1,2 3,2 7,2 4,8 2,0 0,8 На рисунке 3 изображена гистограмма частот распределения объема n  100 , приведенного в таблице 1. ni / h 7 6 5 4 3 2 1 0 5 10 15 20 25 30 35 40 x Рис. 3. Гистограмма частот. Определение 4. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h , а высоты равны отношению Wi / h (плотность относительной частоты). Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные 13 оси абсцисс на расстоянии Wi / h . Площадь i - го частичного прямоугольника равна h  Wi / h  Wi ─ относительной частоте вариант, попавших в i - й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, то есть единице. Пример 2. В результате выборки получена следующая таблица распределения частот. xi 2 6 12 ni 3 10 7 Требуется построить полигоны частот и относительных частот распределения. Для начала построим полигон частот. ni 10 9 8 7 6 5 4 3 2 1 0 2 6 12 xi Рис. 4. Полигон частот. Чтобы построить полигон относительных частот найдем относительные частоты, для чего разделим частоты на объем выборки n. n  3  10  7  20 . Таким образом W1  3 / 20  0,15; W2  10 / 20  0,5; W3  7 / 20  0,35 . Получаем 14 xi 2 6 12 W i 0,15 0,50 0,35 Построим полигон относительных частот. wi 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 5 6 7 8 9 10 11 12 xi Рис. 5. Полигон относительных частот. Пример 3. Требуется построить гистограммы частот и относительных частот данного непрерывного распределения (таблица 2). Таблица 2 Сумма длины h  3 частичного интервала n i ni / h 2–5 9 3 5–8 10 3,3 8 – 11 25 8,3 11 – 14 6 2 Построим гистограмму частот. частот вариант Плотность частоты Частичный интервал 15 ni / h 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 x Рис. 6. Гистограмма частот. Чтобы построить гистограмму относительных частот, нужно найти относительные частоты. Для этого найдем объем выборки n . n   ni  9  10  25  6  50 . Теперь найдем относительные частоты по формуле Wi  ni : n W1  9 / 50  0,18; W2  10 / 50  0,2; W3  25 / 50  0,5; W4  6 / 50  0,12. Вычислим плотности частот Wi / h , учитывая, что шаг h  3 : W1 / h  0,18 / 3  0,06, W2 / h  0,2 / 3  0,07, W 3/ h  0,5 / 3  0,17, W4 / h  0,12 / 3  0,04. Получаем результат, таблица 3: Таблица 3. Частичный интервал 2–5 5–8 8 – 11 11 – 14 Сумма относительных частот Wi 0,18 0,2 0,5 0,12 Плотность частоты Wi / h 0,06 0,07 0,17 0,04 16 Построим гистограмму относительных частот. Wi / h 0,17 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 x Рис.7. Гистограмма относительных частот. 4. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ Определение 1. Статистической оценкой Q  неизвестного параметра Q теоретического распределения называют функцию от f ( x1 , x2 ,..., xn ) наблюдаемых значений x1, x2 ,..., xn количественного признака X . Определение 2. Точечной оценкой называют статистическую оценку, которая определяется одним числом Q   f ( x1 , x2 ,..., xn ) , где x1 , x2 ,..., xn ─ результаты n наблюдений над количественным признаком X (выборка). Определение 3. Несмещенной называют точечную оценку Q , математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, то есть M (Q  )  Q . Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру. Рассмотрим основные точечные оценки параметров распределения. Выборочная средняя. Пусть для изучения генеральной совокупности количественного признака X извлечена выборка объема n . относительно 17 Определение 4. Выборочной средней называют xB среднее арифметическое значение признака выборочной совокупности. Если все значения x1, x2 ,..., xn признака выборки объема n различны, то выборочная средняя находится по формуле: x B  ( x1  x2  ...  xn ) / n . Если же все значения признака x1 , x2 ,..., xk имеют соответственно частоты n1 , n2 ,..., nk , причем объем выборки n1  n2  ...  nk  n , то k x B  ( ni  xi ) / n . i 1 Выборочная средняя является несмещенной оценкой генеральной средней (неизвестного математического ожидания). Замечание. Если первоначальные варианты x i ─ большие числа, то для упрощения решения целесообразно вычесть из каждой варианты одно и то же число c , то есть перейти к условным вариантам ui  xi  c . Тогда k xB  c  (  ni  ui ) / n . i 1 Выборочная дисперсия. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия. Эту величину вводят для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака X выборки вокруг среднего значения x B . Определение 5. Выборочной дисперсией DB называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения xB . Если все значения x1, x2 ,..., xn признака выборки объема n различны, то выборочная дисперсия находится по формуле: n DB  ( ( xi  x B ) 2 ) / n. i 1 18 Если значения признака x1 , x2 ,..., xk имеют соответственно частоты n1 , n2 ,..., nk , причем n1  n2  ...  nk  n , то k DB  ( ni ( xi  xB )2 ) / n. i 1 Эта оценка является смещенной, так как M ( DВ )  D Г , где DГ – генеральная дисперсия. Теорема. Выборочная дисперсия равна среднему квадратов значений признака минус квадрат выборочной средней. DB  x  [ x] 2 2 ni xi2   ni xi       n 2  .  n Для вычисления выборочной дисперсии эта формула наиболее удобна. Замечание. Если перейти к условным вариантам ui  xi  c , то дисперсия при этом не изменится. Тогда 2 DB ( x)  DB (u )  u  [u ] 2  ni  ui2    ni  ui   n   n 2  .  Исправленная выборочная дисперсия. Пусть из генеральной совокупности в результате n независимых наблюдений над количественным признаком X извлечена выборка объема n : Значения признака Частоты xi x1 x2 … xk ni n1 n2 … nk При этом n1  n2  ...  nk  n . Требуется по данным выборки оценить неизвестную генеральную дисперсию DГ . Если в качестве оценки DГ принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение DГ . Объясняется это тем, что математическое ожидание выборочной дисперсии не равно оцениваемой DГ , а равно M [ DB ]  n 1 DГ . n 19 Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить D B на дробь n /( n  1) . Сделав это, мы получим исправленную выборочную дисперсию, которую обычно обозначают s 2 , которая является несмещенной оценкой генеральной дисперсии: s2  n DB . n 1 Если все значения x1, x2 ,..., xn признака выборки объема n различны, то исправленная выборочная дисперсия находится по формуле: n s  DB  n 1 2  ( xi  x B ) 2 . n 1 Если же все значения x1 , x2 ,..., xk признака имеют соответственно частоты n1 , n2 ,..., nk , причем объем выборки n1  n2  ...  nk  n , то n s  DB  n 1 2  ni ( xi  x B ) 2 . n 1 Более удобна форма: s 2 ni xi2  [ ni xi ]2 / n   . n 1 В условных вариантах ui  xi  c она имеет вид: s 2 ni u i2  [ ni u i ]2 / n   . n 1 Пример 1. Из генеральной совокупности извлечена выборка объемом n  60 . xi 1 3 6 26 ni 8 40 10 2 Требуется найти несмещенную оценку генеральной средней. Решение. Несмещенной выборочная средняя: оценкой генеральной средней является 20 k x B  ( ni  xi ) / n , i 1 k где xi ─ варианта выборки, ni ─ частота варианты x i ; n   ni объем выборки. i 1 x B  (8  1  40  3  10  6  2  26) / 60  (8  120  60  52) / 60  240 / 60  4 . Ответ: x B  4 . Пример 2. Выборочная совокупность задана таблицей распределения xi 1 2 3 4 n i 20 15 10 5 Требуется найти выборочную дисперсию. Решение. Найдем выборочную среднюю 4 x B  ( ni  xi ) / n  i 1 20 1  15  2  10  3  5  4 100   2. 20  15  10  5 50 Найдем выборочную дисперсию: 4 DB  ( ni ( xi  x B ) 2 ) / n , i 1 20  (1  2) 2  15  (2  2) 2  10  (3  2) 2  5  (4  2) 2 DB   50 20  (1) 2  15  0  10  12  5  2 2 20  10  20 50     1. 50 50 50 Ответ: D B  1. 5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ Определение 1. Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр. 21 Доверительным называют интервал, который с заданной вероятностью (надежностью)  покрывает заданный параметр. Интервальной оценкой с надежностью  математического ожидания a нормально распределенного признака X по выборочной средней xB при известном среднем квадратическом отклонении  генеральной совокупности служит доверительный интервал xB  t   / n  a  xB  t   / n , где t   / n   – точность оценки, n – объем выборки, t – значение аргумента функции Лапласа Ф(t ) (см. приложение 2), при котором Ф(t )   2 . При неизвестном  (и объеме выборки n  30 ) доверительным будет интервал x B  t  s / n  a  x B  t  s / n , где s – «исправленное» выборочное среднее квадратическое отклонение, t  находят по таблице приложения 3 по заданным n и  . Интервальной оценкой с надежностью  среднего квадратического отклонения  нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит доверительный интервал: s  (1  q)    s  (1  q) при q  1 , 0    s  (1  q) при q  1 , где q находят по таблице приложения 4 по заданным n и  . Интервальной оценкой с надежностью  неизвестной вероятности p биномиального распределения по относительной частоте доверительный интервал (с приближенными концами p1 и p 2 ): p1  p  p 2 , W служит 22 где 2  t2 W (1  W )  t   W  p1  2 t   , 2n n  2n   t n   n 2  t2 W (1  W )  t   W  p2  2 t   . 2 n n  2n   t n   n где n – общее число испытаний, W – относительная частота, равная отношению m n ( m – число появлений события); t – значение аргумента функции Лапласа (приложение 2), при котором Ф(t )   2 (  – заданная надежность). Замечание. При больших значениях n (порядка сотен) можно принять в качестве приближенных границ доверительного интервала p1  W  t W (1  W ) W (1  W ) , p2  W  t . n n Пример 1. Из генеральной совокупности извлечена выборка объема n  25 : Варианта x i 2 3 5 7 10 13 Частота n i 2 4 7 8 3 1 Требуется оценить с надежностью 0,95 математическое ожидание нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интервала. Решение. Выборочную среднюю и «исправленное» квадратическое отклонение найдем соответственно по формулам xB ni  ( x i  x B ) 2 ni  xi    , s n Подставим в эти формулы данные задачи: n 1 . среднее 23 xB  2  2  4  3  7  5  8  7  3  10  1  13 4  12  35  56  30  13 150    6, 25 25 25 s 2  (2  6) 2  4  (3  6) 2  7  (5  6) 2  8  (7  6) 2  3  (10  6)  1  (13  6) 2  25  1  2  (4) 2  4  (3) 2  7  (1) 2  8  12  3  4 2  1  7 2 180   7,5  2,739 . 24 24 Таким образом, получим x B  6 , s  2,739 . Найдем искомый доверительный интервал: x B  t  s n  a  x B  t  s n. Значение t находят по таблице приложения 3 по заданным n  25 и   0,95 : t  2,064 . Подставляя x B  6; t  2,064; s  2,739 ; n  25 ; получим 6  2,064  2,739 / 25  a  6  2,064  2,739 / 25 , 4,87  a  7,13 . Получили доверительный интервал (4,87; 7,13) , покрывающий неизвестное математическое ожидание a с надежностью   0,95 . Пример 2. По данным выборки объема n  40 из генеральной совокупности найдено «исправленное» среднее квадратическое отклонение s  1 нормально распределенного количественного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение  с надежностью 0,99. Решение. Задача сводится к отысканию доверительного интервала s  (1  q)    s  (1  q) (если q  1 ) или 0    s  (1  q) (если q  1 ). Значение q находят по таблице приложения 4 по заданным n  40 и   0,99 : q  0,35 . Так как q  0,35  1, то воспользуемся первым соотношением. Подставим s  1 и q  0,35 . Получим 1  (1  0,35)    1  (1  0,35) , отсюда 0,65    1,35 . 24 Таким образом, полученный доверительный интервал 0,65    1,35 покрывает неизвестное среднее квадратическое отклонение  с надежностью (доверительной вероятностью)   0,99 . Часто используют также следующие выборочные характеристики. sx  s / n – ошибка средней (среднее квадратическое отклонение выборочной средней от генеральной средней); V s  100 % xB – коэффициент вариации (доля среднего квадратического отклонения в выборочной средней, в процентах). 6. РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ Задача 1. В течение 300 дней фиксировалась цена акции ООО «Психолог». Затем была проведена случайная выборка объёмом n=20, и получены следующие результаты: 35,9; 35,3; 42,7; 45,3; 25,6; 35,3; 33,4; 27,0; 35,9; 38,8; 33,7; 38,6; 40,8; 35,5; 44,1; 37,4; 34,2; 30,8; 38,4; 31,3. Требуется получить вариационный ряд и построить гистограмму относительных частот; найти основные выборочные характеристики: x В , s 2 , s, V , s x ; с надежностью   95 % указать доверительный интервал для оценки генеральной средней. Решение. Запишем исходные данные в виде ранжированного ряда, то есть, располагая их в порядке возрастания: 25,6; 27,0; 30,8; 31,3; 33,4; 33,7: 34,2; 35,3; 35,3; 35,5; 35,9; 35,9; 37,4; 38,4; 38,6; 38,8; 40,8; 42,7; 44,1; 45,3. Максимальное значение признака составляет 45,3 ц, а минимальное – 25,6 ц. Разница между ними составляет 19,7 ц. Этот интервал надо разбить на определенное количество частей. При малом объеме выборки (20–40 вариант) намечают 4–7 интервалов. Возьмем длину интервала h  5 . Получаем пять интервалов: первый 25 – 30, второй 30 – 35, третий 35 – 40, четвертый 40 – 45, 25 пятый 45 – 50. С помощью ранжированного ряда определим частоту попадания вариант выборки в каждый интервал. В первый интервал 25 – 30 попадают два значения: 25,6 и 27,0; поэтому n1  2 . Во второй интервал попадают пять значений, поэтому n2  5 . Аналогично, n3  9 , n4  3 , n5  1 . Теперь найдем относительные частоты попадания вариант выборки в каждый интервал: W1  n1 n  2 20  0,1 ; W2  n2 n  5 20  0,25 ; W3  n3 n  9 20  0,45 ; W4  n4 n  3 20  0,15 ; W5  n5 n  1 20  0,05 . Для проверки вычисляем сумму относительных частот: W1  W2  W3  W4  W5  0,1  0,25  0,45  0,15  0,05  1 . Тот факт, что в сумме получена единица, подтверждает правильность вычислений. Вычислим плотности Wi h относительных частот вариант. Получаем W1 h  0,1 5  0,02 ; W2 h  0,25 5  0,05 ; W3 h  0,45 5  0,09 ; W4 h  0,15 5  0,03 ; W5 h  0,05 5  0,01. Полученные результаты сведем в таблицу 4. Таблица 4. Интервал значений 25–30 30–35 35–40 40–45 45–50 2 5 9 3 1 Относительные частоты 0,10 0,25 0,45 0,15 0,05 Плотность относительных частот 0,02 0,05 0,09 0,03 0,01 Частоты вариант Строим гистограмму относительных частот – ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются интервалы, а высотами соответствующие значения плотности относительных частот. 26 Wi / x 0,1 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0 40 25 30 35 45 40 25 30 35 45 50 Рис.8. Гистограмма относительных частот. 50 Так как объем выборки небольшой ( n  20 ) и почти все наблюдаемые значения различны, то для вычисления выборочных характеристик составим вспомогательную таблицу (таблица 5). Основные выборочные характеристики вычисляются по формулам: x В   x1  x2  ...  xn  / n – выборочная средняя; s 2 ( xi  x B ) 2   n 1 – «исправленная» дисперсия; s  s 2 – «исправленное» среднее квадратическое отклонение; s x  s / n – ошибка средней; V  s  100 % xB – коэффициент вариации. Таблица 5. № Результат обследования xi xi  x В xi  x В 2 1 35,9 – 0,1 0,01 2 35,3 – 0,7 0,49 3 42,7 6,7 44,89 4 45,3 9,3 86,49 27 5 25,6 –10,4 108,16 6 35,3 – 0,7 0,49 7 33,4 – 2,6 6,76 8 27,0 – 9,0 81,00 9 35,9 – 0,1 0,01 10 38,8 2,8 7,84 11 33,7 – 2,3 5,29 12 38,6 2,6 6,76 13 40,8 4,8 23,04 14 35,5 – 0,5 0,25 15 44,1 8,1 65,61 16 37,4 1,4 1,96 17 34,2 – 1,8 3,24 18 30,8 – 5,2 27,04 19 38,4 2,4 5,76 20 31,3 – 4,7 22,09 Σ 720,0 0 497,20 Подставляя полученные значения в формулы, получаем x В   x1  x2  ...  xn  / n  720,0 / 20  36,0 ; s 2 ( xi  x B ) 2   n 1  497 ,20 / 19  26,17 ; s  s 2  5,12 ; s x  s / n  5,12 / 20  1,14 ; V s  100 % 5,12   100 %  14 % . 36 xB Доверительный интервал для оценки генеральной средней имеет вид: x B  t  s n  a  x B  t  s n. 28 Вычисляем теперь точность оценки  :   t  s / n  t  s x  2,10  1,14  2,4 ; где значение t  2,10 находим по таблице приложения 3. Таким образом, с надежностью 95% можно утверждать, что средняя цена акции за 300 дней заключена в пределах от x B  t  s (гарантированный минимум) до x B  t  s n  36  2,4  33,6 ц. n  36  2,4  38,4 ц. (возможный максимум). Задача 2. Для определения средней урожайности сахарной свеклы в агрофирме на площади 1000 га была определена ее урожайность на 100 га. Результаты выборочного обследования представлены следующим распределением: Урожайность, ц/га 23–25 25–27 27–29 29–31 31–33 33–35 35–37 3 10 6 16 15 30 20 Площадь, га Требуется найти: 1) величину, которую следует принять за среднюю урожайность на всем массиве; 2) величину, которую следует принять за среднее квадратическое отклонение урожайности на всем массиве; 3) доверительный интервал, в котором с вероятностью   0,95 заключена средняя урожайность на всем массиве. Решение. В качестве приближенного значения средней урожайности на всем массиве принимаем среднюю арифметическую данного распределения, то есть выборочную среднюю. За значения признака нужно принять середины интервалов. Получим: k xB  ( ni  xi ) / n = (24∙3+26∙10+28∙6+30 ∙16+32 ∙15+34∙30+36∙ 20)/100 = i 1 = 3200/100 = 32. 29 Для оценки дисперсии генеральной совокупности вычисляем исправленное среднее квадратическое отклонение: s 2 ni  ( xi  x В ) 2   n 1  1      2      2      2  99  16  (30 - 32) 2  15  (32 - 32) 2  30  (34 - 32) 2  20  (36 - 32) 2 )   1/99  192  360  96  64  0  120  320   1 / 99  1152  11,64 Отсюда можно найти среднее квадратическое отклонение урожайности на всем массиве s  s 2 = 11,64 = 3,4. Найдем среднее квадратическое отклонение выборочной средней по формуле s x  s / n  3,4 / 100  0,34 ц. Итак, оценка средней урожайности сахарной свеклы на всем массиве равна 32 ц со средней квадратической ошибкой 0,34 ц. Оценка среднего квадратического отклонения урожайности на всем массиве равна 3,4 ц. Для вычисления доверительного интервала воспользуемся двойным неравенством: x В  t   s / n  a  x В  t  s / n . Так как n  100  30 , то значение t  найдем из условия   2Ф(t )  0,95 . По таблице приложения 2 находим значение Ф(t )  0,475 и t  1,96 , следовательно, получаем:   t  s n  1,96  3,4 / 100  0,67 . Концы доверительного интервала: x B    32  0,67  31,33 и x B    32  0,67  32,67 . Таким образом, с вероятностью 0,95 средняя урожайность сахарной свеклы на всем массиве заключена в границах от 31,33 ц до 32,67 ц. 30 7. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ Определение 1. Зависимость двух случайных величин называют корреляционной, если изменение одной случайной величины приводит к изменению среднего значения другой случайной величины. Основные задачи теории корреляции: 1. определить есть ли связь между случайными величинами, если есть, то найти уравнение зависимости (уравнение регрессии); 2. определить силу (тесноту) связи между случайными величинами. Для определения самого факта связи между случайными величинами и тесноты связи служит коэффициент корреляции. Уравнение регрессии позволяет предсказать, какие изменения в среднем будет претерпевать признак при изменении другого признака. Если уравнения регрессии являются линейными, то есть графиками будут прямые линии, то корреляционная зависимость называется линейной. Пусть извлечена выборка объема n и исследуются два количественных признака X и Y . Результаты измерений занесены в таблицу. Значения x i x1 x2 … xn Значения y i y1 y2 … yn Выборочный коэффициент корреляции rВ находится по формуле: rВ   ( xi  xB )  ( yi  yВ ) . 2 2 ( x  x )  ( y  y )  i В  i В Свойства выборочного коэффициента корреляции: 1. Значения коэффициента корреляции изменяются на отрезке [–1;1]:  1  rВ  1 . 2. Чем модуль rВ больше и ближе к 1, тем теснее связь между изучаемыми признаками. 3. Если rВ  1 , то между признаками функциональная связь. 31 4. Если rВ  0 , то между изучаемыми признаками нет линейной корреляционной зависимости. 5. Если rВ  0 , то между признаками прямая (положительная) связь и если rВ  0 , то между признаками обратная (отрицательная) связь. Выборочное уравнение прямой регрессии Y на X имеет вид: y  x  xВ  , x y  yВ  rВ  где x В , y В – выборочные средние. За приближенные значения  y и  x принимают соответственно s x и s y :  x  sx   ( xi  x В ) 2 ,  y n 1  ( yi  y В ) 2 .  sy  n 1 Выборочное уравнение прямой регрессии X на Y имеет вид: x  xВ  rВ  Пример. Психологи x  y  yВ  . y провели тестирование среди пациентов психоневрологического диспансера. Возраст пациентов колебался от 14 до 34 лет. Затем была проведена случайная выборка объёмом n=10. Была поставлена задача: определить есть ли зависимость возраста испытуемого (Y ) от значения показателя развития заболевания Результаты этого измерения (X ) . представлены в таблице 6: Таблица 6. X 25 35 45 55 65 75 85 95 105 115 Y 14 18 19 20 23 23 24 26 29 34 Требуется вычислить выборочный коэффициент выборочное уравнение прямой регрессии Y на X . корреляции и найти 32 Решение. Вычислим выборочный коэффициент корреляции по формуле:  ( xi  xB )  ( yi  y В )  ( xi  xВ ) 2   ( yi  y В ) 2 rВ  Для вычисления величин, входящих . в формулу, составим вспомогательную таблицу 7, в которой результаты измерений записаны столбцами. Внизу каждого из столбцов вычислены суммы для нахождения средних x В и y В . Далее расположены столбцы, в которых вычисляются разности xi  x В и yi  y В , их квадраты и произведения. Значения этих столбцов суммируются (последняя строка), чтобы получились величины, необходимые для подстановки в формулу. Отметим, что суммы в столбцах, в которых вычислены разности xi  x В и yi  y В будут всегда равны нулю. Таблица 7. xi yi xi  xВ ( xi  x В ) 2 yi  y В ( yi  y В ) 2 ( xi  x В )  ( y i  y В ) 25 14 – 45 2025 –9 81 405 35 18 – 35 1225 –5 25 175 45 19 – 25 625 –4 16 100 55 20 – 15 225 –3 9 45 65 23 –5 25 0 0 0 75 23 5 25 0 0 0 85 24 15 225 1 1 15 95 26 25 625 3 9 75 105 29 35 1225 6 36 210 115 34 45 2025 11 121 495 700 230 0 8250 0 298 1520 Находим выборочные средние x В и y В (смотри данные в таблице, 1–2 столбцы): 33 x В = 700/10 = 70, y В = 230/10 = 23. Выполнив все вычисления в таблице (3 – 7 столбцы), получаем:  ( xi  x В )  ( yi  y В )  1520 ,  ( xi  x В ) 2  8250 ,  ( yi  y В ) 2  298 . Подставляя эти значения в соответствующую формулу, вычислим коэффициент корреляции: 1520  0,97. 8250  298 rВ  Таким образом, y выбранных пациентов имеет место очень сильная (т.к. значение rВ близко к 1) и положительная (т.к. rВ  0 ) корреляция между возрастом испытуемого (Y ) и значением показателя развития заболевания (X ) . Найдем теперь выборочное уравнение прямой регрессии Y на X . y  y В  rВ  где  y  s y   ( yi  y В ) 2 ,  x n 1  Тогда  y /  x   sx  y x  y  x  x В , x  ( xi  x В ) 2 n 1  ( yi  y В ) 2  ( xi  x В ) 2  . 298  0,0361  0,19. 8250 Подставляя в выборочное уравнение прямой регрессии Y на X : x В  70 , y В  23 , rB  0,97 ,  y /  x  0,19 , получим y  23  0,97  0,19  ( x  70) или y  23  0,18 x  12,6 . Окончательно, y  0,18 x  10,4 – искомое уравнение прямой регрессии Y на X . 34 ЗАДАЧИ ДЛЯ КОНТРОЛЬНОЙ РАБОТЫ 1 группа Выборка задана в виде распределения частот. Найти: а) распределение относительных частот; б) эмпирическую функцию по данному распределению выборки; построить график функции F  (x ) . 1.1. xi 2 1.2. 5 7 xi 1 n i 12 3 5 4 6 n i 13 12 25 1.3. 1.4. xi 3 6 9 xi 2 n i 5 15 10 4 8 n i 10 12 14 1.5. 1.6. x i 10 15 25 xi 2 n i 11 13 16 n i 10 15 20 1.7. xi 4 5 6 1.8. 7 8 xi 2 5 7 8 n i 15 25 30 ni 1 3 2 4 1.9. 1.10. x i 4 7 8 12 xi 2 3 4 n i 5 2 3 10 n i 10 18 22 2 группа 1.2.Построить полигон частот по данному распределению выборки: xi 1 3 5 9 n i 19 7 13 3 35 2.2.Построить полигон относительных частот по данному распределению выборки: 2 xi 4 6 7 9 Wi 0,1 0,2 0,1 0,25 0,35 2.3.Построить полигон частот по данному распределению выборки: xi 5 10 15 20 25 n i 10 15 20 25 30 2.4.Построить полигон относительных частот по данному распределению выборки: xi 2 3 5 6 9 Wi 0,15 0,2 0,25 0,3 0,1 2.5.Построить полигон частот по данному распределению выборки: xi 3 5 6 9 n i 10 5 15 20 2..6.Построить гистограмму частот по данному распределению выборки: Частичный интервал 2 – 4 4 – 6 6 – 8 8 – 10 Сумма частот вариант интервала n i 10 12 16 14 2..7.Построить гистограмму частот по данному распределению выборки: Частичный интервал 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 Сумма частот вариант интервала, n i 2.8.Построить гистограмму распределению: 10 15 относительных 20 частот 15 5 по данному 36 Частичный интервал 2 – 5 5 – 8 8 – 11 11 – 14 14 – 17 Сумма относительных частот 0,18 вариант интервала, Wi 2.9.Построить гистограмму 0,06 0,16 относительных 0,2 частот 0,4 по данному распределению: Частичный интервал 0 – 5 5 – 10 10 – 15 Сумма относительных частот вариант интервала, Wi 2.10.Построить гистограмму относительных 0,3 частот 0,5 по 0,2 данному распределению: Частичный интервал 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12 Сумма относительных частот вариант интервала, Wi 0,1 0,25 0,45 0,15 0,05 3 группа 3.1.Из генеральной совокупности извлечена выборка объема n  40 : 4 xi 6 8 11 n i 14 11 3 ? Найти несмещенную оценку генеральной средней. 3.2.Найти выборочную среднюю по данному распределению выборки объема n  15 : x i 13803 13845 13864 ni 3.3.По выборке ? объема 6 n  81 7 найдена смещенная оценка D B  5 генеральной дисперсии. Найти несмещенную оценку дисперсии генеральной совокупности. 37 3.4.В итоге пяти измерений (без систематических ошибок) длины бруска одним прибором получены следующие результаты: 804, 806, 807, 809, 810. Найти: а) выборочную среднюю длину бруска; б) выборочную и исправленную дисперсии ошибок измерений. 3.5.Найти выборочную дисперсию по данному распределению выборки объема n  30 : x i 354 365 372 ? ni 9 14 3..6.Найти выборочную дисперсию по данному распределению выборки объема n  120 : x i 3832 3848 3850 3900 13 ni 24 35 ? 3.7.Найти выборочную дисперсию по данному распределению выборки объема n  75 : x i 34,7 35,4 35,9 36,3 ni 13 ? 24 20 3.8.Найти выборочную дисперсию по данному распределению выборки объема n  20 : x i 0,004 0,005 0,008 ? ni 7 9 3.9.Найти выборочную дисперсию по данному распределению выборки объема n  40 : x i 344 349 355 ni 6 8 ? 38 3.10.Найти выборочную дисперсию по данному распределению выборки объема n  50 : x i 0,3 0,7 0,9 ni ? 15 22 4 группа 4.1.Из генеральной совокупности извлечена выборка объема n  10 : xi 5 6 8 4 3 2 ni 1 2 2 1 3 1 Оценить с надежностью 0,99 математическое ожидание нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 4.2.Из генеральной совокупности извлечена выборка объема n  10 : xi 1 3 4 2 ni 2 1 5 2 Оценить с надежностью 0,95 математическое ожидание нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 4.3.Из генеральной совокупности извлечена выборка объема n  11 : xi 2 4 6 3 1 ni 3 2 2 1 3 Оценить с надежностью   0,95 математическое ожидание нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 4.4.Количественный признак X генеральной совокупности распределен нормально. По выборке объема n  20 найдена выборочная средняя 39 x В  15 и выборочная дисперсия D B  3,8 . Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью   0,99 . 4.5.Даны «исправленное» среднее квадратическое отклонение s  0,5 ; выборочная средняя x В  3; t  2,20 . Найти доверительный интервал для оценки неизвестного математического ожидания, нормально распределенной случайной величины X с надежностью   0,95 . 4.6.Случайная величина X имеет нормальное распределение с известным средним квадратическим отклонением   8 . Найти доверительный интервал для оценки неизвестного математического ожидания, если выборочная средняя x В  16,6 , объем выборки n  25 и заданная надежность   0,95 . 4.7.Даны среднее квадратическое отклонение   10 , выборочная средняя x В  7,8 и объем выборки нормально распределенного признака n  10 . Найти доверительный интервал для оценки неизвестного математического ожидания с заданной надежностью   0,95 . 4.8.Количественный признак X генеральной совокупности распределен нормально. По выборке объема n  40 найдена выборочная дисперсия D B  0,624 . Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение  с надежностью   0,999 . 4.9.Количественный признак X генеральной совокупности распределен нормально. По выборке объема n  10 найдена выборочная дисперсия DB  22,5 . Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение  с надежностью   0,99 . 4.10.По данным выборки объема n  20 из генеральной совокупности нормально распределенного количественного признака найдена выборочная дисперсия DB  27,702 . Найти доверительный интервал, 40 покрывающий генеральное среднее квадратическое отклонение  с надежностью   0,95 . 5 группа Вычислить выборочный коэффициент корреляции и найти выборочное уравнение прямой регрессии Y на X . 5.1. X Y 10 18 20 19 30 20 40 23 50 25 60 29 70 36 80 47 90 61 100 85 5 4 17 7 27 10 35 13 43 16 49 19 53 22 57 25 63 28 67 31 15 11 20 12 25 13 30 14 35 15 40 17 45 19 50 21 55 23 60 25 10 5 20 8 30 13 40 17 50 23 60 29 70 36 80 41 90 48 100 57 10 7 12 8 14 11 16 13 18 16 20 19 22 21 24 23 26 25 28 27 14 8 16 9 18 10 20 13 22 15 24 18 26 21 28 25 30 29 32 32 10 25 20 26 30 28 40 31 50 35 60 40 70 46 80 53 90 61 100 70 5.2. X Y 5.3. X Y 5.4. X Y 5.5. X Y 5.6. X Y 5.7. X Y 41 5.8. X Y 15 9 23 15 31 18 39 21 47 25 55 29 63 36 71 47 79 61 87 85 11 18 13 19 15 20 17 23 19 27 21 34 23 43 25 49 27 61 29 81 20 35 30 40 40 46 50 53 60 61 70 70 80 80 90 91 100 103 5.9. X Y 5.10. 10 31 X Y 6 группа Найти основные выборочные характеристики x В , s 2 , s , V , s x ; с надежностью 95% указать доверительный интервал для оценки генеральной средней x Г для следующей выборки: Номер задачи 6.1. 40,8 26,4 33,2 29,5 36,1 32,8 33,5 36,4 37,1 39,6 41,0 28,3 30,6 37,9 39,2 32,5 35,6 34,8 36,9 34,2 6.2. 12,6 18,7 15,3 14,8 19,5 13,7 16,4 15,2 16,3 12,9 18,5 16,5 15,4 13,6 16,9 15,8 17,3 19,6 15,8 19,6 6.3. 19,7 20,3 25,6 24,3 28,9 29,6 19,4 23,5 25,8 29,4 28,2 26,1 23,9 25,8 23,9 26,9 27,6 25,9 24,7 28,5 6.4. 18,6 19,5 23,8 15,4 39,7 24,5 19,8 20,5 26,5 23,4 21,6 29,7 29,7 24,6 19,4 16,5 16,8 14,4 13,8 22,4 6.5. 26,5 18,4 29,4 35,8 26,9 34,2 26,7 34,6 35,1 32,8 30,9 28,7 29,6 31,5 36,4 34,8 39,5 32,9 34,4 30,4 6.6. 29,8 30,5 31,6 29,6 35,7 36,8 29,4 21,6 29,7 24,6 34,8 36,4 32,1 39,7 34,5 34,8 31,5 34,8 37,9 29,6 6.7. 45,8 50,4 48,4 53,2 49,5 52,6 48,7 51,9 45,9 46,8 49,5 51,2 46,3 48,7 48,9 48,3 47,6 48,3 49,5 48,6 6.8. 95,4 82,5 86,9 90,2 89,1 85,6 87,5 86,4 89,3 92,1 90,3 86,9 87,4 90,4 94,6 93,2 87,5 86,4 93,4 86,5 6.9. 32,5 35,4 18,9 21,5 26,5 23,0 26,1 28,4 19,8 31,5 30,6 25,8 31,0 36,4 26,5 28,7 23,4 26,8 29,4 29,4 6.10. 11,5 12,4 13,9 18,4 12,0 15,1 16,7 13,8 14,6 12,5 11,8 13,9 14,7 15,8 16,8 13,0 11,2 14,8 17,9 19,6 42 КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Что понимается под генеральной совокупностью? Что такое выборка? Что называется вариантами выборки и вариационным рядом? 2. Что такое частота появления варианты в выборке? 3. Как получают относительную частоту появления варианты в выборке? 4. Как построить полигоны частот и относительных частот? 5. Как построить гистограммы частот и относительных частот? 6. В чем сущность задачи по определению параметров генеральной совокупности? 7. Какую величину принимают за среднюю генеральной совокупности? Как она вычисляется? 8. Какую величину принимают за дисперсию генеральной совокупности? Как она вычисляется? 9. Как вычисляется среднее квадратическое отклонение средней выборки? 10.Что понимают под доверительным интервалом и доверительной вероятностью? 11.Как вычислить доверительный интервал для математического ожидания нормально распределенной случайной величины в случае, когда среднее квадратическое отклонение известно; когда среднее квадратическое неизвестно? 12.Как вычисляется доверительный интервал для среднего квадратического отклонения нормально распределенной случайной величины? 13.Дайте определение корреляционной зависимости. 14.В чем состоят две основные задачи теории корреляции? 15.Какую корреляционную зависимость называют линейной? 16.Как найти выборочный коэффициент корреляции, перечислите его свойства. 17. Запишите выборочные уравнения прямых регрессий. 43 Приложение 1 Таблица значений функции  x   0 0,0 1 0,3989 3989 1  x2 / 2 e 2 2 3 4 5 6 7 8 9 3989 3988 3986 3984 3982 3980 3977 3973 0,1 3970 3965 3961 3956 3951 3945 3939 3932 3925 3918 0,2 3910 3902 3894 3885 3876 3867 3857 3847 3836 3825 0,3 3814 3802 3790 3778 3865 3752 3739 3726 3712 3697 0,4 3683 3668 3652 3637 3621 3605 3589 3572 3555 3538 0,5 3521 3503 3485 3467 3448 3429 3410 3391 3372 3352 0,6 3332 3312 3292 3271 3251 3230 3209 3187 3166 3144 0,7 3123 3104 3079 3056 3034 3011 2989 2966 2943 2920 0,8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2685 0,9 2661 2637 2613 2589 2565 2541 2516 2492 2468 2444 0,2420 2396 2371 2347 2323 2299 2275 2251 2227 2203 1,0 1,1 2179 2155 2131 2107 2083 2059 2036 2012 1989 1965 1,2 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1513 1,4 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 1,5 1295 1276 1257 1238 1219 1200 1182 1163 1145 1127 1,6 1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 1,7 0940 0925 0909 0893 0878 0863 0848 0833 0818 0804 1,8 0790 0775 0761 0748 0734 0721 0707 0694 0681 0669 1,9 0656 0644 0632 0620 0608 0596 0584 0573 0562 0551 0,0540 0529 0519 0508 0498 0488 0478 0468 0459 0449 2,0 2,1 0440 0431 0422 0413 0404 0396 0387 0379 0371 0363 2,2 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290 44 2,3 0283 0277 0270 0264 0258 0252 0246 0241 0235 0229 2,4 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180 2,5 0175 0171 0167 0163 0158 0154 0151 0147 0143 0139 2,6 0136 0132 0129 0126 0122 0119 0116 0113 0110 0107 2,7 0104 0101 0099 0096 0093 0091 0088 0086 0084 0081 2,8 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061 2,9 0060 0058 0056 0055 0053 0051 0050 0048 0047 0043 0,0044 0043 0042 0040 0039 0038 0037 0036 0035 0034 3,0 3,1 0033 0032 0031 0030 0029 0028 0027 0026 0025 0025 3,2 0024 0023 0022 0022 0021 0020 0020 0019 0018 0018 3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013 3,4 0012 0012 0012 0011 0011 0010 0010 0010 0009 0009 3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0006 3,6 0006 0006 0006 0006 0006 0005 0005 0005 0005 0004 3,7 0004 0004 0004 0004 0004 0004 0003 0003 0003 0003 3,8 0003 0003 0003 0003 0003 0002 0002 0002 0002 0002 3,9 0002 0002 0002 0002 0002 0002 0002 0002 0001 0001 45 Приложение 2 Таблица значений функции Ф x   1 x z2 / 2 dz e 2 0 x Ф x  x Ф x  x Ф x  x Ф x  0,00 0,0000 0,25 0,0987 0,50 0,1915 0,75 0,2734 0,01 0,0040 0,26 0,1026 0,51 0,1950 0,76 0,2764 0,02 0,0080 0,27 0,1064 0,52 0,1985 0,77 0,2794 0,03 0,0120 0,28 0,1103 0,53 0,2019 0,78 0,2823 0,04 0,0160 0,29 0,1141 0,54 0,2054 0,79 0,2852 0,05 0,0199 0,30 0,1179 0,55 0,2088 0,80 0,2881 0,06 0,0239 0,31 0,1217 0,56 0,2123 0,81 0,2910 0,07 0,0279 0,32 0,1255 0,57 0,2157 0,82 0,2939 0,08 0,0319 0,33 0,1293 0,58 0,2190 0,83 0,2967 0,09 0,0359 0,34 0,1331 0,59 0,2224 0,84 0,2995 0,10 0,0398 0,35 0,1368 0,60 0,2257 0,85 0,3023 0,11 0,0438 0,36 0,1406 0,61 0,2291 0,86 0,3051 0,12 0,0478 0,37 0,1443 0,62 0,2324 0,87 0,3078 0,13 0,0517 0,38 0,1480 0,63 0,2357 0,88 0,3106 0,14 0,0557 0,39 0,1517 0,64 0,2389 0,89 0,3133 0,15 0,0596 0,40 0,1554 0,65 0,2422 0,90 0,3159 0,16 0,0636 0,41 0,1591 0,66 0,2454 0,91 0,3186 0,17 0,0675 0,42 0,1628 0,67 0,2486 0,92 0,3212 0,18 0,0714 0,43 0,1664 0,68 0,2517 0,93 0,3238 0,19 0,0753 0,44 0,1700 0,69 0,2549 0,94 0,3264 0,20 0,0793 0,45 0,1736 0,70 0,2580 0,95 0,3289 0,21 0,0832 0,46 0,1772 0,71 0,2611 0,96 0,3315 0,22 0,0871 0,47 0,1808 0,72 0,2642 0,97 0,3340 0,23 0,0910 0,48 0,1844 0,73 0,2673 0,98 0,3365 0,24 0,0948 0,49 0,1879 0,74 0,2703 0,99 0,3389 46 1,00 0,3413 1,28 0,3997 1,56 0,4406 1,84 0, 4671 1,01 0,3438 1,29 0,4015 1,57 0,4418 1,85 0, 4678 1,02 0,3461 1,30 0, 4032 1,58 0,4429 1,86 0,4686 1,03 0,3485 1,31 0,4049 1,59 0,4441 1,87 0,4693 1,04 0,3508 1,32 0,4066 1,60 0,4452 1,88 0,4699 1,05 0,3531 1,33 0,4082 1,61 0,4463 1,89 0,4706 1,06 0,3554 1,34 0,4099 1,62 0,4474 1,90 0,4713 1,07 0,3577 1,35 0,4115 1,63 0,4484 1,91 0,4719 1,08 0,3599 1,36 0,4131 1,64 0,4495 1,92 0,4726 1,09 0,3621 1,37 0,4147 1,65 0,4505 1,93 0,4732 1,10 0,3643 1,38 0,4162 1,66 0,4515 1,94 0,4738 1,11 0,3665 1,39 0,4177 1,67 0,4525 1,95 0,4744 1,12 0,3686 1,40 0,4192 1,68 0,4535 1,96 0,4750 1,13 0,3708 1,41 0,4207 1,69 0,4545 1,97 0,4756 1,14 0,3729 1,42 0,4222 1,70 0,4554 1,98 0,4761 1,15 0,3749 1,43 0,4236 1,71 0,4564 1,99 0,4767 1,16 0,3770 1,44 0,4251 1,72 0,4573 2,00 0,4772 1,17 0,3790 1,45 0,4265 1,73 0,4582 2,02 0,4783 1,18 0,3810 1,46 0,4279 1,74 0,4591 2,04 0,4793 1,19 0,3830 1,47 0,4292 1,75 0,4599 2,06 0,4803 1,20 0,3849 1,48 0,4306 1,76 0,4608 2,08 0,4812 1,21 0,3869 1,49 0,4319 1,77 0,4616 2,10 0,4821 1,22 0,3883 1,50 0,4332 1,78 0,4525 2,12 0,4830 1,23 0,3907 1,51 0,4345 1,79 0,4633 2,14 0,4838 1,24 0,3925 1,52 0,4357 1,80 0,4641 2,16 0,4846 1,25 0,3944 1,53 0,4370 1,81 0,4649 2,18 0,4854 1,26 0,3962 1,54 0,4382 1,82 0,4656 2,20 0,4861 1,27 0,3980 1,55 0,4394 1,83 0,4664 2,22 0,4868 2,24 0,4875 2,48 0, 4934 2,72 0,4967 2,96 0,4985 2,26 0,4881 2,50 0,4938 2,74 0,4969 2,98 0,4986 47 2,28 0,4887 2,52 0,4941 2,76 0,4971 3,00 0,49865 2,30 0,4893 2,54 0,4945 2,78 0,4973 3,20 0,49931 2,32 0,4898 2,56 0,4948 2,80 0,4974 3,40 0,49966 2,34 0,4904 2,58 0,4951 2,82 0,4976 3,60 0,499841 2,36 0,4909 2,60 0,4953 2,84 0,4977 3,80 0,499928 2,38 0,4913 2,62 0,4956 2,86 0,4979 4,00 0,499968 2,40 0,4918 2,64 0,4959 2,88 0,4980 4,50 0,499997 2,42 0,4922 2,66 0,4961 2,90 0,4981 5,00 0, 499997 2,44 0,4927 2,68 0,4963 2,92 0,4982 2,46 0,4931 2,70 0,4965 2,94 0,4984 48 Приложение 3 Таблица значений t  t ( , n)  0,95 0,99  0,999 n 0,95 0,99 0,999 n 5 2,78 4,60 8,61 20 2,093 2,861 3,883 6 2,57 4,03 6,86 25 2,064 2,797 3,745 7 2,45 3,71 5,96 30 2,045 2,756 3,659 8 2,37 3,50 5,41 35 2,032 2,720 3,600 9 2,31 3,36 5,04 40 2,023 2,708 3,558 10 2,26 3,25 4,78 45 2,016 2,692 3,527 11 2,23 3,17 4,59 50 2,009 2,679 3,502 12 2,20 3,11 4,44 60 2,001 2,662 3,464 13 2,18 3,06 4,32 70 1,996 2,649 3,439 14 2,16 3,01 4,22 80 1,991 2,640 3,418 15 2,15 2,98 4,14 90 1,987 2,633 3,403 16 2,13 2,95 4,07 100 1,984 2,627 3,392 17 2,12 2,92 4,02 120 1,980 2,617 3,374 18 2,11 2,90 3,97 ∞ 1,960 2,576 3,291 19 2,10 2,88 3,92 49 Приложение 4 Таблица значений q  q( , n)  0,95 0,99  0,999 n 0,95 0,99 0,999 n 5 1,37 2,67 5,64 20 0,37 0,58 0,88 6 1,09 2,01 3,88 25 0,32 0,49 0,73 7 0,92 1,62 2,98 30 0,28 0,43 0,63 8 0,80 1,38 2,42 35 0,26 0,38 0,56 9 0,71 1,20 2,06 40 0,24 0,35 0,50 10 0,65 1,08 1,80 45 0,22 0,32 0,46 11 0,59 0,98 0,98 50 0,21 0,30 0,43 12 0,55 0,90 0,90 60 0,188 0,269 0,38 13 0,52 0,83 0,83 70 0,174 0,245 0,34 14 0,48 0,78 0,78 80 0,161 0,226 0,31 15 0,46 0,73 0,73 90 0,151 0,211 0,29 16 0,44 0,70 0,70 100 0,143 0,198 0,27 17 0,42 0,66 0,66 150 0,115 0,160 0,211 18 0,40 0,63 0,63 200 0,099 0,136 0,185 19 0,39 0,60 0,60 250 0,089 0,120 0,162 50 Рекомендуемая литература 1. Андронов А.М. Теория вероятностей и математическая статистика. / А.М. Андронов, Е.А. Копытов, Л.Я. Гринглаз. – СПб.: Питер, 2004.- 464с. 2. Баврин И.И. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2005.- 160 с. 3. Бочаров П. П. Теория вероятностей. Математическая статистика. / П. П. Бочаров, А. В. Печинкин. - 2-е изд. - М.: ФИЗМАТЛИТ, 2005. - 296 с. 4. Ватутин В. А. Теория вероятностей и математическая статистика в задачах: Учебное пособие для вузов / В. А. Ватутин, Г. И. Ивченко, Ю. И. Медведев и др. - 2-е изд., исправленное. - М.: Дрофа, 2003. - 328 с. 5. Вентцель Е. С. Задачи и упражнения по теории вероятностей: Учебное пособие для студентов втузов / Е. С. Вентцель, Л. А. Овчаров. - 5-е изд., исправленное. - М.: Издательский центр «Академия», 2003. - 448 с. 6. Виленкин Н.Я. Комбинаторика. / Н.Я. Виленкин, А.Н. Виленкин, П.А. Виленкин. - М.: ФИМА, МЦНМО, 2006. - 400 с. 7. Гнеденко Б.В. исправленное Курс теории вероятностей: Учебник. Изд. 8-е, и дополненное. - М.: Едиториал УРСС, 2005. - 448 с. (Классический университетский учебник.). 8. Гмурман В.Е. Теория вероятностей и математическая статистика. - Изд. 6е доп. - М.: Высшая школа, 2002. 9. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: Учебное пособие для студентов вузов. Изд. 6е, доп. - М.: Высшая школа, 2002. 10. Ивченко Г.И. Введение в математическую статистику: Учебник. / Г.И. Ивченко, Ю.И. Медведев. - М.: Издательство ЛКИ, 2010. -600 с. 11. Кибзун и др. Теория вероятностей и математическая статистика. Базовый курс с примерами и задачами. - М.: Физматлит, 2002. - 224 с. 51 12. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. - 2-е изд., переработанное и доп.- М.: ЮНИТИДАНА, 2004. - 573 с. 13. Колемаев В. А. Теория вероятностей в примерах и задачах: Учебное пособие / В. А. Колемаев, В. Н. Калинина, В. И. Соловьёв и др.; ГУУ. М., 2001. - 87 с. 14. Маталыцкий М.А. Теория вероятностей в примерах и задачах: Учеб. пособие. / М.А. Маталыцкий, Т.В. Романюк. - Гродно: ГрГУ, 2002. - 248 с. 15. Горяинов В. Б. Математическая статистика: Учебник для вузов. / В. Б. Горяинов, И. В. Павлов, Г. М. Цветкова, О. И. Тескин.; Под ред. B.C. Зарубина, А.П. Крищенко. - М.: Иэдательство МГТУ им. Н.Э. Баумана, 2001. - 424 с. 16. Маценко П. К. Руководство к решению задач по теории вероятностей. Учебное пособие. / П. К. Маценко, В. В. Селиванов. - Ульяновск: УлГТУ, 2000.- 99 с. 17. Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. - М.: Айрис-пресс, 2004. - 256 с. 18. Пугачев В.С. Теория вероятностей и математическая статистика: Учебное пособие.- 2-е изд., исправленное и дополненное. - М.: Физматлит, 2002.496с.

Математическая статистика. Учебно

Похожие документы

Разделы

Поддержка

Математическая статистика. Учебно

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib