Математическая статистика. Учебно

advertisement
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего
профессионального образования
«Новгородский государственный университет имени Ярослава Мудрого»
________________________________________________________________
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
УЧЕБНО-МЕТОДИЧЕСКОЕ ПОСОБИЕ
ВЕЛИКИЙ НОВГОРОД
2012
2
УДК 517.5
Печатается по решению
РИС НовГУ
Рецензент
доктор физико-математических наук, профессор Т.Г. Сукачева
Математическая статистика: Учебно-методическое
пособие
/Н.В.
Манова, С.В. Неустроева; Т.С.Афанасьева, НовГУ им. Ярослава Мудрого. Великий Новгород, 2012. - 52с.
Изложены программа, основные понятия математической статистики,
предложено много примеров, поясняющих основные теоретические вопросы, а
также даны варианты контрольных работ.
Предназначено для студентов очного и
заочного отделений
гуманитарных специальностей.
© Новгородский государственный
университет, 2012
© Н.В. Манова, С.В. Неустроева,
Т.С.Афанасьева,
2012
3
СОДЕРЖАНИЕ
Введение………………………………………………………………………… …4
Программа курса «Математическая статистика»………...........................................5
1. Статистическое распределение выборки…………………………………………6
2. Эмпирическая функция распределения…………………………………………..8
3. Полигон и гистограмма……………………………………………………… …10
4. Точечные оценки параметров распределения……………………………. ..….16
5. Интервальные оценки параметров распределения …………………… …...…20
6. Решение типовых задач по математической статистике……………… …...…24
7. Элементы теории корреляции……………………………………………....…...30
Задачи для контрольной работы……………………………………………………34
Контрольные вопросы………………………………………………………………42
Приложения……………………………………………………………………….…43
Рекомендуемая литература……………………………………………………....…50
4
ВВЕДЕНИЕ
Данные методические указания предназначены для студентов очных и
заочных отделений гуманитарных вузов.
Работа содержит программу, методические указания для выполнения
контрольных работ, задачи для контрольных работ, большое количество
примеров.
Основной формой обучения студента-заочника является самостоятельная
работа над учебным материалом. В конце работы предложена литература по
математической
статистике.
Хочется
порекомендовать
следующие
замечательные книги [8] и [9], в которых студент сможет найти ответы на все
вопросы изучаемого курса математической статистики.
В каждом параграфе приведены примеры, поясняющие изучаемые
вопросы. Надеемся, что рассмотрение этих примеров поможет студентам при
решении контрольных заданий.
Номера задач одного варианта оканчиваются на одну и ту же цифру,
совпадающую с последней цифрой номера зачетной книжки. Например, если
номер зачетной книжки оканчивается на 6, то нужно решать задачи всех групп,
номера которых оканчиваются на 6: №№ 1.6; 2.6; 3.6; ...
При оформлении контрольной работы решения задач следует излагать по
порядку, подробно, предварительно полностью переписав задание. Работа
оформляется на листах формата A 4 с одной стороны.
5
ПРОГРАММА КУРСА
« МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»
1. Статистическое распределение выборки.
2. Эмпирическая функция распределения.
3. Несмещенные, эффективные и состоятельные оценки.
4. Выборочные средняя и дисперсия.
5. Точность
оценки,
доверительная
доверительный интервал.
6. Элементы теории корреляции.
вероятность
(надежность),
6
1. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ
Определение 1. Генеральной совокупностью называется множество
единиц, из которых производится отбор.
Определение 2. Выборкой (выборочной совокупностью) называется
множество отобранных для обследования единиц.
На практике наибольшее значение получили следующие виды: случайная,
механическая, типическая, серийная, комбинированная выборки.
Пусть для изучения количественного (дискретного или непрерывного)
признака X из генеральной совокупности извлечена выборка, причем значение
x1 наблюдалось n1 раз, значение x 2 наблюдалось n2 раз, …, значение x k
наблюдалось nk раз.
Наблюдаемые
значения
xi i  1,2,..., n 
признака
X
называют
вариантами, а последовательность всех вариант, записанных в возрастающем
порядке, – вариационным рядом. Числа наблюдений n i называют частотами, их
сумма
 ni  n
─ объем выборки.
Отношения частот к объему выборки
ni
 Wi есть относительные частоты (сумма всех относительных частот
n
равна 1).
Статистическим распределением выборки называют перечень вариант
x i вариационного ряда и соответствующих им частот n i или относительных
частот Wi . Статистическое распределение можно задать также в виде
последовательности интервалов и соответствующих им частот (в качестве
частоты, соответствующей интервалу, принимают сумму частот, попавших в
этот интервал).
Заметим, что в теории вероятностей под распределением понимают
соответствие между возможными значениями случайной величины и их
7
вероятностями, а в математической статистике – соответствие между
наблюдаемыми вариантами и их частотами (или относительными частотами).
Пример. Задано распределение частот выборки:
xi
2
6
12
ni
3
10
7
В данной выборке получены следующие варианты: x1  2 ; x 2  6 ;
x3  12 , соответствующие им частоты n1  3; n2  10; n3  7 . Требуется написать
распределение относительных частот.
Решение. Определим относительные частоты, для чего найдем объем
выборки
 ni
 n  3  10  7  20 .
относительные частоты находятся по формуле:
Wi 
W1 
W2 
ni
,
n
n1 3

 0,15;
n 20
n2 10 1

  0,50;
n 20 2
W3 
n3
7

 0,35.
n 20
Напишем распределение относительных частот:
xi
2
6
12
Wi 0,15 0,50 0,35
Контроль: сумма всех относительных частот Wi равна единице:
Wi
 W1  W2  W3  0,15  0,50  0,35  1 .
8
2. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
Пусть известно статистическое распределение частот количественного
признака X . Введем обозначения: n x ─ число наблюдений, при которых
наблюдалось значение признака меньше x; n – общее число наблюдений (объем
выборки). Ясно, что относительная частота события X  x равна
nx
. Если x
n
изменяется, то, вообще говоря, изменится и относительная частота, то есть
относительная частота
nx
n
есть функция от x . Так как статистическое
распределение выборки находится эмпирическим (опытным) путем, то эту
функцию называют эмпирической.
Определение 1. Эмпирической функцией распределения (функцией
распределения выборки) называется функция F  (x ) , определяющая для каждого
значения x относительную частоту события X  x .
F * ( x) 
nx
,
n
где n x ─ число вариант, меньших x; n – объем выборки.
В отличие от эмпирической функции распределения выборки функцию
распределения
F (x) генеральной совокупности называют теоретической
функцией распределения. Различие между эмпирической и теоретической
функциями состоит в том, что теоретическая функция
F (x) определяет
вероятность события X  x , а эмпирическая функция F  (x ) определяет
относительную частоту этого же события.
Доказано, что относительная частота F  (x ) события X  x стремится по
вероятности к вероятности F (x) этого события. Другими словами, при больших
значениях n числа F  (x ) и F (x) мало отличаются одно от другого в том
смысле, что
9
lim P[| F ( x)  F * ( x) |  ]  1, (  0) .
n
Отсюда следует целесообразность использования эмпирической функции
распределения выборки для приближенного представления теоретической
(интегральной) функции распределения генеральной совокупности. Такое
заключение подтверждается и тем, что F  (x ) обладает всеми свойствами F (x) .
Из определения функции F  (x ) вытекают следующие ее свойства:
1) значения эмпирической функции принадлежит отрезку 0;1 ;
2) F  (x ) – неубывающая функция;
3) если x1 ─ наименьшая варианта, то F  ( x)  0 при x  x1 ;
4) если x k ─ наибольшая варианта, то F  ( x)  1 при x  x k .
Итак, эмпирическая функция распределения выборки служит для оценки
теоретической функции распределения генеральной совокупности.
Пример. Построить эмпирическую функцию по данному распределению
выборки:
Варианты x i
2
6
10
Частоты n i
12
18
30
Решение. Найдем объем выборки (сумма всех частот n i ):
n  n1  n2  n3  12  18  30  60 .
1. Наименьшая варианта равна 2  x1  2 , следовательно, F  ( x)  0 при
x  2 (по свойству 3 функции F  (x ) ).
2. Значения, меньшие 6 x  6 , а именно x1  2 , наблюдались n1  12 раз,
следовательно, F * ( x) 
3.Значения x  10 ,
nx
n 12
 F * ( x)  1 
 0,2 при 2  x  6 .
n
n 60
а
именно
x1  2, x 2  6
n1  n2  12  18  30 раз, следовательно, F * ( x) 
наблюдались
30
 0,5 при 6  x  10 .
60
10
4. Так как x  10 – наибольшая варианта, то F * ( x)  1 при x  10 (по
свойству 4 функции F * ( x ) ).
Искомая эмпирическая функция имеет вид:
0,
0,2,


F ( x)  
0,5,
1,
при x  2,
при 2  x  6,
при 6  x  10,
при x  10.
Ниже (рис. 1) приведен график полученной эмпирической функции.
На графике на соответствующих осях отложены значения функции
F * ( x ) и значения вариант
F  (x )
1
0,5
0,2
0
2
6
10
14
x
Рис. 1. График эмпирической функции.
3. ПОЛИГОН И ГИСТОГРАММА
Для
наглядности
строят
различные
графики
статистического
распределения, в частности, полигон и гистограмму.
Определение 1. Полигоном частот называют ломаную, отрезки которой
соединяют точки  x1 ; n1 ,  x2 ; n2 , ...,  xk ; nk  .
Для построения полигона частот на оси абсцисс откладывают варианты x i ,
а на оси ординат – соответствующие им частоты n i . Точки  xi ; ni  соединяют
отрезками прямых и получают полигон частот.
11
Определение 2. Полигоном относительных частот называют ломаную,
отрезки которой соединяют точки  x1 ;W1 ,  x2 ;W2 , ...,  xk ;Wk  .
Для построения полигона относительных частот на оси абсцисс
откладывают варианты x i , а на оси ординат относительные частоты Wi . Точки
( xi ;Wi )
соединяют отрезками прямых и получают полигон относительных
частот.
На рисунке 2 изображен полигон
относительных частот следующего
распределения:
x
1,5
3,5
5,5
7,5
W
0,1
0,2
0,4
0,3
Wi
0,4
0,3
0,2
0,1
0
1,5
3,5
5,5
7,5
xi
Рис. 2. Полигон относительных частот.
В случае непрерывного признака целесообразно строить гистограмму, для
чего интервал, в котором заключены все наблюдаемые значения признака,
разбивают на несколько частичных интервалов длины h и находят для каждого
частичного интервала n i – сумму частот вариант, попавших в i - ый интервал.
Определение 3. Гистограммой частот называют ступенчатую фигуру,
состоящую из прямоугольников, основаниями которых служат частичные
интервалы длины h , а высоты равны отношению ni / h (плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают
частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс,
на расстоянии ni / h и строят соответствующие прямоугольники.
12
Площадь i - го частичного прямоугольника равна h  (ni / h)  ni ─ сумме
частот вариант i - го интервала; следовательно, площадь гистограммы частот
равна сумме всех частот, то есть объему выборки n .
Пример 1. Дано распределение частот непрерывного признака (табл.1).
Таблица 1
Частичный интервал,
длиною h  5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30
30 – 35
34 – 40
Сумма частот вариант
частичного интервала n i
4
6
16
36
24
10
4
Плотность частоты
ni / h
0,8
1,2
3,2
7,2
4,8
2,0
0,8
На рисунке 3 изображена гистограмма частот распределения объема
n  100 , приведенного в таблице 1.
ni / h
7
6
5
4
3
2
1
0
5 10 15 20 25 30 35 40
x
Рис. 3. Гистограмма частот.
Определение
4. Гистограммой относительных частот
называют
ступенчатую фигуру, состоящую из прямоугольников, основаниями которых
служат частичные интервалы длины h , а высоты равны отношению Wi / h
(плотность относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс
откладывают частичные интервалы, а над ними проводят отрезки, параллельные
13
оси абсцисс на расстоянии Wi / h . Площадь i - го частичного прямоугольника
равна h  Wi / h  Wi ─ относительной частоте вариант, попавших в i - й интервал.
Следовательно, площадь гистограммы относительных частот равна сумме всех
относительных частот, то есть единице.
Пример 2. В результате
выборки получена следующая таблица
распределения частот.
xi
2
6
12
ni
3
10
7
Требуется построить полигоны частот и относительных частот распределения.
Для начала построим полигон частот.
ni
10
9
8
7
6
5
4
3
2
1
0
2
6
12
xi
Рис. 4. Полигон частот.
Чтобы построить полигон относительных частот найдем относительные
частоты, для чего разделим частоты на объем выборки n.
n  3  10  7  20 .
Таким образом
W1  3 / 20  0,15; W2  10 / 20  0,5; W3  7 / 20  0,35 .
Получаем
14
xi
2
6
12
W i 0,15 0,50 0,35
Построим полигон относительных частот.
wi
0,5
0,4
0,3
0,2
0,1
0
1 2 3 4 5 6 7 8 9 10 11 12
xi
Рис. 5. Полигон относительных частот.
Пример 3. Требуется построить гистограммы частот и относительных
частот данного непрерывного распределения (таблица 2).
Таблица 2
Сумма
длины h  3
частичного интервала n i
ni / h
2–5
9
3
5–8
10
3,3
8 – 11
25
8,3
11 – 14
6
2
Построим гистограмму частот.
частот
вариант Плотность частоты
Частичный интервал
15
ni / h
8
7
6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 x
Рис. 6. Гистограмма частот.
Чтобы построить гистограмму относительных частот, нужно найти
относительные частоты. Для этого найдем объем выборки n .
n   ni  9  10  25  6  50 .
Теперь найдем относительные частоты по формуле Wi 
ni
:
n
W1  9 / 50  0,18; W2  10 / 50  0,2; W3  25 / 50  0,5; W4  6 / 50  0,12.
Вычислим плотности частот Wi / h , учитывая, что шаг h  3 :
W1 / h  0,18 / 3  0,06,
W2 / h  0,2 / 3  0,07,
W 3/ h  0,5 / 3  0,17,
W4 / h  0,12 / 3  0,04.
Получаем результат, таблица 3:
Таблица 3.
Частичный
интервал
2–5
5–8
8 – 11
11 – 14
Сумма относительных частот
Wi
0,18
0,2
0,5
0,12
Плотность частоты
Wi / h
0,06
0,07
0,17
0,04
16
Построим гистограмму относительных частот.
Wi / h
0,17
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 x
Рис.7. Гистограмма относительных частот.
4. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Определение 1. Статистической оценкой Q  неизвестного параметра Q
теоретического
распределения
называют
функцию
от
f ( x1 , x2 ,..., xn )
наблюдаемых значений x1, x2 ,..., xn количественного признака X .
Определение 2. Точечной оценкой называют статистическую оценку,
которая определяется одним числом Q   f ( x1 , x2 ,..., xn ) , где x1 , x2 ,..., xn ─
результаты n наблюдений над количественным признаком X (выборка).
Определение
3.
Несмещенной
называют
точечную
оценку
Q ,
математическое ожидание которой равно оцениваемому параметру Q при
любом объеме выборки, то есть M (Q  )  Q . Смещенной называют точечную
оценку, математическое ожидание которой не равно оцениваемому параметру.
Рассмотрим основные точечные оценки параметров распределения.
Выборочная средняя.
Пусть
для
изучения
генеральной
совокупности
количественного признака X извлечена выборка объема n .
относительно
17
Определение
4.
Выборочной
средней
называют
xB
среднее
арифметическое значение признака выборочной совокупности.
Если все значения x1, x2 ,..., xn признака выборки объема n различны, то
выборочная средняя находится по формуле:
x B  ( x1  x2  ...  xn ) / n .
Если же все значения признака x1 , x2 ,..., xk имеют соответственно частоты
n1 , n2 ,..., nk , причем объем выборки n1  n2  ...  nk  n , то
k
x B  ( ni  xi ) / n .
i 1
Выборочная средняя является несмещенной оценкой генеральной средней
(неизвестного математического ожидания).
Замечание. Если первоначальные варианты x i ─ большие числа, то для
упрощения решения целесообразно вычесть из каждой варианты одно и то же
число c , то есть перейти к условным вариантам ui  xi  c . Тогда
k
xB  c  (  ni  ui ) / n .
i 1
Выборочная дисперсия.
Смещенной
оценкой
генеральной
дисперсии
служит
выборочная
дисперсия. Эту величину вводят для того, чтобы охарактеризовать рассеяние
наблюдаемых значений количественного признака X выборки вокруг среднего
значения x B .
Определение
5.
Выборочной
дисперсией
DB
называют
среднее
арифметическое квадратов отклонения наблюдаемых значений признака от их
среднего значения xB .
Если все значения x1, x2 ,..., xn признака выборки объема n различны, то
выборочная дисперсия находится по формуле:
n
DB  ( ( xi  x B ) 2 ) / n.
i 1
18
Если значения признака x1 , x2 ,..., xk
имеют соответственно частоты
n1 , n2 ,..., nk , причем n1  n2  ...  nk  n , то
k
DB  ( ni ( xi  xB )2 ) / n.
i 1
Эта оценка является смещенной, так как M ( DВ )  D Г , где DГ – генеральная
дисперсия.
Теорема. Выборочная дисперсия равна среднему квадратов значений
признака минус квадрат выборочной средней.
DB  x  [ x]
2
2
ni xi2   ni xi 





n
2
 .

n
Для вычисления выборочной дисперсии эта формула наиболее удобна.
Замечание. Если перейти к условным вариантам ui  xi  c , то дисперсия
при этом не изменится. Тогда
2
DB ( x)  DB (u )  u  [u ]
2
 ni  ui2    ni  ui 

n


n
2
 .

Исправленная выборочная дисперсия.
Пусть из генеральной совокупности в результате n независимых
наблюдений над количественным признаком X извлечена выборка объема n :
Значения
признака
Частоты
xi
x1
x2
…
xk
ni
n1
n2
…
nk
При этом n1  n2  ...  nk  n .
Требуется по данным выборки оценить неизвестную генеральную
дисперсию DГ . Если в качестве оценки DГ принять выборочную дисперсию, то
эта оценка будет приводить к систематическим ошибкам, давая заниженное
значение DГ . Объясняется это тем, что математическое ожидание выборочной
дисперсии не равно оцениваемой DГ , а равно M [ DB ] 
n 1
DГ .
n
19
Легко «исправить» выборочную дисперсию так, чтобы ее математическое
ожидание было равно генеральной дисперсии. Достаточно для этого умножить
D B на дробь n /( n  1) . Сделав это, мы получим исправленную выборочную
дисперсию, которую обычно обозначают s 2 , которая является несмещенной
оценкой генеральной дисперсии:
s2 
n
DB .
n 1
Если все значения x1, x2 ,..., xn признака выборки объема n различны, то
исправленная выборочная дисперсия находится по формуле:
n
s 
DB 
n 1
2
 ( xi  x B ) 2 .
n 1
Если же все значения x1 , x2 ,..., xk признака
имеют соответственно
частоты n1 , n2 ,..., nk , причем объем выборки n1  n2  ...  nk  n , то
n
s 
DB 
n 1
2
 ni ( xi  x B ) 2 .
n 1
Более удобна форма:
s
2
ni xi2  [ ni xi ]2 / n


.
n 1
В условных вариантах ui  xi  c она имеет вид:
s
2
ni u i2  [ ni u i ]2 / n


.
n 1
Пример 1.
Из генеральной совокупности извлечена выборка объемом n  60 .
xi
1
3
6
26
ni
8
40 10
2
Требуется найти несмещенную оценку генеральной средней.
Решение.
Несмещенной
выборочная средняя:
оценкой
генеральной
средней
является
20
k
x B  ( ni  xi ) / n ,
i 1
k
где xi ─ варианта выборки, ni ─ частота варианты x i ; n   ni объем выборки.
i 1
x B  (8  1  40  3  10  6  2  26) / 60  (8  120  60  52) / 60  240 / 60  4 .
Ответ: x B  4 .
Пример 2.
Выборочная совокупность задана таблицей распределения
xi
1
2
3
4
n i 20 15 10
5
Требуется найти выборочную дисперсию.
Решение. Найдем выборочную среднюю
4
x B  ( ni  xi ) / n 
i 1
20 1  15  2  10  3  5  4 100

 2.
20  15  10  5
50
Найдем выборочную дисперсию:
4
DB  ( ni ( xi  x B ) 2 ) / n ,
i 1
20  (1  2) 2  15  (2  2) 2  10  (3  2) 2  5  (4  2) 2
DB 

50
20  (1) 2  15  0  10  12  5  2 2 20  10  20 50



 1.
50
50
50
Ответ: D B  1.
5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Определение 1. Интервальной называют оценку, которая определяется
двумя числами – концами интервала, покрывающего оцениваемый параметр.
21
Доверительным называют интервал, который с заданной вероятностью
(надежностью)  покрывает заданный параметр.
Интервальной оценкой с надежностью  математического ожидания a
нормально распределенного признака X по выборочной средней xB
при
известном среднем квадратическом отклонении  генеральной совокупности
служит доверительный интервал
xB  t   / n  a  xB  t   / n ,
где t   / n   – точность оценки,
n – объем выборки,
t – значение аргумента функции Лапласа Ф(t ) (см. приложение 2), при
котором Ф(t )   2 .
При неизвестном  (и объеме выборки n  30 ) доверительным будет
интервал
x B  t  s / n  a  x B  t  s / n ,
где
s – «исправленное» выборочное среднее квадратическое отклонение, t 
находят по таблице приложения 3 по заданным n и  .
Интервальной оценкой с надежностью 
среднего квадратического
отклонения  нормально распределенного количественного признака X по
«исправленному» выборочному среднему квадратическому отклонению s
служит доверительный интервал:
s  (1  q)    s  (1  q)
при q  1 ,
0    s  (1  q)
при q  1 ,
где q находят по таблице приложения 4 по заданным n и  .
Интервальной оценкой с надежностью  неизвестной вероятности p
биномиального
распределения
по
относительной
частоте
доверительный интервал (с приближенными концами p1 и p 2 ):
p1  p  p 2 ,
W
служит
22
где
2

t2
W (1  W )  t  
W 
p1  2
t
  ,
2n
n
 2n  
t n


n
2

t2
W (1  W )  t  
W 
p2  2
t
  .
2
n
n
 2n  
t n


n
где n – общее число испытаний,
W – относительная частота, равная отношению m n ( m – число появлений
события);
t – значение аргумента функции Лапласа (приложение 2), при котором
Ф(t )   2 (  – заданная надежность).
Замечание. При больших значениях n (порядка сотен) можно принять в
качестве приближенных границ доверительного интервала
p1  W  t
W (1  W )
W (1  W )
, p2  W  t
.
n
n
Пример 1. Из генеральной совокупности извлечена выборка объема
n  25 :
Варианта x i
2
3
5
7
10
13
Частота n i
2
4
7
8
3
1
Требуется оценить с надежностью 0,95 математическое ожидание
нормально распределенного признака генеральной совокупности по выборочной
средней при помощи доверительного интервала.
Решение.
Выборочную
среднюю
и
«исправленное»
квадратическое отклонение найдем соответственно по формулам
xB
ni  ( x i  x B ) 2
ni  xi



, s
n
Подставим в эти формулы данные задачи:
n 1
.
среднее
23
xB 
2  2  4  3  7  5  8  7  3  10  1  13 4  12  35  56  30  13 150


 6,
25
25
25
s
2  (2  6) 2  4  (3  6) 2  7  (5  6) 2  8  (7  6) 2  3  (10  6)  1  (13  6) 2

25  1

2  (4) 2  4  (3) 2  7  (1) 2  8  12  3  4 2  1  7 2
180

 7,5  2,739 .
24
24
Таким образом, получим x B  6 , s  2,739 .
Найдем искомый доверительный интервал:
x B  t  s
n  a  x B  t  s
n.
Значение t находят по таблице приложения 3 по заданным n  25 и
  0,95 : t  2,064 .
Подставляя x B  6; t  2,064; s  2,739 ; n  25 ; получим
6  2,064  2,739 / 25  a  6  2,064  2,739 / 25 , 4,87  a  7,13 .
Получили доверительный интервал (4,87; 7,13) , покрывающий неизвестное
математическое ожидание a с надежностью   0,95 .
Пример 2. По данным выборки объема
n  40
из генеральной
совокупности найдено «исправленное» среднее квадратическое отклонение s  1
нормально распределенного количественного признака. Найти доверительный
интервал, покрывающий генеральное среднее квадратическое отклонение  с
надежностью 0,99.
Решение. Задача сводится к отысканию доверительного интервала
s  (1  q)    s  (1  q) (если q  1 ) или 0    s  (1  q) (если q  1 ).
Значение q находят по таблице приложения 4 по заданным n  40 и   0,99 :
q  0,35 . Так как q  0,35  1, то воспользуемся первым соотношением.
Подставим s  1 и q  0,35 . Получим
1  (1  0,35)    1  (1  0,35) ,
отсюда
0,65    1,35 .
24
Таким
образом,
полученный
доверительный
интервал
0,65    1,35 покрывает неизвестное среднее квадратическое отклонение  с
надежностью (доверительной вероятностью)   0,99 .
Часто используют также следующие выборочные характеристики.
sx  s / n
– ошибка средней (среднее квадратическое отклонение
выборочной средней от генеральной средней);
V
s  100 %
xB
– коэффициент вариации (доля среднего квадратического
отклонения в выборочной средней, в процентах).
6. РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ ПО МАТЕМАТИЧЕСКОЙ
СТАТИСТИКЕ
Задача 1. В течение
300 дней фиксировалась цена акции ООО
«Психолог». Затем была проведена случайная выборка объёмом n=20, и
получены следующие результаты: 35,9; 35,3; 42,7; 45,3; 25,6; 35,3; 33,4; 27,0;
35,9; 38,8; 33,7; 38,6; 40,8; 35,5; 44,1; 37,4; 34,2; 30,8; 38,4; 31,3.
Требуется получить вариационный ряд и построить гистограмму
относительных частот; найти основные выборочные характеристики: x В , s 2 , s,
V , s x ; с надежностью   95 % указать доверительный интервал для оценки
генеральной средней.
Решение. Запишем исходные данные в виде ранжированного ряда, то
есть, располагая их в порядке возрастания: 25,6; 27,0; 30,8; 31,3; 33,4; 33,7: 34,2;
35,3; 35,3; 35,5; 35,9; 35,9; 37,4; 38,4; 38,6; 38,8; 40,8; 42,7; 44,1; 45,3.
Максимальное значение признака составляет 45,3 ц, а минимальное –
25,6 ц. Разница между ними составляет 19,7 ц. Этот интервал надо разбить на
определенное количество частей. При малом объеме выборки (20–40 вариант)
намечают 4–7 интервалов. Возьмем длину интервала h  5 . Получаем пять
интервалов: первый 25 – 30, второй 30 – 35, третий 35 – 40, четвертый 40 – 45,
25
пятый 45 – 50. С помощью ранжированного ряда определим частоту попадания
вариант выборки в каждый интервал. В первый интервал 25 – 30 попадают два
значения: 25,6 и 27,0; поэтому n1  2 . Во второй интервал попадают пять
значений, поэтому n2  5 . Аналогично, n3  9 , n4  3 , n5  1 .
Теперь найдем относительные частоты попадания вариант выборки в
каждый интервал:
W1  n1 n  2 20  0,1 ; W2  n2 n  5 20  0,25 ; W3  n3 n  9 20  0,45 ;
W4  n4 n  3 20  0,15 ; W5  n5 n  1 20  0,05 .
Для проверки вычисляем сумму относительных частот:
W1  W2  W3  W4  W5  0,1  0,25  0,45  0,15  0,05  1 .
Тот факт, что в сумме получена единица, подтверждает правильность
вычислений.
Вычислим плотности Wi h относительных частот вариант. Получаем
W1 h  0,1 5  0,02 ;
W2 h  0,25 5  0,05 ;
W3 h  0,45 5  0,09 ;
W4 h  0,15 5  0,03 ;
W5 h  0,05 5  0,01.
Полученные результаты сведем в таблицу 4.
Таблица 4.
Интервал значений
25–30
30–35
35–40
40–45
45–50
2
5
9
3
1
Относительные частоты
0,10
0,25
0,45
0,15
0,05
Плотность относительных частот
0,02
0,05
0,09
0,03
0,01
Частоты вариант
Строим гистограмму относительных частот – ступенчатую фигуру,
состоящую из прямоугольников, основаниями которых являются интервалы, а
высотами соответствующие значения плотности относительных частот.
26
Wi / x
0,1
0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0
40
25 30
35
45
40
25 30
35
45
50
Рис.8. Гистограмма относительных частот.
50
Так как объем выборки небольшой ( n  20 ) и почти все наблюдаемые
значения различны, то для вычисления выборочных характеристик составим
вспомогательную таблицу (таблица 5).
Основные выборочные характеристики вычисляются по формулам:
x В   x1  x2  ...  xn  / n
–
выборочная
средняя;
s
2
( xi  x B ) 2


n 1
–
«исправленная» дисперсия; s  s 2 – «исправленное» среднее квадратическое
отклонение; s x  s / n – ошибка средней; V 
s  100 %
xB
– коэффициент
вариации.
Таблица 5.
№
Результат обследования
xi
xi  x В
xi  x В 2
1
35,9
– 0,1
0,01
2
35,3
– 0,7
0,49
3
42,7
6,7
44,89
4
45,3
9,3
86,49
27
5
25,6
–10,4
108,16
6
35,3
– 0,7
0,49
7
33,4
– 2,6
6,76
8
27,0
– 9,0
81,00
9
35,9
– 0,1
0,01
10
38,8
2,8
7,84
11
33,7
– 2,3
5,29
12
38,6
2,6
6,76
13
40,8
4,8
23,04
14
35,5
– 0,5
0,25
15
44,1
8,1
65,61
16
37,4
1,4
1,96
17
34,2
– 1,8
3,24
18
30,8
– 5,2
27,04
19
38,4
2,4
5,76
20
31,3
– 4,7
22,09
Σ
720,0
0
497,20
Подставляя полученные значения в формулы, получаем
x В   x1  x2  ...  xn  / n  720,0 / 20  36,0 ;
s
2
( xi  x B ) 2


n 1
 497 ,20 / 19  26,17 ;
s  s 2  5,12 ;
s x  s / n  5,12 / 20  1,14 ;
V
s  100 % 5,12

 100 %  14 % .
36
xB
Доверительный интервал для оценки генеральной средней имеет вид:
x B  t  s
n  a  x B  t  s
n.
28
Вычисляем теперь точность оценки  :
  t  s / n  t  s x  2,10  1,14  2,4 ;
где значение t  2,10 находим по таблице приложения 3.
Таким образом, с надежностью 95% можно утверждать, что средняя цена
акции за 300 дней заключена в пределах от x B  t  s
(гарантированный минимум) до x B  t  s
n  36  2,4  33,6 ц.
n  36  2,4  38,4 ц. (возможный
максимум).
Задача 2. Для определения средней урожайности сахарной свеклы в
агрофирме на площади 1000 га была определена ее урожайность на 100 га.
Результаты
выборочного
обследования
представлены
следующим
распределением:
Урожайность, ц/га
23–25
25–27
27–29
29–31
31–33
33–35
35–37
3
10
6
16
15
30
20
Площадь, га
Требуется найти:
1) величину, которую следует принять за среднюю урожайность на всем
массиве;
2) величину, которую следует принять за среднее квадратическое
отклонение урожайности на всем массиве;
3) доверительный интервал, в котором с вероятностью
  0,95
заключена средняя урожайность на всем массиве.
Решение. В качестве приближенного значения средней урожайности на
всем массиве принимаем среднюю арифметическую данного распределения, то
есть выборочную среднюю. За значения признака нужно принять середины
интервалов. Получим:
k
xB  ( ni  xi ) / n = (24∙3+26∙10+28∙6+30 ∙16+32 ∙15+34∙30+36∙ 20)/100 =
i 1
= 3200/100 = 32.
29
Для оценки дисперсии генеральной совокупности вычисляем исправленное
среднее квадратическое отклонение:
s
2
ni  ( xi  x В ) 2


n 1

1
     2      2      2 
99
 16  (30 - 32) 2  15  (32 - 32) 2  30  (34 - 32) 2  20  (36 - 32) 2 ) 
 1/99  192  360  96  64  0  120  320   1 / 99  1152  11,64
Отсюда можно найти среднее квадратическое отклонение урожайности на всем
массиве
s  s 2 = 11,64 = 3,4.
Найдем среднее квадратическое отклонение выборочной средней по формуле
s x  s / n  3,4 / 100  0,34 ц.
Итак, оценка средней урожайности сахарной свеклы на всем массиве
равна 32 ц со средней квадратической ошибкой 0,34 ц. Оценка среднего
квадратического отклонения урожайности на всем массиве равна 3,4 ц.
Для вычисления доверительного интервала воспользуемся двойным
неравенством:
x В  t   s / n  a  x В  t  s / n .
Так как n  100  30 , то значение t  найдем из условия   2Ф(t )  0,95 .
По таблице приложения 2 находим значение Ф(t )  0,475 и t  1,96 ,
следовательно, получаем:
  t  s
n  1,96  3,4 / 100  0,67 .
Концы доверительного интервала:
x B    32  0,67  31,33 и x B    32  0,67  32,67 .
Таким образом, с вероятностью 0,95 средняя урожайность сахарной
свеклы на всем массиве заключена в границах от 31,33 ц до 32,67 ц.
30
7. ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ
Определение 1. Зависимость двух случайных величин называют
корреляционной, если изменение одной случайной величины приводит к
изменению среднего значения другой случайной величины.
Основные задачи теории корреляции:
1.
определить есть ли связь между случайными величинами, если есть,
то найти уравнение зависимости (уравнение регрессии);
2.
определить силу (тесноту) связи между случайными величинами.
Для определения самого факта связи между случайными величинами и
тесноты связи служит коэффициент корреляции. Уравнение регрессии позволяет
предсказать, какие изменения в среднем будет претерпевать признак при
изменении другого признака.
Если уравнения регрессии являются линейными, то есть графиками будут
прямые линии, то корреляционная зависимость называется линейной.
Пусть извлечена выборка объема n и исследуются два количественных
признака X и Y . Результаты измерений занесены в таблицу.
Значения x i
x1
x2
…
xn
Значения y i
y1
y2
…
yn
Выборочный коэффициент корреляции rВ находится по формуле:
rВ 
 ( xi  xB )  ( yi  yВ )
.
2
2
(
x

x
)

(
y

y
)
 i В
 i В
Свойства выборочного коэффициента корреляции:
1. Значения коэффициента корреляции изменяются на отрезке [–1;1]:
 1  rВ  1 .
2. Чем модуль rВ больше и ближе к 1, тем теснее связь между
изучаемыми признаками.
3. Если rВ  1 , то между признаками функциональная связь.
31
4. Если rВ  0 , то между изучаемыми признаками нет линейной
корреляционной зависимости.
5. Если rВ  0 , то между признаками прямая (положительная) связь и
если rВ  0 , то между признаками обратная (отрицательная) связь.
Выборочное уравнение прямой регрессии Y на X имеет вид:
y
 x  xВ  ,
x
y  yВ  rВ 
где x В , y В – выборочные средние. За приближенные значения  y и  x
принимают соответственно s x и s y :
 x  sx 
 ( xi  x В ) 2 , 
y
n 1
 ( yi  y В ) 2 .
 sy 
n 1
Выборочное уравнение прямой регрессии X на Y имеет вид:
x  xВ  rВ 
Пример.
Психологи
x
 y  yВ  .
y
провели
тестирование
среди
пациентов
психоневрологического диспансера. Возраст пациентов колебался от 14 до 34
лет. Затем была проведена случайная выборка объёмом n=10. Была поставлена
задача: определить есть ли зависимость возраста испытуемого (Y ) от значения
показателя развития заболевания
Результаты этого измерения
(X ) .
представлены в таблице 6:
Таблица 6.
X
25
35
45
55
65
75
85
95
105
115
Y
14
18
19
20
23
23
24
26
29
34
Требуется
вычислить
выборочный
коэффициент
выборочное уравнение прямой регрессии Y на X .
корреляции
и
найти
32
Решение. Вычислим выборочный коэффициент корреляции по формуле:
 ( xi  xB )  ( yi  y В )
 ( xi  xВ ) 2   ( yi  y В ) 2
rВ 
Для
вычисления
величин,
входящих
.
в
формулу,
составим
вспомогательную таблицу 7, в которой результаты измерений записаны
столбцами. Внизу каждого из столбцов вычислены суммы для нахождения
средних x В и
y В . Далее расположены столбцы, в которых вычисляются
разности xi  x В и yi  y В , их квадраты и произведения. Значения этих
столбцов суммируются (последняя строка), чтобы получились величины,
необходимые для подстановки в формулу. Отметим, что суммы в столбцах, в
которых вычислены разности xi  x В и yi  y В будут всегда равны нулю.
Таблица 7.
xi
yi
xi  xВ
( xi  x В ) 2
yi  y В
( yi  y В ) 2
( xi  x В )  ( y i  y В )
25
14
– 45
2025
–9
81
405
35
18
– 35
1225
–5
25
175
45
19
– 25
625
–4
16
100
55
20
– 15
225
–3
9
45
65
23
–5
25
0
0
0
75
23
5
25
0
0
0
85
24
15
225
1
1
15
95
26
25
625
3
9
75
105 29
35
1225
6
36
210
115 34
45
2025
11
121
495
700 230
0
8250
0
298
1520
Находим выборочные средние x В и y В (смотри данные в таблице, 1–2
столбцы):
33
x В = 700/10 = 70, y В = 230/10 = 23.
Выполнив все вычисления в таблице (3 – 7 столбцы), получаем:
 ( xi  x В )  ( yi  y В )  1520 ,
 ( xi  x В )
2
 8250 ,
 ( yi  y В ) 2  298 .
Подставляя эти значения в соответствующую формулу, вычислим
коэффициент корреляции:
1520
 0,97.
8250  298
rВ 
Таким образом, y выбранных пациентов имеет место очень сильная (т.к.
значение rВ близко к 1) и
положительная (т.к. rВ  0 ) корреляция между
возрастом испытуемого (Y ) и значением показателя развития заболевания (X ) .
Найдем теперь выборочное уравнение прямой регрессии Y на X .
y  y В  rВ 
где  y  s y 
 ( yi  y В ) 2 , 
x
n 1

Тогда  y /  x 
 sx 
y
x

y
 x  x В ,
x
 ( xi  x В ) 2
n 1
 ( yi  y В ) 2
 ( xi  x В ) 2

.
298
 0,0361  0,19.
8250
Подставляя в выборочное уравнение прямой регрессии Y на X :
x В  70 , y В  23 , rB  0,97 ,  y /  x  0,19 , получим y  23  0,97  0,19  ( x  70)
или y  23  0,18 x  12,6 .
Окончательно,
y  0,18 x  10,4 –
искомое уравнение прямой регрессии Y на X .
34
ЗАДАЧИ ДЛЯ КОНТРОЛЬНОЙ РАБОТЫ
1 группа
Выборка задана в виде распределения частот. Найти: а) распределение
относительных частот; б) эмпирическую функцию по данному распределению
выборки; построить график функции F  (x ) .
1.1.
xi 2
1.2.
5 7
xi 1
n i 12 3 5
4
6
n i 13 12 25
1.3.
1.4.
xi 3 6
9
xi 2
n i 5 15 10
4
8
n i 10 12 14
1.5.
1.6.
x i 10 15 25
xi 2
n i 11 13 16
n i 10 15 20
1.7.
xi 4
5
6
1.8.
7
8
xi 2 5 7 8
n i 15 25 30
ni 1 3 2 4
1.9.
1.10.
x i 4 7 8 12
xi 2
3
4
n i 5 2 3 10
n i 10 18 22
2 группа
1.2.Построить полигон частот по данному распределению выборки:
xi
1
3
5
9
n i 19 7 13 3
35
2.2.Построить полигон относительных частот по данному распределению
выборки:
2
xi
4
6
7
9
Wi 0,1 0,2 0,1 0,25 0,35
2.3.Построить полигон частот по данному распределению выборки:
xi 5
10 15 20 25
n i 10 15 20 25 30
2.4.Построить полигон относительных частот по данному распределению
выборки:
xi
2
3
5
6
9
Wi 0,15 0,2 0,25 0,3 0,1
2.5.Построить полигон частот по данному распределению выборки:
xi 3
5 6
9
n i 10 5 15 20
2..6.Построить гистограмму частот по данному распределению выборки:
Частичный интервал
2 – 4 4 – 6 6 – 8 8 – 10
Сумма частот вариант интервала n i
10
12
16
14
2..7.Построить гистограмму частот по данному распределению выборки:
Частичный интервал
5 – 10 10 – 15 15 – 20 20 – 25 25 – 30
Сумма частот вариант интервала, n i
2.8.Построить
гистограмму
распределению:
10
15
относительных
20
частот
15
5
по
данному
36
Частичный интервал
2 – 5 5 – 8 8 – 11 11 – 14 14 – 17
Сумма относительных частот 0,18
вариант интервала, Wi
2.9.Построить
гистограмму
0,06
0,16
относительных
0,2
частот
0,4
по
данному
распределению:
Частичный интервал
0 – 5 5 – 10 10 – 15
Сумма относительных частот вариант интервала, Wi
2.10.Построить
гистограмму
относительных
0,3
частот
0,5
по
0,2
данному
распределению:
Частичный интервал
2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
Сумма относительных частот
вариант интервала, Wi
0,1
0,25
0,45
0,15
0,05
3 группа
3.1.Из генеральной совокупности извлечена выборка объема n  40 :
4
xi
6
8 11
n i 14 11 3
?
Найти несмещенную оценку генеральной средней.
3.2.Найти выборочную среднюю по данному распределению выборки
объема n  15 :
x i 13803 13845 13864
ni
3.3.По
выборке
?
объема
6
n  81
7
найдена
смещенная
оценка
D B  5 генеральной дисперсии. Найти несмещенную оценку дисперсии
генеральной совокупности.
37
3.4.В итоге пяти измерений (без систематических ошибок) длины бруска
одним прибором получены следующие результаты: 804, 806, 807, 809,
810. Найти: а) выборочную среднюю длину бруска; б) выборочную и
исправленную дисперсии ошибок измерений.
3.5.Найти выборочную дисперсию по данному распределению выборки
объема n  30 :
x i 354 365 372
?
ni
9
14
3..6.Найти выборочную дисперсию по данному распределению выборки
объема n  120 :
x i 3832 3848 3850 3900
13
ni
24
35
?
3.7.Найти выборочную дисперсию по данному распределению выборки
объема n  75 :
x i 34,7 35,4 35,9 36,3
ni
13
?
24
20
3.8.Найти выборочную дисперсию по данному распределению выборки
объема n  20 :
x i 0,004 0,005 0,008
?
ni
7
9
3.9.Найти выборочную дисперсию по данному распределению выборки
объема n  40 :
x i 344 349 355
ni
6
8
?
38
3.10.Найти выборочную дисперсию по данному распределению выборки
объема n  50 :
x i 0,3 0,7 0,9
ni
?
15
22
4 группа
4.1.Из генеральной совокупности извлечена выборка объема n  10 :
xi 5 6 8 4 3 2
ni 1 2 2 1 3 1
Оценить с надежностью 0,99 математическое ожидание нормально
распределенного признака генеральной совокупности по выборочной
средней при помощи доверительного интервала.
4.2.Из генеральной совокупности извлечена выборка объема n  10 :
xi 1 3 4 2
ni 2 1 5 2
Оценить с надежностью 0,95 математическое ожидание нормально
распределенного признака генеральной совокупности по выборочной
средней при помощи доверительного интервала.
4.3.Из генеральной совокупности извлечена выборка объема n  11 :
xi 2 4 6 3 1
ni 3 2 2 1 3
Оценить с надежностью   0,95 математическое ожидание нормально
распределенного признака генеральной совокупности по выборочной
средней при помощи доверительного интервала.
4.4.Количественный признак X генеральной совокупности распределен
нормально. По выборке объема n  20 найдена выборочная средняя
39
x В  15 и выборочная дисперсия D B  3,8 . Оценить неизвестное
математическое ожидание при помощи доверительного интервала с
надежностью   0,99 .
4.5.Даны «исправленное» среднее квадратическое отклонение s  0,5 ;
выборочная средняя x В  3; t  2,20 . Найти доверительный интервал
для оценки неизвестного математического ожидания, нормально
распределенной случайной величины X с надежностью   0,95 .
4.6.Случайная величина X имеет нормальное распределение с известным
средним квадратическим отклонением   8 . Найти доверительный
интервал для оценки неизвестного математического ожидания, если
выборочная средняя
x В  16,6 , объем выборки n  25 и заданная
надежность   0,95 .
4.7.Даны среднее квадратическое отклонение   10 , выборочная средняя
x В  7,8
и объем выборки нормально распределенного признака
n  10 . Найти доверительный интервал для оценки неизвестного
математического ожидания с заданной надежностью   0,95 .
4.8.Количественный признак X генеральной совокупности распределен
нормально. По выборке объема n  40 найдена выборочная дисперсия
D B  0,624 .
Найти
доверительный
интервал,
покрывающий
генеральное среднее квадратическое отклонение  с надежностью
  0,999 .
4.9.Количественный признак X генеральной совокупности распределен
нормально. По выборке объема n  10 найдена выборочная дисперсия
DB  22,5 . Найти доверительный интервал, покрывающий генеральное
среднее квадратическое отклонение  с надежностью   0,99 .
4.10.По данным выборки объема n  20 из генеральной совокупности
нормально
распределенного
количественного
признака
найдена
выборочная дисперсия DB  27,702 . Найти доверительный интервал,
40
покрывающий генеральное среднее квадратическое отклонение  с
надежностью   0,95 .
5 группа
Вычислить выборочный коэффициент корреляции и найти выборочное
уравнение прямой регрессии Y на X .
5.1.
X
Y
10
18
20
19
30
20
40
23
50
25
60
29
70
36
80
47
90
61
100
85
5
4
17
7
27
10
35
13
43
16
49
19
53
22
57
25
63
28
67
31
15
11
20
12
25
13
30
14
35
15
40
17
45
19
50
21
55
23
60
25
10
5
20
8
30
13
40
17
50
23
60
29
70
36
80
41
90
48
100
57
10
7
12
8
14
11
16
13
18
16
20
19
22
21
24
23
26
25
28
27
14
8
16
9
18
10
20
13
22
15
24
18
26
21
28
25
30
29
32
32
10
25
20
26
30
28
40
31
50
35
60
40
70
46
80
53
90
61
100
70
5.2.
X
Y
5.3.
X
Y
5.4.
X
Y
5.5.
X
Y
5.6.
X
Y
5.7.
X
Y
41
5.8.
X
Y
15
9
23
15
31
18
39
21
47
25
55
29
63
36
71
47
79
61
87
85
11
18
13
19
15
20
17
23
19
27
21
34
23
43
25
49
27
61
29
81
20
35
30
40
40
46
50
53
60
61
70
70
80
80
90
91
100
103
5.9.
X
Y
5.10.
10
31
X
Y
6 группа
Найти основные выборочные характеристики x В , s 2 , s , V , s x ; с
надежностью 95% указать доверительный интервал для оценки генеральной
средней x Г для следующей выборки:
Номер задачи
6.1.
40,8
26,4
33,2
29,5
36,1
32,8
33,5
36,4
37,1
39,6
41,0
28,3
30,6
37,9
39,2
32,5
35,6
34,8
36,9
34,2
6.2.
12,6
18,7
15,3
14,8
19,5
13,7
16,4
15,2
16,3
12,9
18,5
16,5
15,4
13,6
16,9
15,8
17,3
19,6
15,8
19,6
6.3.
19,7
20,3
25,6
24,3
28,9
29,6
19,4
23,5
25,8
29,4
28,2
26,1
23,9
25,8
23,9
26,9
27,6
25,9
24,7
28,5
6.4.
18,6
19,5
23,8
15,4
39,7
24,5
19,8
20,5
26,5
23,4
21,6
29,7
29,7
24,6
19,4
16,5
16,8
14,4
13,8
22,4
6.5.
26,5
18,4
29,4
35,8
26,9
34,2
26,7
34,6
35,1
32,8
30,9
28,7
29,6
31,5
36,4
34,8
39,5
32,9
34,4
30,4
6.6.
29,8
30,5
31,6
29,6
35,7
36,8
29,4
21,6
29,7
24,6
34,8
36,4
32,1
39,7
34,5
34,8
31,5
34,8
37,9
29,6
6.7.
45,8
50,4
48,4
53,2
49,5
52,6
48,7
51,9
45,9
46,8
49,5
51,2
46,3
48,7
48,9
48,3
47,6
48,3
49,5
48,6
6.8.
95,4
82,5
86,9
90,2
89,1
85,6
87,5
86,4
89,3
92,1
90,3
86,9
87,4
90,4
94,6
93,2
87,5
86,4
93,4
86,5
6.9.
32,5
35,4
18,9
21,5
26,5
23,0
26,1
28,4
19,8
31,5
30,6
25,8
31,0
36,4
26,5
28,7
23,4
26,8
29,4
29,4
6.10.
11,5
12,4
13,9
18,4
12,0
15,1
16,7
13,8
14,6
12,5
11,8
13,9
14,7
15,8
16,8
13,0
11,2
14,8
17,9
19,6
42
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Что понимается под генеральной совокупностью? Что такое выборка?
Что называется вариантами выборки и вариационным рядом?
2. Что такое частота появления варианты в выборке?
3. Как получают относительную частоту появления варианты в выборке?
4. Как построить полигоны частот и относительных частот?
5. Как построить гистограммы частот и относительных частот?
6. В чем сущность задачи по определению параметров генеральной
совокупности?
7. Какую величину принимают за среднюю генеральной совокупности? Как
она вычисляется?
8. Какую величину принимают за дисперсию генеральной совокупности?
Как она вычисляется?
9. Как вычисляется среднее квадратическое отклонение средней выборки?
10.Что понимают под доверительным интервалом и доверительной
вероятностью?
11.Как вычислить доверительный интервал для математического ожидания
нормально распределенной случайной величины в случае, когда среднее
квадратическое отклонение известно; когда среднее квадратическое
неизвестно?
12.Как вычисляется доверительный интервал для среднего квадратического
отклонения нормально распределенной случайной величины?
13.Дайте определение корреляционной зависимости.
14.В чем состоят две основные задачи теории корреляции?
15.Какую корреляционную зависимость называют линейной?
16.Как найти выборочный коэффициент корреляции, перечислите его
свойства.
17. Запишите выборочные уравнения прямых регрессий.
43
Приложение 1
Таблица значений функции  x  
0
0,0
1
0,3989 3989
1  x2 / 2
e
2
2
3
4
5
6
7
8
9
3989
3988
3986
3984
3982
3980
3977
3973
0,1
3970
3965
3961
3956
3951
3945
3939
3932
3925
3918
0,2
3910
3902
3894
3885
3876
3867
3857
3847
3836
3825
0,3
3814
3802
3790
3778
3865
3752
3739
3726
3712
3697
0,4
3683
3668
3652
3637
3621
3605
3589
3572
3555
3538
0,5
3521
3503
3485
3467
3448
3429
3410
3391
3372
3352
0,6
3332
3312
3292
3271
3251
3230
3209
3187
3166
3144
0,7
3123
3104
3079
3056
3034
3011
2989
2966
2943
2920
0,8
2897
2874
2850
2827
2803
2780
2756
2732
2709
2685
0,9
2661
2637
2613
2589
2565
2541
2516
2492
2468
2444
0,2420 2396
2371
2347
2323
2299
2275
2251
2227
2203
1,0
1,1
2179
2155
2131
2107
2083
2059
2036
2012
1989
1965
1,2
1942
1919
1895
1872
1849
1826
1804
1781
1758
1736
1,3
1714
1691
1669
1647
1626
1604
1582
1561
1539
1513
1,4
1497
1476
1456
1435
1415
1394
1374
1354
1334
1315
1,5
1295
1276
1257
1238
1219
1200
1182
1163
1145
1127
1,6
1109
1092
1074
1057
1040
1023
1006
0989
0973
0957
1,7
0940
0925
0909
0893
0878
0863
0848
0833
0818
0804
1,8
0790
0775
0761
0748
0734
0721
0707
0694
0681
0669
1,9
0656
0644
0632
0620
0608
0596
0584
0573
0562
0551
0,0540 0529
0519
0508
0498
0488
0478
0468
0459
0449
2,0
2,1
0440
0431
0422
0413
0404
0396
0387
0379
0371
0363
2,2
0355
0347
0339
0332
0325
0317
0310
0303
0297
0290
44
2,3
0283
0277
0270
0264
0258
0252
0246
0241
0235
0229
2,4
0224
0219
0213
0208
0203
0198
0194
0189
0184
0180
2,5
0175
0171
0167
0163
0158
0154
0151
0147
0143
0139
2,6
0136
0132
0129
0126
0122
0119
0116
0113
0110
0107
2,7
0104
0101
0099
0096
0093
0091
0088
0086
0084
0081
2,8
0079
0077
0075
0073
0071
0069
0067
0065
0063
0061
2,9
0060
0058
0056
0055
0053
0051
0050
0048
0047
0043
0,0044 0043
0042
0040
0039
0038
0037
0036
0035
0034
3,0
3,1
0033
0032
0031
0030
0029
0028
0027
0026
0025
0025
3,2
0024
0023
0022
0022
0021
0020
0020
0019
0018
0018
3,3
0017
0017
0016
0016
0015
0015
0014
0014
0013
0013
3,4
0012
0012
0012
0011
0011
0010
0010
0010
0009
0009
3,5
0009
0008
0008
0008
0008
0007
0007
0007
0007
0006
3,6
0006
0006
0006
0006
0006
0005
0005
0005
0005
0004
3,7
0004
0004
0004
0004
0004
0004
0003
0003
0003
0003
3,8
0003
0003
0003
0003
0003
0002
0002
0002
0002
0002
3,9
0002
0002
0002
0002
0002
0002
0002
0002
0001
0001
45
Приложение 2
Таблица значений функции Ф x  
1 x z2 / 2
dz
e
2 0
x
Ф x 
x
Ф x 
x
Ф x 
x
Ф x 
0,00
0,0000
0,25
0,0987
0,50
0,1915
0,75
0,2734
0,01
0,0040
0,26
0,1026
0,51
0,1950
0,76
0,2764
0,02
0,0080
0,27
0,1064
0,52
0,1985
0,77
0,2794
0,03
0,0120
0,28
0,1103
0,53
0,2019
0,78
0,2823
0,04
0,0160
0,29
0,1141
0,54
0,2054
0,79
0,2852
0,05
0,0199
0,30
0,1179
0,55
0,2088
0,80
0,2881
0,06
0,0239
0,31
0,1217
0,56
0,2123
0,81
0,2910
0,07
0,0279
0,32
0,1255
0,57
0,2157
0,82
0,2939
0,08
0,0319
0,33
0,1293
0,58
0,2190
0,83
0,2967
0,09
0,0359
0,34
0,1331
0,59
0,2224
0,84
0,2995
0,10
0,0398
0,35
0,1368
0,60
0,2257
0,85
0,3023
0,11
0,0438
0,36
0,1406
0,61
0,2291
0,86
0,3051
0,12
0,0478
0,37
0,1443
0,62
0,2324
0,87
0,3078
0,13
0,0517
0,38
0,1480
0,63
0,2357
0,88
0,3106
0,14
0,0557
0,39
0,1517
0,64
0,2389
0,89
0,3133
0,15
0,0596
0,40
0,1554
0,65
0,2422
0,90
0,3159
0,16
0,0636
0,41
0,1591
0,66
0,2454
0,91
0,3186
0,17
0,0675
0,42
0,1628
0,67
0,2486
0,92
0,3212
0,18
0,0714
0,43
0,1664
0,68
0,2517
0,93
0,3238
0,19
0,0753
0,44
0,1700
0,69
0,2549
0,94
0,3264
0,20
0,0793
0,45
0,1736
0,70
0,2580
0,95
0,3289
0,21
0,0832
0,46
0,1772
0,71
0,2611
0,96
0,3315
0,22
0,0871
0,47
0,1808
0,72
0,2642
0,97
0,3340
0,23
0,0910
0,48
0,1844
0,73
0,2673
0,98
0,3365
0,24
0,0948
0,49
0,1879
0,74
0,2703
0,99
0,3389
46
1,00
0,3413
1,28
0,3997
1,56
0,4406
1,84
0, 4671
1,01
0,3438
1,29
0,4015
1,57
0,4418
1,85
0, 4678
1,02
0,3461
1,30
0, 4032
1,58
0,4429
1,86
0,4686
1,03
0,3485
1,31
0,4049
1,59
0,4441
1,87
0,4693
1,04
0,3508
1,32
0,4066
1,60
0,4452
1,88
0,4699
1,05
0,3531
1,33
0,4082
1,61
0,4463
1,89
0,4706
1,06
0,3554
1,34
0,4099
1,62
0,4474
1,90
0,4713
1,07
0,3577
1,35
0,4115
1,63
0,4484
1,91
0,4719
1,08
0,3599
1,36
0,4131
1,64
0,4495
1,92
0,4726
1,09
0,3621
1,37
0,4147
1,65
0,4505
1,93
0,4732
1,10
0,3643
1,38
0,4162
1,66
0,4515
1,94
0,4738
1,11
0,3665
1,39
0,4177
1,67
0,4525
1,95
0,4744
1,12
0,3686
1,40
0,4192
1,68
0,4535
1,96
0,4750
1,13
0,3708
1,41
0,4207
1,69
0,4545
1,97
0,4756
1,14
0,3729
1,42
0,4222
1,70
0,4554
1,98
0,4761
1,15
0,3749
1,43
0,4236
1,71
0,4564
1,99
0,4767
1,16
0,3770
1,44
0,4251
1,72
0,4573
2,00
0,4772
1,17
0,3790
1,45
0,4265
1,73
0,4582
2,02
0,4783
1,18
0,3810
1,46
0,4279
1,74
0,4591
2,04
0,4793
1,19
0,3830
1,47
0,4292
1,75
0,4599
2,06
0,4803
1,20
0,3849
1,48
0,4306
1,76
0,4608
2,08
0,4812
1,21
0,3869
1,49
0,4319
1,77
0,4616
2,10
0,4821
1,22
0,3883
1,50
0,4332
1,78
0,4525
2,12
0,4830
1,23
0,3907
1,51
0,4345
1,79
0,4633
2,14
0,4838
1,24
0,3925
1,52
0,4357
1,80
0,4641
2,16
0,4846
1,25
0,3944
1,53
0,4370
1,81
0,4649
2,18
0,4854
1,26
0,3962
1,54
0,4382
1,82
0,4656
2,20
0,4861
1,27
0,3980
1,55
0,4394
1,83
0,4664
2,22
0,4868
2,24
0,4875
2,48
0, 4934
2,72
0,4967
2,96
0,4985
2,26
0,4881
2,50
0,4938
2,74
0,4969
2,98
0,4986
47
2,28
0,4887
2,52
0,4941
2,76
0,4971
3,00
0,49865
2,30
0,4893
2,54
0,4945
2,78
0,4973
3,20
0,49931
2,32
0,4898
2,56
0,4948
2,80
0,4974
3,40
0,49966
2,34
0,4904
2,58
0,4951
2,82
0,4976
3,60
0,499841
2,36
0,4909
2,60
0,4953
2,84
0,4977
3,80
0,499928
2,38
0,4913
2,62
0,4956
2,86
0,4979
4,00
0,499968
2,40
0,4918
2,64
0,4959
2,88
0,4980
4,50
0,499997
2,42
0,4922
2,66
0,4961
2,90
0,4981
5,00
0, 499997
2,44
0,4927
2,68
0,4963
2,92
0,4982
2,46
0,4931
2,70
0,4965
2,94
0,4984
48
Приложение 3
Таблица значений t  t ( , n)

0,95
0,99

0,999
n
0,95
0,99
0,999
n
5
2,78
4,60
8,61
20
2,093
2,861
3,883
6
2,57
4,03
6,86
25
2,064
2,797
3,745
7
2,45
3,71
5,96
30
2,045
2,756
3,659
8
2,37
3,50
5,41
35
2,032
2,720
3,600
9
2,31
3,36
5,04
40
2,023
2,708
3,558
10
2,26
3,25
4,78
45
2,016
2,692
3,527
11
2,23
3,17
4,59
50
2,009
2,679
3,502
12
2,20
3,11
4,44
60
2,001
2,662
3,464
13
2,18
3,06
4,32
70
1,996
2,649
3,439
14
2,16
3,01
4,22
80
1,991
2,640
3,418
15
2,15
2,98
4,14
90
1,987
2,633
3,403
16
2,13
2,95
4,07
100
1,984
2,627
3,392
17
2,12
2,92
4,02
120
1,980
2,617
3,374
18
2,11
2,90
3,97
∞
1,960
2,576
3,291
19
2,10
2,88
3,92
49
Приложение 4
Таблица значений q  q( , n)

0,95
0,99

0,999
n
0,95
0,99
0,999
n
5
1,37
2,67
5,64
20
0,37
0,58
0,88
6
1,09
2,01
3,88
25
0,32
0,49
0,73
7
0,92
1,62
2,98
30
0,28
0,43
0,63
8
0,80
1,38
2,42
35
0,26
0,38
0,56
9
0,71
1,20
2,06
40
0,24
0,35
0,50
10
0,65
1,08
1,80
45
0,22
0,32
0,46
11
0,59
0,98
0,98
50
0,21
0,30
0,43
12
0,55
0,90
0,90
60
0,188
0,269
0,38
13
0,52
0,83
0,83
70
0,174
0,245
0,34
14
0,48
0,78
0,78
80
0,161
0,226
0,31
15
0,46
0,73
0,73
90
0,151
0,211
0,29
16
0,44
0,70
0,70
100
0,143
0,198
0,27
17
0,42
0,66
0,66
150
0,115
0,160
0,211
18
0,40
0,63
0,63
200
0,099
0,136
0,185
19
0,39
0,60
0,60
250
0,089
0,120
0,162
50
Рекомендуемая литература
1. Андронов А.М. Теория вероятностей и математическая статистика. / А.М.
Андронов, Е.А. Копытов, Л.Я. Гринглаз. – СПб.: Питер, 2004.- 464с.
2. Баврин И.И. Теория вероятностей и математическая статистика. - М.:
Высшая школа, 2005.- 160 с.
3. Бочаров П. П. Теория вероятностей. Математическая статистика. / П. П.
Бочаров, А. В. Печинкин. - 2-е изд. - М.: ФИЗМАТЛИТ, 2005. - 296 с.
4. Ватутин В. А. Теория вероятностей и математическая статистика в
задачах: Учебное пособие для вузов / В. А. Ватутин, Г. И. Ивченко, Ю. И.
Медведев и др. - 2-е изд., исправленное. - М.: Дрофа, 2003. - 328 с.
5. Вентцель Е. С. Задачи и упражнения по теории вероятностей: Учебное
пособие для студентов втузов / Е. С. Вентцель, Л. А. Овчаров. - 5-е изд.,
исправленное. - М.: Издательский центр «Академия», 2003. - 448 с.
6. Виленкин Н.Я. Комбинаторика. / Н.Я. Виленкин, А.Н. Виленкин, П.А.
Виленкин. - М.: ФИМА, МЦНМО, 2006. - 400 с.
7. Гнеденко
Б.В.
исправленное
Курс
теории
вероятностей:
Учебник.
Изд.
8-е,
и дополненное. - М.: Едиториал УРСС, 2005. - 448 с.
(Классический университетский учебник.).
8. Гмурман В.Е. Теория вероятностей и математическая статистика. - Изд. 6е доп. - М.: Высшая школа, 2002.
9. Гмурман В.Е. Руководство к решению задач по теории вероятностей и
математической статистике: Учебное пособие для студентов вузов. Изд. 6е, доп. - М.: Высшая школа, 2002.
10. Ивченко Г.И. Введение в математическую статистику: Учебник. / Г.И.
Ивченко, Ю.И. Медведев. - М.: Издательство ЛКИ, 2010. -600 с.
11. Кибзун и др. Теория вероятностей и математическая статистика. Базовый
курс с примерами и задачами. - М.: Физматлит, 2002. - 224 с.
51
12. Кремер Н.Ш. Теория вероятностей и математическая статистика:
Учебник для вузов. - 2-е изд., переработанное и доп.- М.: ЮНИТИДАНА, 2004. - 573 с.
13. Колемаев В. А. Теория вероятностей в примерах и задачах: Учебное
пособие / В. А. Колемаев, В. Н. Калинина, В. И. Соловьёв и др.; ГУУ. М., 2001. - 87 с.
14. Маталыцкий М.А. Теория вероятностей в примерах и задачах: Учеб.
пособие. / М.А. Маталыцкий, Т.В. Романюк. - Гродно: ГрГУ, 2002. - 248 с.
15. Горяинов В. Б. Математическая статистика: Учебник для вузов. / В. Б.
Горяинов, И. В. Павлов, Г. М. Цветкова, О. И. Тескин.; Под ред. B.C.
Зарубина, А.П. Крищенко. - М.: Иэдательство МГТУ им. Н.Э. Баумана,
2001. - 424 с.
16. Маценко П. К. Руководство к решению задач по теории вероятностей.
Учебное пособие. / П. К. Маценко, В. В. Селиванов. - Ульяновск: УлГТУ,
2000.- 99 с.
17. Письменный
Д.Т.
Конспект
лекций
по
теории
вероятностей
и
математической статистике. - М.: Айрис-пресс, 2004. - 256 с.
18. Пугачев В.С. Теория вероятностей и математическая статистика: Учебное
пособие.- 2-е изд., исправленное и дополненное. - М.: Физматлит, 2002.496с.
Download