СТАТИСТИКА МОСКОВСКИЙ ЛЕСОТЕХНИЧЕСКИЙ ИНСТИТУТ И. II. УЧЕБНОЕ ПОСОБИЕ

реклама
МИНИСТЕРСТВО ВЫ СШ ЕГО И СРЕДНЕГО
СПЕЦИАЛЬНОГО ОБРАЗОВАНИЯ СССР
МОСКОВСКИЙ ЛЕСОТЕХНИЧЕСКИЙ ИНСТИТУТ
;*
И. II.
> ПАП
СТАТИСТИКА
УЧЕБНОЕ ПОСОБИЕ
ДЛЯ СТУДЕНТОВ
Л ЕСО ХО ЗЯЙ СТ ВЕН Н О ГО ФАКУЛЬТЕТА
М о с к в а — 1983
М ИНИСТЕРСТВО ВЫ СШ ЕГО И СРЕД Н ЕГО СП ЕЦ И А Л ЬН ОГО
ОБРАЗОВАНИЯ СССР
М ОСКОВСКИЙ Л ЕСО Т ЕХН И ЧЕСК И Й ИНСТИТУТ
Н. Н. СВАЛОВ
ВАРИАЦИОННАЯ СТАТИСТИКА
У ЧЕБН О Е П О С О Б И Е
Д Л Я СТУДЕНТОВ
Л Е С О Х О ЗЯ Й С Т В Е Н Н О Г О ФАКУЛЬТЕТА
9
М о с к в а — 1983
УДК 630 х 5
Одобрено и рекомендовано
тельюиим советом института
к печати
р едакциошю -изда -
Кафедра лесной таксации и лесоустройства
Николай Николаевич Свалов
ВА РИ А Ц И О Н Н А Я
Учебное
СТАТИСТИКА
пособие
для студентов лесохозяйственного факультета
И з д а н и е 3-е
Рецензенты — ст. преп. ка/федры лесной
таксации ВЛТИ Н. В. Гладышева,
доцент Марийского политехнического института
М. М. Михайлов.
Редактор РИ О — Н. Д. Ьл а годато ва
Корректор — А, А. Гусева.
По темэпическому плану издания учебной литературы
на 1983 год,
поз. 2.
(g) Московский лесотехнический институт, 1983 г.
Л -75408
Подп. к печ. 27.12.83 г.
Объем 3 уч.-изд. п. л., 5 п. л.
Тираж 1000 экз.
Цена 50 коп.
Заказ № 82
Типография Московского лесотехнического института
П Р Е Д И С Л О В И Е
Учебное пособие имеет цель — помочь студентам вьвпошнить расчетную работу »по курсу в ар иациоин о й статистики и
дать анализ статистической совокупности.
Расчетная работа по курсу охватывает два раздела, назы­
ваемых «Вариация (изменчивость) значений признака» и
«Корреляция (взаимосвязь) между признаками». Исходными
материалами для работы служат данные измерений относите­
льно двух каких-либо признаков, например, относительно диа­
метра и высоты деревьев в большой выборочной совокупности
(N > 25 — 30).
Исходные материалы могут быть выданы на кафедре в ви­
де списка наблюденных значений признаков или взяты из
табл. 1 приложения, в соответствии с вариантом, указанным
преподавателем. Студенты-заочники, не получившие по какимлибо причинам индивидуального задания, выписывают исход­
ные данные из той же таблицы, принимая вариант, соответст­
вующий последней цифре установленного деканатом шифра.
Студенты заочного обучения представляют результаты рас­
четов в виде двух контрольных работ, каждая из которых отно­
сится к одному из вышеназванных разделов.
Моменты и статистические показатели следует вычислить
с точностью до 0 ,001 . Данные расчета должны фиксировать­
ся подробно с указанием промежуточных результатов. Каж­
дый этап вычислений нужно проверять.
В качестве учебных пособий, наиболее соответствующих
программе курса, рекомендуются следующие: Свалов Н. II.
«Вариационная статистика», изд. «Лесная промышленность»,
1977; Дворецкий М. Л. Пособие по вариационной статистике,
изд. «Лесная промышленность», 1971.
Свою работу студент выполняет в последовательности, при­
нятой в пособии. При этом он должен читать все приведенные
объяснения, необходимые для понимания техники вычислений
и сущности статистических показателей.
Для уяснения обработки малой выборки, которая проще
раскрывает сущность статистических показателей, студент
3
комiпси со способом непосредственных вычислений и спо­
собом условного начала (табл. 7 и 8 ).
Студенты-заочники после составления и графического изо­
бражения рядов распределения в своей контрольной работе
отводят страницу для «статистической обработки малой вы­
борки». Студенты, имеющие шифр, заканчивающийся нечет­
ной цифрой, берут из табл. 7 первые пять значений X, равные
5, б, 5, 7, 4 см и рассчитывают х, S, V, по способам и схеме
табл. 7 и 8 .
Студенты с четной последней цифрой шифра такую же об­
работку производят па основе 5 последних вариант из табл. 7 .
Исли студент пожелает более индиви-дуализирювать свою ма­
лую вьиборку, он может взять другое — большее число вари­
ант, например 6 , 7 или более, или даже первые 10 дат (вари­
антов) высоты из своего индивидуального задания.
Студенты очного обучения расчеты статистик при малой
выборке производят на контрольном занятии. Обработку боль­
шой выборж-и, т. е. ряда диаметров и ряда высот то 'способу гьроизведешш, производят по схеме табл. 9. По получении выбо­
рочных статистических показателей х, 3, V, А, Е следует умо­
зрительно представить среднюю величину признака, среднее и
предельное отклонение вариант, косость и крутость кривой
распределения.
Г Л А В А
I
В А РИ А Ц И О Н Н А Я СТАТИСТИКА, ЕЕ МЕТОД,
ТЕОРЕТИЧЕСКАЯ И ОПЫ ТНАЯ О СН О В А
Метод и теоретическая основа статистики
В лесохозяйственных и биологических исследованиях по­
стоянно имеют дело с оценкой массовых явлений. Эти явления
нередко представляются сложными, с первого взгляда беспо­
рядочными, вследствие разнообразия (варьирования) в раз­
мерах, весе или в поведении отдельных единиц или индивиду­
умов, составляющих наблюдаемые мзссовые явления.
Чтобы разобраться в сущности таких явлений и дать им ко­
личественную оценку, необходимо располагать соответству­
ющим методом и теорией.
Вариационная статистика излагает методы изучения мас­
совых явлений и построения для них количественных оценок.
Отдельные единицы или индивидуумы, подлежащие на блюде
нию (измерению, взвешиванию или подсчету), называют ва­
риантами. Коллективы отдельных единиц, характеризующихся
определенной общностью, называют статистическими сово­
купностями.
Различают совокупности генеральные и выборочные. Ге­
неральной совокупностью является весь коллектив единиц,
подлежащий изучению. Число единиц в таком коллективе бес­
конечно большое. Выборочной совокупностью, или выборкой,
называют часть единиц, выбранных для наблюдения.
При статистических наблюдениях в биологии практически
всегда имеют дело с выборками и по результатам их судят о
совокупности. Таким образом вариационная статистика при­
меняет метод индукции, когда обобщения делают, изучив от­
дельные случаи. Правомерность этого метода основа па па ис­
пользовании важнейших понятии и положений теории веро­
ятностей.
Одним из основных понятий этой теории является вероят­
ность. Вероятностью события А называют отношение числа
случаев, благоприятствующих появлению данного события, к
а
числу всех возможных случаев. Вероятность обозначают бук­
вой р с указанием в скобках индекса события, в нашем случае
события А. Ее определяют по формуле:
р ( А ) = п/м,
где
( 1)
п — число случаев, благоприятствующих событию А;
N' — общее число случаев.
Так, если в урне содержится 5 одинаковых перемешанных
шаров, причем 2 из них черные, а 3 — белые, то вероятность
вынуть наудачу белый шар равна -р(А) = 3/5= 0 ,6 , а вероят­
ность вынуть черный шар р(В ) = 2/5 = 0 ,4.
Вероятность изменяется от нуля до единицы. Вероятность,
равная нулю, указывает, что событие является невозможным;
вероятность, равная единице, означает, что событие единст­
венно возможное или достоверное.
Если появление одного события исключает появление дру­
гого события, их называют несовместными.
В указанном примере события А и В — несовместные.
Сумма вероятностей несовместных событий равна единице
Р(А) + р (В ) = 1.
События называют равновозможными, если ни одно из
них не является более возможным, чем другие. Вероятности
таких событий одинаковы.
В лесобиологических работах вероятность чаще всего ус­
тановить невозможно, так как вся изучаемая генеральная
совокупность и ее состав неизвестны, например, число дере­
вьев разной толщины в большом участке леса. В таких слу­
чаях получают аналог вероятности на основе опыта в выбо­
рочной совокупности.
Подсчитывают число испытаний, в которых событие прак­
тически появилось, и- относят его к общему числу испытаний.
Это отношение называют относительной частотой события
п выражают формулой:
(2 )
где
п — число появлений события;
N — общее число испытаний.
Длительные наблюдения показали, что при одинаковых
условиях испытаний и достаточно большом их числе относи­
тельная частота в различных опытах изменяется мало, тем
меньше, чем больше объем выборки. Она колеблется (варьи­
рует) около некоторого постоянного числа. Это замечательное
свойство относительных частостей называется устойчивостью
относительной частоты, или статистической устойчивостью.
6
Данные, шведской статистики относительно рождения де­
вочек за 1935 г. приведем в качестве примера устойчивости
относительной частоты. По месяцам, начиная с января, она
характеризуется следующими значениями: 0,486; 0,489; 0,471;
0,478; 0,482; 0,462; 0,484; 0,485; 0,491; 0,482; 0,473. Данные
других стран примерно те же.
Постоянное число, около которого варьируют относитель­
ные частоты, является вероятностью появления события.
Таким образом, если опытным путем установлена относи­
тельная частота, то полученное число можно принять за при­
ближенное значение вероятности.
Относительные частоты в указанном примере колеблются
около числа 0,482, которое можно принять за приближенное
значение вероятности рождения девочек.
Следует обратить внимание, что такое суждение о вероят­
ности на основе относительной частоты тем надежнее, чем
больше число испытаний или объем выборки.
Многократные опыты бросания монеты, в которых подсчи­
тывали число появления герба, дали следующий результат:
число бросаний: 4040, 12000; 24000;
относительная частота: 0,5069; 0,5016; 0,5005;
Вероятность появления герба равна 0 ,5 .
Нетрудно представить или испытать на опыте, что при ма­
лом числе наблюдений, например, при 10 бросаниях, такое
приближение относительной частоты к вероятности, очевидно,
не получить.
Наблюдение
Наблюдение является опытной основой статистического
исследования.
Для того, чтобы по данным выборки можно было бы с оп­
ределенной степенью уверенности делать заключения о со­
вокупности, выборочное наблюдение должно быть правильно
организован о. Решают два основных вопроса:
1 ) какое число наблюдений является достаточным ;
2 ) какие единицы совокупности должны быть выбраны
для наблюдения, т. е. составлять выборку.
Первый вопрос может быть решен с помощью таблицы
достаточно больших чисел, которая приводится во многих
пособиях но статистике или с применением формулы 51.
Отбор единиц для наблюдения может быть спланирован
различным О'бразом в зависимости ют состава совокупности и
сведений о ней.
Если совокупность варьирует не в слишком широких пре­
делах и, если выборка составляет не менее 2 0 % объема сово­
купности, применяют простой случайный отбор единиц или
простое выборочное наблюдение, /[ля этого удобно пользо­
ваться таблицей случайных чисел.
7
Нередко применяют систематическое выборочное наблю
деиие. Например, если предстоит взять 10%-ную выборку
деревьев из 800 шт., то можно случайным порядком выбрать
одно, положим 5, и после этого брать каждое через 10 номе­
ров, т. е. за номерами: 15, 25, 35, и- т. д., кончая нюмером 795.
Если имеются сведения о том, что совокупность в своих
частях неодинакова, например с более высоким уровнем яв­
ления в одних частях чем в других, целесообразно послойное
выборочное наблюдение. Например, известно, что запас древостоев меньше варьирует в пределах классов возраста. Тог­
да для получения статистических характеристик величины
запаса всю совокупность древостоев расчленяют на группы
по возрасту. Получим слои совокупности, для каждого из ко­
торых берут независимую выборку и вычисляют ее характе­
ристики. Статистическая обработка материалов опыта послой­
ной выборки несколько сложнее. Нижеизложенные методы
статистической обработки материалов наблюдений относятся
к простой выборке или ее суррогатам.
ГЛАВА
II
СОСТА ВЛ ЕН И Е РЯ Д О В И ТАБЛИЦ РА СП РЕД ЕЛ Е Н И Я
Ч И С Л Е Н Н О С Т Е Й . ГРА Ф И ЧЕСК О Е ИХ И ЗО Б Р А Ж Е Н И Е
Составление рядов и таблиц распределения
Первичные данные наблюдений чаше всего представляют
в виде списка наблюдаемых значений признаков. В табл. 1
приведены результаты измерения диаметров и высот 94 ство­
лов сосны.
Для того, чтобы придать опытным материалам опреде­
ленную наглядность или извлечь т них необходимую статисти­
ческую информацию о наблюдаемом признаке, материалы
наблюдения подвергают сводке в статистические ряды и таб­
лицы.
Статистическим рядом, или рядом распределения, называ­
ют ряд значений признака, размещенных в порядке возра­
стания или убывания, с указанием
числа
повторений
(табл. 4, 5).
Значения признака, сведенные в ряд, называют классовы­
ми вариантами, а число повторений их в классах — числен­
ностями, или частотами классов.
Статистический ряд значений измеренного признака по­
лучают путем определения величины класса или интервала,
размещения классов и распределения в них всех единиц на­
блюдения.
8
а,
н
О)
s
«}
Высота, м
s
С
О
Н
s
о
CQ
№
деревьев
CQ си
CD
н
Л
си
04Q
S
>
СО
CU
К цн
с®» CU Cf
g
^ ч
Диаметр,
см
Таблица 1
Ведомость измеренных диаметров и высот стволов сосны
32
33
34
35
36
33.5
25,2
42.0
31.5
35.7
29.1
25.8
29,6
26.8
28.4
63
64
65
66
67
32,6
21,0
28,5
34,2
26,0
28,0
27,0
28,0
27,0
26,0
28,1
25.9
27.6
28.6
25.6
37
38
39
40
41
27.5
29.0
28.0
23.0
26.1
26.2
25,8
28,0
27.0
27.5
68
69
70
71
72
34,2
31,2
31,2
31,5
31,2
29,6
27,9
25,6
29,6
25,6
12
13
14
15
29,2_
31.0
27.5
29.5
37.5
27.8
27,Г
27.8
28.6
28,0
42
43
44
45
46
18,0
38.5
41.5
33.0
33.5
24.0
28.6
29.6
25.6
28.5
73
74
75
76
77
30,0
27,5
29,7
23,0
19,5
29,6
28,5
27,9
25,0
20,5
16
17
18
19
20
34.0
20.5
17.0
26.4
29.0
28,6
16.5
22.0
39.0
34.0
37.5
22.6
21.7
28,1
28,4
47
48
49
50
51
27.6
28.4
29.6
29.5
78
79
80
81
82
28,0
28,7
37,2
26,5
41,5
25,8
28,6
29,1
26,6
28,6
21
22
23
24
25
37.2
24.5
23.5
36.5
•42,0
29.3
26.4
26,0
27,6
27.0
52
53
54
55
56
36.0
33.0
40.7
36.4
28.5
29,8v
28.6
27.7
28,2
24.8
83
84
85
86
87
35,5
27,0
28,5
31,5
36,0
27,6
27,6
26,6
29,0
28,6
26
27
28
29
30
36.5
15,5*
38.5
31.0
34.2
27.3
19,6*
29.4
29.0
29,0
57
58
59
60
61
31.7
29.5
26.0
28,0
27.7
26.8
27,2
26,6
25,9
23,8
88
89
90
91
92
36,5
29,0
20,0
20,5
34,0
29,5
27,5
24,0
20,6
29,5
31
38,0
29.8
62
32,0
27,7
93
94
19,7
28,0
23,6
21,6
1
2
3
4
5
6
7
8
9
10
11
CQ
о>
3
Л
CQ
4>
U
<о* C
CU
28.5
28.5
29.2
22.5
34.5
26.5
25.8
28.7
22.7
29.6
32.5
30.0
32.5
41.0
28.5
О
О
СО
22,6
К
н
оо
3
Величину интервала обычно определяют по формуле:
Xfnax
где
X max и Хт 1я
ОТ 8
Xmin
ДО 12
(3)
соответственно наибольшее и наименьшее зна­
чение признака или вариант. Числа от 8 до 12
означают предварительно принимаемое коли­
чество классов.
9
В качестве к принимают круглое число, ближайшее к полу­
ченному частному. При этом действительное число классов
определится как частное от размаха вариант (Х гаах — xmin ) на
округленное значение интервала. В качестве полученного
частного принимают также круглое число. Округление дела­
ется всегда в большую сторону. Хороший результат вычис­
ления величины интервала получается при применении ф ор­
мулы:
(4)
1+3,322 IgN
Величина интервала для диаметров сосны (табл. 1), уста*
новленная по этой формуле, оказывается равной
42,0— 15,5
1+3,322 lg 94
округляем до 4,0 см.
Величина интервала для высот при
29,8— 19,6
к
=
~10
~
10 классах равна:
10,2
~ — =
1,02 м
1 м.
Действительное количество классов оказывается равным:
по диаметру — 26,5:4 = 7;
*
по высоте
—
10,2:1 = 11 .
Границы и срединные значения классов лучше устанав­
ливать следующим образом.
В качестве среднего значения первого класса принимают
число, кратное классовому промежутку к, ближайшее к наи­
меньшей (в возрастающем ряду) или наибольшей (в убы­
вающем ряду) вариантам ряда распределения. Для диамет­
ров, при составлении возрастающего ряда, таким числом ока­
зывается 16,0. Срединные значения последующих классов по­
лучают путем последовательного прибаЕ'.ления величины ин­
тервала. Для ряда диаметров они окажутся равными: 20, 24,
28 и т. д. Эти значения называют классовыми вариантами,
так как они представляют собой классы.
Нижние границы классов определяют путем вычитания по­
ловины величины интервала из срединных значений каждого
класса, а верхние границы — путем прибавления этой поло­
вины...
19
Для первого класса получим соответственно числа 14,0 и
18,0; для второго — 18,0 и 22 ,0 .
В целях исключения перекрытия верхней границы преды­
дущего класса с нижней границей последующего класса, нашример, чисел 18,0 и 18,0, входящих в первый и второй клас­
сы, нижние границы классов увеличивают на величину, рав­
ную точности измерения признака*. Для диаметров она рав­
на 0,1 см, для высот 0,1 м. Полученные таким образом зна­
чения границ и средин классов для диаметров и высот ство­
лов указаны в табл. 2 и 3.
В этих таблицах показано также посредством точек и
черточек число вариант, распределенных по классам. Варианты распределяют по классам путем последовательного
просмотра их, начиная -с -первой. Рекомендуется следующая
система отметок вариант в порядке их нарастания (от 1
до 10 ).
Варианты:
1 2
3
4 5 6 7 8 9
10
Отметки:
.
..
.: ::
|Х 1X1 1^1 1X1
По окончании разноски всех вариант ряда их подсчиты­
вают отдельно для каждого класса и обозначают числами.
Они показывают, как часто встречались варианты, сведенные
в классы. Общее число вариант должно равняться числу из­
меренных значений данного признака.
Примерами рабочих таблиц распределения для первого
и (отдельно) для второго признаков могут служить табл. 2 и 3 .
Таблица 2
Рабочая таблица распределения количества стволов сосны
по классам диаметра
Граница
классов,
см
Срединные
значения
классов,
см
18,1—22,0
20
22,1— 26,0
24
26,1— 30,0
28
34,1— 38,0
36
38,1— 42,0
40
S
32
чО
*
о
Т
16
00
14,1— 18,0
Ч а с т о т а
(число стволов)
в рабочей записи
9
* •
• »
в цифрах
4
—
7
8
х
|_2
28
X
20
1X1 IX
FI
18
X |
9
jVU
94
* М ожно верхние границы классов уменьшить на ту же величину и
таким образом получить значения границ классов:
1)
14,0— 17,9;
2) 18,0— 21,9 и т. д.
11
Таблица 3
Рабочая таблица распределения количества стволов сосны
по классам высоты
Срединные
значения
классов,
м
п рабочей записи
19,6—2675
20
♦
1
20,6—21,5
21
•^
2
21,6— 22,5
22,
••
2
_ 22,6—23,5
23
• Ф
3
23,6— 24,5
24
•
24,6— 25,5
25
25,6—26,5
26
х
:•
13
26,6— 27,5
27
!~х~ ::
14
27,6—28,5
28
-X.
25
28,6— 29,5
29
Граница
классов,
м
__29,6— 30,5
30
2
Ч а с т о т а
(число стволов)
•
в цифрах
4
2
IT t
I X
!Z !
ГЮ
18
10
94
Для последующего статистического анализа результатов
наблюдений из •оабочих
таблиц испсльзуют
данные двух
X
щ
/
столбцов; срединные значения классов (классовые варианты)
и значение частот (см. табл. 4 и 5).
Иногда значения классов указывают в таблицах записью
начальных вариа-нт, сопровождаемых постановкой черточек.
Для диаметров значения классов были бы записаны так:
14,1 — ; 18,1— ; 22,1— и т. д. За расчетные значения классо­
вых вариант, однако, и в этом случае принимают срединные
значения классов.
Полученные таким образом двойные ряды чисел, состоя­
щие ив обозначения классов -и соответствующих им частот,
называют рядами распределения, или вариационными ря­
дами.
Таблицу распределения вариант по двум признакам или
так называемую корреляционную таблицу составляют ана­
логичным образом. Границы классов и срединные значения
для одного из признаков, принимаемого за независимый х,
размещают во 2 и 3 строках, а границы и срединные значе­
ния классов другого признака у — во 2 и 3 столбцах (см. от­
граниченное жирными линиями).
12
Разноску наблюдаемых значений -признаков производят
сразу по обоим признакам, обозначая указанным способом
(постановкой точек и черточек) каждую варианту в клетке,
образуемой пересечением строки и столбца, соответствующих
Таблица 4
Вариационный ряд диаметров стволов сосны
Классовые
варианты
X, см
Частота,
п
| Классовые
варианты
X, см
Частота,
п
16,0
4
32,0
20
20,0
7
36,0
18
24,0
8
40,0
9
28,0
28
94
V
Таблица 5
Вариационный ряд высот стволов сосны
Классо­
вые ва­
рианты
X, м
Ч а с­
тота,
п
Классо­
Ч ас­
вые ва­
тота,
рианты
п
X, м
Классо­
вые ва­
рианты
X, м
Ч ас­
тота,
п
4
28,0
25
25,0
2
29,0
18
2
26,0
13
30,0
10
3
27,0
14
2
94
20,0'
1
24,0
21,0
2
22,0
23,0
:
значениям варианты по обоим признакам. Так, если диаметр
ствола сосны равен 20,8 ом, а высота 28,0 м, варианта будет
занесена в клетку, образуемую третьей строкой и вторым
столбцом (табл. 6 ).
После разноски всех вариант и обозначения их в цифро­
вой записи подводят итоги частот по каждой строке и столб­
цу. Итоги надлежит сверить с частотами соответствующих
вариационных рядов (см. табл. 4, 5). Пример распределения
количества стволов сосны по классам диаметров и высот при­
веден в табл. 6 . Условное обозначение вариант, принятое при
распределении их, в таблице не указано.
Таблица распределения заканчивается вычислением эмпи­
рических средних значений зависимого признака, в нашем
примере высоты, по классам независимого, в нашем примере
по классам диаметра. Для этого вначале в пределах каждого
Таблица б
О
^
00 ю •ф
— I см
со см '•Ф оо см см
ст>
г-Г
см
СП
ю
ю
CM
о
о"
СО
ю
см
О
of
О
тг*
СМ
со
со
(0 Ю Ю (N
см
со
<М
чф
I
СМ
оо
со
со
I
I
I
I
СП
I
ОС
со
о
со
о
о"
со
I I I . I
(О
N
СО
о
см
CJ
00
оо"
см
°i
оо"
см
сэ
00
см
со
см
со
"
см
СП
ю
см
СП
1~-Н
ю
со
<х>
см
СП
ю
см
"ф
о
о"
Г—«
ю
ю
со
ю
о
со"
LO
!>.
оо
см
см
Ю
иО
Г-
00
ю"
со
<о
ю
о
см
оо
о
ОО
СО
СО
<N •чг «—
см
CM
см
см
о
см
~со
см
см
х00
«ч
сэ
о
см
I
см
СМ
I
см
СО
о
оо"
см
со
см"
см
<U CQ
>>
х к с*
S
Я к
ж
я о
^
52 а>
CQ
й
сц
ь
О
со
О ) 00
см см
N
О
Ю
^
СО
СМ
^
О
см см см см см см см см
о ЛS
Л
РЗ
05
05
сх
а>
н
з:
S
ю
иО
lO
ю
см
1
1
со
г-Г
см
см
1
1
сОл
со"
см
Ю
LO Ю
сп оо" оГ со" ю"
о
со см
1 1
1 1
со СО
аГ 00
см см
СО ю
со см"
см см ся см см
1 1 1 I 1
1
1 1 1
со СО СО со С0Л
го"
со" см 1—Г
см см см см см
.те *нэчаэс!э1Т вхоэна
14
00
со
Распределение
количества стволов сосны по классам
X — диаметры деревьев, см
диаметра
и высоты
со
оо
00
см
*
1—Г
ю
о 4
см <М
1 1
I 1
со <о
о" <
тГ
см г—«
-
£
о
о
н
£
CQ
2
н
оо
3
со
<D
К
«о
(L
Г
Г)
X
Оц
35
с
SП
С
О)
£
*а>
С
Си
CJ
а>
00
с
X
>>
••
hQ
ч
о
сх
н
ж
НИ
о
СЮ
оо"
оо
Гч
Ik*
класса независимого признака находят суммы произведении
срединных значений классов зависимого признака на соот­
ветствующие им частоты, помещенные в корреляционной ре­
шетке (центральная часть табл. 6 , отграниченная жирными
линиями). Найденные по каждому разряду суммы произве­
дений (они вписаны во второй строке снизу) делят на,общее
количество частот класса.
Полученные в результате этого деления средние значения
зависимого признака по классам независимого, т. е. средние
эмпирические высоты, вписаны в третьей строке снизу.
Для проверки правильности вычисления этих средних
значений зависимого признака находят сумму произведений
их на численности по.даждому классу независимого призна­
ка. В рассматриваемом © табл. 8 примере: '22,2X4 —88 ,8 ;
24,0X7=168 и т. д! Совпадение общей суммы произведений,
найденной разными способами, свидетельствует о правиль­
ности вычисления. Небольшое расхождение, являющееся
следствием округления в расчетах, неизбежно. В нашем при­
мере оно оказалось равным 1 ,0 .
Практически такое расхождение допустимо. Если опреде­
лить среднюю высоту для всей совокупности стволов путем
деления суммы произведений средних высот классов на сумму
частот, она окажется равной 2560:94 = 27,21 м. Расхождение
со средней, найденной в таблице, составляет всего 0,01 м.
Средние значения частные и общее вычисляют с точностью
не менее точности, принятой при измерении отдельных зна­
чений признака. Обычно средние вычисляют с точностью на
один разряд (десятичный знак) выше.
Графическое изображение рядов и таблиц распределения
Составленные ряды и таблицы распределения изображают
графически. По каждому ряду строят гистограмму, много­
угольник распределения и графики накопленных частот: кумуляту и огиву (рис. 1 ).
Чтобы составить ряд накопленных частот, нужно к часто­
те первого класса rii прибавить частоту второго п2. Получим
накопленную частоту второго класса и т. д. Сущность графи­
ков и способ их построения легко уяснить из рисунка. По
данным измерений двух признаков строят точечную диаграм­
му распределения значений этих признаков.
Графики оформляют на миллиметровой бумаге стандарт­
ного формата. При этом длина вертикальной оси должна со­
ставлять примерно 0,6 длины горизонтальной оси. Тексты и
цифры на графиках должны быть четкими.
На основании построенных графиков дается краткое
предварительное заключение о хпрлктере распределения.
I
a
§ 20
30
20
10-\
\iO
l o 1= D
)6 20 & 28 32 36 AO
0
W 20 24 28 32 36 40
Д иам етры , ем
Д и ам етры , ом
/6 20 24 28 32 36 40
Д иам етры , см
Рис. 1.
а
гистограмма, б — многоугольник
численностей, в — кумулята
Г Л А В А
распределения
I II
ПОНЯТИЕ О СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЯХ.
РА С П РЕ Д Е Л Е Н И Я Ч И С Л Е Н Н О С Т Е Й
Средняя
арифметическая
Средняя арифметическая величина, или просто средняя,
является основным показателем среднего качества. Это центр
ряда распределения по обе стороны от которого, как от точ­
ки'равновесия, находятся варианты, отклоняющиеся на ту
или иную величину.
Средняя арифметическая получается от деления суммы от­
дельный вариант ряда на число их. Так, средняя ряда (обо­
значают ее М или х), состоящего из вариант Хь Хг, Хз..., Х п
равна
y-__ Х 1+ Х 2+ Х 3+... + Х п
где
.16
Х"
N
N — общее число наблюдений;
2 — знак суммирования.
SX
~N ’
Здесь и в последующем его применении без указания преде­
лов суммирования он означает, что должно быть произведе­
но суммирование всех измеренных (наблюденных) вариант
ряда от 1 до п.
Для ряда, разделенного на классы, т. е. для вариационно­
го ряда (понятие о нем дано ниже), среднюю арифметиче­
скую вычисляют как взвешенную.величину:
—
riiXi + П2Х 2+ П3Х 3 + ... +п ПХ П
х = -----------------------------------!tli + П2+ П3 -f*... -{-п п
2—НпХ)
.
N
В формуле (5): Х ь Х2, Х 3,...,ХП — классовые варианты
(срединные значения классов), Пь п2, п з ,...,п п — частоты
соответствующих классов; N — общее число вариант (объем
ряда) или общее число наблюдений N = nj -fn2-f п3+ ..., + п п= 2 п
При обработке большой статистической совокупности спо­
собом моментов среднюю арифметическую вычисляют по
формуле
х-М'4-кшь
(6 )
где
М' — условное начало отсчета отклонений или условная
средняя;
к — величина интервала;
mi — первый’начальный момент.*
Среднее квадратическое отклонение
Среднее квадратическое отклонение является мерой из­
менчивости (варьирования) признака. Оно показывает, на
какую величину в среднем отклоняются варианты ряда X от
средней арифметической х. Поскольку средняя величина яв­
ляется центром ряда, то алгебраическая сумма отклонений
вариант ряда от нее равна нулю (сумма положительных от­
клонений равна сумме отрицательных отклонений). Поэтому
в качестве меры изменчивости признака используют средний
квадрат отклонений, называемый дисперсией ряда или сред­
нее квадратическое отклонение, являющееся корнем квадрат­
ным из дисперсии. Обозначая отклонения отдельных вариант
ряда Х ь Х 2, Х 3,...,ХП от средней х соответственно через
хь х2, х3,..,х„ на основе данного определения можно напи­
сать:
4
5
х 12+ х 22+ х 3М-... + х п2
£х2
-------- N--------- = ~ Т Г '
(7)
*
Моментом называют среднюю величину отклонения вариант ряда от
средней величины (подробнее об этом сказано ниже).
17
m huic^udi генеральной совокупности обозначается а2. По
данным выборки находят s2, являющуюся оценкой су2. Для
вариационного ряда оценка дисперсии выразится равен­
ством:
n 1х j2~Ьп2х22+ ПзХз3 4-... +'п пх„
N
ь -------------------------------
( 8)
В уравнении (8 ) хь х2, х3, ...хп ь— отклонения классовых
вариант ряда (средних значений классов) от средней ариф­
метической; п{, п2, Пз, ...пп — частоты классов; N — общий
объем ряда.
При обработке ряда способом моментов оценку дисперсии
вычисляют по формуле:
где
s2= k2^ 2,
(9)
— второй центральный момент, т. е. средний квадрат
отклонения классовых вариант ряда от средней
арифметической величины, выраженный в долях
интервала к.
При обработке выборки с числом наблюдений N меньше
100 в качестве делителя в формулах (7) и ( 8 ) принимают
не N, а N'-1 , когда s используют для оценки а. Это число на­
зывают «числом степеней свободы». Такое название объяс­
няется тем, что в статистике при вычислении любых средних
величин используют число независимых величин. При вычис­
лении s одно из отклонений оказывается: несвободным. Оно
равно сумме всех остальных, взятых с обратным знаком.
В современной вариационной статистике в качестве меры
изменчивости признака чаще используют среднее квадратич­
ное отклонение или стандартное отклонение, являющееся кор­
нем квадратным из дисперсии (а2) или ее оценки: (s2).
Таким образом, общей формулой для нахождения s будет:
( 10)
При обработке вариационных рядов формула
вид:
принимает
(И )
я при вычислениях с использованием моментов
8 —к’|/ U2.
(12)
Особенно большое значение стандартное отклонение имеет
при исследовании так называемого нормального распределе­
ния. Это распределение вариант является результатом бес­
численного множества независимых между собой причин, вы­
зывающих отклонения у тех или иных вариант от среднего
значения. В результате действия этих причин наиболее час­
тыми будут варианты с небольшими отклонениями. Чем от­
клонения больше, тем варианты встречаются реже. Это легко
представить на примере рассмотрения роста, скажем взрос­
лых мужчин. Всего больше встретится индивидуумов, имею­
щих рост, близкий к среднему. Теорией статистики доказы­
вается, что в статистических совокупностях с нормальным
(или близким к нормальному) распределением вариант 68,3%
последних имеют значения, не превосходящие р,± сх и только
31,7% вариант по своей величине выходят за эти пределы.
Отсюда вероятность того, что любая взятая наугад варианта
ряда придется вне пределов
равна 0,317*.
За пределами ц±2о лежит всего 4,5%, а за пределами
|л±3 о — 0,3% общего числа вариант. Следовательно, веро­
ятность того, что взятая наугад варианта ряда окажется от­
клоняющейся от |л на величину, большую 2 а и 3 а,соответ­
ственно равна 0,045 и 0,003.
Более полные данные о вероятности р отклонения вариант
ряда за пределы jj,±d о (где d — доли сигмы) приведены
ниже:
Вероятность отклонения вариант за пределы }i±d о
Отклонения,
dа
Вероятность
отклонений,
Ш
Отклонения,
&о
Вероятность
отклонений,
Р
0,67 о
0,501
2,33 а
0,020
1,00 а
0,317
2,58 а
0,010
1,50 а
0,134
2,75 а
0,006
2,00 а
0,045
3,00 а
0,003
2,17 а
0,030
3,29 а
0,001
На основании этих данных можно понять толкование сред­
него квадратического отклонения и как меры средней ошибки
одного наблюдения (варианты). Оно дает возможность опре­
делять среднюю величину генеральной совокупности с опреде­
ленной надежностью или вероятностью по одной взятой
наугад варианте великообъемного ряда с приблизительно
нормальным распределением вариант. Можно выразиться,
например, так: каждая варианта ряда представляет собою
{г — средняя величина в генеральной совокупности.
19
приблизительно среднюю величину ряда, отклоняющуюся от
генеральной средней практически не дальше 2,58а. Вариан­
ту, отклоняющуюся от средней за пределы ±2,58 0 , прак­
тически с полной уверенностью можно отнести уже к другому
ряду, с другим |х, так как вероятность того, что она принад­
лежит еще к прежнему, известному нам ряду, составляет
меньше 0,01. Это означает, что, рассуждая таким образом,
мы можем ошибиться в среднем 1 раз на 100 случаев.
Коэффициент вариации
Коэффициент вариации, как и s или 0 , является показате­
лем изменчивости признака, выражая ее в относительных еди­
ницах. Он представляет собой среднее квадратическое от­
клонение отдельных вариант ряда от средней величины, вы­
раженное в процентах:
v = - iio o % .
(13)
X
Являясь показателем, не зависящим от принятых единиц
измерения вариант, коэффициент вариации может применять­
ся для сравнительной оценки величины варьирования раз­
личных признаков.
Показатель асимметрии и показатель эксцесса
Для больших выборок (N=100 и более) вычисляют еще
два статистических показателя, характеризующих распреде­
ление значений наблюдаемого признака (вариант).
Дело в том, что з одних случаях распределение вариант
является нормальным, которое описывается уравнением Гаус­
са-Лапласа.
В других случаях распределения отличаются от нормаль­
ного. Кривая распределения при этом может быть скошен­
ной. Она может быть также островершинной, или наоборот,
туповершинной.
Скошенность кривой называют асимметрией. В качестве
асимметрии принят средний куб отклонения:
< х 3> = —■Snx 3 = —
N
N
2 п(Х— х )3.
(14)
к }
В самом деле, если 2 пх = 0, то 2 п х 3==0 только в случае
строго симметричного распределения. Это можно показать на
следующем примере.
Пусть среди прочих отклонений имеется:
X} =?■■— 5 С ч и сл е н н ост ь ю
П\ —
6 и Х;> = 2 с П 2 = 1 5 .
X птх| = — 30; S п2х2= -Ь30. При нахождении среднего откло­
нения первой степени имела бы место компюпсация отклоне­
ний.
В то же время 2 niXj3 = — 750, 2 п2х23 = 4 -120 . Здесь компен­
сации нет. Величина < х 3> тем больше, чем сильнее асим­
метрия.
Знак величины < х 3> однозначно связан с направлением
асимметрии. При левой асимметрии, т. е., когда вершина кри­
вой сдвинута влево, а правая ветвь кривой растянутая — знак
положительный, при правой — отрицательный.
В качестве меры асимметрии принимают не < х 3> , а его
стандартизованное значение, т. е. выраженное в долях стан­
дартного отклонения для того, чтобы оно не зависело, от
единиц измерения признака. Эту меру называют показателем
асимметрии (в работах по математической статистике — ме­
рой косости).
Таким образом показатель асимметрии
Л < х 3>
А= —
(15)
А — 0 означает, что кривая симметрична, но еще не свидетель­
ствует о том, что ,она нормальна, т. е., что распределение опи­
сывается уравнением Гаусса.
Кривая распределения может иметь крутизну, отличную
от нормальной кривой. Она может быть крутой или пологой,
иногда двух или многовершинной.
В нормальном распределении только 3 варианты или еди­
ницы наблюдения из 1000 лежат вне пределов утроенного
стандартного отклонения в ту или другую сторону от средней
величины.
9
Если за эти пределы выходит большее число единиц сово­
купности, то такое явление, называемое эксцессом, сопро­
вождается большей крутостью кривой, т. е. большим скопле­
нием вариант около х, чем в нормальном распределении. П о­
лучаемая кривая — островершинна.
Если же значения признака (варианты) расположены в
более узких пределах, чем x±3s, то это явление называют де­
фектом. Кривая оказывается плосковершинной. В послед­
нее время у большинства специалистов по статистике принято
одно название отклонения величины крутости кривой •— экс­
цесс.
Ои положительный при островершинной кривой и отрица­
тельный — при шюсковершинной.
Показатель эксцесса обозначают буквой Е и вычисляют
по формуле:
(16)
где < х 4> —
N
или < х 4>
В дальнейшем для вычисления показателя асимметрии и
эксцесса будут указаны более удобные формулы.
ГЛАВА
IV
С П О С О Б Ы В Ы Ч И С Л Е Н И Я СТАТИСТИЧЕСКИХ
ПОКАЗАТЕЛЕЙ РА С П Р Е Д Е Л Е Н И Я Ч И С Л Е Н Н О С Т Е Й
В зависимости от объема выборки и имеющихся счетных
приборов можно применить один из следующих способов ее
обработки: способ непосредственных вычислений, способ ус­
ловного начала, способ произведений и способ сумм. Первые
два способа применяют обычно при обработке малых выбо­
рок, с числом единиц наблюдения до 25— 30. Современная
вычислительная техника позволяет эти способы применять и
при большем числе единиц.
Способ
непосредственных вычислений
Сущность способа состоит в том, что данные наблюдений
относительно какого-либо признака подвергают матшахшщской обработке и анализу непосредственно без их группиров­
ки и составления вариационного ряда.
Пример вычисления статистических показателей этим спо­
собом приведен в табл. 7. В первом столбце таблицы вписа­
ны значения наблюдаемого признака (пусть это будут значе­
ния длины стволиков сеянцев сосны). В столбце втором впи­
саны отклонения отдельных значений от их средней арифме­
тической величины (х = Х — х). Эти отклонения называют
центральными, поскольку средняя арифметическая величина
является центром ряда. В столбце третьем вписаны квадраты
отклонений. В последнем столбце приведен расчет основных
статистическах показателей.
22
Таблица V
Вычисление статистических показателей способом непосредственных
вычислений
Длина,.
см
X
X
5
—0,5
0,25
6
+0,5
0,25
5
— 0,5
0,25
7
+ 1,5
2,25
4
- 1 ,5
2,25
6
+0,5
0,25
5
—0,5
0,25
4
- 1 ,5
2,25
7
+ 1,5
2,25
6
+0,5
0,25
55
- 4 ,5
+ 4,5
0
10,50
Формулы и вычисления
X2
_
IX
X —
N
--
55
10
8 = 1 / 2х2=
Г N— 1
= 5,5 см,
I/
V
Ю-5 10— 1
| / 10’5 - 1,08 ш ,
V V
s
1,08
V = — 10»= ;
100 = 19,6%.
х
Способ условного начала
*
Сущность способа также состоит в расчете, статистических
показателей для иепреобразованного эмпирического ряда.
В целях упрощения расчетов при вычислении средней ве­
личины х и среднего квадратического отклонения s использу­
ют условное начало отклонений вариант. Обозначим его бук­
вой М'.
По определению, данному выше, средняя арифметическая
величина является таким числом, алгебраическая сумма от­
клонений отдельных вариант от которого равна нулю (2 х —0 ).
Справедливость этого определения подтверждена данными
табл. 7. Опираясь на это, можно сказать, что любое условное
начало отсчета отклонений вариант будет отстоять от средней
арифметической величины х на величину среднего отклонения
вариант. Следовательно, ^ нахождение х через принятое ус­
ловное начало М', сводится к нахождению средней ве­
личины отклонения отдельных вариант от избранного начала.
Обозначив отклонения отдельных вариант X от условного
начала М' через х с , можно написать: х с = Х — W . Среднее же
отклонение вариант от условного начала (обозначим его с)
равно сумме всех отклонений, поделенных па число их, или,
что то же самое, на число наблюдений N, т. е.
По данному выше определению
х= М Ч с.
(18)
Для нахождения среднего квадратического отклонения
(s), как видно из вышеприведенных формул и расчета в
табл. 7, необходимо найти сумму квадратов отклонений вари­
ант от средней арифметической величины 2 х 2~ 2 (Х— х )2, т. е
сумму квадратов центральных отклонений.
Ее определяют по формуле:
E x 2= S x 2c-
^
.
(19)
Вычисление средней арифметической величины и средне­
го квадратического отклонения для вышерассмотренной ма­
лой выборочной совокупности из 10 длин сеянцев сосны при­
ведено в табл. 8 .
Таблица 8
Вычисление статистических показателей способом условного начала
Длина,
см
X
Формулы и вычисления
ХС
Хс2
5
0
0
6
+1
1
5
0
0
Проверка:
7
+2
4
2 х с = Я X— N M '= 5 5 — 10X 5= 5
6
+1
1
4
—1
1
5
0
4
—1
0
1
х = М .'+ с= 5 + 0,5=5,5 см
7
+2
4
б
+1
1
£х3
, Л 52
L х2= 2 xS! с— — гг = 1 3 — -- = 10,5
N
Ю
2 55
+7
13
Примем М '= 5 (можно любую
варианту)
£хс
5
с = - х - Го = 0 ’°
си
—2
+5
Остальные, статистические показатели s, V вычисляют
по формулам, приведенным в табл. 7.
Поскольку х и 2 х2 оказались такими же, как и при спо­
собе непосредственных вычислений, результат расчета полу­
чим тот же:
s = 1,08 см; V== 19,6%.
24
Способ
произведений
Вычисление статистических показателей способом произ­
ведений можно производить, непосредственно применяя ф ор­
мулы (2), (4), используя данные составленные рядов распре­
деления. Однако вычисления оказываются весьма громозд­
кими и трудными даже при наличии малых вычислительных
машин. Для облегчения вычислительной работы прибегают
к кодированию вариант и отклонений. Вычисляют вначале от­
клонения (разных степеней) или моменты ряда, а затем с их
посредством н статистические показатели, как это было сде­
лано в способе условного начала.
Понятие о моментах ряда распределения. Моментом на­
зывают среднее отклонение классовых вариант от средней
величины или от любого выбранного числа. Моменты назы­
вают начальными, если их вычисляют от условного нача­
ла М', и центральными, если вычисляют от средней ряда х.
Начальные моменты обозначают буквой m с индексами, ука­
зывающими на порядок момента или на степень отклонения:
то, — нулевой, mi — первый, тг — второй, гпз — третий и
т 4 — четвертый начальные моменты, что означает соответ­
ственно: среднее отклонение нулевой, первой степени, сред­
ний квадрат, средний куб отклонений и т. д. Причем, mo— 1,
так как все отклонения в нулевой степени равны единице, и
следовательно, сумма произведений их на частоты равна об­
щему числу частот.
Центральные моменты обозначают буквой ,и с теми же
индексами: цо, р,ь М
-2» М-з, и*, и т-Д* — соответственно нуле­
вой, первый, второй, третий и четвертый центральны:: гтоменты. Причем, |х0= 1 ; jxi = 0 , легко проверить, пользуясь дан­
ным понятием моментов.
Вычисление начальных моментов. Техника и формулы рас­
чета начальных моментов по способу произведений видны из
табл. 9.
В 1-м столбце таблицы вписаны классовые варианты ис­
следуемого признака X, а в о 2 jm— соответствующие « ч а с т о ­
ты п. Эти два столбца цифр представляют собою исследуемый
вариационный ряд. В 3-м столбце вписывают условные откло­
нения классовых вариант от условной средней М'.- В исследу­
емом ряду распределениям' приняты равными 32 см. Эти от­
клонения находят по формуле
X— М '
где
к — величина
к = 4 см.
интервала.
В
рассматриваемом
ряду
25
Для центрального класса условное отклонение равно ну*
лю, так как значение варианты X и условного начала М 7 здесь
одинаковы. Начиная расчет отклонений от центрального
класса, получим для классов, находящихся в стороне значе­
ний вариант меньших М', натуральный ряд чисел со зна­
ком минус (— 1 , — 2 , — 3, — 4 и т. д.), а для классов, находя­
щихся в стороне значений, вариант больших М ' — со зна­
ком плюс ( + 1, +2, +3, +4 и т. д.).
В столбцы 4— 7 вписывают произведения найденных от­
клонений в первой, второй, третьей и четвертой степенях на
частоты. Эти произведения рекомендуется находить после­
довательно по строкам, умножая в каждой из них число пре­
дыдущего столбца на одно и то же число, т. е. на отклоне­
ние хк. Благодаря этому создаются условия для проверки
чисел, помещенных в столбцах 4— 7.
Таблица 9
Вычисление начальных моментов по способу произведений
для ряда распределения диаметров стволов сосны
п
2
ПХк-’
ПХк
*к
3 .*
4Г
’
*5,
6
*
ПХк'1
(Х к + 0
7
8
9
16
4
—4
— 16
64
— 256
1024
—3
324
20
7
—3
— 21
63
— 189
567
—2
112
24
8
-г2
— 16
32
— 64
128
1
8
28
28
-1
--28
28
— 28
28
0
0
20
0
0
0
0
0
+1
20
36
18
18
18
18
18
+2
288
40
9
+1
+2
. 18
36
72
144
+3
241
— 537
1909
;--
м := з 2
V
94
ш1=
ш2=
....
—
— 81
+36
+
■ 90
— 45
— 447
—45
94 ——0,479,
241
94
—2,564,
Ша=
94
т 4*~
—
1481
729
1481
=15,755
ш0= 1,000
4mi = — 1,916
— 447
6гп2—15,384
= ~ 4'755-
1909
ш4_ — - =20,309.
94
* См. формулу 22.
26
11хкз
П(Хк+1)4
табл. 4
приложе­
ния
4 т 3—— 19,020
т 4= 20,309
15,757
Проверка состоит в сравнении помещенных в графе 7
произведений (пхк4) со значениями их, указанными в табл. 4
приложения. После сделанной проверки вычислений находят
алгебраические суммы чисел каждого столбца, по которым
находят затем начальные моменты. Вычисление моментов
рекомендуется производить с точностью до 0,001. Проверку
правильности вычисления начальных моментов производят
по формуле:
m 4* = mo+ 4 mi-f 6 m 2-Hm3-f т 4,
( 21 )
где
т
*4 — четвертый начальный момент относительно
вого начала отсчета
один разряд выше.
m V=
отклонений,
N
но­
сдвинутого на
t
,
(22)
где
(хк + 1) — условные отклонения классовых вариант относи­
тельно нового
начала (условной средней). В
табл. 9 эта новая условная средняя равна 28 см.
Отклонения от нового начала практически получают, уве­
личивая на единицу отклонения (хк), вписанные в столб­
це 3. Значения произведений этих отклонений, взятых в чет­
вертой степени (столбец 8 ), на частоты (взятые из столбца 2 )
выписывают из табл. 4 приложения.
Данные проверки начальных моментов рекомендуется при­
вести в нижней части расчетной таблицы, оправа.
Вычисление центральных и основных моментов
Центральные моменты вычисляют по формулам:
1*0*1, [XI = 0, jbi2= гп2— m i2;
(23)
fjL3 = m 3— 3m2m {-f 2 т i3;
(24)
jbi4==m4— 4тзШ1 + 6 т 2т 12— Зш!4.
(25)
Для проверки центральных моментов ряда распределе­
ния применяют формулы:
fi,3 = m 3— 3[x2mi— m i3;
jLi4= m 4— 4(n3m i— 6 jA2m i 2— mi4.
(26)
(27)
* Равенство 21 получается из 22 путем разложения бинома (хи Ч I) 4
S п
по формуле Ньютона и умножения каждого из полученных членов на —
Формулы 26 и 27 получены из 24 и 25 путем подстановки
в последние
вместо начальных моментов ш2 и ш3 их значений, полученных из ф ор­
мул 23 и 24.
Из основных моментов, необходимых для вычисления ста­
тистик распределения, находят третий (гз) и четвертый (г4)
моменты по формулам:
г3= — 3— • (28)
Г., =
(s')3 ’ 1 '
(s')4
где
s' — основное отклонение в долях интервала.
s '- Vw-
(29)
(30)
Центральные моменты для ряда диаметров сосны:
Цо=1>
^ 1=
0,
М2 = т 2— т , 2= 2,564— (— 0,479)2= 2,5(54— 0,229=2,335,
fi3 —Шз— ЗШ2 Ш1 ~Ь2mi3 = — 4,755— 3*2,564* (—0,479) -f*
+ 2 •(— 0,479)3= - 4,755+3,685— 0,220= — 1,290,
И4 = т 4—4тзШ1 + 6 Ш2 Ш12— 3mi4 = 20,309— 4 (— 4,755)
(— 0,479)+6*2,564* (— 0,479)2— 3 (>— 0,479)4=
= 20,309— 9,111 + 3,523— 0,156 = 14,565.
Проверка:
у-з — т 3 — ЗцгГП!— m ( 3 = — 4,755— 3 -2,335(— 0,479) —
— (— 0,479)3= — 4,755 + 3,355 + 0,110 = — 1,290.
щ = т 4— 4 ц,3гп1— 6 ц2П112— :Ш14=
= 20,309— 4 (— 1,290) (— 0,479) — 6 •2,335 (— 0,479)2—
— (— 0,479)4='20,309— 2,472— 3,214— 0,052 = 14,571.
При подстановке значений параметров в формулы четвер­
того центрального момента щ целесообразно использовать
уже найденные при проверке начальных моментов произве­
дения 4ш3, 6 ш2 (в основную формулу) и 4тП] (в проверочную
формулу).
Эти произведения использованы ниже при вычислении щ
для ряда высот.
Основные моменты для ряда диаметров:
Г3=
(s')3
U
28
2 . = n il? ? ® - —— 0,362;
1,528s
3,568
щ
14,565
( s ') 4
Т.5284
= 14,565 __2
5,452
"" ’
2
Вычисление статистических показателей
(д л я вы б о р к и
диаметров)
х = ММ- km, -32 + 4 (— 0,479) - 32— 1,916- 30,1 см;
s ' = / | i 2=
1/2,335= 1,528; s = k-s' = 4-1,528=6,11 см;
V =
Iх
А
=
100 % =
6’’ —
(31)
100 = 20,3 % ;
30,11
(s' ) 3
1,528s
= — 0,362;
(32)
(3 3 )
' '
Е = —— -- 3 = ^ — — 3=-0,328.
(s' ) 4
1,5224
Моменты и выборочные статистические показатели
ряда высот сосны. (Исходные данные табл. 5).
для
Начальные моменты (найдены по схеме табл. 9):
mi = 0,223;
m 2= 4,925;
m 3 = —9,734;
m4-90,457.
Центральные моменты (по формулам 23— 25):
^ 0= 1 ;
И1 = 0; ц2= 4,876; ц3 = — 13,007;
Выборочные статистические характеристики
лам 6 , 31, 13, 32, 33)
100,611,
(по форму­
х = 27 + 1Х 0 .2 2 3 ^ 27,22«27,2 м;
S '= 1/4376 = 2,21,
S = 1X2,21 =2,21 м;
V = [ (2,21) 27,2] X 100 % =
8 ,1 %;
А = — 13,007/2,213 = — 1,205;
Е = 100,611/2,214— 3 = 1,218.
'ЭЙ
к
.
ГЛАВА
V
О ШИ Б КИ В Ы Б О Р О Ч Н Ы Х Н А БЛ Ю Д ЕН И Й
ОЦЕНКИ ПАРАМ ЕТРОВ
Понятие о параметрах и методе их оценки
Статистические показатели выборки являются ее числен­
ными характеристиками. Главное назначение их, однако, со­
стоит в том, что они являются оценками статистических по­
казателей генеральной совокупности, которые называют па­
раметрами.
Сущность методов оценки параметров можно уяснить на
экспериментальной основе. Для этого необходимо рассмо­
треть распределения выборочных показателей, полученные
для одной и той же нормальной совокупности. Наибольший
интерес представляет распределение выборочных средних.
Если бы совокупность значений высот (табл. 1 текста или
табл. 1 приложения) была большой, например, в несколько
тысяч единиц (фактически мы имеем здесь выборку болькюго
размера), из нее можно было бы построить много выборок
малого размера, например, по 10 единиц_в каждой. Если най­
ти средние для каждой такой выборки хь хг, хз, ...хи, полу­
чим распределение х. Это распределение оказывается нор­
мальным даже в том случае, когда исходная совокупность не
является нормальной, что позволяет применять излагаемые
ниже методы и критерии оценки параметров без выяснения
точной формы распределения.
Вторая особенность состоит в том, что размах средних
будет приблизительно в 3 раза меньше размаха в исходной
совокупности. Следовательно, любая выборочная средняя
является более надежной оценкой средней в совокупности,
чем отдельная случайная варианта.
Третья особенность относится к самой средней величине
этого распределения. Она может быть получена путем сумми­
рования выборочных средних и деления результата на чис­
ло их. Полученная средняя является наиболее надежной
оценкой средней величины генеральной совокупности. Для
9 выборочных средних табл. 10 средняя х = 27,22.
В табл. 10 приведены значения средних и стандартных от­
клонений для 9 выборок высот сосны. Выборки взяты из
табл. 1 . Первая выборка включает деревья под номером
1— 10 ; вторая с 11 по 20 и т. д. Такой отбор считали возмож^
НЬШ, исходя из представления о случайном составе .выборки
94 значений высот, приведенных в табл. 1.
30
Таблица 10
Оценки среднего значения и стандартного отклонения
по результатам 9 выборок из табл. I
Статистиче­
ский пока­
затель вы­
борки
Номер выборки
2
1
3
4
5
6
8
7
9
В среднем
для
9 выборок
х
26,9
26,9
27,1
27,6
27,2
27,5
27,2 27,0
27,6
27,22
S
1,94
2,55 2,90
1,54
2,38
1,62
1,53 2,85
1,58
2,10
Каждая из 9 выборочных средних является оценкой средней
величины в совокупности, из которой взяты выборки. В на­
шем случае мы имеем выборочную совокупность, подлежа­
щую здесь рассмотрению. Назовем ее большой выборочной
совокупностью (N = 94). Средняя для нее х = 27,22. Средние
квадратичные отклонения
выборки являются оценками
s —2 ,21 , средняя из девяти s = 2,10. Она является наиболее
надежной оценкой s = 2 ,2 1 .
Средняя ошибка выборочной средней величины
При рассмотрении среднего квадратического отклонения
отмечалось, что его можно рассматривать как меру ошибки
выборочной средней, получаемую по одной, случайно взятой
варианте ряда.
Аналогично этому в распределении выборочных сред­
них хь х2, ... х п среднее отклонение их от средней величи­
ны в генеральной совокупности ц можно рассматривать как
ошибку выборочной средней величины, но установленную на
основе N' наблюдений.
Ошибку выборочной средней называют средней ошибкой
средней величины признака. Обозначают ее буквой s x или ш.
Так как средняя величина вычисляется из некоторого
числа вариант, средний квадрат ошибки ее меньше среднего
квадрата отклонения отдельных вариант от средней в N раз,
т. е.
sN
(38)
или
SX —
S
УШ '
(38а)
Выражается s x в тех же единицах, что и отдельные вариан­
ты. Приведенные в табл. 10 9 выборочных средних имеют
следующие отклонения от средней величины в исследуемой
большой выборке с N‘=94, равной 27,22 м: — 0,32* — 0 3?'
—0,12; +0,38; - 0 ,02 ; +0,28; - 0 ,02 ; - 0 ,22 ; +0,38.
31
Эти отклонения можно рассматривать как ошибки соот
ветствующих 9 выборочных средних величин. Среднее квад­
ратическое отклонение, найденное путем возведения каждого
из 9 отклонений в квадрат и деления суммы квадратов на
(9— 1 ), равно 0,28.
В практике исследований значение р, неизвестно. Поэтому
ошибку средней всегда находят по формуле (38). Принято
записывать значение выборочной средней вместе с ее ошиб­
кой, т. е. x ± s х .
\/ Показатель точности опыта
Сравнение средней с величиной ее ошибки дает известное
представление о точности в определении х.
Удобнее, однако, оценить точность выборочной средней,
выразив ее ошибку в относительных единицах, например,
в %. Это отклонение в опытном деле называют «показателем
точности опыта» и обозначают Р
P = s^ 1 0 0 % .
(39)
X
Опыт считают достаточно точным, когда Р не превышает 5%.
Средние ошибки других выборочных статистических
показателей
Другие выборочные показатели s, V, А, Е также содержат
в себе ошибки, имеющие тот же смысл, что и Sx т. е. пред­
ставляющие собой среднюю разность между показателем в
выборке и совокупности. Для вычисления ошибок применяют
формулы:
se -=
(40)
1/2N ’
7
Г
SA =
у
6 .
N ’
я
/
(42)
°
' 5 +
( ш
) ’ :
se= 2 sa.
<4,)
(43)
Критерий t
Из (38) видно, что .величина Sx зависит от степени измен­
чивости признака, выражаемой средним квадратам s2, и от
числа наблюдений в выборке.
Выборочная средняя тем точнее, т. е. тем меньше будет
отличаться от генеральной средней, чем больше объем вы­
борки N
Гоосет (псевдоним Стьюдент) для различных N, точнее
N— 1, рассчитал значения отклонений выборочных средних
от генеральной средней величины. Выборки были взяты из
одной генеральной совокупности и потому отклонения яви­
лись исключительно следствием случайных причин.
Отнесенные к величине средней ошибки отклонения выбо­
рочных средних от средней в генеральной совокупности по­
лучили следующее выражение:
t = х ~~^
'
(44)
Sx
Логически нетрудно представить, что вследствие случай­
ных причин отклонения выборочных средних будут иметь раз­
ную направленность или алгебраический знак. Одна часть х
по своему размеру больше средней величины совокупности |м,
другая меньше ее. Большие отклЪнения встречаются редко,
тем реже, чем они больше. Вследствие этого все значения t,
установленные по выборкам, варьируют около значения, рав­
ного нулю и являющегося центром распределения t.
Данные табл. 10 подтверждают эти положения. Снедекор* вышеописанным 'методом получил 511 значений t для
выборок в 10 единиц по привесу животных. ~Оказалось, что
только 10 % всех значении t имели уровень, превышающий
1,83, 5% значений превысили 2,26 и лишь 1 % превысил зна­
чение! =3,25. '
Такими пограничными уровнями t можно пользоваться
как предельными (критическими) значениями, которые с оп­
ределенной вероятностью могут быть следствием случайных
причин. В опыте Снедекора о вероятности приходится судить
по частости события, т. е. превышения указанных значений t.
Подчеркнем, что значение t = 3,25 и более при числе сте­
пеней свободы, равном 9 ( —-$Г— 1 ), практически встречается
так редко, что событие является крайне маловероятным.
В-приложении 6 приведены критические значения t для
различного числа степеней свободы и для трех стандартных
уровней вероятности Р = 0,95; Р = 0,99 и Р = 0,999.
Если найденное в каком-либо опыте t превзойдет по ве­
личине табличное значение, то его нельзя уже объяснить
Nслучайными причинами.
Оценки
параметров
Интервальная оценка. С помощью критерия t и значения
выборочного статистического показателя и его средней ошиб­
ки можно дать оценку соответствующего параметра с опреде­
ленной вероятностью, например Р = 0,95.
*
Дж. У. Снедекор. Статистические методы в применении к исследов
ниям в сельском хозяйстве и биологии. Изд. с.-х. литературы, М., 1961.
v
33
Если указать для' средней в генеральной совокупности \х
интервал x± t0,05-Sx, то с вероятностью в 0,95 можно утверж­
дать, что этот интервал покроет (ы. Имеется только 1 шанс
из 20 , не благоприятствующий осуществлению этого утверж­
дения, Интервал
x + t s r < X x+tsx
(45)
называют доверительным интервалом. Степень доверия зави­
сит от уровня значимости t (5%-ный, 1%-ный и т. д.), кото­
рый указывают в индексе.
Оценка значимости
Значимость средней. Во многих опытах целесообразно оце­
нить параметр путем проверки некоторой статистической ги­
потезы в отношении его размера. Наиболее часто проверяет­
ся предположение, что полученная выборочная средняя х не­
значимо отличается от гипотетической (теоретически установ­
ленной) или вообще известной величины средней в генераль­
ной совокупности р,. Выдвигается гипотеза Но, что истинная
разность равна нулю. В таком виде гипотеза часто называет­
ся нулевой.
Проверка гипотезы состоит в выяснении совместимости
наблюденных данных с этой гипотезой. Применяют критерий
t = :£— L , см. (44).
sr
Если (л положить равным нулю, то
t = -4- •
Sx
(46)
й Формула (46) может быть обобщена в том отношении,
что она применима для оценки значимости любого статисти­
ческого показателя Т, к которому нулевая гипотеза разумна.
В этом обобщенном виде формула
применена ниже для оценки ряда статистических показа­
телей.
Критерий t обычно называют критерием значимости (или
существенности).
При t < t j (где t} — критическое значение этого крите­
рия, взятое из таблиц для уровня значимости в 5% или
в 1 %) опытные данные совместимы с гипотезой. Но под­
тверждается. При t > t b т. с. t0,ot или t0,os они несовместимы.
Но отвергается.
Значимость разности между
средними.
Еще более
часто в статистических исследованиях встречается проблема,
связанная с определением, были ли взяты две выборки из од­
ной совокупности или из разных совокупностей. Иначе: зна­
чимо ли различие между выборочными средними Х] и х2?
Критерий t, дающий решение, принимает выражение
t =
,
(48)
где
s2xt — средний квадрат стандартной ошибки выборочной
"г:,
средней Хь Он равен частному от величины квад­
рата стандартного отклонения, выборки s }2 на/чисs ^
ло наблюдений N b т. е. s2 x,:- — ;
.N.1
,
s2x. — средний ^вадрат стандартной ошибки выборочной
средней х 2 (формула 48 верна при
Просматривая выборочные средние в табл. 10 видим, что
что средняя первой выборки Xi = 26,9 м, а девятой (обозначим
ее х2)= 27,6 м. Различие, возможно, связано с разными усло­
виями р<&ста, например, почвой. Является ли это различие на­
столько значительным, что мы должны считать выборки взя­
тыми из разных совокупностей, или оно вполне объяснимо
случайным варьированием.
Соответствующая такой постановке вопроса нулевая гипо­
теза состоит в том, что различие незначимо, что обе выборки
взяты из одной совокупности. H 0:xi = x2 обращаясь к дан­
ным табл. 10 , находим
s2x, =
1
= 0,250;
10
+_
27,6— 26,9
t — - . ,
V 0 , 250+0,376
s 't =
'
1 Q42
- 0,376;
10
0,7
01
..... ■
=• —0,9 < t0,05—2,1.
V 0,626
Число степеней свободы при установлении критического зна­
чения из табл. 6 приложений v —*2 (N’— 1 ) —2(10— 1 ) = 18.
Таким образом Но не отвергается даже на 5%-ном уровне
значимости. Выборки относятся к одной совокупности.
35
Значимость
различия между
стандартными
отклонениями
Значимость различия между стандартными отклонениями
оценивают с помощью
* =
Т
Й %
V 7S -s,4~S
- где
sS| и Ss., — ошибки стандартного отклонения,
по формуле 40.
<4 9 >
определяемые
Оценим значимость различия между наиболее контраст
ными стандартными отклонениями, приведенными в табл. 10
s ,= 1,53 и s2 = 2,90;
ss,-= - р = = = =0,34; s 4=
1,53— 2,90
t — ■ -- - = — 1 ,9< 1о,о5 =
Y 0,342 + 0,652
=0,65;
01 п
2,1 . Различие незначимо.
Определение объема выборки
При планировании опыта приходится решат!» вопрос о чис­
ле наблюдений или объеме выборки, достаточном для полу­
чения оценки средней величины или другого статистического
показателя с определенной точностью.
Этот вопрос решают на основе формулы (38), преобразуя
которую, получим:
ч•>
-
N =
.
(g o )
Формула указывает число наблюдений для уровня значимо­
сти средней в 0,32. Такой уровень редко признается доста­
точным. Обычно принимают уровень значимости в 0,05 или
0,01. В формулу вводят соответствующее этому уровню значе­
ние t(to,05 ИЛИ t0,0l).
Тогда
t 2S 2
N - ~ .
ь X
где
s
(51)
— среднее квадратичное отклонение определяют по
данным прежних исследований или на основе проб­
ной выборки;
s r --- ошибка средней, планируемая в данном опыте,
11
I
O •
X
по
Таблица
00
ш
o'
II
о
о
н
CM
со
Ч
сч
Си
со
со
см
о
fct
ьCN
II
т
Он
S
JS
О
со
o'
II
rf
cn
X
Cvi
11
1-^
CN IC5 CN
<M
1
I
i
X
СЛ
11
1
1
-VO
CO
СО
ю
of
\
СО
CO
lo> Ю
CM
oo
o'
1
1
II
1
1>
CO
CO
Г-Ь
04 *-»
CN
00
w”
О
00
о
\
H
о *\
L?V
il
•#
СО
04 of
uJ
L
O
о
О
о* о о •
<о <з о
(Л
я
СО
о*-
о о
*3 *3
.- с00г>
СО
С
М —1
н оН
О
г— I
CN
н
и
о
со смГ*
о
о
Оценки параметров совокупности диаметров и высот сосны
1. Ошибки выборочных статистических показателей
СО
счГ
+1 +1 +1
<М
ю
о
С1
т
гС СМ
<=4 ОО
-1
Л
of
гг*.
о
1C GO
С4) ^ iо
~I Л
о"
— •Iо
UJ
>
о~~
со
2 1C
з:
со
СГ К
S 3
Ч сх
Н а>
О СЙ
О
~
:г
СО СО
Д
СП Ж
W Я
Он
а>
< 2!
СО о
о со
II
-О
сГ"
О
о
X
II
CL
CO
CQ
О
11
с S
ш£
о
Qu С2
о
?—ч
ю
н
Ю
'Ф
О
II
о
н
S3 с°о
соЛ
I4Y—H
S
2 к
н
о
VO
О
ю
1 10
о
Т4
V
Гч
"Т.
о г% о
CN cvf
▼—H t
t— #(4 I2
\cn о
CO
II
1i
11
11
СЛ 1 2
!l
1X
сх
н
а> к
Йк
«j a
Си <и
<я п
о #ч сог*
h- со
о oi
и о
Р<
S
о
К
^ С->
3
о?
t=c
CU
н
о
Л
S
СО
t=f
X
о w
О
О
1х
?||
ел
>>
<i> с;
к
>>
о ''
1Л
«
О
(X
н
ф
Ж
to
S3
♦
а
CN! ю н
<
CNJ
1
C
о
со
fc
t
W
сх
к
*=2
11
</.J
-н +1
*—■<
1— 4
СО
•V)
vto
>
о
«Я
СЧ
<М
СО
о
II о
СО
ю
о
V
Р
со
^ CQ
^ sx
CU
<£>\
oV « tR
C(1ffi
>*
<v H
со ОО
жо
сл
CO
ю со
ИЧ Os
0
3
<i; о
о
2
O
2 C
tr
+1 tl С 1 V3)
с/>
!!!i
!>
OJ I! Г
bЛ
J CO IHr*
Г0
О
Г Л А В А VI
ВЫ РАВНИВАНИЕ
РЯ Д О В
РА С П РЕ Д Е Л Е Н И Я
Выравнивание рядов по уравнению нормального
распределения
При условии, когда вычисленные показатели достоверно­
сти t A и t е меньше , приведенных в та(бл, 6 приложения, те.,
когда отклонение от нормального распределения незначимо,
выравнивание ряда производят по формуле Гаусса-Лапласа.
Формула эта или, как часто называют, уравнение кривой
нормального распределения имеет вид:
kN_e_r>
n^ T
(52)
V 2i
где
п
N'
к
s
—
—
—
—
теоретические частоты классов ряда;
общая численность вариант ряда;
величина интервала;
оценка среднего квадратичного отклонения (в име­
нованных единицах);
я — 3,1416;
-р= =0,39894;
У2ж
е — основание натуральных логарифмов; е = 2,71828;
х — нормирование, т. е. выраженные в долях s отклоне­
ния классовых вариант X от средней х
Х-х
(53)
При вычислении статистик с помощью моментов нормаль­
ное отклонение получают путем деления разницы между ус­
ловными отклонениями х к и первым начальным условным
моментом на основное неименованное отклонение
s '- y ^ T . е .т = - ^ ^ - Из формулы Гаусса-Лапласа можно видеть, что
значение п приобретает для
модального класса,
(54)
наибольшее
где то = 0 .
Теоретическая частота в этом классе
kN
n0- — • 0,39894е° ^
s
оо
0 4 kN'
Z*JZEL
.
s
(55)
Эту частоту следует вычислить. При построении теорети­
ческой кривой распределения значения этой максимальной
ординаты откладывают в середине модального класса, т. е.:
из точки х. Иными словами, отрезок оси абсцисс принимают
гг
о
kN
равным средней величине ряда. Первый множитель — в
s
формуле кривой нормального распределения обусловлен по­
казателями изучаемой совокупности.
При вычислении показателей, с помощью моментов мно­
житель этот упрощается. Именованное основное отклонение s
заменяется произведением величины класса к на основное
неименованное отклонение s '= V 1^2-Получим:
kN__ kN
-• *
s
ks'
N
•
s'
Второй множитель в формуле (52) является функцией
нормированного отклонения. Он обозначается символом f(t)
и соответственно называется функцией нормированного отт2
клонения. Значения f (т) = 0,39894 е
лежо рассчитать, пред­
варительно прологарифмировав функцию. Но эти значения
можно получить и в готовом виде. В настоящем пособии зна­
чения f(t) приведены в табл. 5 приложения.
Таким образом, уравнение кривой нормального распреде­
ления можно записать в следующем рабочем виде:
*•
'
kN
n = — f(x);
s
(56)
или
П = ^-f(x).
S
.
(56а)
Р.асчеты теоретическиос частот применительно к последней
формуле приведены в табл. 12.
В 1-й столбец таблицы вписаны классовые варианты
ряда X, во 2-й — фактические (экспериментальные ) числен­
ности ряда п. В 3-й столбец записаны условные отклоне­
ния вариант ряда X от условной средней М', выраженные
*
запив единицах интервала к, хк ----- 1 , в 4-ио столбец
к
саны значения разностей между условными отклонениями х
ж первым начальным моментом ряда т ь а в 5-й — частное
от этих разностей «на основное отклонение неименованное s'.
х
~
м
^
it
Рис. 2. Кривые распределения численностей:
(эмпирическая — сплошная ломаная; выравнен­
ная по уравнению Гаусса — сплошная плавная;
пыравнеиная по уравнению типа А — пунктирная)
Таблица 12
Вычисление частот кривой нормального распределения
^
11
Хк
Xk-m,
2
3
4
12
16
20
24
28
32
36
40
44
48
0
4
7
8
28
20
18
о
0
0
—5
—4
—3
—2
—1
0
+1
-1-2
+3
+4
2
94
— 4,521
— 3,521
— 2,521
— 1,521
—0,521
+ 0,479
+1,479
+ 2,479
+ 3,479
+4,479
х к— mt
s'
5
—2,959
— 2,304
— 1,650
— 0,995
—0,341
+ 0,313
+0,968
+ 1,623
+ 2,277
+ 2,931
f (X)
(из табл. 5
приложе­
ния)
"= ■ % )
S
6
7
0,00500
0,02807
0,10226
0,24318
0,37641
0,37987
0,24971
0,10689
0,02986
0,00544
0,3
1,7
6,3
15,0
23,2*
23,4
15,4
6,6
1,8
0,3
1,52669
94,0
В 6-й столбец вписаны значения функции нормирован­
ного отклонения из табл. 5 приложения. Поскольку в таблице
указаны значения функций для аргументов т с двумя знача­
щими цифрами после запятой, учет третьего знака приходится
производить интерполированием двух соседних значений функ­
ции.
.40
В 7-й столбец вписывают знамения теоретических ча­
стот, получаемых по формуле (57).
В ряду распределения диаметров сосны N = 94, 8'='|/ц.2=
= 1,528 см,
— =94:1,528 = 61,518.
s'
Правильность расчета теоретических частот ряда проверя­
ют сравнением общей их суммы с суммой фактических ча­
стот. Допустимо лишь небольшое расхождение, неизбежное
вследствие округления значений нормированных отклонений
при пользовании таблицей, а также вследствие округлений
при pac4efax. Результаты выравнивания по уравнению Гаус­
са-Лапласа показаны на рис. 2.
Выравнивание рядов по уравнению кривой распределения
типа А
Выравнивание рядов по уравнению кривой типа А (Шарлье) производят в том случае, когда
tE (или один из
них) больше t] (табл. 6 приложения ). Однако кривая ти­
па А может вычисляться и при меньших значениях \к и U
Выравнивание рядов по уравнению этой кривой дает вообще
лучший результат, чем по уравнению кривой нормального
распределения. Последнему же отдают предпочтение в выше­
указанных случаях (при tA или tg меньше t,- ) только пото­
му, что оно проще, а также исходя из рассуждения, что при
недоказанном достоверно отклонении распределения в иссле­
дуемом ряду от нормального распределения, надежнее счи­
тать это распределение следующим более общему закону
нормального распределения, а найденные показатели откло­
нения А и Е относить за счет случайного состава выборочной
совокупности.
Частоты кривой типа А вычисляют по формуле:
п
f(4) - A-V"(x)+ — fIXV )
6
24
N
s'
(57)
где
f(x) — значения функции нормальной
кривой при
г-'fin(x) и f1V(^) — третья и четвертая производные этой функ­
ции;
А и Е — асимметрия и эксцесс;
N — общая численность вариант ряда;
s' — основное отклонение в единицах интервала,
s' У \
)<2.
Значения f 111 (т) и f iv (т), берут из табл. 5 приложения.
41
со
w
Ctf
sf
к
г:
см
1
-Н
1In
xo
CO
Г> 1C со со оо о
см
о"
—^
—Г СМ
СМ
см" lO
^
О^
*-Г со оо
СО
—
см —<
^
см о
о
Ю
о#*
x
CM
H
w 4
оо"
rH
<м
Qcd
тЦ
ю со см см
со 00
см
со <У> О) © со о
со см о#» ол
тР
©" o' ©" © о о
О
ю
о *©—4 см
ьоо
о о © *—4
о о © ©
о"
©" о
+ i
со
а>
ю
©
ю
И
mL.
w |
см
о
СО с
со юсм см
см
00
©
©
©
о ©" о"
1 1 +
o'
+
ю
со
тг*
о
©"
+
СО
©
©
©
©~
©
со
©
©"
1
1
1
W
2
s 00
X о
о
0>
X см
00
СП
р
>
о
со
^
о
Ю
со
см
СО
а>
рм
СМ
о
о о о о о но о о о о" о"
00
со
см
©
©"
1
а>
ю
го
©"
+
оо
о>
©
1-н
©*
см
оо
см
©
со
©
1
1
о
o' o'
©
Ю
TF ©
Ч < см оо
V
О
о
О
О
см
о" о> сГ
4*
•
fiO
со ^
СМ
оо о сг>
с о см ю
f" 1 0 / . ° °
©" о" ©" '
©
+ + + I
<У> со
оо
оо ‘г см ст> со
^
^
^
о
o' о" o'
I
I +
—
Ю N^
о- ю
^
СМ
<м
^
О)
м см LO см
Н•S ю
00*4 с
-н
h- Ю ~
*
» о о" о" о 4 о"
со
+
+
Мни
«
II
о
о о
*—I О
см с о
о
о"
—«
—'
©
3
to
X о
2
н
о
2
09
СО
О
о
+ + + + I I I
С | <о
СО
o *
c
g
см
см
11
cd
a,
>>
О
оо
Ю
II
с
<u
JQ
-
см 00 _ Н о
ю
ю
см ю оо см
У
со ю СО со v-H СО
© © © о © *-ч см
©" ©" o' о4о" о" О 4
СО
СО
24
0
10*й
*00
Столбцы
6+9+
II
/с
H
Р
<
ГГ-
(Й
s
Tf
Ю (N
Th О )
О Tf
N
о"
о o' o' o' о" о"
ф
N
(М
т)<
N
О
о>
N
ОО
оо
О
O ’—
1 ’—| 0 _>—I rf Ю
+ + + + I I I
СО
ю
N
О) О) О
о
СО
0
0
N
со
^
(N
О)
^
(N -н СО
^
со ю
o'
со
©
^
© o' ©" о" o'
I
++ + +
I
он с
^м
§
ГГ
,
К*1
5
*
О
4>
ST
X
н
0>
о,
о
О)
н
а>
х
х
<v
с?
О
X
э*
2
во
СО
«
о
Ч -н
со
II
z
т*
0“
1 VС/)
1
00
со"
см
см
о
II
и
1
со
-
to
-1
U3
СО
со
со
со
со
1 1 1 1 1 1 1
1
X
с
N S
^СО ^О?(M
4-®
^ . ^ ^°. b
оR
I
II I t
1 I
со
сч см см см см см см
см см см см см см см
Г-Г
in'
со" см" ^-Г
Е
I
*х
II
ю
©
b
ю
X
СМ
СМ
II
© СП
г- о см
©
см © со со
см со
© © © ©
©~ © ©~ © ©" CD ©~
о
т-Н
со
со
LO
со
см
1 1 1 1 1 1 1
см г
,
см см
со
Tt< см
со (
ю
© см
с- ю а> о см
© г - 00 00 №
со со см I ©
o' © ~ © ~ © ~ © "
6
О
1^
00
со
©
© '
w .
й
О
Л
О
О
(О
со
w h
H
- -Г <N
+
+
+
СО
+
Ь.
+
г-
см о г- ггсм г- г©" ©" >—г см" см"
1 + + + + +
{
+
см с о
+ +
+
+
ю
00 ©
©
©
о
Th
см
Ю
vt<
o>
0
X
42
-
©
см
| см со
00 СП ©
Ю
©
см сч см см см g - 111смсм со
<м
со
С>4
со
w
Пример вычисления частот кривой типа Л приведен в
т|бл. 13.
/ В 1-й столбец этой таблицы вписаны классовые вари­
анты X, в 3-й— их условные значения хк, выраженные в
/
X—М'
долях интервала, хк ——----; в 4-м столбце — разность
к
между условными значениями вариант и первым начальным
моментом ряда, т. е. значения хк — mr, в 5-м — значения ар­
гумента т, т. е. частное от разностей (хк —mt) на основное от­
клонение неименованное s'. В 6, 7, 8-м столбцах записывают
значения функций из табл. 5. При этом необходимо учиты­
вать знаки функций.
Значение f,n (т) в табл. 5 приложения дано для положи­
тельных значений т. При^отрицательных значениях т знак,
указанный в таблице, нужно изменить на обратный.
Для f(t) и f lv (т) знаки остаются без изменения, т. е. те­
ми же, что и в таблице, независимо от знака при т.
А
В 9-й столбец записывают значения--- fm (т), в 10-й —
Е
6
значения — f,v0c).
24
В I J-йстолбец вписывают алгебраические суммы:
*
fW +
А
6
fm (т)
т. е. сумму чисел столбцов 6, 9 и 10.
В 12-й столбец записывают произведения чисел преды
N
дущего столбца на — , где N — .объем ряда (общее количестs'
во
наблюдений); s' — основное отклонение в долях
в 3 Л .3 ..
интер-
9
Правильность расчета теоретических частот ряда проверя-*
ют сравнением общей их суммы Еп с суммой фактических
частот N = 2 п.
Оценка согласия между эмпирическим и теоретическим
распределением
Критерий X (лямбда). Оценка согласованности между
экспериментальными и теоретическими (вычисленными) ча­
стотами, т. е. правильность подбора типа теоретической кри­
вой распределения проверяют с помощью критериев согла­
сия. Наиболее универсальным и легко вычисляемым крите­
рием является критерий X (лямбда), предложенный акад,
43
А. Н. Колмогоровым. Условием применения этого критерия
является достаточная численность сравниваемых распреде­
лений (в несколько десятков вариант).
Для сравнения эмпирического распределения с теоретиче­
ским при одинаковом числе классов и одинаковой общей
численности сравниваемых групп критерий X определяют по
формуле:
, .- iL ,
(58)
где
D — максимальная разность (без учета знака) между
накопленными частотами в эмпирическом и теоре­
тическом распределениях в пределах одного и то­
го же класса;
N — общее число наблюдений в эмпирическом ряду р ас­
пределения.
Если значение X не превзойдет предельных его значений:
1,36; 1,63 и 1,95, соответствующих стандартным степеням ве­
роятности достоверного
различия pi = 0,95; ро = 0,99
и.
р3= 0,999, то расхождения между теоретическими и экспери­
ментальными частотами незначимы.
Вычисление критерия лямбда при сопоставлении эмпири­
ческого распределения и теоретического, рассчитанного по
уравнению нормальной кривой для ряда диаметров сосны,
приведено в табл. 14.
'
Таблица 14
Вычисление критерия лямбда
Ч аст от а
Диаметр эксперимен­ з ычислентальная, п
"мая, п
Du
Zn
Г)~ £
0
0,3
0
0,3
0,3
16
4
1,7
4
2,0
2,0
20
7
6,3
И
8,3
2,7
24
8
15,0
19
23,3
СО
28
28
23,2
47
46,5
0,5
32
20
23,4
67
69,9
2,9
3G
18
15,4
85
85,3
0,3
40
9
6,6
94
91,9
2,1
44
0
1,8
94
93,7
0,3
48
0
0,3
94
94,0
0,0
I!
12
4,3
у'м
Найденное значение X не достигает даже первого поро­
га вероятности р —0,95. Поэтому между теоретическим и эм­
пирическим распределением имеется достаточно больщое со­
44
гласив. Имеющиеся расхождения объясняются случайным
составом выборки. Распределение сосен по классам диамет­
ров можно вполне считать нормальным.
Критерий х2 (хи-квадрат). Оценку согласия между экспе-^
и теоретическим распределением можно про-*
извести также по критерию %2> предложенному Пирсоном.
V
(п - п)-
(59)
•
п
где
п — частоты экспериментального ряда;
п —; частоты теоретического ряда.
Сущность оценки согласия между экспериментальным
(опытным) и теоретическим распределением по критерию х2»
состоит в проверке гипотезы, что выборка взята из нормаль­
ной совокупности с определенными ,и и о, которые установле­
ны на основе выборки. Для ряда диаметров Н 0: ,u= 30;l см,
а —6,11 см.
При расчетах критерия х2 численности классов не должны
быть менее 5. Крайние классы поэтому объединяют (см.
табд. 15).
. Вычисление критерия
п
12)
16 )
20
24
28
32
36
40 )
44
48 1
V
^-1
Л-'
п
Таблица 15
хи-квадрат
(п п)*
\Ч-•»);'
п
)1
8,3
+2,7
0,88
8
18
15,0
23,2
23,4
15,4
- 7,0
+4,8
— 3,4.
+ 2,6
3,27
0,99
0,49
0,44
9
8,7
+0,3
0,01
94
94,0
0
6,08
28
20
Полученное х2 сравнивают с критическим х2о,оз или Х"<ь9<ь
принимая число степеней свободы равным, числу классов
без 3, так как в процессе вычисления теоретической кривой
использовали N', х, s, потеряв таким образом три степени
свободы.
45
Сравниваемые распределения объединены в 6 классов
(табл. 15).
Следовательно,
число
степеней
свободы
п = 6— 3 = 3. Найденное значение %2<%2о,93. Поэтому расхож ­
дение между распределениями незнавдмо. Оно вполне могло
быть следствием случайных причин, т. е. случайного состава
выборки.
Таблица 16
Критические значения х 2
Число степеней
свободы
1
2
3
4
5
6
7
8
9
10
11
12
•>
Х'0,95
^2
3,84
5,99
7,81
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
6,63
9,21
11,34
13,28
15,08
16,81
18,48
20,09
21,67
33,21
24,72
26,22
X
>
0,99
Заметим, однако, что х2==6,08 намного ближе к х2(ьуг» чем
а —0,44 к ^о,95 — 1,36. Это говорит о разной мощности (чув­
ствительности) критериев %2 и X.
ГЛАВА
VTI
ПОНЯТИЕ О СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЯХ
СВЯЗИ. СП О С О Б В Ы Ч И С Л Е Н И Я ИХ Д Л Я МАЛОЙ
В Ы Б О Р О Ч Н О Й СОВОК УП НОСТИ
Показатели связи г и г\представляют собой количествен­
ные характеристики связи между изучаемыми признаками.
Численные значения г и п показывают отношение числа фак­
торов, действующих на изменение обоих признаков, к общему
числу факторов.
Указанное содержание коэффициента корреляции вполне
отражается следующей формулой его вычисления, применяе­
мой при малом числе наблюдений
Г
~
2 ху
|/ЁТ 2
^60)
где
х — отклонения отдельных вариант ряда независимой
переменной от средней арифметической этого ря­
да (х), т. е. х'= Х — х;
46
у — отклонения отдельных вариант ряда зависимой пере­
менной от средней арифметической этого ряда (у),
т. е. у = Y— у.
Из формулы видим, что при достаточной тесной связи меж­
ду признаками, когда положительным отклонениям значений
одного признака от их средней арифметической соответству­
ют в общем положительные отклонения значений и другого
признака (а отрицательным — отрицательные), произведения
тшш. отклонений будут иметь положительные зиаченмя.
Только те пары наблюдаемых признаков, значения отклоне­
ний по которым не будут следовать этой общей закономерно­
сти в изменениях признаков, дадут произведения с обратным
знаком (табл. 17).
Таблица 17
Вычисление коэффициента корреляции при малом числе наблюдений
X
S
s
и
&г
ГС *=5
52 Ю
с? 4>
Н
п О
О
S£
tiS
3,5
4,0
4,1
5,0
3,5
3,1 3,5
3,0
5,3
5,0
5
6
5
7
6
4
5
4
7
6
40,0 2 55
Отклонения
! i
J.D X
<
2?
.............. ........ г-Г
О
. ....
&
со §
ц
'2 о
X
У
' §. И ’5
и< ж к
-0,5
0 ’
+ 0,1
+ 1,0
—0,5
-0,9
— 0,5
- 1,0
+1,3
+ 1,0
+3,4
-3,4
0
ч
— 0,5
+0,5
—0,5
+1,5
+0,5
- 1 ,5
— 0,5
- 1 ,5
+ 1,5
+0,5
Квадраты
отклонений
Вычисление
Х2
•V
J'J
0,25
0,25
0,25
-
0
0
0,01
1,00
0,26
х
—0,05
+ 1,50
—0,25
+ 1,35
+ 0,25
+ 1,50
+ 1,95
+0,50
+4,5 +7,30
—4,5 — 0,30
+ 7,00
0
1,00
0,25
2,25
0,25
2,25
0,25
2,25
2,25
0,25
6,26
10,50
0,25
0,81
0,25
1,00
1,69
х
<
М’ = 1
10
iN
1
_
2 Y
У =:
J
N
Г-.:
ю
1
5,5 см;
7,<
у 6,26
7,0
~2,50><3,24
7,00
-
0,86
9
В приведенном в табл. 17 примере расчета коэффициента
корреляции такие отклонения в изменении признаков наблю­
даются у 3 и 5 корреляционных пар (3 и 5 строки таблицы).
Коэффициент корреляции между длиной стебля и длиной
корня во взятой для наблюдения совокупности из 10 расте­
ний равен 0,86. Это означает, что из 100 некоторых факторов,
действующих на изменение признаков, 86 факторов действу­
ют в направлении изменения обоих признаков в одинаковом
направлении.
Коэффициент корреляции является показателем прямо­
линейной связи. Он может принимать значения от +1 до — 1.
47
При r ~ 0 прямолинейная связь отсутствует (но криво­
линейная связь при этом может быть).
Корреляционное отношение является показателем криво­
линейной связи. Значение и смысл корреляционного отноше­
ния аналогичны значению и содержанию коэффициента кор­
реляции. Он может принимать значения от 0 до + 1.
Способа вычисления этого показателя для малой выборки
не приводим. Вообще следует иметь в виду, что к вычисле­
нию корреляционного отношения при малом числе наблюде­
ний нужно относиться с большой осторожностью. Если на ос­
новании биологического анализа явления нет достаточной
уверенности в наличии криволинейной связи между признака­
ми, то вычислять KOpipeля циоиное отношение между призна­
ками не следует.
Для больших выборочных совокупностей, с которыми сту­
дент имеет дело, метод вычисления показателей связи и оцен­
ки связи излагается ниже.
ГЛАВА
V III
В Ы Ч И С Л Е Н И Е ПОКАЗАТЕЛЕЙ СВЯ ЗИ
ДЛЯ Б О Л Ь Ш О Й В Ы Б О Р О Ч Н О Й СОВОКУПНОСТИ
Вычислению показателей связи при большом числе наблю­
дений предшествует сводка данных в корреляционную таб­
лицу. Техника составления рабочей таблицы с разноской дан­
ных одновременно относительно двух признаков показана в
главе 2 (см. табл. б и пояснения к ней).
Вычислению статистических показателей предшествует
составление таблицы (табл. 18).
Та блица начинается расчетной корреляционной решеткой.
В отличие от вышеуказанной рабочей корреляционной табли­
цы в расчетную решетку вписывают лишь средины классов
по обоим признакам: в левом столбце — средины классов
зависимой переменной Y, а в верхней горизонтальной стро­
ке — средины классов независимой переменной X. Частоты
в решетку переносят из рабочей шрреляционной решетки.
В результате разноски частот по двум признакам получа­
ют частные ряды распределения по этим признакам. Верти­
кальные столбцы частот, рассматриваемые вместе с классо­
выми вариантами зависимого признака, представляют собой
частные вариационные ряды это-го признака в пределах каж ­
дого класса независимого признака.
Горизонтальные строки частот, рассматриваемые вместе с
классовыми вариантами независимого признака, представля­
ют собой вариационные ряды независимого признака в пре­
делах каждого класса зависимого.
Итоги строчек л у представляют собой частоты полного
48
ряда зависимого признака, а итоги столбцов
— частоты
полного ряда независимого признака.
За пределами этой части таблицы, являющейся так назы­
ваемой корреляционной решеткой (см. отграниченное жирной
чертой), вводят 5 дополнительных столбцов и 8 дополнитель­
ных строк.
В 1-ю дополнительную строку
вписывают отклонения
классовых вариант ряда независимого признака X от услов­
ной средней величины этого ряда М 'х , выраженные в рабо­
чих единицах, т. е. поделенные на величину классового про­
межутка (кх)
У _ АЛ'
Во 2-ю дополнительную строку вписывают произведе­
ния частот на условные отклонения (пхх1с) и в третью — про­
изведения частот на квадраты условных отклонений (nxxk~).
В следующую строку по каждому частному ряду распре­
деления, т. е. по каждому столбцу, вписывают произведения
отклонений классовых вариант ряда зависимой переменной
от их условной средней величины на частоты каждого част­
ного ряда зависимой.
Для 1-го столбца, например, значения этих произведе­
ний получают так: условное отклонение ук (в 8-й строке
таблицы) равное —3 умножают на численность пух = 1, услов­
ное отклонение у к (в 9-й строке таблицы), равное —4, умно­
жают на численность п ух =1; затем условные отклонения
10-й и 12-й строк таблицы, соответственно равные — 5 и — 7,
умножают на численности, равные 1. Полученные произведе­
ния — 3, —4, — 5, — 7 суммируют. Для 1-го столбца сумма
произведений равна — 19.
В 5-ю
дополнительную
строку
вписывают значения
произведений условных отклонений ряда независимой пере­
менной (х^) на алгебраические суммы произведений (nyxyk),
вписанные в предыдущей строке.
В 6-ю строку таблицы вписывают значения
средних
квадратов отклонений частных рядов зависимого признака по
классам независимого.
Для первого частного ряда (1 столбец) средний квадрат
(пухУk)2 _ (-19)2 ^ 9() 2
п,
4
~
В 7-ю (самую нижнюю строку) вписаны средние значе­
ния зависимого признака У {по каждому классу независи­
мого. Эти значения впервые вычислены в процессе составле­
ния рабочей корреляционной таблицы (см. табл. 6 и поясне­
ния к ней).
49
Распределение числа стволов сосны по классам диаметра
Диаметр, см, X
Высота, м,
Y
16
20
24
М 'х
32
28
2
5__ L . 3
4
7
i
1
1
7 2
29
3
28
1
M'v —27
1 6
10
I
7
$
1
26
?
2
1
24
1
2
23 ' ......
1
Г
22
1
21
10
4
18
2
25
1
14
!
i
;
■
1
2
13
I
25
иу
40
36
! б
*
Г~ 5
■
!1 5
'
! 2
30
2
(1
4
j
Г. 1
3
2
1
2
2
20
•
1
п х-
4
7
8
— 4
— 3
— 2
—1
— 16
— 21
— 16
— 28_
_ _ 6?
— 3
63
32
__ 28_
+ 1
0
+ 6
И того
Хк
ПхХк
Итого,
'
11хХк‘ .
!
4
1
0
:
28
18
20
1
94
9
, чУ + 1
+ 2
0
+ 18
+ 18
— 45
0
18
36
241
_±!.8 .
+ 6
— 4 _-|-10 . J : 12
+ 10
+ 8
4- 6
1
j — 5
— 6
— 2
0
4- 7
+ 5
+ 2
7
— 4
— 4
— 7
0
0
0
— 2
— 2
♦
23
33
16
' 33
32
225
60,5
28,4
281,0
27,0_ _28,2_ 28,8
28,8
П'ухУ1<
t
— 12
— 3
— 5
— 19
— 21
— 10
,1ухУкх к
76
63
20
1
0
(ПухУк)2
90,2
63,0
12,5
0
26,4
_22,2
24,0
25,8
—Г
......П х ... ..
У»
*•
50
Таблица 18
и высоты, расчет моментов и основных отклонении
nxyXk
пуУк
ПуУк2
+3
30
90
0+6+4
10
30
+2
36
72
—3 + 0 +5 -j-8
10
20
+1
25
25
— 3— 10 + 0 + 5 + 4
—4
— 4
0
0
0
— 3— 4— 5+0 + 2 + 2
—8
0
— 1
— 13
13
— 15
15
—2
— 4
8
—3
6
— 12
36
—4— 6— 1
— 11
33
—4
— 12
48
— 4— 3— 2
—9
, 36
—5
-10
50
1-4-1
—5
25
—6
— 12
72
—6
—6
36
—7
— 7
49
—4
—4
28
Ук
ПхуХкУк
4
«я?-
_*0
.*
— 8— 7 + 0
— 2— 1
463
21 4
225
M 0 м e н т ы:
m,x -
m.,x
I nxXk
- 45
N
94
2 ПхХ^к
241
N
94
ш
=-0,479;
111 1
2,564;
L iw *
Hi =0,223;
" N
Г"‘ 94
- пуУ2к
N
in2y -
463
94
—4,926;
s'x --=Vm „ —m*u = V 2,564— (—0779)*-1,528;
s', • V m2y — m,y2= / 4,926—0;2232= 2,202;
- "хуХкУк
N
in ixy
„
ni^y./x
1
^
V
225
= 2,394.
94
Д»хуУк)2 \
^
^
I
(61)
1
Ofti _ o o « o
• 281
2,989,
(62)
51
Содержание дополнительных 5 столбцов таблицы анало­
гично содержанию рассмотренных строк без 2 последних.
Содержание ясно из символов, указанных в заголовках столб­
цов.
Столбцы эти служат для проверки расчетов, произведен­
ных в строках. Суммы 3-й строки снизу и последнего
столбца должны совпадать. После того, как эти суммы про­
верены и найдены суммы других строк и столбцов, вычисляют
начальные моменты и основные отклонения. Формулы и по­
следовательность расчетов
приведены
в нижней части
табл. 18 справа.
В этих формулах:
mix и т 2х— первый и второй начальные моменты ряда рас­
пределения независимого признака (в нашем случае — ряда
диаметров);
т 1у и т_,у — первый и второй начальные моменты ряда за­
висимого признака (в нашем случае — ряда высот);, *
mixy — момент произведения отклонений;
т*>у /х — средний квадрат условных произвольных откло­
нений частных средних ряда у по классам х
(второй момент);
s'x, s'y — основные отклонения вариант, соответственно
ряда х и у от их средних х и у, выраженные в
долях интервалов.
Статистические показатели
вычисляют по формулам:
коэффициент корреляции
связи для больших выборок
m !xy— m ,xm iy
s',s',
(63)
ко р р еля цио ниое оти о шение
(04)
Для совокупности 94 деревьев сосны (табл. 16) показате­
ли связи между диаметром и высотой деревьев оказались
следующими:
2,394— (0,4 79) 0,223__=0 7411,528X2,208
ч = ^2 .989- 0.223^ .,_0,777.
v
2,208
ГЛАВА
IX
ОЦЕНКА ПОКАЗАТЕЛЕЙ С В Я ЗИ
Оценка связи между признаками
г
Оценка показателей связи
Показатели связи, вычисленные для выборочных совокуп­
ностей, как и вышерассмотренные другие выборочные стати­
стические показатели, имеют свою ошибку репрезентативно­
сти. Ошибку коэффициента корреляции при малой выборке
вычисляют по формуле:
(65)
где
-г — коэффициент корреляции;
К — численность выборки, т. е. число
ний признаков.
При большой выборке
корреляции такова:
парных наблюде­
формула ошибки
коэффициента
1—г2
sr - --~==г. L
У N— 1
(66)
Аналогична и формула ошибки корреляционного отношении:
S-л
1—Т]2
|/ N'— Г
Критерием значимости выборочных показателен связи ипляется частное от величины самого показателя па его оши^~
ку, т. е. вышерассмотренный критерий t [см. (47)]:
tr = — ;
Sr
t, =
-
sr,
г-
.
.
(67, 68)
Для совокупности диаметров и высот сосны, помещенной
п табл. 18, ошибки показателей связи равны:
1— 0,741 -
s
1/94— 1
1^94— 1
tr
0 741
0,047
-16.0;
1—0.54Г , п ._
....__ . -ч.1,047;
9,644
' - » • « « „0,0,1;
9,644
t,
0 777
’
' 0,041
19.0.
53
Полученные значения t позволяют произвести проверку ну­
левой гипотезы: значимы ли г и т] или в более подробной ее
постановке: совместимы ли полученные показатели с предпо­
ложением о том, что в генеральной совокупности не суще­
ствует связи между изучаемыми признаками, т. е. р = 0 ; и
vjr=0(p ит)г— показатели генеральной совокупности),
Так как найденные t r и Ц выше критических значений,
приведенных в табл. 6 приложений для N'— 1=93, то можно
утверждать, что разность между выборочным показате­
лем (г) и гипотетическим (р) (аналогично между г) и т)г) яв­
ляется значимой. Нулевая гипотеза отвергается, г и у\— зна­
чимы.
С вероятностью в 0,95 можно утверждать, что генеральные
показатели связи будут в интервале:
\ не менее 0,647,
j не более 0,835;
р —i± ts r —0,741 ±2,0 0,047
„
ол
М., = 0,/77±2,0-0,041
i
j
не менее 0,695,
„е более 0,859.
Для совокупности длин стеблей и корней (табл. 17)
s= ,/ iz Z = I/
V N -2
V
tr = —
sr
1—0,86» = , / 0 , 2 6 = 0 ]8
10-2
V 8
•• ° ,8С- ==5,33.
0,18
Таким образом и здесь найденный выборочный
циент корреляции является значимым, т. е. что р ^ 0 .
коэффи­
Интервальную оценку для р, если г получено по малой
выборке и оно высоко, производят, пользуясь z — преобразо­
ванием Фишера. Это связано с тем, что распределение г в та­
ком случае отличается от нормального.
По значению г, пользуясь таблицей, находят z (табл. 7
приложений). Затем находят ошибку z по формуле:
1f
V
~N——3
(69)
и доверительный интервал для z. Пограничные значения ин­
тервала по той же таблице (пользуясь в обратном порядке)
переводят в значение г.
Произведем интервальную оценку для коэффициента корреляции длины стеблей и корней.
54
С о г л а с н о табл . 7 .для г — 0,8(1, z = 1,203:
sz - 1 /
|/
10— 3
-0.378.
Доверительный интервал для z в генеральной совокупно­
сти равен z±ttf?fc> s2*= 1,293 ±2,3-0,373, т. с. от 0,424 до 2,102.
Интервал для р (по табл. 7) будет: 0,40—0,97.
Оценка связи между призиаками
Оценку связи между призиаками производят в отношении
направленности, тесноты и формы. Направленность связи на­
дежно устанавливается уже из корреляционной решетки. По
полученному полю точек можно приближенно провести об­
щее направление линии связи. Если при этом наименьшим
значениям одного из признаков соответствуют в общем и
наименьшие значения второго признака, связь является пря­
мей; в противном случае — обратной.
Коэффициент корреляции при прямой связи между при­
знаками имеет положительное значение, а при обратной —
отрицательное. Связь между диаметрами и высотами деревь­
ев является прямой, коэффициент корреляции имеет положи­
тельное значение.
Тесноту связи оценивают по величине показателей свя­
зи г и т]. Для оценки тесноты связи можно пользоваться сле­
дующей шкалой:
Значение
показателем связи
0
0,30
Градации
тесноты сиязи
слабая
0,31- 0,50
умеренная
О.Г, 1—0,70
спасительная
0,71 и >
тесная
Связь высот и диаметров деревьев ч исследуемой совокуп­
ности является тесной: г— 0,741; rj = 0,777. Показатели эти
значимы, так как t г— 16,1 >3,4 и t ■,,= 19 > 3,4 (из табл. 6 при­
ложения). Следовательно, связь проявляется в том же на­
правлении и в генеральной совокупности. Интервалы для
р ит|г показаны выше.
Оценку формы связи дают на основе сопоставления пока­
зателей связи (г и т]). Вычисляют так называемую меру криволинейностиЖ и критерий криволинейности t k.
Мерой криволинейности связи называют разницу меж­
ду yj2 и г2 ]^рй
связь строго прямолинейна, что бывает
крайне редко, при К =1 криволинейный характер связи до­
стигает максимума. Это возможно при г= 0 и г|— 1. Во всех
других случаях связь в той или иной мере криволинейна.
При небольшой степени криволинейности связь практически
можно принять за прямолинейную и тем значительно облег55
чить дальнейшие работы по вычислению уравнений связи.
Порогом (границей) криволинейности, перейдя который связь
уже не может считаться прямолинейной, обычно принимают
значение tk> равное tj или большему числу (см. табл. 6 при­
ложения). Критерий криволинейности — обычный критерий 1.
Определяется
он
по формуле tk= --- ,
где sk — основная
ошибка меры криволинейности, определяемая по формуле:
2
= y"K— K2(2-fri*— r V
(70)
Sk
J/N
Связь диаметров и высот рассматриваемой совокупности
94 деревьев оценивается:
K = ri2— г2=0,7772— 0,7412= 0,055;
sk ^
2
(71)
____________________________ ,_______
j/0,055— 0,055* (2—0,7772— 0,7412) =
|/'070524Т = —-— 0,229=
=0,047;
9,695
9,695
9,695
sk
0,047
Так как t k<to,oi и д а ж е > 1 о,05, то связь можно считать
прямолинейной*.
По значениям г= 0,741; т]= 0,777; t г== 16.0; t = 19; t k= l , l 7
можно дать следующую общую характеристику связи: связь
д/ря'мая,
тесная,
прямолинейная.
Значение
г = 0,741
говорит о гом, что из 1000 каких-то факторов 741 фактор
действует на изменение обоих признаков в одинаковом на­
правлении. При наличии такой связи ее можно использовать
в практических целях, например для выравнивания экспери­
ментальных значений признаков.
Г Л А В А X
УРАВНЕНИЯ
СВЯЗИ
Линейное корреляционное уравнение
Когда линейный характер связи установлен, удобно вос­
пользоваться имеющимися статистиками
для получения
прямолинейного корреляционного уравнения:
*
В дальнейшем можно было бы выравнивание экспериментальны
данных произвести по уравнению прямой линии. Однако К=?£=0; следова­
тельно, связь в некоторой мере криволинейна. Уравнение параболы 2-го
порядка отражает связь между диаметрами и высотами лучше.
56
где _
х, у — средние для ряда независимой переменной х и ря­
да зависимой переменной у;
§/х> s'y — основные отклонения для этих рядов
тервалов;
в долях ин­
кх, ку — величины интервалов для ряда х и ряда у;
г — коэффициент
первым х;
корреляции
второго признака
ус
X — значения независимой переменной в принятых при
наблюдении единицах измерения;
Y — выравненные значения зависимой переменной.
куо'у
г ~г—г~
называется коэффициентом
регрескха х
сии Ry/x . Он показывает, насколько изменяется зависимый
признак при изменении независимого на единицу.
Для сведенной в корреляционную таблицу (табл. 16) со­
вокупности 94 сосен прямолинейное корреляционное уравне­
ние связи высот с диаметрами оказывается следующим:
Множитель
Y= y
'
(X— х) = 27,223 + 0,741 i l l ’--0-2- (X— 30,084) =
М 'к
4-1,528 ’
= 27,223 + 0,267 (Х-30,084) = 19,160+-0,267Х.
В полученном уравнении Y ' = 19,160 + 0,267Х независимой
переменной являются диаметры деревьев, а зависимой — вы­
соты.
Способ наименьших квадратов .является наиболее общим
аналитическим способом выравнивания* эмпирических дан­
ных. Этим способом получают выравненные значения функ­
ции, сумма отклонений которых от эмпирических значений
является наименьшей. Подобно средней величине признака,
заменяющей собой весь коллектив, выравненные значения
зависимого признака заменяют собою экспериментальные его
значения для каждого значения независимого признака.
Выравнивание эмпирических линий связи по этому спосо­
бу включает следующие этапы:
1) определение общего вида уравнения;
2) составление системы нормальных уравнений;
3) определение числовых значений сумм, входящих а нор­
мальные уравнения;
4) определение коэффициентов основного уравнения;
57
5) нахождение выравненных значений зависимого призна­
ка (функции);
6) оценку точности уравнения.
Нормальные уравнения получают путем умножения всех
членов основного уравнения связи на коэффициенты при не­
известных членах а, Ь, с и т. д. Сущность этих коэффициентов
можно понять из следующего изложения.
При наличии нескольких N единиц наблюдения с двумя
измеренными признаками можно составить N конкретных
уравнений. Если связь прямолинейна, эти уравнения запи­
шутся в виде Y = a-fbX (73). Причем, в каждом из них вме­
сто Y иХ будут вписаны конкретные значения признаков. Н а ­
хождение коэффициентов а и b можно свести к решению по­
лученных исходных уравнений, беря из них каждый раз
новую пару.
При этом получили бы частные значения коэффициентов
а и Ь, отражающие связь только между двумя взятыми в
каждом случае единицами наблюдения, но не удовлетворяю­
щие связи оставшихся других единиц.
Лучший общий средний результат для ©сей наблюденной
совокупности вариант получится, если из ©сех N исходных
уравнений получить два нормальных уравнения. Для этого все
члены исходного уравнения нужно умножить на коэффициент
при а, равный 1 (получим N уравнений типа Y' = aH-bX), и сум­
мировать полученные выражения; получим 2 У=а1Чн-в2 X.
Второе нормальное уравнение получим, умножая каждое
исходное уравнение на коэффициент при Ь, равный х (получим
N уравнений типа ух = ах-ьЬх2), и суммируя полученные вы­
ражения имеем 2 YX— а 2 X + b 2 X2.
Нормальные уравнения в алгебраической форме :штисн
будут такими:
1) 2 Y = a N ' + b 2 X ;
2) 2 YX = а 2 X + b 2 X2.
(74)
Для рядов распределения, где каждая классовая вариан­
та встретится л раз, два нормальных уравнения прямой ли­
нии примут вид:
1) 2 nY —а 2 п -Ь о - пХ
2 л;
2) 2 пУХ - а 2 nX + Ь 2 г«Х2
2 лХ.
(75)
Очевидно, что первое и второе нормальные уравнения от­
личаются от основного уравнения У = а + ЬХ, соответственно,
множителями 2п и 2 лХ, которыми в последующем и надле­
жит пользоваться при составлении нормальных уравнений на
основе уравнения общего вида.
Числовые значения сумм пх, пх2, nY, nYX находят в ито­
гах расчетной таблицы. Для упрощения расчетов при полу58
чснии указанных сумм произведений и при вычислении коэф­
фициентов, входящих в уравнения, в качестве значений аргу­
мента лучше брать не срединные значения классов, а услов­
ные их значения (х), подобно тому, как это делали при вы­
числении моментов.
Избегая отрицательных произведений, в качестве услов­
ных срединных значений классов аргумента лучше прини­
мать натуральный ряд чисел: 1, 2, 3 и т. д. Значения этих
условных классовых вариант можно выразить формулой:
где
к
X
В
величина интервала;
классовые варианты независимого признака;
число, на которое надлежит уменьшить наимень­
шую классовую варианту с тем, чтобы в числителе
формулы 76 получить разность, равную величине
класса.
Средние эмпирические значения зависимой переменной Y,
взятые из корреляционной таблицы и вписан-ные в 3-й стол­
бец табл. 19, можно также упростить, уменьшив их на некото­
рую одинаковую величину С. В нашем примере значения вы­
сот стволов сосны удобно уменьшить на С = 20 м, получим
y = Y— 20.
Определение неизвестных
коэффициентов а, Ь, входя­
щих в уравнения, производят, решая систему полученных кон­
кретных нормальных уравнений.
Выравненные или наиболее вероятные значения зависи­
мого признака находят, подставляя в полученное конкретное
уравнение значения аргумента, в нашем случае х = 1 , 2, 3, 4
и т. д. Для получения действительных выравненных значений
функции свободный член уравнения увеличивают на величи­
ну С, в нашем примере равную 20 м.
Оценку уравнения производят, сопоставляя^ эксперимен­
тальные средние значения зависимого признака Y с наиболее
вероятными его значениями Y, полученными по уравнению.
Затем находят среднюю квадратическую ошибку s ух . Для
иллюстрации техники выравнивания значений зависимого при­
знака методом наименьших квадратов приведем примеры вы­
числения некоторых уравнений.
*
Полученные таким образом значения классовых вариант по своем
существу не отличаются от применявшихся ранее в расчетах условных
отклонений классовых вариант, выраженных в единицах интервала. Но
они отличаются от последних численно, вследствие другого избранного
начала отсчета отклонений (определенное В вместо произвольного М').
59
Уравнение прямой линии
Общий вид уравнения прямой Y = а -Ь ЬХ.
Нормальные уравнения в общем виде следующие:
2 nY = а 2 -Ь b 2 пХ;
2 nYX = а 2 nX + b 2пХ2.
Для приводимого в табл. 19 исходного материала наблю­
дений, после упрощения значений переменных вышеописан­
ным способом, нормальные уравнения запишутся так:
2пу = а 2 п + Ь2 пх;
2 пух = а 2 пх -Ь b 2 пх2,
где х — кодированные значения X. Сущность их та же, что
и условных отклонений, применявшихся при расчете моментов
для этого ряда. Численно же они отличаются вследствие дру­
гого избранного начала отсчета отклонений, y = Y— 20.
Подставляя в эти уравнения вместо 2 п, 2 пх, - пх2,
2 пу, 2 пух их значения из табл. 19, получим следующие дна
конкретных уравнения:
680,0 = 94а + 425b
3310,4 = 425а + 2141 b
I
:
425;
: 2141.
Поделив все члены этих уравнений
при Ь, равные 425 «и 2141, получим:
1,6000-0,2212а + b;
(1),
1,5462 = 0,1985а+,Ь.
(2) ,
на коэффициенты
Вычитая (2) из (1), получим: 0,0538 = 0,0227а, откуда
а ==2,370. На основе (1) Ь = 1,6000— 0,2212X2,370= 1,076. Урав­
нение “ТуГй кодированных переменных х, у будет таким:
у =5*2^70+ 1,076х. 'Переходя к значениям высоты Y, получим:
7.
Y = у + 20 = 22,370 d- 1,07^х.
(78)
Если требуется перейти к значениям некодированной пере­
менной X, в нашем случае к значениям диаметра, следует вос­
пользоваться выражением (76), приняв конкретные значения
В и к.
60
о
л
х
л
X
ч
о-»
•О.
с
СО
ою"
ю
h—
оо
о
o'
CM
1.0
см"
"О
Tt4
•st*
г-Г
ю
см
о"
~_4
о
о"
СГ> ю
со см
О 4 о"
см
ю
о
+
о
о
ю
<т>
00
о"
о
о
о
СО
см
\о
cd
Н
( >-
2
к
3
£
СО
сЗ
О.
ю
О
О
1
1
•-
о
О
_
—
см
со"
- ч#»
» —»
+
+
"а
£
к
CL
С
+
II
о
со
ю
ий
ь
О
о
3
CQ
Q.
Q
4\j
*«,
/
а
л
<>-
J3
СП
.х
О
с
2
ас
о
оо
н»
оо
29
0
С
ю
со"
сч
см
ос"
00л
сэ
со
ю
°&
00
о
ас
см
со
Ю
см
г*со"
см
г-Г
см
00
оо"
см
со
CD
г+Г
ОС
о
о
о"
см
00
о"
iO
СТ>
to
to
о
"
У— <
со
00
о
со"
<о
00
lO
см
сгГ
г-
о
о"
оо
СО
СО
ю
СТ>
-z f
со
*—*4
<у>
оГ
см
со
ctf
п*
e
tct
О-
00
см
<м
СМ
г*-
С
О
£
О
<и
3*
S
а
s
с
г
00
Tf
о
о
ю
оо
ТГ
со
«-4
Гр
1.0
I*»♦
о"
II
1»—Ц
см
о
о
,
—.
СМ
см
с
о
о
ОО
о
со
СО
ю
см
"Sf
ф
а>
S
ж
00
ссв
з
S
£
03
а
0
0
см
о
см
00 а>
со
CN
2
*Г*‘\
CQ
со
Н
3
GQ
А
о
к
О
см"
см '
'См"
СМ
<о
^f*
о
ю
CD
rC
CD
CD
4 ю"
CM - CM
CM
^f
CM
ас
00
ОО
CM
00
CM
00
оо"
00 00
оо
см .
00
см
СО
VI
?I
тз
о>
и*г
W
оо
с*
PC
<D
X
CQ
«5
Ом
см
ю
со
cs
СО
и:
VO
Я
3
X eWD
41Яс1хЭ1Л1ВИ^
со
—
О
см
rf
СМ
ос
см
см
со
со
СО
о
о
61
Д л я н а ш е г о п р и м е р а получим:
Y = 22,370+ 1,076
= 19,142 + 0,269Х.
4
(79)
На основе (78) или (79) находят выравненные значения Y.
✓ч
. 'v
В табл. 19 они равны в м:
= 23,4; Y2= 24,5 и т. д.
Последним шагом выравнивания опытных данных являет­
ся нахождение стандартного отклонения опытных значений Y
от выравненных Y, которое называют также ошибкой уравне­
ния S yx. Для этого находят последовательно все разности
dj — Yj — Yj
(т. е. di, d2, d3 и т. д.), возводят каждую раз­
ность в квадрат, умножают на соответствующую численность
пь находят сумму произведений, которую делят на число сте­
пеней свободы, равное N—т , где N — объем выравниваемого
ряда; т — число коэффициентов в уравнении (для прямой —2,
параболы ^З). Ошибкой уравнения является корень квадрат­
ный из указанного выражения, т. е. S yx==J/ ^ — — .
Значе­
ния Syx показаны внизу табл. 19 и 21. Показанное выше ре­
шение уравнений рекомендуется проводить гто схемам табл.
20 и 22 с контролем каждого шага вычислений.
Если студент уже произвел вычисление коэффициентов
прямолинейного уравнения вышеуказанным способом, он дол­
жен решить уравнение параболы 2-го порядка с применением
контрольного способа, т. е. в табл. типа 22.
Таблица 20
Вычисление коэффициентов линейной регрессии высот 94 деревьев
на диаметры
№
ii/ п
Действие
а
в
У
у
У
2 /k
i
а
*4
1.
2.
3. Строку 1:425
4. Строку 2:2141
5. От строки 3—
строку 4
6 . а = 0,0538/0,0227
7. аГ->в строку 3
8 . а, в —►в строку 1
94
425
425
2141
0,2212
1
1
0,1985
0,0227
= 2,3700
'
-
380,0 "
3310,4
1,6000
1,5462'
1
1199
5876,4
2,8212
2,7447
00538
0,0765
в = 1,0758
Проверка
= 680,0
V 1
2,8212
2,7447
t
i\
Примечание.
Знак —► означает подстановку в уравнение соот-
ветствующего а, в коэффициента,
V
2 = а + в+у; 2 /в —
а
частное от сум-
мы на коэффициенты kj. Например, в 3-й строке 2,8212=1199/425.
Уравнение параболы 2-го порядка
Общий вид уравнения параболы 2-го порядка:
у = а-Ь bx-fcx2.
Нормальные уравнения в общем виде следующие:
■?-'
2n
;
*i
пх
2 n y « a 2 n -Ь b S rtx-4-с £ пх2;
I; 2 nxv* = а X г,х -f b X пх2-Ье 2 nxs:'
2 пх2
2 ix2y = а Е nx2-f I) 2 пх3Ч-с S пх4.
Для нахождения конкретных нормальных уравнений пара­
болы 2-го порядка для того же ряда высот сосны можно ог­
раничиться вычислением только недостающих еще не вычис­
ленных сумм.
Расчет этих сумм приведен в табл. 21, являющейся по су­
ществу продолжением табл. 19 (столбцы х, у, п, здесь повторе­
ны для удобства чтения). Значения произведений частот
на условные классовые варианты пх, пх2, пх3, пх4 могут быть
проведены
сравнением полученных в табл. 21 произве­
дений пх* с произведениями из табл. 4 приложений.
Вычисление коэффициентов
уравнения параболы 2-го по­
рядка приведено в табл. 22. Уравнение параболы 2-го порядка и
числах кода оказалось таким: у™ —0,7051 -{-2.741 ОХ— 0,1Я ^ х 2.
Перейдя к значениям высоты, имеем :
Y - у + 20 = 19,2949 + 2,74 ГОх— 0.1855хй
.
Подставляя в полученное уравнение, значения диаметров
в долях интервала, т. е. числа 1, 2, 3и т. д., получили вырав­
ненные или наиболее вероятные значениявысот.
При х=1
Y ! =21,976
и т. д.
При х = 2
¥2 = 24,046 и т. д.
Вычисленные (выравненные) значения высот приведены
в табл. 21. В графе 9 этой таблицы приведены разности меж­
ду наиболее вероятными и экспериментальными значениями
высот. Наибольшее различие составило 0,2 м. ^/Результаты
выравнивания по уравнению параболы 2-го порядка оказа­
лись лучшими, чем по уравнению прямой, где максимальное
расхождение равно 1,2 м, sy.>; =0,54. Результаты выравпива-
■if
63
04
со
^
X
Ю
C3
H
о
о
о" о"
I +
о"
+
о
(N
CM
3
n
о
Ю
св
«X
o
j
X
2
X
X
4>
X
0
0
0*
&
>>
ч
>*
а
н
оо
3
о>
ar S
X
о. аГ ^ ^-< 00
5
3й
2
С й
м Ж
л о> «
нх 2
О аз _
5
2 Я
нО
CQ
Си
ои.
^
04
^
о*
o'
+
+
см
X
>%
С
СО
_л
<о
of OJ
04
°°~
\о
t
оо ■хГ
oj
! О)
04/
04
04
ОС о
04
00
»—4
1*^ О о
Tf<
со" o ’ of
о"
>— 4
оо
о—
о
»—И
со Tt* «.о
00
o'
оо
оо
СО
1-— !
н
о
о
3
«
К(
о;
О
DQ <2п о
С
о
о
О
О 04
сч <D
<Ю
of
ао 30 ОС"
ю
04 OI 04 04 04 104 04
О
2
x
—
сГ о" о" о" о* о" о"
*o
*
к
c
u
о
к
0
1
о
о
•v
о*
ю
СО
см
СО
со
X
а
<М СО
КО
о
*"Ч ою
О!
N
1»ч
<7>
<го
<го
<м
о
со
04
сг>
со
со
1
C
<о
00
<х>
<>0
<У0
ь.
00
о
оо
СО
1C
04 О! оо о>
СП
СО
СО
‘30
со
о>
О
ж
О
О)
У
X
CL
X
с:
s
д>
<г>
х
х
с$
00
X
CQ
С$
04
<о
ю
со
X
с
со
со
—н
04
OI
w -t
О
о
ю
OJ
СЮ 00 о
S
I
S3
и
У,
>*
СП
3'
СО
04
64
СО
CD
^
ГЮ
•—» 04
СО
04
of
О*
00
N
(.
со
(О
CD
00
оо
W
СЧ|
cs
сс
sr
к
ч
V
O
cd
ОСП О О —
"QOOOO
ООО^—
‘-^ОЮЮ
ЮОЬ-1ЛСОО^(М
Ю Ю т Г О О Ф О О О
И
^гн Г ^ О О С О С О О
H
x
о
О
о
г
09
О
оч
CQ
SM *
И
о
O^^OCDOO»-^OOOOG
оS^nCDOMOCOONCN
а?со о оо^-н^оюю
^ ^ «Л ^О О Ф О О О
CONCO^^rHOOCOCOO
’—
•о
оно
2
09
•' \
O^^OtS^CftCOOOvOt4
-*•
о г^Г <-~Г t4* со Ю CD
00 о
^SS-^OOCOCOC^tOCslcC
09
О
Си
н
4>
о
оо
CJD
O O N O O d ' О о CN см'оГ
S
л
5
кС
О?
ч
К
с*
*
еС
с;
и
ооа
^ со а>
иО
ю
оо
1—» ю
CJD
o '
М4to
трсо
со
^0s
) *—*СО*»—
"*’-ч v—
I
I
I!
у
0
to
1
см
2
ч
о
\о
CJ
Си
сд
а
Ю’-'СОЮ'ФФ-ОО
Csj’sfrfOOlOCOCOC»
т^т-чги—«О
ПС
*©
<С
**—4
г—О
ЧГ
Г"'~
—*f
""*)|
C^
-J
,-- 1
о
0*
о
г*
«ч /*““s
о
о
ей
«
аси
сс
о
Ои
Е
csf
Я*
о
с
сс
X
X
й>
X
09
сЗ
О*
>>
сз
> 0 5 0 0 0 0 ’— о о ю ю
ОХМгРСО
СОСЧГ'-'ФСЧ’**100
^ юо
— ■ Т}< СО СО о о Ю
СМо о о,© О Юг* о #*•
o'o'о"о"сГо"о*»©'о
осон
1
Г'
X
о
X
X
-в -е ф
оX
а>
х
х
о
ч
о
X
ST
21
S3
г о СО
а>
к
со
н
о
»38
а>
*= (
00
oo
>, >
>>чd-d-£2
& Sa£ н Н о
о О О о о ^
Си C l Си
о
Ь“ fc-1 h
j" • •
•N
э-§ О «
" 3 !>» J?
1—I
If - О
SC
ю
со со £ей
cГ
l,
Г
£
^ 1*Л
ю со
С
ОGО
Н
LO
CS со
•о
§ £ ?
§ w I
•* H II
О,
а *!
ЁГ
0»
л
1
U U U O O n оо О eg «J
c«i С
* в-
b
ri
tr
о
t "
Й £0
-
..
CO CO
счс6^юсо1>оос')6^
e4co rr ю
r—ч Г—* г**м^ r—i ?•—<
65
X
/6
20
2Ь
28
32
i
36
40
Д и ам е т р , см
Рис. 3. Кривые связи диаметров и высот деревьев
ния эмпирических высот по уравнению параболы 2-го поряд­
ка можно считать вполне удовлетворительными.^
Экспериментальная и выравненные но уравнению прямой
и па!ра;болы 2-го гтрядка кривые изображены ,на рис. 3.
Уравнения логарифмических парабол
Для выражения корреляционных связей между многими
признаками в лесном деле и биологий часто применяют па­
раболы полулогарифмическою вида:
Y —a- fblgX ;
У = a + b lg X + c (lg X)
(80)
(81)
а также логарифмические:
lgY = a + b lg X ;
(82)
пли
Ig Y - a + b IgX-i- c(lg Х )2(
66
(83)
Решение уравнений подобно решению простых парабол.
Отличие состоит к том, что значения вариант независимого
признака, а в (82) и (83) и зависимого признака берут в ло­
гарифмическом виде.
Нормальными уравнениями будут:
для (80)
2 Y lg X = a S lg X + b S (lg X )2; j
(84)
2 Y = aN + b S lg X ;
для (81)
2
J
2 Y = a N + b 2 1gX + c£ (Ig X )2; |
Y l g X - a 2 1gX + b 2 (tg X )2-fc2 (Ig X )3; (85)
S Y ( lg X ) 2= a 2 (Ig X )2+ b 2 (lg X )3+ c2 (Ig X )4.
Для 82 и 83 нормальные уравнения будут отличаться
и 85 только левыми частями, где Y заменяется на lg Y.
Расчетные таблицы должны
щих столбцов:
от 84
включить заголовки следую­
для 80 и 81:
X, Y, п, у, IgX, (Ig x )2;
для 82 и 83:
X? Y, n, lg X, (Ig x )2, lg Y.
- ;
Значения сумм произведений зависимого и независимого
признаков, входящих в нормальные уравнения, получают с
применением счетных машин.
67
ПРИЛОЖЕНИЯ
Таблица I
Ведомость измеренных диаметров и высот дере&ьев
ев
Днаметр,
см
I
12,6
деревь­
1
•
2
22,0
24.2
18,6
19.2
15.0
22.3
10,2
15.1,
3
4
. 5
< 6
(
8
9
12,2
10
14.3
22.3
12,6
И
12
.
:
13
14
11.1
1S
17
18
32.2
17.0
23.6
19
27.6
22.6
20.0
15.3
32,2
J9>8.25.0
9.7
25,2’
14.5
17.7
18.6
14.4
30.2,
18.4
8,5
•16
22
23
24
ТЯГ
26
'27
28
29
30
31
32
'33
и
(\
оо
36
37
39
40
41
42-
133
1^4
135
136
UJL.
140
141
м
16,7”
21.7
22,0
20.8
19.5
17.8
21,0
9.6
17.8
8.7
11.4
21.3
11.6
10.5
21 #
17.3
21.5
16.5
22.3
21 , Г
22.6
17.4
22.7
20.9
.19,7
9.7
24.8
16,1
16.9
18,0
18.5
23,8
17.7
8.7
~2£Д
■2TJ-"
15.1
24.2
19.4
20.5
'-fs;/
17,4
10.3
15.7
13.4
22.5
16.7
12,4
23.8
2,1
22.8
13.4
22,1
22.7
19.5
23,0
17.3
19.3
21.8
17.5
-
lit .
138
Вы­
сота,
18,8
27,6
23,2
2L9
2JJL
19,3
19.6
13,5
18,1
№
деревь­
ев
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64,
65-’ I
66
67
68-
71
72
73
74
75
76
77
78
79
80
81
82
83
iiv
Диа­
метр,
20,6
16.5
12.0
29.5
22,8
24.4
13.8
22.4
27.1
22.1
14.8
29.8
20.3
28.8
22.7
13.8
28,0
25.5
22.6
32.4
12.3
13.6
27.6
33.4
23.8
15,У
Вы­
сота,
25.8
19,6
14.5
16.5
22,0
27.2
21.5
19.6
21.8
15.2
16.7
13,1
26.7
32,6
14.8
20.4
18.5
19.0
17.0
.2 0 5 -
~2Ъ$~
23.6
см
см
16,2
29.7
20.8
14.9
14.7
29.0
17.3
9.7
33.6
11.3
14.7
23.9
15.7
18.7
21.7
26.3
Диа­
метр,
17.5
21.3
22,7
18,1
-19,5
25.5
18.6
13.1
25.5
13.6
15.3
22.1
18,1
21.7
23.3
21.3
21,1
19.5
15.3
22.5
23.5
19,9
15.8
20.5
23.6
19.6
17.6
19.7
19,1
22,0
20.8
15.0
23.6
23.6
21.1
24.4
14.8
14.8
22.9
24.5
23.7
17.5
12.5
■23JL
10,4'
Ш
r’V'i ___ 217,6
20,0
21,7
: о9
19,3
160
29,2
24,2
161
13,7
16,1
162
20,6
22,9
163
19,6
21,7
164
15,6
19,7.
JJL 6 ....14J>J
..
Т р ■
160
21,8
89
90
91
92
93
94
95
96
97
98
99
00
01
02
03
04
05
06
07
08
т
11SL.
и
12
13
14
15
16
17
18
19
20
!1
23
24
25
26
27
28
29
30
31
|Т83
184
185
186
187
188
189 .
190
191
м
18.3
16.5
21.5
24.5
21.3
15.5
21.7
17.7
19.5
16.3
23.9
24.0
17.9
17.5
20.3
21.1
18.7
-34,5
22,9
21.5
Ж
‘5
11.7
10,0
28.4
18,0
21,9
17.1
14.1
17.2
21.5
27.3
23.5
17.6
11.4
27.4
29.8
26,2
25,0
25,3
20.6
И Д,
31,6
22,7
32,7
18,8
23,3
22,6
23,6
36,7
23,2
22.6
15,8»
14.0
,,
22 8
19.5
21.3
18,7
19.5 '
22.5
22.0
24.5
21.6
20.5
15.5
23.1
22.1
18.3
22.4
22.6
21,0
- ilk
25,5^
21,7
24,0
22,7
23,5
21,7
20,3
22,8
21,5
Продолжение таблицы I
№
деревь­
ев
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
Диа­
метр,
№
j
j деревь­
j
ев
Высота,
м
СМ
17,5
33,5
30,6
23,2 *
26,8
22,6
23,7
22,7
23,5
23,7
22,7
23,7
22,5
19,7
22,5
21,7
18,7
20,7
22,8
21,3
23,1
18,5
26,6
18,8
16,6
20,7
17,2
13,4
17,4
21,5
16,4
18,4
16,3
26,1
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
18,5
22,7
22,5
№
деревь­
ев
Вы­
сота,
м
Диа­
метр,
см
21,8
21,7
20,5
23,4
22,7
13,0
22,5
20,0
21,6
11,7
25,9
21,9
13,6
17,4
16,4
17,9
23,7.
23,9
14,7
17,7
15,0
21,5
24,6
22,1
11,8
20,0
30,7
192
193
194
195
196
197
198
199
Диа­
метр,
см
Вы­
сота,
м
18,3
27,2
19,5
22,7
20,7
14,4
16,8
22,0
13,1
18,5
26,6
25,8
21,2
22,7
21,0
20,2
20,2
200
201
202
18,0
19,0
21,3
18,5
18,5
11,4
22,5
23,9
15,7
19,5
9,4
203
В табл. 1 шисаны значения диаметров и высот 205 изме­
ренных деревьев ели.
В качестве исходных данных для расчетных (контроль­
ных) работ выписывают значения двух указанных признаков
следующих номеров деревьев (табл. 2).
Таблица 2
Варианты заданий для контрольных работ
1
№
варианта
чадания
1
2
1— 110
1— 20 ,
101— 200
6*
7
No
деревьев
из табл. 1
приложен.
№
варианта
задания
№
деревьев
из табл. 1
приложен.
96— 200
3
4
1— 50,
1—30,
146—
205
121— 205
5
1—60,
156— 200
9
8
11 — 110,
31— 60,
71— 130,
126— 135 121—205 146— 190
10
91— 205
Таблица 3
Мантиссы обыкновенных логарифмов чисел
Числа
П
1
2
0000
Числа
П
11
12
9
ЗОЮ
4771
6021
6990
7782
8451
9031
9542
13
14
15
16
17
18
19
10
0000
20
3
4
5
6
7
8
70
Ман­
тиссы
М ан­
тиссы
0414
0792
1139
1461
1761
2041
2304
2553
2784
ЗОЮ
Числа | Ман­
тиссы
П
21
22
23
24
25
26
27
28
29
30
3222
3424
3617
3802
3979
4150
4314
4472
4624
4771
Числа
П
90
91
92
93
94
95
96
97
98
99
М ан­
тиссы
9542
9590
9638
9685
9731
9777
9823
9868
9912
9956
Числа
П
100
105
110
115
120
125
130
140
150
М ан­
тиссы
0000
0212
0414
0607
0792
0969
1139
1461
1761
Таблица 4
Значений чётв<фтых моментов разрядных частот**пХк1
II
Хк
2
хк
! хк” 4
Xк
хк --=6
хк- 7
Хк---- 8
1296
2592
3888
5184
6480
7776
9072
10368
11664
12960
14256
15552
16848
18144
19440
20736
22032
23328
24624
25920
27216
28512
29808
31104
32400
33696
34992
36288
37584
38880
40176
41472
42768
44064
45360
46656
47952
49248
50544
5Т840
53136
54432
55728
57024
58320
59616
60912
62208
63504
64800
2401
4802
7203
9604
12005
14406
16807
19208
21609
24010
26411
28812
31213
33614
36015
38416
40817
43218
45619
48020
50421
52822
55223
57624
60025
62426
64827
67228
69629
72030
74431
76832
79233
81634
84035
86436
88837
91238
93639
96040
98441
100842
103243
105644
108045
110446
112847
115248
117649
120050
4096
8192
12288
16384
20480
24576 ’
28672
32768
36864
40960
45056
49152
53248
57344
61440
65536
69632
73728
77824
81920
86016
90112
94208
98304
102400
106496
1\
0592
114688
118784
122880
126976
131072
135168
139264
143360
147456
151552
155648
159744
163840
167936
172032
176128
180224
184320
188416
192512
196608
200704
204800
Хк~9
1
6
16
32
48
64
80
96
7
112
8
128
144
160
176
192
208
224
240
256
272
288
304
320
336
352
368
384
400
416
432
448
464
480
496
512
528
544
560
576
592
608
624
640
656
672
1
2
3
4
5
9
10
11
12*
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
688
704
720
736
752
768
784
800
256
512
768
1024
1280
Ш
486
1536
567
1792
648
2048
2304
729
2560
$ |0
2816
891
3072
972
1053
3328
3584
1134
3840
1215
1296
4096
1377
4352
4608
1458
4864
1539
1620
5120
5376
1701
5632
1782
1863
5888
1944 •' 6144
6400
2025
6656
2106
2187
6912
2268
7168
7424
2349
2430
7680
7936
2511
2592
8192
8448
2673
8704
2754
8960
2835
9216
2916
2997
9472
9728
3078
9984
3159
10240
3240
10496
3321
10752
3402
3483
11008
3564
11264
3645
11520
3726
11776
3807
12032
12288
3888
12544
3969
12800
4050
81
162
243
324
625
1250
1875
2500
3125
3750
4375
5000
5625
6250
6875
7500
8125
8750
9375
10000
10625
11250
11875
12500
13125
13750
14375
15000
15625
16250
16875
17500
18125
18750
19375
20000
20625
21250
21875
22500
23125
23750
24375
25000
25625
26250
26875
27500
28125
28750
29375
30000
30625
31250
6561
13122
19683
26244
32805
39366
45927
52488
59049
65610
72171
78732
85293
91854
98415
104976
111537
118098
124659
131220
137781
144342
150903
157464
164025
170586
177147
183708
190269
196830
203391
209952
216513
223074
229635
236196
242757
249318
255879
262440
269001
275562
282123
288684
295245
301806
308367
314928
321489
328050
Значения четвертых моментов разрядных частот nxi, 4 находят на
перрееч ейни значения частоты п и условного отклонения х к •
Таблица 5
Значения нормальной функции распределения и ее производных
f(x)
f ,v(x)
Р »(т )
f vl( . )
<-Г
V
0,39894
39892
39886
39876
39862
39844
39822
39797
39767
39733
+ 0,00000
01197
02393
03588
04781
05972
07159
08344
09524
10699
+ 1,19683
19653
19563
19414
19204
18936
18608
18221
17775
17271
0,50
51
52
53
54
55
56
57
58
59
0,35207
35029
34849
34667
34482
34294
34105
33912
33718
33521
+0,48409
48948
49465
49959
50431
50880
51306
51710
52091
52448
+ 0,55010
52791
50556
48308
46048
43777
41497
39208
36913
34613
39695
39654
39608
39559
39505
39448
39387
39322
39253
39181
11869
13033
14190
15341
16484
17618
18744
19861
20968
22064
16708
16088
15410
14676
13885
13038
12137
11180
10170
09106
60
61
62
63
64
65
69
33322
33121
32918
32713
32506
32297
32036
31874
31659
31443
52783
53094
53383
53648
53891
54110
54306
54480
54630
54758
32309
30003
27696
25390
23085
20783
18486
16195
13912
11636
23
24
25
26
27
28
.29
.39104.
39024
38940
38853
38762
38667
38568
38466
38361
38251
23150
24224
25286
26336
27373
28396
29405
30401
31381
32346
07990
06823
05604
04335
03018
01651
1,00238
0,98778
JJZ2Zа .
95723
70
71
72
73
74
75
76
77
78
79
.31225
31006
30785
305G3
30339
30114
29887
29659
29430
29200
$ш д
54863
54945
07116
04874
55005
02646
55043 v
55058
+0,00433
55052
-0,01764
03944
55023
54973
06106
54901
08248
54808
10369
30
31
32
33
34
35
36
37
38
39
38139
38023
37903
37780
37664
37524
37391
37255
37115
36973
33295
34228
35145
36045
36927
37791
38638
39466
40275
41065
94130
92495
90819
89103
87348
85555
83726
81862
79963
78032
80
81
82
83
84
85
89
28969
28737
28504
28269
28034
27798
27562
27324
27086
26848
54694
54559
54403
54227
54031
53814
53579
53324
53049
52757
12468
14545
16597
18621
20626
22600
24546
26464
28351
30208
40
41
42
43
44
45
46
47
48
49
36827
36678
36526
36371
36213
36053
35889
35723
35553
35381
41835
42586
43317
44027
44717
45386
46034
46660
47265
47848
76070
74077
72056
70007
67932
65832
63709
61564
59398
57213
90
91
92
93
94
95
96
97
98
99
26609
26369
26129
25888
25647
25406
25164
24923
24681
24439
52445
52116
51769
51404
51023
50624
50210
49779
49332
48871
32034
33827
35587
37314
39005
40668
42283
43867
45414
46923
0,50
0,35207
+ 0,48409
+ 0,55010
1,00
0,24197
+0,48394
—0,48394
<т
V
0,00
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
72
66
67
68
86
87
88
f(x)
l lu (x)
Продолжение таблицы 5
f(x)
f m (x)
f'V(*)
X
f(x)
+ 0,48394
47903
47398
46879
46346
45801
45243
44673
44092
43499
—0,48394
49827
51220
52573
53887
55160
56393
57584
58734
59843
1,50
51
52
53
54
55
56
57
58
59
0,12952
12758
12566
12376
12188
21785
21546
21307
21069
20831
20594
20357
20121
19886
19652
42895
42281
41657
41023
40380
39728
39067
38399
37724
37041
60909
61934
62917
63857
64755
65611
66425
67196
67924
68610
60
61
62
63
64
65
gQ____19419
19186
22
18954
23
18724
24
18494
25
18265
26
18037
27
17810
28
17585
29
17360
36352
35656
34955
34248
33536
32820
32099
31375
30648
29917
.69255
69857
70417
70935
71411
71847
72241
72594
72907
73180
70
71
72
73
74
75
76
77
78
79
30
31
32
33
34
35
36
37
38
39
17137
16915
16694
16474
16256
16038
15822
15608
15395
15183
29184
28449
27712
26974
26235
25495
24755
24015
23276
22537
73413
73606
73760
73876
73953
73993
73995
73961
73890
73784
80
81
82
83
84
85
40
41
42
43
44
45
46
47
48
49
14973
14764
14556
14350
14146
13943
13742
13542
13344
13147
21800
21065
20331
19600
18871
18145
17423
16704
15988
15277
1*50 0,12952
+ 0,14571
1,00 0,24197
01
23955
23713
02
23471
03
23230
04
22988
05
06 22747
22506
07
22265
08
22025
09
10
И
12
13
14
15
16
17
18
19
66
67
68
69
f 'V(T)
11816
11632
11450
11270
+ 0,14571
13869
13172
12481
11795
11114
10440
09772
09111
08456
—0,70425
69937
69423
68881
68314
67721
67104
66463
65799
65113
11092
10915
10741
10567
10396
10226
10059
09893
09728
09566
07809
07168
06535
05910
05292
04682
04081
03487
02903
02326
64405
63677
62928
62161
61375
60571
59751
58914
58063
57202
12001
09405
01759
09246
01200
09089
00650
08933 + 0,00110
08780 --0,00422
00944
08628
08478
01456
08329
01959
'08185
02453
08038
02937
56316
55422
54516
53599
52671
51733
50785
49m 48865
47893
87
S8.
89
07895
07754
07614
07477
07341
07206
07074
06943
06814
06687
03411
03875
04329
04774
05208
05633
06047
06452
06846
07.231
46915
45932
4.4943
4*3950
42953
41953
40950
39946
38940
37934
73642
73466
73256
73012
72736
72427
72087
71716
71315
70885
90
91
92
93
94
95
96
97
98
99
06562
06438
06316
06195
06077
05959
05844
05730
05618
05508
07605
07969
08323
08667
09002
09326
09640
09944
10239
10523
36928
35923
34918
33916
32916
31919
30925
29936
28950
27970
— '0,70425
2,00
0,05399
—0,10798
—0,26996
86
73
Продолжение таблицы 5
X
f(t)
f vl(x)
fw
V "{ * )
2,50
51
52
53
54
55
56
57
58
59
0,01753
01709
01667
01625
01585
01545
01506
01468
01431
01394
—0,14242
14160
14075
13986
13894
13798
13700
13599
13495
13388
+ 0,07997
08360
08710
09047
09372
09683
09982
10268
10542
10804
67
01358
01323
01289
01256
01223
01191
01160
01130
68
01100
13279
13167
13053
12937
12818
12698
12576
12452
12326
12199
11053
11291
11517
11732
11935
124 27
1230&
12479
12638
12787
12071
11941
11810
11677
11544
11410
11274
11139
/Т
V
f ,vW
\
0,05399
05292
05186
05082
04980
04879
04780
04682
04586
04491
—0,10798
11063
11319
11565
11801
12028
12245
12454
12653
12844
— 0,26996
26027
25064
24109
23160
04398
04307
04217
04128
04041
03955
03871
03788
03706
03626
13024
13196
13359
13513
13659
13797
13926
14046
14159
14263
17646
16759
15883
15017
14162
13318
12486
11665
10856
10059
60
61
62
63
64
65
69
01071
22
23
24
25
26
27
28
29
03547
03470
03394
03319
03246
03174
03103
03034
02965
02898
14360
14449
14530
14604
14670
14729
14781
14826
14864
14895
09274
08502
07743
06996
06263
05542
04835
04141
03461
02794
70
71
72
73
74
75
76
77
78
79
01042
01014
00987
00961
00935
00909
00885
00861
00837
00814
10865
12926
13055
13174
13283
13383
13473
13555
13627
13691
13746
30
3"l
32
33
34
35
36
37
38
39
02833
02768
02705
02643
02582
02522
02463
02406
02349
02294
14920
14938
14950
14956
14955
14949
14937
14919
14896
14868
02141
- 01502
00877
—0,00265
+ 0,00332
00915
01485
02040
02582
03109
80
81
82
83
84
85
00792
00770
00748
00727
00707
00687
00668
00649
00631
00613
10727
10589
10450
10312
10173
10034
09895
09755
09616
09478
13793
13832
13863
13886
13902
13910
13912
13906
13894
13875
40
41
42
14834
14795
14752
14703
14650
14593
14531
14464
14394
44320
03623
04122
04608
05079
05537
05981
06411
06828
07231
07621
90
91
92
93
94
46
47
48
49
02239
02186
02134
02083
02033
01984
01936
01888
01842
01797
00595
00578
00562
00545
00530
00514
96 о 00499
97
00485
00470
98
99
00457
09339
09201
09063
08925
08789
08651
08515
08380
08245
08111
13850
13819
13782
13739
13681
13638
13579
13515
13446
13373
50
0,01753
— 0,14242
+0,07997
3,00
—0,07977
+0,13296
,00
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
43
44
45
22220
21287
20363
19448
18542
66
86
87
88
89
0,00443
11002
Продолжение таблицы 5
f(x)
3,00
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
f"i(x )
f lV(T)
•z
f(T)
f!l!W
0,00443
00430
00417
00405
00393
00381
00370
00358
00348
00337
— 0,07977
07845
07713
07582
07452
07323
07195
07068
06943
06818
+ 0,13296
13214
13128
13038
12944
12847
12747
12643
12536
12426
3,50
51
52
53
54
55
56
57
58
59
0,00087
00084
00081
00079
00076
00073
00071
00068
00066
00063
-—0,02825
02757
02689
02623
02558
02494
02432
02370
02310
02252
+ 0,06943
06814
06685
06558
06432
06308
06184
06062
05941
05821
00327
00317
00307
00298
00288
00279
00271
00262
00254
00246
06694
06571
06450
06330
06211
06093
05977
05861
05747
05635
12313
12198
12080
11960
11838
11714
11588
11460
11330
11199
60
61
62
63
64
65
69
00061
00059
00057
00055
Т1Ш З
00051
00049
00047
00046
00044
02194
02138
02082
02028
01975
01923
01873
01823
01774
01727
05703
05585
05471
05357
05240
05133
05023
04915
04808
04703
00238
00231
00224
00216
11066
10933
10798
10662
10525
10387
10249
09370
09830
70
71
72
73
74
75
7£>
77
78
79
00042
00041
00039
00038
00037
00035
00034
00033
00031
00030
01680
01635
01590
01547
01504
01463
01422
01383
01344
01306
04599
04497
04396
04297
04200
04103
04009
03916
03824
03734
80
81
82
83
84
85
00029
00028
00027
00026
00025
00024
* 3
01269
01233
01198
01164
01130
01098
01066
01035
01004
00975
03646
03559
03473
03389
03307
03226
03146
03068
02991
02916
02842
02770
02690
02630
02562
02495
02430
02366
02303
02242
+ 0,02181
66
67
68
23
24
25
26
27
28
29
00203
00196
00190
00184
00178
05523
05413
05305
05196
05092
04987
04884
04782
04682
04583
30
31
32
33
34
35
36
37
38
39
00172
00167
00161
00156
00151
00146
00141
00136
00132
00127
04485
04389
04294
04201
04109
04018
03929
03841
03755
93670
09690
09549
09409
09268
09128
08987
08847
08707
08567
08428
89
40
41
42
43
44
45
46
47
48
49
00123
00119
00115
00097
00094
00090
03586
03504
03423
03344
03266
03189
03114
03040
02967
* 02895
08290
08151
08014
07877
07741
07606
07471
07338
07205
07074
90
91
92
93
94
95
96
97
98
99
00018
00017
00016
00016
00015
00014
00014
00946
00918
00891
00864
00838
00813
00788
00764
00741
00718
0,00087
— 0,02825
+ 0,06945
4,00
0,00013
-—0,00696
20
21
22
3,50
f ,v(x)
00210
00111
00107
00104
00100
10110
86
87
88
00022
00021
00021
00020
00019
0 0 0 1'8
75
В табл. 5 даны значения нормальной функции распреде­
ления f (т) и значения третьей и четвертой ее производных:
fin(x) и flv(x).
Значения f111 (г) даны для положительных отклонений т*.
Для отрицательных отклонений знак, указанный в таблице,
нужно менять на обратный. Для I (т) и f lv (т) знаки принима­
ют такими, какими они указаны в таблице, независимо от
знака при отклонении т. При значениях т, вычисленных с тре­
мя значащими цифрами после запятой, т. е. с точностью до
0,001, значение функции и ее производных находят путем ин­
терполяции.
Пример. Найдем значение нормальной функции распреде­
ления для т — 2,959, или, что то же самое, для т= 2,959.
При т-2,95
f (т) =0,00514,
а
при т = 2,96 f ( r ) = 0,00499.
Следовательно,
разнице в нормированных отклонениях,
равной 0,01, соответствует различие в функции, равное
0,00015, т. е. в 15 единиц разряда последней цифры функции.
Разнице между т = 2,959 и ближайшим т, имеющимся п
таблице (2,96), равной 0,01, соответствует различие в функ­
ции, равное 0,00001 или в единицах разряда последней цифры
15x0,001
1с
функции: -- -------- =1,5, округлим до I.
Прибавив эту поправку к значению функции 0,00499 (так
как от т —2,96 к т = 2,95 значение функции возрастает), полу­
чим: при х = — 2,959 f (т) = 0,00500.
Таблица G
Значения критерия t
(pt = 0,95,
v
число степеней свободы.
v принимается ранным N— 1,
i
V
t(),05
|
Ь ,01
1
j
для трех степеней вероятности
р 2=0,99, р3= 0,999)
При оценке средней величины признака
при оценке показателей связи v = N— 2 .
,
То,00!
V
to,05
10,(11
to,001
2,2
2,1
2,1
2,1
2,1
3,0
3,0
2,9
2,9
4,1
4,1
4,0
3,9
3,8
3,7
3,7
3,7
3,6
3,5
3,4
3,3
г
I
2
3
4
5
12,7
4,3
3,2
2,8
2,6
G
~7
/
2,4
2,4
2,3
2,3
8
9
10
11
12
76
2,2
2,2
2,2
63,7
9,9
5,8
4,6
Ш ,7
4,0
3,7
3,5
3,4
3,3
3,2
3,1
3,1
6,9
31,6
12,9
8,6
6,0
5,3
5,0
4,8
.4,6
4,4
4,3
13
14'— 15
16— 17
18— 20
21— 24
25— 28
29— 30
31— 34
35— 42
43— 62
63— 175
176 и
больше
2,4.
2,0
2,0
2,0
2,0
2,0
2,0
2,8
2,8
2,8
2,7
2,7
2,7
2,6
2,6
Таблица 7
Значения величины z для значений г от 0 до 0,999
1
2
4
5
СО
0
со
г
7
8
9
0,0
0,000
0,010
0,020
0,030
0,040
0,050
0,060
0,070
0,080
0,090
J
0,100
0,110
0,121
0,131
0,141
0,151
0,161
0,172
0,182
0,192
2
0,203
0,213
0,224
0,234
0,245
0,255
0,266
0,277
0,288
0,299
з
0,310
0,321
0,332
0,343
0,354
0,365
0,377
0,388
0,400
0,412
4
0,424
0,436
0,448
0,460
0,472
0,485
0,497
0,510
0,523
0,536
5
0,549
0,563
0,576
0,590
0,604
0,618
0,633
0,648
0,662
0,678
{)
0,693
0,709
0,725
0,741
0,758
0,775
0,793
0,811
0,829
0,848
i
0,867
0,887
0,908
0,929
0,950
0,973
0,996
1,020
1,045
1,071
8
1,099
1,127
1,157
1,188
1,221
1,256
1,293
1,333
1,376
1,422
9
1,472
1,528
1,589
1,658
1,738
1,832
1,946
2,092
2,298
2,647
ОГЛАВЛЕНИИ
- OrJO.;> ' ' : •
*
Стр.
Предисловие .......................................................................................3
Глава I. Вариационная статистика, ее метод, теоретическая и
опытная о с н о в а ..............................................................................5
Метод и теоретическая основа статистики ...................................
Н а б л ю д е н и е ......................................................................................7
Глава II. Составление рядов и таблиц распределения числен­
ностей. Графическое их и з о б р а ж е н и е .................................. 8
Составление рядов и таблиц распределения
.
.
.
.
Графическое изображение рядов и таблиц распределения
.
Глава III. Понятие о статистических показателях распределе­
ния численностей
.....................................................................
Средняя а р и ф м е т и ч е с к а я ........................................................... 16
Среднее квадратическое о т к л он е н и е ..........................................17
Коэффициент вариации
.
.
.
.
.
.
.
.
Показатель асимметрии и показатель эксцесса
. . .
Глава IV. Способы вычисления статистических показателе^
распределения численностей
....................................................
Способ непосредственных в ы ч и с л е н и й ................................. 22
Способ условного начала
.............................................................
Способ произведений
.
.,
.................................................. 25
Понятие о моментах ряда ■распределения................................. 25
Вычисление начальных м о м е н т о в ......................................... 25
Вычисление статистических * показателей Гдля выборки диа­
метров)
.
. ». г.
. /
.
.
.
.
.
.2
5
8
15
16
20
20
22
23
9
*
Глава V Ошибки выборочных "наблюдений. Оценки пара­
метров
.................................................................................... 30
Понятие о параметрах и методе их опенки
.
.
.
.
Средняя ошибка выборочной средней величины
.
.
.3
Показатель точности опыта
* ..................................................32
Средние ошибки других выборочных статистических показа­
телей
.
...................................................................32
Критерий t
.................................................................................... 32
Оценки п а р а м е т р о в ...................................................................33
Оценка з н а ч и м о с т и ................................................................... 34
Значимость разности между с р е д н и м и .................................35
Значимость различия между стандартными отклонениями
.
Определение объема в ы б о р к и ..................................................36
Оценки параметров совокупности диаметров ивысот сосны .
30
1
36
37
Глава VI. Выравнивание рядов распределения. . .
38
Выравнивание рядов по уравнению нормального распределе­
ния
.
,
.
.
.
.................................................. 38
Выравнивание рядов по уравнению кривой распределения
типа А
.................................................................................... 41
Оценки согласия между эмпирическим и ''еоретическим рас­
пределением
........................................................................... 43
Глава VII. Понятие о статистических показателях связи. Спо­
соб вычисления их для малой выборочнойсовокупности
.
46
Глава VIИ. Вычисление показателей связи для большой вы­
борочной совокупности
.
.
.
.
.
.
. 4 8
78
Глава IX. Оценка показателей связи. Оценка связи между
признаками
.............................................................................53
Оценка показателей связи
...........................................................
53
Оценка связи между п р и з н а к а м и ...........................................55
Глава X. Уравнения связи
.
...........................................56
Линейное корреляционное уравнение ...........................................
56
Уравнение прямой линии
.
.
........................................... 60
уравнение параболы 2 -го п о р я д к а ...........................................63
Уравнения логарифмических п а р а б о л .................................. 66
П р и л о ж е н и я ..................................................................................... 69
Таблица 1. Ведомость измеренных диаметров и высот де­
ревьев
..................................................................................... 68
Таблица 2. Варианты заданий для контрольных работ .
.
70
Таблица 3. Мантиссы логарифмов ч и с е л .................................. 70
Таблица 4, Значения четвертых моментов разрядных частот
71
Таблица 5. Значения нормальной функции распределения и
ее производных .
.....................................................................72
Таблица 6 . Значения критерия t для трех степеней вероят­
ности,
........................................................................................ 76
Таблица 7. Значения величины г для значений от 0 до 0,999
77
1
\
Скачать