МИНИСТЕРСТВО ВЫ СШ ЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО ОБРАЗОВАНИЯ СССР МОСКОВСКИЙ ЛЕСОТЕХНИЧЕСКИЙ ИНСТИТУТ ;* И. II. > ПАП СТАТИСТИКА УЧЕБНОЕ ПОСОБИЕ ДЛЯ СТУДЕНТОВ Л ЕСО ХО ЗЯЙ СТ ВЕН Н О ГО ФАКУЛЬТЕТА М о с к в а — 1983 М ИНИСТЕРСТВО ВЫ СШ ЕГО И СРЕД Н ЕГО СП ЕЦ И А Л ЬН ОГО ОБРАЗОВАНИЯ СССР М ОСКОВСКИЙ Л ЕСО Т ЕХН И ЧЕСК И Й ИНСТИТУТ Н. Н. СВАЛОВ ВАРИАЦИОННАЯ СТАТИСТИКА У ЧЕБН О Е П О С О Б И Е Д Л Я СТУДЕНТОВ Л Е С О Х О ЗЯ Й С Т В Е Н Н О Г О ФАКУЛЬТЕТА 9 М о с к в а — 1983 УДК 630 х 5 Одобрено и рекомендовано тельюиим советом института к печати р едакциошю -изда - Кафедра лесной таксации и лесоустройства Николай Николаевич Свалов ВА РИ А Ц И О Н Н А Я Учебное СТАТИСТИКА пособие для студентов лесохозяйственного факультета И з д а н и е 3-е Рецензенты — ст. преп. ка/федры лесной таксации ВЛТИ Н. В. Гладышева, доцент Марийского политехнического института М. М. Михайлов. Редактор РИ О — Н. Д. Ьл а годато ва Корректор — А, А. Гусева. По темэпическому плану издания учебной литературы на 1983 год, поз. 2. (g) Московский лесотехнический институт, 1983 г. Л -75408 Подп. к печ. 27.12.83 г. Объем 3 уч.-изд. п. л., 5 п. л. Тираж 1000 экз. Цена 50 коп. Заказ № 82 Типография Московского лесотехнического института П Р Е Д И С Л О В И Е Учебное пособие имеет цель — помочь студентам вьвпошнить расчетную работу »по курсу в ар иациоин о й статистики и дать анализ статистической совокупности. Расчетная работа по курсу охватывает два раздела, назы­ ваемых «Вариация (изменчивость) значений признака» и «Корреляция (взаимосвязь) между признаками». Исходными материалами для работы служат данные измерений относите­ льно двух каких-либо признаков, например, относительно диа­ метра и высоты деревьев в большой выборочной совокупности (N > 25 — 30). Исходные материалы могут быть выданы на кафедре в ви­ де списка наблюденных значений признаков или взяты из табл. 1 приложения, в соответствии с вариантом, указанным преподавателем. Студенты-заочники, не получившие по какимлибо причинам индивидуального задания, выписывают исход­ ные данные из той же таблицы, принимая вариант, соответст­ вующий последней цифре установленного деканатом шифра. Студенты заочного обучения представляют результаты рас­ четов в виде двух контрольных работ, каждая из которых отно­ сится к одному из вышеназванных разделов. Моменты и статистические показатели следует вычислить с точностью до 0 ,001 . Данные расчета должны фиксировать­ ся подробно с указанием промежуточных результатов. Каж­ дый этап вычислений нужно проверять. В качестве учебных пособий, наиболее соответствующих программе курса, рекомендуются следующие: Свалов Н. II. «Вариационная статистика», изд. «Лесная промышленность», 1977; Дворецкий М. Л. Пособие по вариационной статистике, изд. «Лесная промышленность», 1971. Свою работу студент выполняет в последовательности, при­ нятой в пособии. При этом он должен читать все приведенные объяснения, необходимые для понимания техники вычислений и сущности статистических показателей. Для уяснения обработки малой выборки, которая проще раскрывает сущность статистических показателей, студент 3 комiпси со способом непосредственных вычислений и спо­ собом условного начала (табл. 7 и 8 ). Студенты-заочники после составления и графического изо­ бражения рядов распределения в своей контрольной работе отводят страницу для «статистической обработки малой вы­ борки». Студенты, имеющие шифр, заканчивающийся нечет­ ной цифрой, берут из табл. 7 первые пять значений X, равные 5, б, 5, 7, 4 см и рассчитывают х, S, V, по способам и схеме табл. 7 и 8 . Студенты с четной последней цифрой шифра такую же об­ работку производят па основе 5 последних вариант из табл. 7 . Исли студент пожелает более индиви-дуализирювать свою ма­ лую вьиборку, он может взять другое — большее число вари­ ант, например 6 , 7 или более, или даже первые 10 дат (вари­ антов) высоты из своего индивидуального задания. Студенты очного обучения расчеты статистик при малой выборке производят на контрольном занятии. Обработку боль­ шой выборж-и, т. е. ряда диаметров и ряда высот то 'способу гьроизведешш, производят по схеме табл. 9. По получении выбо­ рочных статистических показателей х, 3, V, А, Е следует умо­ зрительно представить среднюю величину признака, среднее и предельное отклонение вариант, косость и крутость кривой распределения. Г Л А В А I В А РИ А Ц И О Н Н А Я СТАТИСТИКА, ЕЕ МЕТОД, ТЕОРЕТИЧЕСКАЯ И ОПЫ ТНАЯ О СН О В А Метод и теоретическая основа статистики В лесохозяйственных и биологических исследованиях по­ стоянно имеют дело с оценкой массовых явлений. Эти явления нередко представляются сложными, с первого взгляда беспо­ рядочными, вследствие разнообразия (варьирования) в раз­ мерах, весе или в поведении отдельных единиц или индивиду­ умов, составляющих наблюдаемые мзссовые явления. Чтобы разобраться в сущности таких явлений и дать им ко­ личественную оценку, необходимо располагать соответству­ ющим методом и теорией. Вариационная статистика излагает методы изучения мас­ совых явлений и построения для них количественных оценок. Отдельные единицы или индивидуумы, подлежащие на блюде нию (измерению, взвешиванию или подсчету), называют ва­ риантами. Коллективы отдельных единиц, характеризующихся определенной общностью, называют статистическими сово­ купностями. Различают совокупности генеральные и выборочные. Ге­ неральной совокупностью является весь коллектив единиц, подлежащий изучению. Число единиц в таком коллективе бес­ конечно большое. Выборочной совокупностью, или выборкой, называют часть единиц, выбранных для наблюдения. При статистических наблюдениях в биологии практически всегда имеют дело с выборками и по результатам их судят о совокупности. Таким образом вариационная статистика при­ меняет метод индукции, когда обобщения делают, изучив от­ дельные случаи. Правомерность этого метода основа па па ис­ пользовании важнейших понятии и положений теории веро­ ятностей. Одним из основных понятий этой теории является вероят­ ность. Вероятностью события А называют отношение числа случаев, благоприятствующих появлению данного события, к а числу всех возможных случаев. Вероятность обозначают бук­ вой р с указанием в скобках индекса события, в нашем случае события А. Ее определяют по формуле: р ( А ) = п/м, где ( 1) п — число случаев, благоприятствующих событию А; N' — общее число случаев. Так, если в урне содержится 5 одинаковых перемешанных шаров, причем 2 из них черные, а 3 — белые, то вероятность вынуть наудачу белый шар равна -р(А) = 3/5= 0 ,6 , а вероят­ ность вынуть черный шар р(В ) = 2/5 = 0 ,4. Вероятность изменяется от нуля до единицы. Вероятность, равная нулю, указывает, что событие является невозможным; вероятность, равная единице, означает, что событие единст­ венно возможное или достоверное. Если появление одного события исключает появление дру­ гого события, их называют несовместными. В указанном примере события А и В — несовместные. Сумма вероятностей несовместных событий равна единице Р(А) + р (В ) = 1. События называют равновозможными, если ни одно из них не является более возможным, чем другие. Вероятности таких событий одинаковы. В лесобиологических работах вероятность чаще всего ус­ тановить невозможно, так как вся изучаемая генеральная совокупность и ее состав неизвестны, например, число дере­ вьев разной толщины в большом участке леса. В таких слу­ чаях получают аналог вероятности на основе опыта в выбо­ рочной совокупности. Подсчитывают число испытаний, в которых событие прак­ тически появилось, и- относят его к общему числу испытаний. Это отношение называют относительной частотой события п выражают формулой: (2 ) где п — число появлений события; N — общее число испытаний. Длительные наблюдения показали, что при одинаковых условиях испытаний и достаточно большом их числе относи­ тельная частота в различных опытах изменяется мало, тем меньше, чем больше объем выборки. Она колеблется (варьи­ рует) около некоторого постоянного числа. Это замечательное свойство относительных частостей называется устойчивостью относительной частоты, или статистической устойчивостью. 6 Данные, шведской статистики относительно рождения де­ вочек за 1935 г. приведем в качестве примера устойчивости относительной частоты. По месяцам, начиная с января, она характеризуется следующими значениями: 0,486; 0,489; 0,471; 0,478; 0,482; 0,462; 0,484; 0,485; 0,491; 0,482; 0,473. Данные других стран примерно те же. Постоянное число, около которого варьируют относитель­ ные частоты, является вероятностью появления события. Таким образом, если опытным путем установлена относи­ тельная частота, то полученное число можно принять за при­ ближенное значение вероятности. Относительные частоты в указанном примере колеблются около числа 0,482, которое можно принять за приближенное значение вероятности рождения девочек. Следует обратить внимание, что такое суждение о вероят­ ности на основе относительной частоты тем надежнее, чем больше число испытаний или объем выборки. Многократные опыты бросания монеты, в которых подсчи­ тывали число появления герба, дали следующий результат: число бросаний: 4040, 12000; 24000; относительная частота: 0,5069; 0,5016; 0,5005; Вероятность появления герба равна 0 ,5 . Нетрудно представить или испытать на опыте, что при ма­ лом числе наблюдений, например, при 10 бросаниях, такое приближение относительной частоты к вероятности, очевидно, не получить. Наблюдение Наблюдение является опытной основой статистического исследования. Для того, чтобы по данным выборки можно было бы с оп­ ределенной степенью уверенности делать заключения о со­ вокупности, выборочное наблюдение должно быть правильно организован о. Решают два основных вопроса: 1 ) какое число наблюдений является достаточным ; 2 ) какие единицы совокупности должны быть выбраны для наблюдения, т. е. составлять выборку. Первый вопрос может быть решен с помощью таблицы достаточно больших чисел, которая приводится во многих пособиях но статистике или с применением формулы 51. Отбор единиц для наблюдения может быть спланирован различным О'бразом в зависимости ют состава совокупности и сведений о ней. Если совокупность варьирует не в слишком широких пре­ делах и, если выборка составляет не менее 2 0 % объема сово­ купности, применяют простой случайный отбор единиц или простое выборочное наблюдение, /[ля этого удобно пользо­ ваться таблицей случайных чисел. 7 Нередко применяют систематическое выборочное наблю деиие. Например, если предстоит взять 10%-ную выборку деревьев из 800 шт., то можно случайным порядком выбрать одно, положим 5, и после этого брать каждое через 10 номе­ ров, т. е. за номерами: 15, 25, 35, и- т. д., кончая нюмером 795. Если имеются сведения о том, что совокупность в своих частях неодинакова, например с более высоким уровнем яв­ ления в одних частях чем в других, целесообразно послойное выборочное наблюдение. Например, известно, что запас древостоев меньше варьирует в пределах классов возраста. Тог­ да для получения статистических характеристик величины запаса всю совокупность древостоев расчленяют на группы по возрасту. Получим слои совокупности, для каждого из ко­ торых берут независимую выборку и вычисляют ее характе­ ристики. Статистическая обработка материалов опыта послой­ ной выборки несколько сложнее. Нижеизложенные методы статистической обработки материалов наблюдений относятся к простой выборке или ее суррогатам. ГЛАВА II СОСТА ВЛ ЕН И Е РЯ Д О В И ТАБЛИЦ РА СП РЕД ЕЛ Е Н И Я Ч И С Л Е Н Н О С Т Е Й . ГРА Ф И ЧЕСК О Е ИХ И ЗО Б Р А Ж Е Н И Е Составление рядов и таблиц распределения Первичные данные наблюдений чаше всего представляют в виде списка наблюдаемых значений признаков. В табл. 1 приведены результаты измерения диаметров и высот 94 ство­ лов сосны. Для того, чтобы придать опытным материалам опреде­ ленную наглядность или извлечь т них необходимую статисти­ ческую информацию о наблюдаемом признаке, материалы наблюдения подвергают сводке в статистические ряды и таб­ лицы. Статистическим рядом, или рядом распределения, называ­ ют ряд значений признака, размещенных в порядке возра­ стания или убывания, с указанием числа повторений (табл. 4, 5). Значения признака, сведенные в ряд, называют классовы­ ми вариантами, а число повторений их в классах — числен­ ностями, или частотами классов. Статистический ряд значений измеренного признака по­ лучают путем определения величины класса или интервала, размещения классов и распределения в них всех единиц на­ блюдения. 8 а, н О) s «} Высота, м s С О Н s о CQ № деревьев CQ си CD н Л си 04Q S > СО CU К цн с®» CU Cf g ^ ч Диаметр, см Таблица 1 Ведомость измеренных диаметров и высот стволов сосны 32 33 34 35 36 33.5 25,2 42.0 31.5 35.7 29.1 25.8 29,6 26.8 28.4 63 64 65 66 67 32,6 21,0 28,5 34,2 26,0 28,0 27,0 28,0 27,0 26,0 28,1 25.9 27.6 28.6 25.6 37 38 39 40 41 27.5 29.0 28.0 23.0 26.1 26.2 25,8 28,0 27.0 27.5 68 69 70 71 72 34,2 31,2 31,2 31,5 31,2 29,6 27,9 25,6 29,6 25,6 12 13 14 15 29,2_ 31.0 27.5 29.5 37.5 27.8 27,Г 27.8 28.6 28,0 42 43 44 45 46 18,0 38.5 41.5 33.0 33.5 24.0 28.6 29.6 25.6 28.5 73 74 75 76 77 30,0 27,5 29,7 23,0 19,5 29,6 28,5 27,9 25,0 20,5 16 17 18 19 20 34.0 20.5 17.0 26.4 29.0 28,6 16.5 22.0 39.0 34.0 37.5 22.6 21.7 28,1 28,4 47 48 49 50 51 27.6 28.4 29.6 29.5 78 79 80 81 82 28,0 28,7 37,2 26,5 41,5 25,8 28,6 29,1 26,6 28,6 21 22 23 24 25 37.2 24.5 23.5 36.5 •42,0 29.3 26.4 26,0 27,6 27.0 52 53 54 55 56 36.0 33.0 40.7 36.4 28.5 29,8v 28.6 27.7 28,2 24.8 83 84 85 86 87 35,5 27,0 28,5 31,5 36,0 27,6 27,6 26,6 29,0 28,6 26 27 28 29 30 36.5 15,5* 38.5 31.0 34.2 27.3 19,6* 29.4 29.0 29,0 57 58 59 60 61 31.7 29.5 26.0 28,0 27.7 26.8 27,2 26,6 25,9 23,8 88 89 90 91 92 36,5 29,0 20,0 20,5 34,0 29,5 27,5 24,0 20,6 29,5 31 38,0 29.8 62 32,0 27,7 93 94 19,7 28,0 23,6 21,6 1 2 3 4 5 6 7 8 9 10 11 CQ о> 3 Л CQ 4> U <о* C CU 28.5 28.5 29.2 22.5 34.5 26.5 25.8 28.7 22.7 29.6 32.5 30.0 32.5 41.0 28.5 О О СО 22,6 К н оо 3 Величину интервала обычно определяют по формуле: Xfnax где X max и Хт 1я ОТ 8 Xmin ДО 12 (3) соответственно наибольшее и наименьшее зна­ чение признака или вариант. Числа от 8 до 12 означают предварительно принимаемое коли­ чество классов. 9 В качестве к принимают круглое число, ближайшее к полу­ ченному частному. При этом действительное число классов определится как частное от размаха вариант (Х гаах — xmin ) на округленное значение интервала. В качестве полученного частного принимают также круглое число. Округление дела­ ется всегда в большую сторону. Хороший результат вычис­ ления величины интервала получается при применении ф ор­ мулы: (4) 1+3,322 IgN Величина интервала для диаметров сосны (табл. 1), уста* новленная по этой формуле, оказывается равной 42,0— 15,5 1+3,322 lg 94 округляем до 4,0 см. Величина интервала для высот при 29,8— 19,6 к = ~10 ~ 10 классах равна: 10,2 ~ — = 1,02 м 1 м. Действительное количество классов оказывается равным: по диаметру — 26,5:4 = 7; * по высоте — 10,2:1 = 11 . Границы и срединные значения классов лучше устанав­ ливать следующим образом. В качестве среднего значения первого класса принимают число, кратное классовому промежутку к, ближайшее к наи­ меньшей (в возрастающем ряду) или наибольшей (в убы­ вающем ряду) вариантам ряда распределения. Для диамет­ ров, при составлении возрастающего ряда, таким числом ока­ зывается 16,0. Срединные значения последующих классов по­ лучают путем последовательного прибаЕ'.ления величины ин­ тервала. Для ряда диаметров они окажутся равными: 20, 24, 28 и т. д. Эти значения называют классовыми вариантами, так как они представляют собой классы. Нижние границы классов определяют путем вычитания по­ ловины величины интервала из срединных значений каждого класса, а верхние границы — путем прибавления этой поло­ вины... 19 Для первого класса получим соответственно числа 14,0 и 18,0; для второго — 18,0 и 22 ,0 . В целях исключения перекрытия верхней границы преды­ дущего класса с нижней границей последующего класса, нашример, чисел 18,0 и 18,0, входящих в первый и второй клас­ сы, нижние границы классов увеличивают на величину, рав­ ную точности измерения признака*. Для диаметров она рав­ на 0,1 см, для высот 0,1 м. Полученные таким образом зна­ чения границ и средин классов для диаметров и высот ство­ лов указаны в табл. 2 и 3. В этих таблицах показано также посредством точек и черточек число вариант, распределенных по классам. Варианты распределяют по классам путем последовательного просмотра их, начиная -с -первой. Рекомендуется следующая система отметок вариант в порядке их нарастания (от 1 до 10 ). Варианты: 1 2 3 4 5 6 7 8 9 10 Отметки: . .. .: :: |Х 1X1 1^1 1X1 По окончании разноски всех вариант ряда их подсчиты­ вают отдельно для каждого класса и обозначают числами. Они показывают, как часто встречались варианты, сведенные в классы. Общее число вариант должно равняться числу из­ меренных значений данного признака. Примерами рабочих таблиц распределения для первого и (отдельно) для второго признаков могут служить табл. 2 и 3 . Таблица 2 Рабочая таблица распределения количества стволов сосны по классам диаметра Граница классов, см Срединные значения классов, см 18,1—22,0 20 22,1— 26,0 24 26,1— 30,0 28 34,1— 38,0 36 38,1— 42,0 40 S 32 чО * о Т 16 00 14,1— 18,0 Ч а с т о т а (число стволов) в рабочей записи 9 * • • » в цифрах 4 — 7 8 х |_2 28 X 20 1X1 IX FI 18 X | 9 jVU 94 * М ожно верхние границы классов уменьшить на ту же величину и таким образом получить значения границ классов: 1) 14,0— 17,9; 2) 18,0— 21,9 и т. д. 11 Таблица 3 Рабочая таблица распределения количества стволов сосны по классам высоты Срединные значения классов, м п рабочей записи 19,6—2675 20 ♦ 1 20,6—21,5 21 •^ 2 21,6— 22,5 22, •• 2 _ 22,6—23,5 23 • Ф 3 23,6— 24,5 24 • 24,6— 25,5 25 25,6—26,5 26 х :• 13 26,6— 27,5 27 !~х~ :: 14 27,6—28,5 28 -X. 25 28,6— 29,5 29 Граница классов, м __29,6— 30,5 30 2 Ч а с т о т а (число стволов) • в цифрах 4 2 IT t I X !Z ! ГЮ 18 10 94 Для последующего статистического анализа результатов наблюдений из •оабочих таблиц испсльзуют данные двух X щ / столбцов; срединные значения классов (классовые варианты) и значение частот (см. табл. 4 и 5). Иногда значения классов указывают в таблицах записью начальных вариа-нт, сопровождаемых постановкой черточек. Для диаметров значения классов были бы записаны так: 14,1 — ; 18,1— ; 22,1— и т. д. За расчетные значения классо­ вых вариант, однако, и в этом случае принимают срединные значения классов. Полученные таким образом двойные ряды чисел, состоя­ щие ив обозначения классов -и соответствующих им частот, называют рядами распределения, или вариационными ря­ дами. Таблицу распределения вариант по двум признакам или так называемую корреляционную таблицу составляют ана­ логичным образом. Границы классов и срединные значения для одного из признаков, принимаемого за независимый х, размещают во 2 и 3 строках, а границы и срединные значе­ ния классов другого признака у — во 2 и 3 столбцах (см. от­ граниченное жирными линиями). 12 Разноску наблюдаемых значений -признаков производят сразу по обоим признакам, обозначая указанным способом (постановкой точек и черточек) каждую варианту в клетке, образуемой пересечением строки и столбца, соответствующих Таблица 4 Вариационный ряд диаметров стволов сосны Классовые варианты X, см Частота, п | Классовые варианты X, см Частота, п 16,0 4 32,0 20 20,0 7 36,0 18 24,0 8 40,0 9 28,0 28 94 V Таблица 5 Вариационный ряд высот стволов сосны Классо­ вые ва­ рианты X, м Ч а с­ тота, п Классо­ Ч ас­ вые ва­ тота, рианты п X, м Классо­ вые ва­ рианты X, м Ч ас­ тота, п 4 28,0 25 25,0 2 29,0 18 2 26,0 13 30,0 10 3 27,0 14 2 94 20,0' 1 24,0 21,0 2 22,0 23,0 : значениям варианты по обоим признакам. Так, если диаметр ствола сосны равен 20,8 ом, а высота 28,0 м, варианта будет занесена в клетку, образуемую третьей строкой и вторым столбцом (табл. 6 ). После разноски всех вариант и обозначения их в цифро­ вой записи подводят итоги частот по каждой строке и столб­ цу. Итоги надлежит сверить с частотами соответствующих вариационных рядов (см. табл. 4, 5). Пример распределения количества стволов сосны по классам диаметров и высот при­ веден в табл. 6 . Условное обозначение вариант, принятое при распределении их, в таблице не указано. Таблица распределения заканчивается вычислением эмпи­ рических средних значений зависимого признака, в нашем примере высоты, по классам независимого, в нашем примере по классам диаметра. Для этого вначале в пределах каждого Таблица б О ^ 00 ю •ф — I см со см '•Ф оо см см ст> г-Г см СП ю ю CM о о" СО ю см О of О тг* СМ со со (0 Ю Ю (N см со <М чф I СМ оо со со I I I I СП I ОС со о со о о" со I I I . I (О N СО о см CJ 00 оо" см °i оо" см сэ 00 см со см со " см СП ю см СП 1~-Н ю со <х> см СП ю см "ф о о" Г—« ю ю со ю о со" LO !>. оо см см Ю иО Г- 00 ю" со <о ю о см оо о ОО СО СО <N •чг «— см CM см см о см ~со см см х00 «ч сэ о см I см СМ I см СО о оо" см со см" см <U CQ >> х к с* S Я к ж я о ^ 52 а> CQ й сц ь О со О ) 00 см см N О Ю ^ СО СМ ^ О см см см см см см см см о ЛS Л РЗ 05 05 сх а> н з: S ю иО lO ю см 1 1 со г-Г см см 1 1 сОл со" см Ю LO Ю сп оо" оГ со" ю" о со см 1 1 1 1 со СО аГ 00 см см СО ю со см" см см ся см см 1 1 1 I 1 1 1 1 1 со СО СО со С0Л го" со" см 1—Г см см см см см .те *нэчаэс!э1Т вхоэна 14 00 со Распределение количества стволов сосны по классам X — диаметры деревьев, см диаметра и высоты со оо 00 см * 1—Г ю о 4 см <М 1 1 I 1 со <о о" < тГ см г—« - £ о о н £ CQ 2 н оо 3 со <D К «о (L Г Г) X Оц 35 с SП С О) £ *а> С Си CJ а> 00 с X >> •• hQ ч о сх н ж НИ о СЮ оо" оо Гч Ik* класса независимого признака находят суммы произведении срединных значений классов зависимого признака на соот­ ветствующие им частоты, помещенные в корреляционной ре­ шетке (центральная часть табл. 6 , отграниченная жирными линиями). Найденные по каждому разряду суммы произве­ дений (они вписаны во второй строке снизу) делят на,общее количество частот класса. Полученные в результате этого деления средние значения зависимого признака по классам независимого, т. е. средние эмпирические высоты, вписаны в третьей строке снизу. Для проверки правильности вычисления этих средних значений зависимого признака находят сумму произведений их на численности по.даждому классу независимого призна­ ка. В рассматриваемом © табл. 8 примере: '22,2X4 —88 ,8 ; 24,0X7=168 и т. д! Совпадение общей суммы произведений, найденной разными способами, свидетельствует о правиль­ ности вычисления. Небольшое расхождение, являющееся следствием округления в расчетах, неизбежно. В нашем при­ мере оно оказалось равным 1 ,0 . Практически такое расхождение допустимо. Если опреде­ лить среднюю высоту для всей совокупности стволов путем деления суммы произведений средних высот классов на сумму частот, она окажется равной 2560:94 = 27,21 м. Расхождение со средней, найденной в таблице, составляет всего 0,01 м. Средние значения частные и общее вычисляют с точностью не менее точности, принятой при измерении отдельных зна­ чений признака. Обычно средние вычисляют с точностью на один разряд (десятичный знак) выше. Графическое изображение рядов и таблиц распределения Составленные ряды и таблицы распределения изображают графически. По каждому ряду строят гистограмму, много­ угольник распределения и графики накопленных частот: кумуляту и огиву (рис. 1 ). Чтобы составить ряд накопленных частот, нужно к часто­ те первого класса rii прибавить частоту второго п2. Получим накопленную частоту второго класса и т. д. Сущность графи­ ков и способ их построения легко уяснить из рисунка. По данным измерений двух признаков строят точечную диаграм­ му распределения значений этих признаков. Графики оформляют на миллиметровой бумаге стандарт­ ного формата. При этом длина вертикальной оси должна со­ ставлять примерно 0,6 длины горизонтальной оси. Тексты и цифры на графиках должны быть четкими. На основании построенных графиков дается краткое предварительное заключение о хпрлктере распределения. I a § 20 30 20 10-\ \iO l o 1= D )6 20 & 28 32 36 AO 0 W 20 24 28 32 36 40 Д иам етры , ем Д и ам етры , ом /6 20 24 28 32 36 40 Д иам етры , см Рис. 1. а гистограмма, б — многоугольник численностей, в — кумулята Г Л А В А распределения I II ПОНЯТИЕ О СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЯХ. РА С П РЕ Д Е Л Е Н И Я Ч И С Л Е Н Н О С Т Е Й Средняя арифметическая Средняя арифметическая величина, или просто средняя, является основным показателем среднего качества. Это центр ряда распределения по обе стороны от которого, как от точ­ ки'равновесия, находятся варианты, отклоняющиеся на ту или иную величину. Средняя арифметическая получается от деления суммы от­ дельный вариант ряда на число их. Так, средняя ряда (обо­ значают ее М или х), состоящего из вариант Хь Хг, Хз..., Х п равна y-__ Х 1+ Х 2+ Х 3+... + Х п где .16 Х" N N — общее число наблюдений; 2 — знак суммирования. SX ~N ’ Здесь и в последующем его применении без указания преде­ лов суммирования он означает, что должно быть произведе­ но суммирование всех измеренных (наблюденных) вариант ряда от 1 до п. Для ряда, разделенного на классы, т. е. для вариационно­ го ряда (понятие о нем дано ниже), среднюю арифметиче­ скую вычисляют как взвешенную.величину: — riiXi + П2Х 2+ П3Х 3 + ... +п ПХ П х = -----------------------------------!tli + П2+ П3 -f*... -{-п п 2—НпХ) . N В формуле (5): Х ь Х2, Х 3,...,ХП — классовые варианты (срединные значения классов), Пь п2, п з ,...,п п — частоты соответствующих классов; N — общее число вариант (объем ряда) или общее число наблюдений N = nj -fn2-f п3+ ..., + п п= 2 п При обработке большой статистической совокупности спо­ собом моментов среднюю арифметическую вычисляют по формуле х-М'4-кшь (6 ) где М' — условное начало отсчета отклонений или условная средняя; к — величина интервала; mi — первый’начальный момент.* Среднее квадратическое отклонение Среднее квадратическое отклонение является мерой из­ менчивости (варьирования) признака. Оно показывает, на какую величину в среднем отклоняются варианты ряда X от средней арифметической х. Поскольку средняя величина яв­ ляется центром ряда, то алгебраическая сумма отклонений вариант ряда от нее равна нулю (сумма положительных от­ клонений равна сумме отрицательных отклонений). Поэтому в качестве меры изменчивости признака используют средний квадрат отклонений, называемый дисперсией ряда или сред­ нее квадратическое отклонение, являющееся корнем квадрат­ ным из дисперсии. Обозначая отклонения отдельных вариант ряда Х ь Х 2, Х 3,...,ХП от средней х соответственно через хь х2, х3,..,х„ на основе данного определения можно напи­ сать: 4 5 х 12+ х 22+ х 3М-... + х п2 £х2 -------- N--------- = ~ Т Г ' (7) * Моментом называют среднюю величину отклонения вариант ряда от средней величины (подробнее об этом сказано ниже). 17 m huic^udi генеральной совокупности обозначается а2. По данным выборки находят s2, являющуюся оценкой су2. Для вариационного ряда оценка дисперсии выразится равен­ ством: n 1х j2~Ьп2х22+ ПзХз3 4-... +'п пх„ N ь ------------------------------- ( 8) В уравнении (8 ) хь х2, х3, ...хп ь— отклонения классовых вариант ряда (средних значений классов) от средней ариф­ метической; п{, п2, Пз, ...пп — частоты классов; N — общий объем ряда. При обработке ряда способом моментов оценку дисперсии вычисляют по формуле: где s2= k2^ 2, (9) — второй центральный момент, т. е. средний квадрат отклонения классовых вариант ряда от средней арифметической величины, выраженный в долях интервала к. При обработке выборки с числом наблюдений N меньше 100 в качестве делителя в формулах (7) и ( 8 ) принимают не N, а N'-1 , когда s используют для оценки а. Это число на­ зывают «числом степеней свободы». Такое название объяс­ няется тем, что в статистике при вычислении любых средних величин используют число независимых величин. При вычис­ лении s одно из отклонений оказывается: несвободным. Оно равно сумме всех остальных, взятых с обратным знаком. В современной вариационной статистике в качестве меры изменчивости признака чаще используют среднее квадратич­ ное отклонение или стандартное отклонение, являющееся кор­ нем квадратным из дисперсии (а2) или ее оценки: (s2). Таким образом, общей формулой для нахождения s будет: ( 10) При обработке вариационных рядов формула вид: принимает (И ) я при вычислениях с использованием моментов 8 —к’|/ U2. (12) Особенно большое значение стандартное отклонение имеет при исследовании так называемого нормального распределе­ ния. Это распределение вариант является результатом бес­ численного множества независимых между собой причин, вы­ зывающих отклонения у тех или иных вариант от среднего значения. В результате действия этих причин наиболее час­ тыми будут варианты с небольшими отклонениями. Чем от­ клонения больше, тем варианты встречаются реже. Это легко представить на примере рассмотрения роста, скажем взрос­ лых мужчин. Всего больше встретится индивидуумов, имею­ щих рост, близкий к среднему. Теорией статистики доказы­ вается, что в статистических совокупностях с нормальным (или близким к нормальному) распределением вариант 68,3% последних имеют значения, не превосходящие р,± сх и только 31,7% вариант по своей величине выходят за эти пределы. Отсюда вероятность того, что любая взятая наугад варианта ряда придется вне пределов равна 0,317*. За пределами ц±2о лежит всего 4,5%, а за пределами |л±3 о — 0,3% общего числа вариант. Следовательно, веро­ ятность того, что взятая наугад варианта ряда окажется от­ клоняющейся от |л на величину, большую 2 а и 3 а,соответ­ ственно равна 0,045 и 0,003. Более полные данные о вероятности р отклонения вариант ряда за пределы jj,±d о (где d — доли сигмы) приведены ниже: Вероятность отклонения вариант за пределы }i±d о Отклонения, dа Вероятность отклонений, Ш Отклонения, &о Вероятность отклонений, Р 0,67 о 0,501 2,33 а 0,020 1,00 а 0,317 2,58 а 0,010 1,50 а 0,134 2,75 а 0,006 2,00 а 0,045 3,00 а 0,003 2,17 а 0,030 3,29 а 0,001 На основании этих данных можно понять толкование сред­ него квадратического отклонения и как меры средней ошибки одного наблюдения (варианты). Оно дает возможность опре­ делять среднюю величину генеральной совокупности с опреде­ ленной надежностью или вероятностью по одной взятой наугад варианте великообъемного ряда с приблизительно нормальным распределением вариант. Можно выразиться, например, так: каждая варианта ряда представляет собою {г — средняя величина в генеральной совокупности. 19 приблизительно среднюю величину ряда, отклоняющуюся от генеральной средней практически не дальше 2,58а. Вариан­ ту, отклоняющуюся от средней за пределы ±2,58 0 , прак­ тически с полной уверенностью можно отнести уже к другому ряду, с другим |х, так как вероятность того, что она принад­ лежит еще к прежнему, известному нам ряду, составляет меньше 0,01. Это означает, что, рассуждая таким образом, мы можем ошибиться в среднем 1 раз на 100 случаев. Коэффициент вариации Коэффициент вариации, как и s или 0 , является показате­ лем изменчивости признака, выражая ее в относительных еди­ ницах. Он представляет собой среднее квадратическое от­ клонение отдельных вариант ряда от средней величины, вы­ раженное в процентах: v = - iio o % . (13) X Являясь показателем, не зависящим от принятых единиц измерения вариант, коэффициент вариации может применять­ ся для сравнительной оценки величины варьирования раз­ личных признаков. Показатель асимметрии и показатель эксцесса Для больших выборок (N=100 и более) вычисляют еще два статистических показателя, характеризующих распреде­ ление значений наблюдаемого признака (вариант). Дело в том, что з одних случаях распределение вариант является нормальным, которое описывается уравнением Гаус­ са-Лапласа. В других случаях распределения отличаются от нормаль­ ного. Кривая распределения при этом может быть скошен­ ной. Она может быть также островершинной, или наоборот, туповершинной. Скошенность кривой называют асимметрией. В качестве асимметрии принят средний куб отклонения: < х 3> = —■Snx 3 = — N N 2 п(Х— х )3. (14) к } В самом деле, если 2 пх = 0, то 2 п х 3==0 только в случае строго симметричного распределения. Это можно показать на следующем примере. Пусть среди прочих отклонений имеется: X} =?■■— 5 С ч и сл е н н ост ь ю П\ — 6 и Х;> = 2 с П 2 = 1 5 . X птх| = — 30; S п2х2= -Ь30. При нахождении среднего откло­ нения первой степени имела бы место компюпсация отклоне­ ний. В то же время 2 niXj3 = — 750, 2 п2х23 = 4 -120 . Здесь компен­ сации нет. Величина < х 3> тем больше, чем сильнее асим­ метрия. Знак величины < х 3> однозначно связан с направлением асимметрии. При левой асимметрии, т. е., когда вершина кри­ вой сдвинута влево, а правая ветвь кривой растянутая — знак положительный, при правой — отрицательный. В качестве меры асимметрии принимают не < х 3> , а его стандартизованное значение, т. е. выраженное в долях стан­ дартного отклонения для того, чтобы оно не зависело, от единиц измерения признака. Эту меру называют показателем асимметрии (в работах по математической статистике — ме­ рой косости). Таким образом показатель асимметрии Л < х 3> А= — (15) А — 0 означает, что кривая симметрична, но еще не свидетель­ ствует о том, что ,она нормальна, т. е., что распределение опи­ сывается уравнением Гаусса. Кривая распределения может иметь крутизну, отличную от нормальной кривой. Она может быть крутой или пологой, иногда двух или многовершинной. В нормальном распределении только 3 варианты или еди­ ницы наблюдения из 1000 лежат вне пределов утроенного стандартного отклонения в ту или другую сторону от средней величины. 9 Если за эти пределы выходит большее число единиц сово­ купности, то такое явление, называемое эксцессом, сопро­ вождается большей крутостью кривой, т. е. большим скопле­ нием вариант около х, чем в нормальном распределении. П о­ лучаемая кривая — островершинна. Если же значения признака (варианты) расположены в более узких пределах, чем x±3s, то это явление называют де­ фектом. Кривая оказывается плосковершинной. В послед­ нее время у большинства специалистов по статистике принято одно название отклонения величины крутости кривой •— экс­ цесс. Ои положительный при островершинной кривой и отрица­ тельный — при шюсковершинной. Показатель эксцесса обозначают буквой Е и вычисляют по формуле: (16) где < х 4> — N или < х 4> В дальнейшем для вычисления показателя асимметрии и эксцесса будут указаны более удобные формулы. ГЛАВА IV С П О С О Б Ы В Ы Ч И С Л Е Н И Я СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ РА С П Р Е Д Е Л Е Н И Я Ч И С Л Е Н Н О С Т Е Й В зависимости от объема выборки и имеющихся счетных приборов можно применить один из следующих способов ее обработки: способ непосредственных вычислений, способ ус­ ловного начала, способ произведений и способ сумм. Первые два способа применяют обычно при обработке малых выбо­ рок, с числом единиц наблюдения до 25— 30. Современная вычислительная техника позволяет эти способы применять и при большем числе единиц. Способ непосредственных вычислений Сущность способа состоит в том, что данные наблюдений относительно какого-либо признака подвергают матшахшщской обработке и анализу непосредственно без их группиров­ ки и составления вариационного ряда. Пример вычисления статистических показателей этим спо­ собом приведен в табл. 7. В первом столбце таблицы вписа­ ны значения наблюдаемого признака (пусть это будут значе­ ния длины стволиков сеянцев сосны). В столбце втором впи­ саны отклонения отдельных значений от их средней арифме­ тической величины (х = Х — х). Эти отклонения называют центральными, поскольку средняя арифметическая величина является центром ряда. В столбце третьем вписаны квадраты отклонений. В последнем столбце приведен расчет основных статистическах показателей. 22 Таблица V Вычисление статистических показателей способом непосредственных вычислений Длина,. см X X 5 —0,5 0,25 6 +0,5 0,25 5 — 0,5 0,25 7 + 1,5 2,25 4 - 1 ,5 2,25 6 +0,5 0,25 5 —0,5 0,25 4 - 1 ,5 2,25 7 + 1,5 2,25 6 +0,5 0,25 55 - 4 ,5 + 4,5 0 10,50 Формулы и вычисления X2 _ IX X — N -- 55 10 8 = 1 / 2х2= Г N— 1 = 5,5 см, I/ V Ю-5 10— 1 | / 10’5 - 1,08 ш , V V s 1,08 V = — 10»= ; 100 = 19,6%. х Способ условного начала * Сущность способа также состоит в расчете, статистических показателей для иепреобразованного эмпирического ряда. В целях упрощения расчетов при вычислении средней ве­ личины х и среднего квадратического отклонения s использу­ ют условное начало отклонений вариант. Обозначим его бук­ вой М'. По определению, данному выше, средняя арифметическая величина является таким числом, алгебраическая сумма от­ клонений отдельных вариант от которого равна нулю (2 х —0 ). Справедливость этого определения подтверждена данными табл. 7. Опираясь на это, можно сказать, что любое условное начало отсчета отклонений вариант будет отстоять от средней арифметической величины х на величину среднего отклонения вариант. Следовательно, ^ нахождение х через принятое ус­ ловное начало М', сводится к нахождению средней ве­ личины отклонения отдельных вариант от избранного начала. Обозначив отклонения отдельных вариант X от условного начала М' через х с , можно написать: х с = Х — W . Среднее же отклонение вариант от условного начала (обозначим его с) равно сумме всех отклонений, поделенных па число их, или, что то же самое, на число наблюдений N, т. е. По данному выше определению х= М Ч с. (18) Для нахождения среднего квадратического отклонения (s), как видно из вышеприведенных формул и расчета в табл. 7, необходимо найти сумму квадратов отклонений вари­ ант от средней арифметической величины 2 х 2~ 2 (Х— х )2, т. е сумму квадратов центральных отклонений. Ее определяют по формуле: E x 2= S x 2c- ^ . (19) Вычисление средней арифметической величины и средне­ го квадратического отклонения для вышерассмотренной ма­ лой выборочной совокупности из 10 длин сеянцев сосны при­ ведено в табл. 8 . Таблица 8 Вычисление статистических показателей способом условного начала Длина, см X Формулы и вычисления ХС Хс2 5 0 0 6 +1 1 5 0 0 Проверка: 7 +2 4 2 х с = Я X— N M '= 5 5 — 10X 5= 5 6 +1 1 4 —1 1 5 0 4 —1 0 1 х = М .'+ с= 5 + 0,5=5,5 см 7 +2 4 б +1 1 £х3 , Л 52 L х2= 2 xS! с— — гг = 1 3 — -- = 10,5 N Ю 2 55 +7 13 Примем М '= 5 (можно любую варианту) £хс 5 с = - х - Го = 0 ’° си —2 +5 Остальные, статистические показатели s, V вычисляют по формулам, приведенным в табл. 7. Поскольку х и 2 х2 оказались такими же, как и при спо­ собе непосредственных вычислений, результат расчета полу­ чим тот же: s = 1,08 см; V== 19,6%. 24 Способ произведений Вычисление статистических показателей способом произ­ ведений можно производить, непосредственно применяя ф ор­ мулы (2), (4), используя данные составленные рядов распре­ деления. Однако вычисления оказываются весьма громозд­ кими и трудными даже при наличии малых вычислительных машин. Для облегчения вычислительной работы прибегают к кодированию вариант и отклонений. Вычисляют вначале от­ клонения (разных степеней) или моменты ряда, а затем с их посредством н статистические показатели, как это было сде­ лано в способе условного начала. Понятие о моментах ряда распределения. Моментом на­ зывают среднее отклонение классовых вариант от средней величины или от любого выбранного числа. Моменты назы­ вают начальными, если их вычисляют от условного нача­ ла М', и центральными, если вычисляют от средней ряда х. Начальные моменты обозначают буквой m с индексами, ука­ зывающими на порядок момента или на степень отклонения: то, — нулевой, mi — первый, тг — второй, гпз — третий и т 4 — четвертый начальные моменты, что означает соответ­ ственно: среднее отклонение нулевой, первой степени, сред­ ний квадрат, средний куб отклонений и т. д. Причем, mo— 1, так как все отклонения в нулевой степени равны единице, и следовательно, сумма произведений их на частоты равна об­ щему числу частот. Центральные моменты обозначают буквой ,и с теми же индексами: цо, р,ь М -2» М-з, и*, и т-Д* — соответственно нуле­ вой, первый, второй, третий и четвертый центральны:: гтоменты. Причем, |х0= 1 ; jxi = 0 , легко проверить, пользуясь дан­ ным понятием моментов. Вычисление начальных моментов. Техника и формулы рас­ чета начальных моментов по способу произведений видны из табл. 9. В 1-м столбце таблицы вписаны классовые варианты ис­ следуемого признака X, а в о 2 jm— соответствующие « ч а с т о ­ ты п. Эти два столбца цифр представляют собою исследуемый вариационный ряд. В 3-м столбце вписывают условные откло­ нения классовых вариант от условной средней М'.- В исследу­ емом ряду распределениям' приняты равными 32 см. Эти от­ клонения находят по формуле X— М ' где к — величина к = 4 см. интервала. В рассматриваемом ряду 25 Для центрального класса условное отклонение равно ну* лю, так как значение варианты X и условного начала М 7 здесь одинаковы. Начиная расчет отклонений от центрального класса, получим для классов, находящихся в стороне значе­ ний вариант меньших М', натуральный ряд чисел со зна­ ком минус (— 1 , — 2 , — 3, — 4 и т. д.), а для классов, находя­ щихся в стороне значений, вариант больших М ' — со зна­ ком плюс ( + 1, +2, +3, +4 и т. д.). В столбцы 4— 7 вписывают произведения найденных от­ клонений в первой, второй, третьей и четвертой степенях на частоты. Эти произведения рекомендуется находить после­ довательно по строкам, умножая в каждой из них число пре­ дыдущего столбца на одно и то же число, т. е. на отклоне­ ние хк. Благодаря этому создаются условия для проверки чисел, помещенных в столбцах 4— 7. Таблица 9 Вычисление начальных моментов по способу произведений для ряда распределения диаметров стволов сосны п 2 ПХк-’ ПХк *к 3 .* 4Г ’ *5, 6 * ПХк'1 (Х к + 0 7 8 9 16 4 —4 — 16 64 — 256 1024 —3 324 20 7 —3 — 21 63 — 189 567 —2 112 24 8 -г2 — 16 32 — 64 128 1 8 28 28 -1 --28 28 — 28 28 0 0 20 0 0 0 0 0 +1 20 36 18 18 18 18 18 +2 288 40 9 +1 +2 . 18 36 72 144 +3 241 — 537 1909 ;-- м := з 2 V 94 ш1= ш2= .... — — 81 +36 + ■ 90 — 45 — 447 —45 94 ——0,479, 241 94 —2,564, Ша= 94 т 4*~ — 1481 729 1481 =15,755 ш0= 1,000 4mi = — 1,916 — 447 6гп2—15,384 = ~ 4'755- 1909 ш4_ — - =20,309. 94 * См. формулу 22. 26 11хкз П(Хк+1)4 табл. 4 приложе­ ния 4 т 3—— 19,020 т 4= 20,309 15,757 Проверка состоит в сравнении помещенных в графе 7 произведений (пхк4) со значениями их, указанными в табл. 4 приложения. После сделанной проверки вычислений находят алгебраические суммы чисел каждого столбца, по которым находят затем начальные моменты. Вычисление моментов рекомендуется производить с точностью до 0,001. Проверку правильности вычисления начальных моментов производят по формуле: m 4* = mo+ 4 mi-f 6 m 2-Hm3-f т 4, ( 21 ) где т *4 — четвертый начальный момент относительно вого начала отсчета один разряд выше. m V= отклонений, N но­ сдвинутого на t , (22) где (хк + 1) — условные отклонения классовых вариант относи­ тельно нового начала (условной средней). В табл. 9 эта новая условная средняя равна 28 см. Отклонения от нового начала практически получают, уве­ личивая на единицу отклонения (хк), вписанные в столб­ це 3. Значения произведений этих отклонений, взятых в чет­ вертой степени (столбец 8 ), на частоты (взятые из столбца 2 ) выписывают из табл. 4 приложения. Данные проверки начальных моментов рекомендуется при­ вести в нижней части расчетной таблицы, оправа. Вычисление центральных и основных моментов Центральные моменты вычисляют по формулам: 1*0*1, [XI = 0, jbi2= гп2— m i2; (23) fjL3 = m 3— 3m2m {-f 2 т i3; (24) jbi4==m4— 4тзШ1 + 6 т 2т 12— Зш!4. (25) Для проверки центральных моментов ряда распределе­ ния применяют формулы: fi,3 = m 3— 3[x2mi— m i3; jLi4= m 4— 4(n3m i— 6 jA2m i 2— mi4. (26) (27) * Равенство 21 получается из 22 путем разложения бинома (хи Ч I) 4 S п по формуле Ньютона и умножения каждого из полученных членов на — Формулы 26 и 27 получены из 24 и 25 путем подстановки в последние вместо начальных моментов ш2 и ш3 их значений, полученных из ф ор­ мул 23 и 24. Из основных моментов, необходимых для вычисления ста­ тистик распределения, находят третий (гз) и четвертый (г4) моменты по формулам: г3= — 3— • (28) Г., = (s')3 ’ 1 ' (s')4 где s' — основное отклонение в долях интервала. s '- Vw- (29) (30) Центральные моменты для ряда диаметров сосны: Цо=1> ^ 1= 0, М2 = т 2— т , 2= 2,564— (— 0,479)2= 2,5(54— 0,229=2,335, fi3 —Шз— ЗШ2 Ш1 ~Ь2mi3 = — 4,755— 3*2,564* (—0,479) -f* + 2 •(— 0,479)3= - 4,755+3,685— 0,220= — 1,290, И4 = т 4—4тзШ1 + 6 Ш2 Ш12— 3mi4 = 20,309— 4 (— 4,755) (— 0,479)+6*2,564* (— 0,479)2— 3 (>— 0,479)4= = 20,309— 9,111 + 3,523— 0,156 = 14,565. Проверка: у-з — т 3 — ЗцгГП!— m ( 3 = — 4,755— 3 -2,335(— 0,479) — — (— 0,479)3= — 4,755 + 3,355 + 0,110 = — 1,290. щ = т 4— 4 ц,3гп1— 6 ц2П112— :Ш14= = 20,309— 4 (— 1,290) (— 0,479) — 6 •2,335 (— 0,479)2— — (— 0,479)4='20,309— 2,472— 3,214— 0,052 = 14,571. При подстановке значений параметров в формулы четвер­ того центрального момента щ целесообразно использовать уже найденные при проверке начальных моментов произве­ дения 4ш3, 6 ш2 (в основную формулу) и 4тП] (в проверочную формулу). Эти произведения использованы ниже при вычислении щ для ряда высот. Основные моменты для ряда диаметров: Г3= (s')3 U 28 2 . = n il? ? ® - —— 0,362; 1,528s 3,568 щ 14,565 ( s ') 4 Т.5284 = 14,565 __2 5,452 "" ’ 2 Вычисление статистических показателей (д л я вы б о р к и диаметров) х = ММ- km, -32 + 4 (— 0,479) - 32— 1,916- 30,1 см; s ' = / | i 2= 1/2,335= 1,528; s = k-s' = 4-1,528=6,11 см; V = Iх А = 100 % = 6’’ — (31) 100 = 20,3 % ; 30,11 (s' ) 3 1,528s = — 0,362; (32) (3 3 ) ' ' Е = —— -- 3 = ^ — — 3=-0,328. (s' ) 4 1,5224 Моменты и выборочные статистические показатели ряда высот сосны. (Исходные данные табл. 5). для Начальные моменты (найдены по схеме табл. 9): mi = 0,223; m 2= 4,925; m 3 = —9,734; m4-90,457. Центральные моменты (по формулам 23— 25): ^ 0= 1 ; И1 = 0; ц2= 4,876; ц3 = — 13,007; Выборочные статистические характеристики лам 6 , 31, 13, 32, 33) 100,611, (по форму­ х = 27 + 1Х 0 .2 2 3 ^ 27,22«27,2 м; S '= 1/4376 = 2,21, S = 1X2,21 =2,21 м; V = [ (2,21) 27,2] X 100 % = 8 ,1 %; А = — 13,007/2,213 = — 1,205; Е = 100,611/2,214— 3 = 1,218. 'ЭЙ к . ГЛАВА V О ШИ Б КИ В Ы Б О Р О Ч Н Ы Х Н А БЛ Ю Д ЕН И Й ОЦЕНКИ ПАРАМ ЕТРОВ Понятие о параметрах и методе их оценки Статистические показатели выборки являются ее числен­ ными характеристиками. Главное назначение их, однако, со­ стоит в том, что они являются оценками статистических по­ казателей генеральной совокупности, которые называют па­ раметрами. Сущность методов оценки параметров можно уяснить на экспериментальной основе. Для этого необходимо рассмо­ треть распределения выборочных показателей, полученные для одной и той же нормальной совокупности. Наибольший интерес представляет распределение выборочных средних. Если бы совокупность значений высот (табл. 1 текста или табл. 1 приложения) была большой, например, в несколько тысяч единиц (фактически мы имеем здесь выборку болькюго размера), из нее можно было бы построить много выборок малого размера, например, по 10 единиц_в каждой. Если най­ ти средние для каждой такой выборки хь хг, хз, ...хи, полу­ чим распределение х. Это распределение оказывается нор­ мальным даже в том случае, когда исходная совокупность не является нормальной, что позволяет применять излагаемые ниже методы и критерии оценки параметров без выяснения точной формы распределения. Вторая особенность состоит в том, что размах средних будет приблизительно в 3 раза меньше размаха в исходной совокупности. Следовательно, любая выборочная средняя является более надежной оценкой средней в совокупности, чем отдельная случайная варианта. Третья особенность относится к самой средней величине этого распределения. Она может быть получена путем сумми­ рования выборочных средних и деления результата на чис­ ло их. Полученная средняя является наиболее надежной оценкой средней величины генеральной совокупности. Для 9 выборочных средних табл. 10 средняя х = 27,22. В табл. 10 приведены значения средних и стандартных от­ клонений для 9 выборок высот сосны. Выборки взяты из табл. 1 . Первая выборка включает деревья под номером 1— 10 ; вторая с 11 по 20 и т. д. Такой отбор считали возмож^ НЬШ, исходя из представления о случайном составе .выборки 94 значений высот, приведенных в табл. 1. 30 Таблица 10 Оценки среднего значения и стандартного отклонения по результатам 9 выборок из табл. I Статистиче­ ский пока­ затель вы­ борки Номер выборки 2 1 3 4 5 6 8 7 9 В среднем для 9 выборок х 26,9 26,9 27,1 27,6 27,2 27,5 27,2 27,0 27,6 27,22 S 1,94 2,55 2,90 1,54 2,38 1,62 1,53 2,85 1,58 2,10 Каждая из 9 выборочных средних является оценкой средней величины в совокупности, из которой взяты выборки. В на­ шем случае мы имеем выборочную совокупность, подлежа­ щую здесь рассмотрению. Назовем ее большой выборочной совокупностью (N = 94). Средняя для нее х = 27,22. Средние квадратичные отклонения выборки являются оценками s —2 ,21 , средняя из девяти s = 2,10. Она является наиболее надежной оценкой s = 2 ,2 1 . Средняя ошибка выборочной средней величины При рассмотрении среднего квадратического отклонения отмечалось, что его можно рассматривать как меру ошибки выборочной средней, получаемую по одной, случайно взятой варианте ряда. Аналогично этому в распределении выборочных сред­ них хь х2, ... х п среднее отклонение их от средней величи­ ны в генеральной совокупности ц можно рассматривать как ошибку выборочной средней величины, но установленную на основе N' наблюдений. Ошибку выборочной средней называют средней ошибкой средней величины признака. Обозначают ее буквой s x или ш. Так как средняя величина вычисляется из некоторого числа вариант, средний квадрат ошибки ее меньше среднего квадрата отклонения отдельных вариант от средней в N раз, т. е. sN (38) или SX — S УШ ' (38а) Выражается s x в тех же единицах, что и отдельные вариан­ ты. Приведенные в табл. 10 9 выборочных средних имеют следующие отклонения от средней величины в исследуемой большой выборке с N‘=94, равной 27,22 м: — 0,32* — 0 3?' —0,12; +0,38; - 0 ,02 ; +0,28; - 0 ,02 ; - 0 ,22 ; +0,38. 31 Эти отклонения можно рассматривать как ошибки соот ветствующих 9 выборочных средних величин. Среднее квад­ ратическое отклонение, найденное путем возведения каждого из 9 отклонений в квадрат и деления суммы квадратов на (9— 1 ), равно 0,28. В практике исследований значение р, неизвестно. Поэтому ошибку средней всегда находят по формуле (38). Принято записывать значение выборочной средней вместе с ее ошиб­ кой, т. е. x ± s х . \/ Показатель точности опыта Сравнение средней с величиной ее ошибки дает известное представление о точности в определении х. Удобнее, однако, оценить точность выборочной средней, выразив ее ошибку в относительных единицах, например, в %. Это отклонение в опытном деле называют «показателем точности опыта» и обозначают Р P = s^ 1 0 0 % . (39) X Опыт считают достаточно точным, когда Р не превышает 5%. Средние ошибки других выборочных статистических показателей Другие выборочные показатели s, V, А, Е также содержат в себе ошибки, имеющие тот же смысл, что и Sx т. е. пред­ ставляющие собой среднюю разность между показателем в выборке и совокупности. Для вычисления ошибок применяют формулы: se -= (40) 1/2N ’ 7 Г SA = у 6 . N ’ я / (42) ° ' 5 + ( ш ) ’ : se= 2 sa. <4,) (43) Критерий t Из (38) видно, что .величина Sx зависит от степени измен­ чивости признака, выражаемой средним квадратам s2, и от числа наблюдений в выборке. Выборочная средняя тем точнее, т. е. тем меньше будет отличаться от генеральной средней, чем больше объем вы­ борки N Гоосет (псевдоним Стьюдент) для различных N, точнее N— 1, рассчитал значения отклонений выборочных средних от генеральной средней величины. Выборки были взяты из одной генеральной совокупности и потому отклонения яви­ лись исключительно следствием случайных причин. Отнесенные к величине средней ошибки отклонения выбо­ рочных средних от средней в генеральной совокупности по­ лучили следующее выражение: t = х ~~^ ' (44) Sx Логически нетрудно представить, что вследствие случай­ ных причин отклонения выборочных средних будут иметь раз­ ную направленность или алгебраический знак. Одна часть х по своему размеру больше средней величины совокупности |м, другая меньше ее. Большие отклЪнения встречаются редко, тем реже, чем они больше. Вследствие этого все значения t, установленные по выборкам, варьируют около значения, рав­ ного нулю и являющегося центром распределения t. Данные табл. 10 подтверждают эти положения. Снедекор* вышеописанным 'методом получил 511 значений t для выборок в 10 единиц по привесу животных. ~Оказалось, что только 10 % всех значении t имели уровень, превышающий 1,83, 5% значений превысили 2,26 и лишь 1 % превысил зна­ чение! =3,25. ' Такими пограничными уровнями t можно пользоваться как предельными (критическими) значениями, которые с оп­ ределенной вероятностью могут быть следствием случайных причин. В опыте Снедекора о вероятности приходится судить по частости события, т. е. превышения указанных значений t. Подчеркнем, что значение t = 3,25 и более при числе сте­ пеней свободы, равном 9 ( —-$Г— 1 ), практически встречается так редко, что событие является крайне маловероятным. В-приложении 6 приведены критические значения t для различного числа степеней свободы и для трех стандартных уровней вероятности Р = 0,95; Р = 0,99 и Р = 0,999. Если найденное в каком-либо опыте t превзойдет по ве­ личине табличное значение, то его нельзя уже объяснить Nслучайными причинами. Оценки параметров Интервальная оценка. С помощью критерия t и значения выборочного статистического показателя и его средней ошиб­ ки можно дать оценку соответствующего параметра с опреде­ ленной вероятностью, например Р = 0,95. * Дж. У. Снедекор. Статистические методы в применении к исследов ниям в сельском хозяйстве и биологии. Изд. с.-х. литературы, М., 1961. v 33 Если указать для' средней в генеральной совокупности \х интервал x± t0,05-Sx, то с вероятностью в 0,95 можно утверж­ дать, что этот интервал покроет (ы. Имеется только 1 шанс из 20 , не благоприятствующий осуществлению этого утверж­ дения, Интервал x + t s r < X x+tsx (45) называют доверительным интервалом. Степень доверия зави­ сит от уровня значимости t (5%-ный, 1%-ный и т. д.), кото­ рый указывают в индексе. Оценка значимости Значимость средней. Во многих опытах целесообразно оце­ нить параметр путем проверки некоторой статистической ги­ потезы в отношении его размера. Наиболее часто проверяет­ ся предположение, что полученная выборочная средняя х не­ значимо отличается от гипотетической (теоретически установ­ ленной) или вообще известной величины средней в генераль­ ной совокупности р,. Выдвигается гипотеза Но, что истинная разность равна нулю. В таком виде гипотеза часто называет­ ся нулевой. Проверка гипотезы состоит в выяснении совместимости наблюденных данных с этой гипотезой. Применяют критерий t = :£— L , см. (44). sr Если (л положить равным нулю, то t = -4- • Sx (46) й Формула (46) может быть обобщена в том отношении, что она применима для оценки значимости любого статисти­ ческого показателя Т, к которому нулевая гипотеза разумна. В этом обобщенном виде формула применена ниже для оценки ряда статистических показа­ телей. Критерий t обычно называют критерием значимости (или существенности). При t < t j (где t} — критическое значение этого крите­ рия, взятое из таблиц для уровня значимости в 5% или в 1 %) опытные данные совместимы с гипотезой. Но под­ тверждается. При t > t b т. с. t0,ot или t0,os они несовместимы. Но отвергается. Значимость разности между средними. Еще более часто в статистических исследованиях встречается проблема, связанная с определением, были ли взяты две выборки из од­ ной совокупности или из разных совокупностей. Иначе: зна­ чимо ли различие между выборочными средними Х] и х2? Критерий t, дающий решение, принимает выражение t = , (48) где s2xt — средний квадрат стандартной ошибки выборочной "г:, средней Хь Он равен частному от величины квад­ рата стандартного отклонения, выборки s }2 на/чисs ^ ло наблюдений N b т. е. s2 x,:- — ; .N.1 , s2x. — средний ^вадрат стандартной ошибки выборочной средней х 2 (формула 48 верна при Просматривая выборочные средние в табл. 10 видим, что что средняя первой выборки Xi = 26,9 м, а девятой (обозначим ее х2)= 27,6 м. Различие, возможно, связано с разными усло­ виями р<&ста, например, почвой. Является ли это различие на­ столько значительным, что мы должны считать выборки взя­ тыми из разных совокупностей, или оно вполне объяснимо случайным варьированием. Соответствующая такой постановке вопроса нулевая гипо­ теза состоит в том, что различие незначимо, что обе выборки взяты из одной совокупности. H 0:xi = x2 обращаясь к дан­ ным табл. 10 , находим s2x, = 1 = 0,250; 10 +_ 27,6— 26,9 t — - . , V 0 , 250+0,376 s 't = ' 1 Q42 - 0,376; 10 0,7 01 ..... ■ =• —0,9 < t0,05—2,1. V 0,626 Число степеней свободы при установлении критического зна­ чения из табл. 6 приложений v —*2 (N’— 1 ) —2(10— 1 ) = 18. Таким образом Но не отвергается даже на 5%-ном уровне значимости. Выборки относятся к одной совокупности. 35 Значимость различия между стандартными отклонениями Значимость различия между стандартными отклонениями оценивают с помощью * = Т Й % V 7S -s,4~S - где sS| и Ss., — ошибки стандартного отклонения, по формуле 40. <4 9 > определяемые Оценим значимость различия между наиболее контраст ными стандартными отклонениями, приведенными в табл. 10 s ,= 1,53 и s2 = 2,90; ss,-= - р = = = =0,34; s 4= 1,53— 2,90 t — ■ -- - = — 1 ,9< 1о,о5 = Y 0,342 + 0,652 =0,65; 01 п 2,1 . Различие незначимо. Определение объема выборки При планировании опыта приходится решат!» вопрос о чис­ ле наблюдений или объеме выборки, достаточном для полу­ чения оценки средней величины или другого статистического показателя с определенной точностью. Этот вопрос решают на основе формулы (38), преобразуя которую, получим: ч•> - N = . (g o ) Формула указывает число наблюдений для уровня значимо­ сти средней в 0,32. Такой уровень редко признается доста­ точным. Обычно принимают уровень значимости в 0,05 или 0,01. В формулу вводят соответствующее этому уровню значе­ ние t(to,05 ИЛИ t0,0l). Тогда t 2S 2 N - ~ . ь X где s (51) — среднее квадратичное отклонение определяют по данным прежних исследований или на основе проб­ ной выборки; s r --- ошибка средней, планируемая в данном опыте, 11 I O • X по Таблица 00 ш o' II о о н CM со Ч сч Си со со см о fct ьCN II т Он S JS О со o' II rf cn X Cvi 11 1-^ CN IC5 CN <M 1 I i X СЛ 11 1 1 -VO CO СО ю of \ СО CO lo> Ю CM oo o' 1 1 II 1 1> CO CO Г-Ь 04 *-» CN 00 w” О 00 о \ H о *\ L?V il •# СО 04 of uJ L O о О о* о о • <о <з о (Л я СО о*- о о *3 *3 .- с00г> СО С М —1 н оН О г— I CN н и о со смГ* о о Оценки параметров совокупности диаметров и высот сосны 1. Ошибки выборочных статистических показателей СО счГ +1 +1 +1 <М ю о С1 т гС СМ <=4 ОО -1 Л of гг*. о 1C GO С4) ^ iо ~I Л о" — •Iо UJ > о~~ со 2 1C з: со СГ К S 3 Ч сх Н а> О СЙ О ~ :г СО СО Д СП Ж W Я Он а> < 2! СО о о со II -О сГ" О о X II CL CO CQ О 11 с S ш£ о Qu С2 о ?—ч ю н Ю 'Ф О II о н S3 с°о соЛ I4Y—H S 2 к н о VO О ю 1 10 о Т4 V Гч "Т. о г% о CN cvf ▼—H t t— #(4 I2 \cn о CO II 1i 11 11 СЛ 1 2 !l 1X сх н а> к Йк «j a Си <и <я п о #ч сог* h- со о oi и о Р< S о К ^ С-> 3 о? t=c CU н о Л S СО t=f X о w О О 1х ?|| ел >> <i> с; к >> о '' 1Л « О (X н ф Ж to S3 ♦ а CN! ю н < CNJ 1 C о со fc t W сх к *=2 11 </.J -н +1 *—■< 1— 4 СО •V) vto > о «Я СЧ <М СО о II о СО ю о V Р со ^ CQ ^ sx CU <£>\ oV « tR C(1ffi >* <v H со ОО жо сл CO ю со ИЧ Os 0 3 <i; о о 2 O 2 C tr +1 tl С 1 V3) с/> !!!i !> OJ I! Г bЛ J CO IHr* Г0 О Г Л А В А VI ВЫ РАВНИВАНИЕ РЯ Д О В РА С П РЕ Д Е Л Е Н И Я Выравнивание рядов по уравнению нормального распределения При условии, когда вычисленные показатели достоверно­ сти t A и t е меньше , приведенных в та(бл, 6 приложения, те., когда отклонение от нормального распределения незначимо, выравнивание ряда производят по формуле Гаусса-Лапласа. Формула эта или, как часто называют, уравнение кривой нормального распределения имеет вид: kN_e_r> n^ T (52) V 2i где п N' к s — — — — теоретические частоты классов ряда; общая численность вариант ряда; величина интервала; оценка среднего квадратичного отклонения (в име­ нованных единицах); я — 3,1416; -р= =0,39894; У2ж е — основание натуральных логарифмов; е = 2,71828; х — нормирование, т. е. выраженные в долях s отклоне­ ния классовых вариант X от средней х Х-х (53) При вычислении статистик с помощью моментов нормаль­ ное отклонение получают путем деления разницы между ус­ ловными отклонениями х к и первым начальным условным моментом на основное неименованное отклонение s '- y ^ T . е .т = - ^ ^ - Из формулы Гаусса-Лапласа можно видеть, что значение п приобретает для модального класса, (54) наибольшее где то = 0 . Теоретическая частота в этом классе kN n0- — • 0,39894е° ^ s оо 0 4 kN' Z*JZEL . s (55) Эту частоту следует вычислить. При построении теорети­ ческой кривой распределения значения этой максимальной ординаты откладывают в середине модального класса, т. е.: из точки х. Иными словами, отрезок оси абсцисс принимают гг о kN равным средней величине ряда. Первый множитель — в s формуле кривой нормального распределения обусловлен по­ казателями изучаемой совокупности. При вычислении показателей, с помощью моментов мно­ житель этот упрощается. Именованное основное отклонение s заменяется произведением величины класса к на основное неименованное отклонение s '= V 1^2-Получим: kN__ kN -• * s ks' N • s' Второй множитель в формуле (52) является функцией нормированного отклонения. Он обозначается символом f(t) и соответственно называется функцией нормированного отт2 клонения. Значения f (т) = 0,39894 е лежо рассчитать, пред­ варительно прологарифмировав функцию. Но эти значения можно получить и в готовом виде. В настоящем пособии зна­ чения f(t) приведены в табл. 5 приложения. Таким образом, уравнение кривой нормального распреде­ ления можно записать в следующем рабочем виде: *• ' kN n = — f(x); s (56) или П = ^-f(x). S . (56а) Р.асчеты теоретическиос частот применительно к последней формуле приведены в табл. 12. В 1-й столбец таблицы вписаны классовые варианты ряда X, во 2-й — фактические (экспериментальные ) числен­ ности ряда п. В 3-й столбец записаны условные отклоне­ ния вариант ряда X от условной средней М', выраженные * запив единицах интервала к, хк ----- 1 , в 4-ио столбец к саны значения разностей между условными отклонениями х ж первым начальным моментом ряда т ь а в 5-й — частное от этих разностей «на основное отклонение неименованное s'. х ~ м ^ it Рис. 2. Кривые распределения численностей: (эмпирическая — сплошная ломаная; выравнен­ ная по уравнению Гаусса — сплошная плавная; пыравнеиная по уравнению типа А — пунктирная) Таблица 12 Вычисление частот кривой нормального распределения ^ 11 Хк Xk-m, 2 3 4 12 16 20 24 28 32 36 40 44 48 0 4 7 8 28 20 18 о 0 0 —5 —4 —3 —2 —1 0 +1 -1-2 +3 +4 2 94 — 4,521 — 3,521 — 2,521 — 1,521 —0,521 + 0,479 +1,479 + 2,479 + 3,479 +4,479 х к— mt s' 5 —2,959 — 2,304 — 1,650 — 0,995 —0,341 + 0,313 +0,968 + 1,623 + 2,277 + 2,931 f (X) (из табл. 5 приложе­ ния) "= ■ % ) S 6 7 0,00500 0,02807 0,10226 0,24318 0,37641 0,37987 0,24971 0,10689 0,02986 0,00544 0,3 1,7 6,3 15,0 23,2* 23,4 15,4 6,6 1,8 0,3 1,52669 94,0 В 6-й столбец вписаны значения функции нормирован­ ного отклонения из табл. 5 приложения. Поскольку в таблице указаны значения функций для аргументов т с двумя знача­ щими цифрами после запятой, учет третьего знака приходится производить интерполированием двух соседних значений функ­ ции. .40 В 7-й столбец вписывают знамения теоретических ча­ стот, получаемых по формуле (57). В ряду распределения диаметров сосны N = 94, 8'='|/ц.2= = 1,528 см, — =94:1,528 = 61,518. s' Правильность расчета теоретических частот ряда проверя­ ют сравнением общей их суммы с суммой фактических ча­ стот. Допустимо лишь небольшое расхождение, неизбежное вследствие округления значений нормированных отклонений при пользовании таблицей, а также вследствие округлений при pac4efax. Результаты выравнивания по уравнению Гаус­ са-Лапласа показаны на рис. 2. Выравнивание рядов по уравнению кривой распределения типа А Выравнивание рядов по уравнению кривой типа А (Шарлье) производят в том случае, когда tE (или один из них) больше t] (табл. 6 приложения ). Однако кривая ти­ па А может вычисляться и при меньших значениях \к и U Выравнивание рядов по уравнению этой кривой дает вообще лучший результат, чем по уравнению кривой нормального распределения. Последнему же отдают предпочтение в выше­ указанных случаях (при tA или tg меньше t,- ) только пото­ му, что оно проще, а также исходя из рассуждения, что при недоказанном достоверно отклонении распределения в иссле­ дуемом ряду от нормального распределения, надежнее счи­ тать это распределение следующим более общему закону нормального распределения, а найденные показатели откло­ нения А и Е относить за счет случайного состава выборочной совокупности. Частоты кривой типа А вычисляют по формуле: п f(4) - A-V"(x)+ — fIXV ) 6 24 N s' (57) где f(x) — значения функции нормальной кривой при г-'fin(x) и f1V(^) — третья и четвертая производные этой функ­ ции; А и Е — асимметрия и эксцесс; N — общая численность вариант ряда; s' — основное отклонение в единицах интервала, s' У \ )<2. Значения f 111 (т) и f iv (т), берут из табл. 5 приложения. 41 со w Ctf sf к г: см 1 -Н 1In xo CO Г> 1C со со оо о см о" —^ —Г СМ СМ см" lO ^ О^ *-Г со оо СО — см —< ^ см о о Ю о#* x CM H w 4 оо" rH <м Qcd тЦ ю со см см со 00 см со <У> О) © со о со см о#» ол тР ©" o' ©" © о о О ю о *©—4 см ьоо о о © *—4 о о © © о" ©" о + i со а> ю © ю И mL. w | см о СО с со юсм см см 00 © © © о ©" о" 1 1 + o' + ю со тг* о ©" + СО © © © ©~ © со © ©" 1 1 1 W 2 s 00 X о о 0> X см 00 СП р > о со ^ о Ю со см СО а> рм СМ о о о о о о но о о о о" о" 00 со см © ©" 1 а> ю го ©" + оо о> © 1-н ©* см оо см © со © 1 1 о o' o' © Ю TF © Ч < см оо V О о О О см о" о> сГ 4* • fiO со ^ СМ оо о сг> с о см ю f" 1 0 / . ° ° ©" о" ©" ' © + + + I <У> со оо оо ‘г см ст> со ^ ^ ^ о o' о" o' I I + — Ю N^ о- ю ^ СМ <м ^ О) м см LO см Н•S ю 00*4 с -н h- Ю ~ * » о о" о" о 4 о" со + + Мни « II о о о *—I О см с о о о" —« —' © 3 to X о 2 н о 2 09 СО О о + + + + I I I С | <о СО o * c g см см 11 cd a, >> О оо Ю II с <u JQ - см 00 _ Н о ю ю см ю оо см У со ю СО со v-H СО © © © о © *-ч см ©" ©" o' о4о" о" О 4 СО СО 24 0 10*й *00 Столбцы 6+9+ II /с H Р < ГГ- (Й s Tf Ю (N Th О ) О Tf N о" о o' o' o' о" о" ф N (М т)< N О о> N ОО оо О O ’— 1 ’—| 0 _>—I rf Ю + + + + I I I СО ю N О) О) О о СО 0 0 N со ^ (N О) ^ (N -н СО ^ со ю o' со © ^ © o' ©" о" o' I ++ + + I он с ^м § ГГ , К*1 5 * О 4> ST X н 0> о, о О) н а> х х <v с? О X э* 2 во СО « о Ч -н со II z т* 0“ 1 VС/) 1 00 со" см см о II и 1 со - to -1 U3 СО со со со со 1 1 1 1 1 1 1 1 X с N S ^СО ^О?(M 4-® ^ . ^ ^°. b оR I II I t 1 I со сч см см см см см см см см см см см см см Г-Г in' со" см" ^-Г Е I *х II ю © b ю X СМ СМ II © СП г- о см © см © со со см со © © © © ©~ © ©~ © ©" CD ©~ о т-Н со со LO со см 1 1 1 1 1 1 1 см г , см см со Tt< см со ( ю © см с- ю а> о см © г - 00 00 № со со см I © o' © ~ © ~ © ~ © " 6 О 1^ 00 со © © ' w . й О Л О О (О со w h H - -Г <N + + + СО + Ь. + г- см о г- ггсм г- г©" ©" >—г см" см" 1 + + + + + { + см с о + + + + ю 00 © © © о Th см Ю vt< o> 0 X 42 - © см | см со 00 СП © Ю © см сч см см см g - 111смсм со <м со С>4 со w Пример вычисления частот кривой типа Л приведен в т|бл. 13. / В 1-й столбец этой таблицы вписаны классовые вари­ анты X, в 3-й— их условные значения хк, выраженные в / X—М' долях интервала, хк ——----; в 4-м столбце — разность к между условными значениями вариант и первым начальным моментом ряда, т. е. значения хк — mr, в 5-м — значения ар­ гумента т, т. е. частное от разностей (хк —mt) на основное от­ клонение неименованное s'. В 6, 7, 8-м столбцах записывают значения функций из табл. 5. При этом необходимо учиты­ вать знаки функций. Значение f,n (т) в табл. 5 приложения дано для положи­ тельных значений т. При^отрицательных значениях т знак, указанный в таблице, нужно изменить на обратный. Для f(t) и f lv (т) знаки остаются без изменения, т. е. те­ ми же, что и в таблице, независимо от знака при т. А В 9-й столбец записывают значения--- fm (т), в 10-й — Е 6 значения — f,v0c). 24 В I J-йстолбец вписывают алгебраические суммы: * fW + А 6 fm (т) т. е. сумму чисел столбцов 6, 9 и 10. В 12-й столбец записывают произведения чисел преды N дущего столбца на — , где N — .объем ряда (общее количестs' во наблюдений); s' — основное отклонение в долях в 3 Л .3 .. интер- 9 Правильность расчета теоретических частот ряда проверя-* ют сравнением общей их суммы Еп с суммой фактических частот N = 2 п. Оценка согласия между эмпирическим и теоретическим распределением Критерий X (лямбда). Оценка согласованности между экспериментальными и теоретическими (вычисленными) ча­ стотами, т. е. правильность подбора типа теоретической кри­ вой распределения проверяют с помощью критериев согла­ сия. Наиболее универсальным и легко вычисляемым крите­ рием является критерий X (лямбда), предложенный акад, 43 А. Н. Колмогоровым. Условием применения этого критерия является достаточная численность сравниваемых распреде­ лений (в несколько десятков вариант). Для сравнения эмпирического распределения с теоретиче­ ским при одинаковом числе классов и одинаковой общей численности сравниваемых групп критерий X определяют по формуле: , .- iL , (58) где D — максимальная разность (без учета знака) между накопленными частотами в эмпирическом и теоре­ тическом распределениях в пределах одного и то­ го же класса; N — общее число наблюдений в эмпирическом ряду р ас­ пределения. Если значение X не превзойдет предельных его значений: 1,36; 1,63 и 1,95, соответствующих стандартным степеням ве­ роятности достоверного различия pi = 0,95; ро = 0,99 и. р3= 0,999, то расхождения между теоретическими и экспери­ ментальными частотами незначимы. Вычисление критерия лямбда при сопоставлении эмпири­ ческого распределения и теоретического, рассчитанного по уравнению нормальной кривой для ряда диаметров сосны, приведено в табл. 14. ' Таблица 14 Вычисление критерия лямбда Ч аст от а Диаметр эксперимен­ з ычислентальная, п "мая, п Du Zn Г)~ £ 0 0,3 0 0,3 0,3 16 4 1,7 4 2,0 2,0 20 7 6,3 И 8,3 2,7 24 8 15,0 19 23,3 СО 28 28 23,2 47 46,5 0,5 32 20 23,4 67 69,9 2,9 3G 18 15,4 85 85,3 0,3 40 9 6,6 94 91,9 2,1 44 0 1,8 94 93,7 0,3 48 0 0,3 94 94,0 0,0 I! 12 4,3 у'м Найденное значение X не достигает даже первого поро­ га вероятности р —0,95. Поэтому между теоретическим и эм­ пирическим распределением имеется достаточно больщое со­ 44 гласив. Имеющиеся расхождения объясняются случайным составом выборки. Распределение сосен по классам диамет­ ров можно вполне считать нормальным. Критерий х2 (хи-квадрат). Оценку согласия между экспе-^ и теоретическим распределением можно про-* извести также по критерию %2> предложенному Пирсоном. V (п - п)- (59) • п где п — частоты экспериментального ряда; п —; частоты теоретического ряда. Сущность оценки согласия между экспериментальным (опытным) и теоретическим распределением по критерию х2» состоит в проверке гипотезы, что выборка взята из нормаль­ ной совокупности с определенными ,и и о, которые установле­ ны на основе выборки. Для ряда диаметров Н 0: ,u= 30;l см, а —6,11 см. При расчетах критерия х2 численности классов не должны быть менее 5. Крайние классы поэтому объединяют (см. табд. 15). . Вычисление критерия п 12) 16 ) 20 24 28 32 36 40 ) 44 48 1 V ^-1 Л-' п Таблица 15 хи-квадрат (п п)* \Ч-•»);' п )1 8,3 +2,7 0,88 8 18 15,0 23,2 23,4 15,4 - 7,0 +4,8 — 3,4. + 2,6 3,27 0,99 0,49 0,44 9 8,7 +0,3 0,01 94 94,0 0 6,08 28 20 Полученное х2 сравнивают с критическим х2о,оз или Х"<ь9<ь принимая число степеней свободы равным, числу классов без 3, так как в процессе вычисления теоретической кривой использовали N', х, s, потеряв таким образом три степени свободы. 45 Сравниваемые распределения объединены в 6 классов (табл. 15). Следовательно, число степеней свободы п = 6— 3 = 3. Найденное значение %2<%2о,93. Поэтому расхож ­ дение между распределениями незнавдмо. Оно вполне могло быть следствием случайных причин, т. е. случайного состава выборки. Таблица 16 Критические значения х 2 Число степеней свободы 1 2 3 4 5 6 7 8 9 10 11 12 •> Х'0,95 ^2 3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 6,63 9,21 11,34 13,28 15,08 16,81 18,48 20,09 21,67 33,21 24,72 26,22 X > 0,99 Заметим, однако, что х2==6,08 намного ближе к х2(ьуг» чем а —0,44 к ^о,95 — 1,36. Это говорит о разной мощности (чув­ ствительности) критериев %2 и X. ГЛАВА VTI ПОНЯТИЕ О СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЯХ СВЯЗИ. СП О С О Б В Ы Ч И С Л Е Н И Я ИХ Д Л Я МАЛОЙ В Ы Б О Р О Ч Н О Й СОВОК УП НОСТИ Показатели связи г и г\представляют собой количествен­ ные характеристики связи между изучаемыми признаками. Численные значения г и п показывают отношение числа фак­ торов, действующих на изменение обоих признаков, к общему числу факторов. Указанное содержание коэффициента корреляции вполне отражается следующей формулой его вычисления, применяе­ мой при малом числе наблюдений Г ~ 2 ху |/ЁТ 2 ^60) где х — отклонения отдельных вариант ряда независимой переменной от средней арифметической этого ря­ да (х), т. е. х'= Х — х; 46 у — отклонения отдельных вариант ряда зависимой пере­ менной от средней арифметической этого ряда (у), т. е. у = Y— у. Из формулы видим, что при достаточной тесной связи меж­ ду признаками, когда положительным отклонениям значений одного признака от их средней арифметической соответству­ ют в общем положительные отклонения значений и другого признака (а отрицательным — отрицательные), произведения тшш. отклонений будут иметь положительные зиаченмя. Только те пары наблюдаемых признаков, значения отклоне­ ний по которым не будут следовать этой общей закономерно­ сти в изменениях признаков, дадут произведения с обратным знаком (табл. 17). Таблица 17 Вычисление коэффициента корреляции при малом числе наблюдений X S s и &г ГС *=5 52 Ю с? 4> Н п О О S£ tiS 3,5 4,0 4,1 5,0 3,5 3,1 3,5 3,0 5,3 5,0 5 6 5 7 6 4 5 4 7 6 40,0 2 55 Отклонения ! i J.D X < 2? .............. ........ г-Г О . .... & со § ц '2 о X У ' §. И ’5 и< ж к -0,5 0 ’ + 0,1 + 1,0 —0,5 -0,9 — 0,5 - 1,0 +1,3 + 1,0 +3,4 -3,4 0 ч — 0,5 +0,5 —0,5 +1,5 +0,5 - 1 ,5 — 0,5 - 1 ,5 + 1,5 +0,5 Квадраты отклонений Вычисление Х2 •V J'J 0,25 0,25 0,25 - 0 0 0,01 1,00 0,26 х —0,05 + 1,50 —0,25 + 1,35 + 0,25 + 1,50 + 1,95 +0,50 +4,5 +7,30 —4,5 — 0,30 + 7,00 0 1,00 0,25 2,25 0,25 2,25 0,25 2,25 2,25 0,25 6,26 10,50 0,25 0,81 0,25 1,00 1,69 х < М’ = 1 10 iN 1 _ 2 Y У =: J N Г-.: ю 1 5,5 см; 7,< у 6,26 7,0 ~2,50><3,24 7,00 - 0,86 9 В приведенном в табл. 17 примере расчета коэффициента корреляции такие отклонения в изменении признаков наблю­ даются у 3 и 5 корреляционных пар (3 и 5 строки таблицы). Коэффициент корреляции между длиной стебля и длиной корня во взятой для наблюдения совокупности из 10 расте­ ний равен 0,86. Это означает, что из 100 некоторых факторов, действующих на изменение признаков, 86 факторов действу­ ют в направлении изменения обоих признаков в одинаковом направлении. Коэффициент корреляции является показателем прямо­ линейной связи. Он может принимать значения от +1 до — 1. 47 При r ~ 0 прямолинейная связь отсутствует (но криво­ линейная связь при этом может быть). Корреляционное отношение является показателем криво­ линейной связи. Значение и смысл корреляционного отноше­ ния аналогичны значению и содержанию коэффициента кор­ реляции. Он может принимать значения от 0 до + 1. Способа вычисления этого показателя для малой выборки не приводим. Вообще следует иметь в виду, что к вычисле­ нию корреляционного отношения при малом числе наблюде­ ний нужно относиться с большой осторожностью. Если на ос­ новании биологического анализа явления нет достаточной уверенности в наличии криволинейной связи между признака­ ми, то вычислять KOpipeля циоиное отношение между призна­ ками не следует. Для больших выборочных совокупностей, с которыми сту­ дент имеет дело, метод вычисления показателей связи и оцен­ ки связи излагается ниже. ГЛАВА V III В Ы Ч И С Л Е Н И Е ПОКАЗАТЕЛЕЙ СВЯ ЗИ ДЛЯ Б О Л Ь Ш О Й В Ы Б О Р О Ч Н О Й СОВОКУПНОСТИ Вычислению показателей связи при большом числе наблю­ дений предшествует сводка данных в корреляционную таб­ лицу. Техника составления рабочей таблицы с разноской дан­ ных одновременно относительно двух признаков показана в главе 2 (см. табл. б и пояснения к ней). Вычислению статистических показателей предшествует составление таблицы (табл. 18). Та блица начинается расчетной корреляционной решеткой. В отличие от вышеуказанной рабочей корреляционной табли­ цы в расчетную решетку вписывают лишь средины классов по обоим признакам: в левом столбце — средины классов зависимой переменной Y, а в верхней горизонтальной стро­ ке — средины классов независимой переменной X. Частоты в решетку переносят из рабочей шрреляционной решетки. В результате разноски частот по двум признакам получа­ ют частные ряды распределения по этим признакам. Верти­ кальные столбцы частот, рассматриваемые вместе с классо­ выми вариантами зависимого признака, представляют собой частные вариационные ряды это-го признака в пределах каж ­ дого класса независимого признака. Горизонтальные строки частот, рассматриваемые вместе с классовыми вариантами независимого признака, представля­ ют собой вариационные ряды независимого признака в пре­ делах каждого класса зависимого. Итоги строчек л у представляют собой частоты полного 48 ряда зависимого признака, а итоги столбцов — частоты полного ряда независимого признака. За пределами этой части таблицы, являющейся так назы­ ваемой корреляционной решеткой (см. отграниченное жирной чертой), вводят 5 дополнительных столбцов и 8 дополнитель­ ных строк. В 1-ю дополнительную строку вписывают отклонения классовых вариант ряда независимого признака X от услов­ ной средней величины этого ряда М 'х , выраженные в рабо­ чих единицах, т. е. поделенные на величину классового про­ межутка (кх) У _ АЛ' Во 2-ю дополнительную строку вписывают произведе­ ния частот на условные отклонения (пхх1с) и в третью — про­ изведения частот на квадраты условных отклонений (nxxk~). В следующую строку по каждому частному ряду распре­ деления, т. е. по каждому столбцу, вписывают произведения отклонений классовых вариант ряда зависимой переменной от их условной средней величины на частоты каждого част­ ного ряда зависимой. Для 1-го столбца, например, значения этих произведе­ ний получают так: условное отклонение ук (в 8-й строке таблицы) равное —3 умножают на численность пух = 1, услов­ ное отклонение у к (в 9-й строке таблицы), равное —4, умно­ жают на численность п ух =1; затем условные отклонения 10-й и 12-й строк таблицы, соответственно равные — 5 и — 7, умножают на численности, равные 1. Полученные произведе­ ния — 3, —4, — 5, — 7 суммируют. Для 1-го столбца сумма произведений равна — 19. В 5-ю дополнительную строку вписывают значения произведений условных отклонений ряда независимой пере­ менной (х^) на алгебраические суммы произведений (nyxyk), вписанные в предыдущей строке. В 6-ю строку таблицы вписывают значения средних квадратов отклонений частных рядов зависимого признака по классам независимого. Для первого частного ряда (1 столбец) средний квадрат (пухУk)2 _ (-19)2 ^ 9() 2 п, 4 ~ В 7-ю (самую нижнюю строку) вписаны средние значе­ ния зависимого признака У {по каждому классу независи­ мого. Эти значения впервые вычислены в процессе составле­ ния рабочей корреляционной таблицы (см. табл. 6 и поясне­ ния к ней). 49 Распределение числа стволов сосны по классам диаметра Диаметр, см, X Высота, м, Y 16 20 24 М 'х 32 28 2 5__ L . 3 4 7 i 1 1 7 2 29 3 28 1 M'v —27 1 6 10 I 7 $ 1 26 ? 2 1 24 1 2 23 ' ...... 1 Г 22 1 21 10 4 18 2 25 1 14 ! i ; ■ 1 2 13 I 25 иу 40 36 ! б * Г~ 5 ■ !1 5 ' ! 2 30 2 (1 4 j Г. 1 3 2 1 2 2 20 • 1 п х- 4 7 8 — 4 — 3 — 2 —1 — 16 — 21 — 16 — 28_ _ _ 6? — 3 63 32 __ 28_ + 1 0 + 6 И того Хк ПхХк Итого, ' 11хХк‘ . ! 4 1 0 : 28 18 20 1 94 9 , чУ + 1 + 2 0 + 18 + 18 — 45 0 18 36 241 _±!.8 . + 6 — 4 _-|-10 . J : 12 + 10 + 8 4- 6 1 j — 5 — 6 — 2 0 4- 7 + 5 + 2 7 — 4 — 4 — 7 0 0 0 — 2 — 2 ♦ 23 33 16 ' 33 32 225 60,5 28,4 281,0 27,0_ _28,2_ 28,8 28,8 П'ухУ1< t — 12 — 3 — 5 — 19 — 21 — 10 ,1ухУкх к 76 63 20 1 0 (ПухУк)2 90,2 63,0 12,5 0 26,4 _22,2 24,0 25,8 —Г ......П х ... .. У» *• 50 Таблица 18 и высоты, расчет моментов и основных отклонении nxyXk пуУк ПуУк2 +3 30 90 0+6+4 10 30 +2 36 72 —3 + 0 +5 -j-8 10 20 +1 25 25 — 3— 10 + 0 + 5 + 4 —4 — 4 0 0 0 — 3— 4— 5+0 + 2 + 2 —8 0 — 1 — 13 13 — 15 15 —2 — 4 8 —3 6 — 12 36 —4— 6— 1 — 11 33 —4 — 12 48 — 4— 3— 2 —9 , 36 —5 -10 50 1-4-1 —5 25 —6 — 12 72 —6 —6 36 —7 — 7 49 —4 —4 28 Ук ПхуХкУк 4 «я?- _*0 .* — 8— 7 + 0 — 2— 1 463 21 4 225 M 0 м e н т ы: m,x - m.,x I nxXk - 45 N 94 2 ПхХ^к 241 N 94 ш =-0,479; 111 1 2,564; L iw * Hi =0,223; " N Г"‘ 94 - пуУ2к N in2y - 463 94 —4,926; s'x --=Vm „ —m*u = V 2,564— (—0779)*-1,528; s', • V m2y — m,y2= / 4,926—0;2232= 2,202; - "хуХкУк N in ixy „ ni^y./x 1 ^ V 225 = 2,394. 94 Д»хуУк)2 \ ^ ^ I (61) 1 Ofti _ o o « o • 281 2,989, (62) 51 Содержание дополнительных 5 столбцов таблицы анало­ гично содержанию рассмотренных строк без 2 последних. Содержание ясно из символов, указанных в заголовках столб­ цов. Столбцы эти служат для проверки расчетов, произведен­ ных в строках. Суммы 3-й строки снизу и последнего столбца должны совпадать. После того, как эти суммы про­ верены и найдены суммы других строк и столбцов, вычисляют начальные моменты и основные отклонения. Формулы и по­ следовательность расчетов приведены в нижней части табл. 18 справа. В этих формулах: mix и т 2х— первый и второй начальные моменты ряда рас­ пределения независимого признака (в нашем случае — ряда диаметров); т 1у и т_,у — первый и второй начальные моменты ряда за­ висимого признака (в нашем случае — ряда высот);, * mixy — момент произведения отклонений; т*>у /х — средний квадрат условных произвольных откло­ нений частных средних ряда у по классам х (второй момент); s'x, s'y — основные отклонения вариант, соответственно ряда х и у от их средних х и у, выраженные в долях интервалов. Статистические показатели вычисляют по формулам: коэффициент корреляции связи для больших выборок m !xy— m ,xm iy s',s', (63) ко р р еля цио ниое оти о шение (04) Для совокупности 94 деревьев сосны (табл. 16) показате­ ли связи между диаметром и высотой деревьев оказались следующими: 2,394— (0,4 79) 0,223__=0 7411,528X2,208 ч = ^2 .989- 0.223^ .,_0,777. v 2,208 ГЛАВА IX ОЦЕНКА ПОКАЗАТЕЛЕЙ С В Я ЗИ Оценка связи между признаками г Оценка показателей связи Показатели связи, вычисленные для выборочных совокуп­ ностей, как и вышерассмотренные другие выборочные стати­ стические показатели, имеют свою ошибку репрезентативно­ сти. Ошибку коэффициента корреляции при малой выборке вычисляют по формуле: (65) где -г — коэффициент корреляции; К — численность выборки, т. е. число ний признаков. При большой выборке корреляции такова: парных наблюде­ формула ошибки коэффициента 1—г2 sr - --~==г. L У N— 1 (66) Аналогична и формула ошибки корреляционного отношении: S-л 1—Т]2 |/ N'— Г Критерием значимости выборочных показателен связи ипляется частное от величины самого показателя па его оши^~ ку, т. е. вышерассмотренный критерий t [см. (47)]: tr = — ; Sr t, = - sr, г- . . (67, 68) Для совокупности диаметров и высот сосны, помещенной п табл. 18, ошибки показателей связи равны: 1— 0,741 - s 1/94— 1 1^94— 1 tr 0 741 0,047 -16.0; 1—0.54Г , п ._ ....__ . -ч.1,047; 9,644 ' - » • « « „0,0,1; 9,644 t, 0 777 ’ ' 0,041 19.0. 53 Полученные значения t позволяют произвести проверку ну­ левой гипотезы: значимы ли г и т] или в более подробной ее постановке: совместимы ли полученные показатели с предпо­ ложением о том, что в генеральной совокупности не суще­ ствует связи между изучаемыми признаками, т. е. р = 0 ; и vjr=0(p ит)г— показатели генеральной совокупности), Так как найденные t r и Ц выше критических значений, приведенных в табл. 6 приложений для N'— 1=93, то можно утверждать, что разность между выборочным показате­ лем (г) и гипотетическим (р) (аналогично между г) и т)г) яв­ ляется значимой. Нулевая гипотеза отвергается, г и у\— зна­ чимы. С вероятностью в 0,95 можно утверждать, что генеральные показатели связи будут в интервале: \ не менее 0,647, j не более 0,835; р —i± ts r —0,741 ±2,0 0,047 „ ол М., = 0,/77±2,0-0,041 i j не менее 0,695, „е более 0,859. Для совокупности длин стеблей и корней (табл. 17) s= ,/ iz Z = I/ V N -2 V tr = — sr 1—0,86» = , / 0 , 2 6 = 0 ]8 10-2 V 8 •• ° ,8С- ==5,33. 0,18 Таким образом и здесь найденный выборочный циент корреляции является значимым, т. е. что р ^ 0 . коэффи­ Интервальную оценку для р, если г получено по малой выборке и оно высоко, производят, пользуясь z — преобразо­ ванием Фишера. Это связано с тем, что распределение г в та­ ком случае отличается от нормального. По значению г, пользуясь таблицей, находят z (табл. 7 приложений). Затем находят ошибку z по формуле: 1f V ~N——3 (69) и доверительный интервал для z. Пограничные значения ин­ тервала по той же таблице (пользуясь в обратном порядке) переводят в значение г. Произведем интервальную оценку для коэффициента корреляции длины стеблей и корней. 54 С о г л а с н о табл . 7 .для г — 0,8(1, z = 1,203: sz - 1 / |/ 10— 3 -0.378. Доверительный интервал для z в генеральной совокупно­ сти равен z±ttf?fc> s2*= 1,293 ±2,3-0,373, т. с. от 0,424 до 2,102. Интервал для р (по табл. 7) будет: 0,40—0,97. Оценка связи между призиаками Оценку связи между призиаками производят в отношении направленности, тесноты и формы. Направленность связи на­ дежно устанавливается уже из корреляционной решетки. По полученному полю точек можно приближенно провести об­ щее направление линии связи. Если при этом наименьшим значениям одного из признаков соответствуют в общем и наименьшие значения второго признака, связь является пря­ мей; в противном случае — обратной. Коэффициент корреляции при прямой связи между при­ знаками имеет положительное значение, а при обратной — отрицательное. Связь между диаметрами и высотами деревь­ ев является прямой, коэффициент корреляции имеет положи­ тельное значение. Тесноту связи оценивают по величине показателей свя­ зи г и т]. Для оценки тесноты связи можно пользоваться сле­ дующей шкалой: Значение показателем связи 0 0,30 Градации тесноты сиязи слабая 0,31- 0,50 умеренная О.Г, 1—0,70 спасительная 0,71 и > тесная Связь высот и диаметров деревьев ч исследуемой совокуп­ ности является тесной: г— 0,741; rj = 0,777. Показатели эти значимы, так как t г— 16,1 >3,4 и t ■,,= 19 > 3,4 (из табл. 6 при­ ложения). Следовательно, связь проявляется в том же на­ правлении и в генеральной совокупности. Интервалы для р ит|г показаны выше. Оценку формы связи дают на основе сопоставления пока­ зателей связи (г и т]). Вычисляют так называемую меру криволинейностиЖ и критерий криволинейности t k. Мерой криволинейности связи называют разницу меж­ ду yj2 и г2 ]^рй связь строго прямолинейна, что бывает крайне редко, при К =1 криволинейный характер связи до­ стигает максимума. Это возможно при г= 0 и г|— 1. Во всех других случаях связь в той или иной мере криволинейна. При небольшой степени криволинейности связь практически можно принять за прямолинейную и тем значительно облег55 чить дальнейшие работы по вычислению уравнений связи. Порогом (границей) криволинейности, перейдя который связь уже не может считаться прямолинейной, обычно принимают значение tk> равное tj или большему числу (см. табл. 6 при­ ложения). Критерий криволинейности — обычный критерий 1. Определяется он по формуле tk= --- , где sk — основная ошибка меры криволинейности, определяемая по формуле: 2 = y"K— K2(2-fri*— r V (70) Sk J/N Связь диаметров и высот рассматриваемой совокупности 94 деревьев оценивается: K = ri2— г2=0,7772— 0,7412= 0,055; sk ^ 2 (71) ____________________________ ,_______ j/0,055— 0,055* (2—0,7772— 0,7412) = |/'070524Т = —-— 0,229= =0,047; 9,695 9,695 9,695 sk 0,047 Так как t k<to,oi и д а ж е > 1 о,05, то связь можно считать прямолинейной*. По значениям г= 0,741; т]= 0,777; t г== 16.0; t = 19; t k= l , l 7 можно дать следующую общую характеристику связи: связь д/ря'мая, тесная, прямолинейная. Значение г = 0,741 говорит о гом, что из 1000 каких-то факторов 741 фактор действует на изменение обоих признаков в одинаковом на­ правлении. При наличии такой связи ее можно использовать в практических целях, например для выравнивания экспери­ ментальных значений признаков. Г Л А В А X УРАВНЕНИЯ СВЯЗИ Линейное корреляционное уравнение Когда линейный характер связи установлен, удобно вос­ пользоваться имеющимися статистиками для получения прямолинейного корреляционного уравнения: * В дальнейшем можно было бы выравнивание экспериментальны данных произвести по уравнению прямой линии. Однако К=?£=0; следова­ тельно, связь в некоторой мере криволинейна. Уравнение параболы 2-го порядка отражает связь между диаметрами и высотами лучше. 56 где _ х, у — средние для ряда независимой переменной х и ря­ да зависимой переменной у; §/х> s'y — основные отклонения для этих рядов тервалов; в долях ин­ кх, ку — величины интервалов для ряда х и ряда у; г — коэффициент первым х; корреляции второго признака ус X — значения независимой переменной в принятых при наблюдении единицах измерения; Y — выравненные значения зависимой переменной. куо'у г ~г—г~ называется коэффициентом регрескха х сии Ry/x . Он показывает, насколько изменяется зависимый признак при изменении независимого на единицу. Для сведенной в корреляционную таблицу (табл. 16) со­ вокупности 94 сосен прямолинейное корреляционное уравне­ ние связи высот с диаметрами оказывается следующим: Множитель Y= y ' (X— х) = 27,223 + 0,741 i l l ’--0-2- (X— 30,084) = М 'к 4-1,528 ’ = 27,223 + 0,267 (Х-30,084) = 19,160+-0,267Х. В полученном уравнении Y ' = 19,160 + 0,267Х независимой переменной являются диаметры деревьев, а зависимой — вы­ соты. Способ наименьших квадратов .является наиболее общим аналитическим способом выравнивания* эмпирических дан­ ных. Этим способом получают выравненные значения функ­ ции, сумма отклонений которых от эмпирических значений является наименьшей. Подобно средней величине признака, заменяющей собой весь коллектив, выравненные значения зависимого признака заменяют собою экспериментальные его значения для каждого значения независимого признака. Выравнивание эмпирических линий связи по этому спосо­ бу включает следующие этапы: 1) определение общего вида уравнения; 2) составление системы нормальных уравнений; 3) определение числовых значений сумм, входящих а нор­ мальные уравнения; 4) определение коэффициентов основного уравнения; 57 5) нахождение выравненных значений зависимого призна­ ка (функции); 6) оценку точности уравнения. Нормальные уравнения получают путем умножения всех членов основного уравнения связи на коэффициенты при не­ известных членах а, Ь, с и т. д. Сущность этих коэффициентов можно понять из следующего изложения. При наличии нескольких N единиц наблюдения с двумя измеренными признаками можно составить N конкретных уравнений. Если связь прямолинейна, эти уравнения запи­ шутся в виде Y = a-fbX (73). Причем, в каждом из них вме­ сто Y иХ будут вписаны конкретные значения признаков. Н а ­ хождение коэффициентов а и b можно свести к решению по­ лученных исходных уравнений, беря из них каждый раз новую пару. При этом получили бы частные значения коэффициентов а и Ь, отражающие связь только между двумя взятыми в каждом случае единицами наблюдения, но не удовлетворяю­ щие связи оставшихся других единиц. Лучший общий средний результат для ©сей наблюденной совокупности вариант получится, если из ©сех N исходных уравнений получить два нормальных уравнения. Для этого все члены исходного уравнения нужно умножить на коэффициент при а, равный 1 (получим N уравнений типа Y' = aH-bX), и сум­ мировать полученные выражения; получим 2 У=а1Чн-в2 X. Второе нормальное уравнение получим, умножая каждое исходное уравнение на коэффициент при Ь, равный х (получим N уравнений типа ух = ах-ьЬх2), и суммируя полученные вы­ ражения имеем 2 YX— а 2 X + b 2 X2. Нормальные уравнения в алгебраической форме :штисн будут такими: 1) 2 Y = a N ' + b 2 X ; 2) 2 YX = а 2 X + b 2 X2. (74) Для рядов распределения, где каждая классовая вариан­ та встретится л раз, два нормальных уравнения прямой ли­ нии примут вид: 1) 2 nY —а 2 п -Ь о - пХ 2 л; 2) 2 пУХ - а 2 nX + Ь 2 г«Х2 2 лХ. (75) Очевидно, что первое и второе нормальные уравнения от­ личаются от основного уравнения У = а + ЬХ, соответственно, множителями 2п и 2 лХ, которыми в последующем и надле­ жит пользоваться при составлении нормальных уравнений на основе уравнения общего вида. Числовые значения сумм пх, пх2, nY, nYX находят в ито­ гах расчетной таблицы. Для упрощения расчетов при полу58 чснии указанных сумм произведений и при вычислении коэф­ фициентов, входящих в уравнения, в качестве значений аргу­ мента лучше брать не срединные значения классов, а услов­ ные их значения (х), подобно тому, как это делали при вы­ числении моментов. Избегая отрицательных произведений, в качестве услов­ ных срединных значений классов аргумента лучше прини­ мать натуральный ряд чисел: 1, 2, 3 и т. д. Значения этих условных классовых вариант можно выразить формулой: где к X В величина интервала; классовые варианты независимого признака; число, на которое надлежит уменьшить наимень­ шую классовую варианту с тем, чтобы в числителе формулы 76 получить разность, равную величине класса. Средние эмпирические значения зависимой переменной Y, взятые из корреляционной таблицы и вписан-ные в 3-й стол­ бец табл. 19, можно также упростить, уменьшив их на некото­ рую одинаковую величину С. В нашем примере значения вы­ сот стволов сосны удобно уменьшить на С = 20 м, получим y = Y— 20. Определение неизвестных коэффициентов а, Ь, входя­ щих в уравнения, производят, решая систему полученных кон­ кретных нормальных уравнений. Выравненные или наиболее вероятные значения зависи­ мого признака находят, подставляя в полученное конкретное уравнение значения аргумента, в нашем случае х = 1 , 2, 3, 4 и т. д. Для получения действительных выравненных значений функции свободный член уравнения увеличивают на величи­ ну С, в нашем примере равную 20 м. Оценку уравнения производят, сопоставляя^ эксперимен­ тальные средние значения зависимого признака Y с наиболее вероятными его значениями Y, полученными по уравнению. Затем находят среднюю квадратическую ошибку s ух . Для иллюстрации техники выравнивания значений зависимого при­ знака методом наименьших квадратов приведем примеры вы­ числения некоторых уравнений. * Полученные таким образом значения классовых вариант по своем существу не отличаются от применявшихся ранее в расчетах условных отклонений классовых вариант, выраженных в единицах интервала. Но они отличаются от последних численно, вследствие другого избранного начала отсчета отклонений (определенное В вместо произвольного М'). 59 Уравнение прямой линии Общий вид уравнения прямой Y = а -Ь ЬХ. Нормальные уравнения в общем виде следующие: 2 nY = а 2 -Ь b 2 пХ; 2 nYX = а 2 nX + b 2пХ2. Для приводимого в табл. 19 исходного материала наблю­ дений, после упрощения значений переменных вышеописан­ ным способом, нормальные уравнения запишутся так: 2пу = а 2 п + Ь2 пх; 2 пух = а 2 пх -Ь b 2 пх2, где х — кодированные значения X. Сущность их та же, что и условных отклонений, применявшихся при расчете моментов для этого ряда. Численно же они отличаются вследствие дру­ гого избранного начала отсчета отклонений, y = Y— 20. Подставляя в эти уравнения вместо 2 п, 2 пх, - пх2, 2 пу, 2 пух их значения из табл. 19, получим следующие дна конкретных уравнения: 680,0 = 94а + 425b 3310,4 = 425а + 2141 b I : 425; : 2141. Поделив все члены этих уравнений при Ь, равные 425 «и 2141, получим: 1,6000-0,2212а + b; (1), 1,5462 = 0,1985а+,Ь. (2) , на коэффициенты Вычитая (2) из (1), получим: 0,0538 = 0,0227а, откуда а ==2,370. На основе (1) Ь = 1,6000— 0,2212X2,370= 1,076. Урав­ нение “ТуГй кодированных переменных х, у будет таким: у =5*2^70+ 1,076х. 'Переходя к значениям высоты Y, получим: 7. Y = у + 20 = 22,370 d- 1,07^х. (78) Если требуется перейти к значениям некодированной пере­ менной X, в нашем случае к значениям диаметра, следует вос­ пользоваться выражением (76), приняв конкретные значения В и к. 60 о л х л X ч о-» •О. с СО ою" ю h— оо о o' CM 1.0 см" "О Tt4 •st* г-Г ю см о" ~_4 о о" СГ> ю со см О 4 о" см ю о + о о ю <т> 00 о" о о о СО см \о cd Н ( >- 2 к 3 £ СО сЗ О. ю О О 1 1 •- о О _ — см со" - ч#» » —» + + "а £ к CL С + II о со ю ий ь О о 3 CQ Q. Q 4\j *«, / а л <>- J3 СП .х О с 2 ас о оо н» оо 29 0 С ю со" сч см ос" 00л сэ со ю °& 00 о ас см со Ю см г*со" см г-Г см 00 оо" см со CD г+Г ОС о о о" см 00 о" iO СТ> to to о " У— < со 00 о со" <о 00 lO см сгГ г- о о" оо СО СО ю СТ> -z f со *—*4 <у> оГ см со ctf п* e tct О- 00 см <м СМ г*- С О £ О <и 3* S а s с г 00 Tf о о ю оо ТГ со «-4 Гр 1.0 I*»♦ о" II 1»—Ц см о о , —. СМ см с о о ОО о со СО ю см "Sf ф а> S ж 00 ссв з S £ 03 а 0 0 см о см 00 а> со CN 2 *Г*‘\ CQ со Н 3 GQ А о к О см" см ' 'См" СМ <о ^f* о ю CD rC CD CD 4 ю" CM - CM CM ^f CM ас 00 ОО CM 00 CM 00 оо" 00 00 оо см . 00 см СО VI ?I тз о> и*г W оо с* PC <D X CQ «5 Ом см ю со cs СО и: VO Я 3 X eWD 41Яс1хЭ1Л1ВИ^ со — О см rf СМ ос см см со со СО о о 61 Д л я н а ш е г о п р и м е р а получим: Y = 22,370+ 1,076 = 19,142 + 0,269Х. 4 (79) На основе (78) или (79) находят выравненные значения Y. ✓ч . 'v В табл. 19 они равны в м: = 23,4; Y2= 24,5 и т. д. Последним шагом выравнивания опытных данных являет­ ся нахождение стандартного отклонения опытных значений Y от выравненных Y, которое называют также ошибкой уравне­ ния S yx. Для этого находят последовательно все разности dj — Yj — Yj (т. е. di, d2, d3 и т. д.), возводят каждую раз­ ность в квадрат, умножают на соответствующую численность пь находят сумму произведений, которую делят на число сте­ пеней свободы, равное N—т , где N — объем выравниваемого ряда; т — число коэффициентов в уравнении (для прямой —2, параболы ^З). Ошибкой уравнения является корень квадрат­ ный из указанного выражения, т. е. S yx==J/ ^ — — . Значе­ ния Syx показаны внизу табл. 19 и 21. Показанное выше ре­ шение уравнений рекомендуется проводить гто схемам табл. 20 и 22 с контролем каждого шага вычислений. Если студент уже произвел вычисление коэффициентов прямолинейного уравнения вышеуказанным способом, он дол­ жен решить уравнение параболы 2-го порядка с применением контрольного способа, т. е. в табл. типа 22. Таблица 20 Вычисление коэффициентов линейной регрессии высот 94 деревьев на диаметры № ii/ п Действие а в У у У 2 /k i а *4 1. 2. 3. Строку 1:425 4. Строку 2:2141 5. От строки 3— строку 4 6 . а = 0,0538/0,0227 7. аГ->в строку 3 8 . а, в —►в строку 1 94 425 425 2141 0,2212 1 1 0,1985 0,0227 = 2,3700 ' - 380,0 " 3310,4 1,6000 1,5462' 1 1199 5876,4 2,8212 2,7447 00538 0,0765 в = 1,0758 Проверка = 680,0 V 1 2,8212 2,7447 t i\ Примечание. Знак —► означает подстановку в уравнение соот- ветствующего а, в коэффициента, V 2 = а + в+у; 2 /в — а частное от сум- мы на коэффициенты kj. Например, в 3-й строке 2,8212=1199/425. Уравнение параболы 2-го порядка Общий вид уравнения параболы 2-го порядка: у = а-Ь bx-fcx2. Нормальные уравнения в общем виде следующие: ■?-' 2n ; *i пх 2 n y « a 2 n -Ь b S rtx-4-с £ пх2; I; 2 nxv* = а X г,х -f b X пх2-Ье 2 nxs:' 2 пх2 2 ix2y = а Е nx2-f I) 2 пх3Ч-с S пх4. Для нахождения конкретных нормальных уравнений пара­ болы 2-го порядка для того же ряда высот сосны можно ог­ раничиться вычислением только недостающих еще не вычис­ ленных сумм. Расчет этих сумм приведен в табл. 21, являющейся по су­ ществу продолжением табл. 19 (столбцы х, у, п, здесь повторе­ ны для удобства чтения). Значения произведений частот на условные классовые варианты пх, пх2, пх3, пх4 могут быть проведены сравнением полученных в табл. 21 произве­ дений пх* с произведениями из табл. 4 приложений. Вычисление коэффициентов уравнения параболы 2-го по­ рядка приведено в табл. 22. Уравнение параболы 2-го порядка и числах кода оказалось таким: у™ —0,7051 -{-2.741 ОХ— 0,1Я ^ х 2. Перейдя к значениям высоты, имеем : Y - у + 20 = 19,2949 + 2,74 ГОх— 0.1855хй . Подставляя в полученное уравнение, значения диаметров в долях интервала, т. е. числа 1, 2, 3и т. д., получили вырав­ ненные или наиболее вероятные значениявысот. При х=1 Y ! =21,976 и т. д. При х = 2 ¥2 = 24,046 и т. д. Вычисленные (выравненные) значения высот приведены в табл. 21. В графе 9 этой таблицы приведены разности меж­ ду наиболее вероятными и экспериментальными значениями высот. Наибольшее различие составило 0,2 м. ^/Результаты выравнивания по уравнению параболы 2-го порядка оказа­ лись лучшими, чем по уравнению прямой, где максимальное расхождение равно 1,2 м, sy.>; =0,54. Результаты выравпива- ■if 63 04 со ^ X Ю C3 H о о о" о" I + о" + о (N CM 3 n о Ю св «X o j X 2 X X 4> X 0 0 0* & >> ч >* а н оо 3 о> ar S X о. аГ ^ ^-< 00 5 3й 2 С й м Ж л о> « нх 2 О аз _ 5 2 Я нО CQ Си ои. ^ 04 ^ о* o' + + см X >% С СО _л <о of OJ 04 °°~ \о t оо ■хГ oj ! О) 04/ 04 04 ОС о 04 00 »—4 1*^ О о Tf< со" o ’ of о" >— 4 оо о— о »—И со Tt* «.о 00 o' оо оо СО 1-— ! н о о 3 « К( о; О DQ <2п о С о о О О 04 сч <D <Ю of ао 30 ОС" ю 04 OI 04 04 04 104 04 О 2 x — сГ о" о" о" о* о" о" *o * к c u о к 0 1 о о •v о* ю СО см СО со X а <М СО КО о *"Ч ою О! N 1»ч <7> <го <го <м о со 04 сг> со со 1 C <о 00 <х> <>0 <У0 ь. 00 о оо СО 1C 04 О! оо о> СП СО СО ‘30 со о> О ж О О) У X CL X с: s д> <г> х х с$ 00 X CQ С$ 04 <о ю со X с со со —н 04 OI w -t О о ю OJ СЮ 00 о S I S3 и У, >* СП 3' СО 04 64 СО CD ^ ГЮ •—» 04 СО 04 of О* 00 N (. со (О CD 00 оо W СЧ| cs сс sr к ч V O cd ОСП О О — "QOOOO ООО^— ‘-^ОЮЮ ЮОЬ-1ЛСОО^(М Ю Ю т Г О О Ф О О О И ^гн Г ^ О О С О С О О H x о О о г 09 О оч CQ SM * И о O^^OCDOO»-^OOOOG оS^nCDOMOCOONCN а?со о оо^-н^оюю ^ ^ «Л ^О О Ф О О О CONCO^^rHOOCOCOO ’— •о оно 2 09 •' \ O^^OtS^CftCOOOvOt4 -*• о г^Г <-~Г t4* со Ю CD 00 о ^SS-^OOCOCOC^tOCslcC 09 О Си н 4> о оо CJD O O N O O d ' О о CN см'оГ S л 5 кС О? ч К с* * еС с; и ооа ^ со а> иО ю оо 1—» ю CJD o ' М4to трсо со ^0s ) *—*СО*»— "*’-ч v— I I I! у 0 to 1 см 2 ч о \о CJ Си сд а Ю’-'СОЮ'ФФ-ОО Csj’sfrfOOlOCOCOC» т^т-чги—«О ПС *© <С **—4 г—О ЧГ Г"'~ —*f ""*)| C^ -J ,-- 1 о 0* о г* «ч /*““s о о ей « аси сс о Ои Е csf Я* о с сс X X й> X 09 сЗ О* >> сз > 0 5 0 0 0 0 ’— о о ю ю ОХМгРСО СОСЧГ'-'ФСЧ’**100 ^ юо — ■ Т}< СО СО о о Ю СМо о о,© О Юг* о #*• o'o'о"о"сГо"о*»©'о осон 1 Г' X о X X -в -е ф оX а> х х о ч о X ST 21 S3 г о СО а> к со н о »38 а> *= ( 00 oo >, > >>чd-d-£2 & Sa£ н Н о о О О о о ^ Си C l Си о Ь“ fc-1 h j" • • •N э-§ О « " 3 !>» J? 1—I If - О SC ю со со £ей cГ l, Г £ ^ 1*Л ю со С ОGО Н LO CS со •о § £ ? § w I •* H II О, а *! ЁГ 0» л 1 U U U O O n оо О eg «J c«i С * в- b ri tr о t " Й £0 - .. CO CO счс6^юсо1>оос')6^ e4co rr ю r—ч Г—* г**м^ r—i ?•—< 65 X /6 20 2Ь 28 32 i 36 40 Д и ам е т р , см Рис. 3. Кривые связи диаметров и высот деревьев ния эмпирических высот по уравнению параболы 2-го поряд­ ка можно считать вполне удовлетворительными.^ Экспериментальная и выравненные но уравнению прямой и па!ра;болы 2-го гтрядка кривые изображены ,на рис. 3. Уравнения логарифмических парабол Для выражения корреляционных связей между многими признаками в лесном деле и биологий часто применяют па­ раболы полулогарифмическою вида: Y —a- fblgX ; У = a + b lg X + c (lg X) (80) (81) а также логарифмические: lgY = a + b lg X ; (82) пли Ig Y - a + b IgX-i- c(lg Х )2( 66 (83) Решение уравнений подобно решению простых парабол. Отличие состоит к том, что значения вариант независимого признака, а в (82) и (83) и зависимого признака берут в ло­ гарифмическом виде. Нормальными уравнениями будут: для (80) 2 Y lg X = a S lg X + b S (lg X )2; j (84) 2 Y = aN + b S lg X ; для (81) 2 J 2 Y = a N + b 2 1gX + c£ (Ig X )2; | Y l g X - a 2 1gX + b 2 (tg X )2-fc2 (Ig X )3; (85) S Y ( lg X ) 2= a 2 (Ig X )2+ b 2 (lg X )3+ c2 (Ig X )4. Для 82 и 83 нормальные уравнения будут отличаться и 85 только левыми частями, где Y заменяется на lg Y. Расчетные таблицы должны щих столбцов: от 84 включить заголовки следую­ для 80 и 81: X, Y, п, у, IgX, (Ig x )2; для 82 и 83: X? Y, n, lg X, (Ig x )2, lg Y. - ; Значения сумм произведений зависимого и независимого признаков, входящих в нормальные уравнения, получают с применением счетных машин. 67 ПРИЛОЖЕНИЯ Таблица I Ведомость измеренных диаметров и высот дере&ьев ев Днаметр, см I 12,6 деревь­ 1 • 2 22,0 24.2 18,6 19.2 15.0 22.3 10,2 15.1, 3 4 . 5 < 6 ( 8 9 12,2 10 14.3 22.3 12,6 И 12 . : 13 14 11.1 1S 17 18 32.2 17.0 23.6 19 27.6 22.6 20.0 15.3 32,2 J9>8.25.0 9.7 25,2’ 14.5 17.7 18.6 14.4 30.2, 18.4 8,5 •16 22 23 24 ТЯГ 26 '27 28 29 30 31 32 '33 и (\ оо 36 37 39 40 41 42- 133 1^4 135 136 UJL. 140 141 м 16,7” 21.7 22,0 20.8 19.5 17.8 21,0 9.6 17.8 8.7 11.4 21.3 11.6 10.5 21 # 17.3 21.5 16.5 22.3 21 , Г 22.6 17.4 22.7 20.9 .19,7 9.7 24.8 16,1 16.9 18,0 18.5 23,8 17.7 8.7 ~2£Д ■2TJ-" 15.1 24.2 19.4 20.5 '-fs;/ 17,4 10.3 15.7 13.4 22.5 16.7 12,4 23.8 2,1 22.8 13.4 22,1 22.7 19.5 23,0 17.3 19.3 21.8 17.5 - lit . 138 Вы­ сота, 18,8 27,6 23,2 2L9 2JJL 19,3 19.6 13,5 18,1 № деревь­ ев 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64, 65-’ I 66 67 68- 71 72 73 74 75 76 77 78 79 80 81 82 83 iiv Диа­ метр, 20,6 16.5 12.0 29.5 22,8 24.4 13.8 22.4 27.1 22.1 14.8 29.8 20.3 28.8 22.7 13.8 28,0 25.5 22.6 32.4 12.3 13.6 27.6 33.4 23.8 15,У Вы­ сота, 25.8 19,6 14.5 16.5 22,0 27.2 21.5 19.6 21.8 15.2 16.7 13,1 26.7 32,6 14.8 20.4 18.5 19.0 17.0 .2 0 5 - ~2Ъ$~ 23.6 см см 16,2 29.7 20.8 14.9 14.7 29.0 17.3 9.7 33.6 11.3 14.7 23.9 15.7 18.7 21.7 26.3 Диа­ метр, 17.5 21.3 22,7 18,1 -19,5 25.5 18.6 13.1 25.5 13.6 15.3 22.1 18,1 21.7 23.3 21.3 21,1 19.5 15.3 22.5 23.5 19,9 15.8 20.5 23.6 19.6 17.6 19.7 19,1 22,0 20.8 15.0 23.6 23.6 21.1 24.4 14.8 14.8 22.9 24.5 23.7 17.5 12.5 ■23JL 10,4' Ш r’V'i ___ 217,6 20,0 21,7 : о9 19,3 160 29,2 24,2 161 13,7 16,1 162 20,6 22,9 163 19,6 21,7 164 15,6 19,7. JJL 6 ....14J>J .. Т р ■ 160 21,8 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 т 11SL. и 12 13 14 15 16 17 18 19 20 !1 23 24 25 26 27 28 29 30 31 |Т83 184 185 186 187 188 189 . 190 191 м 18.3 16.5 21.5 24.5 21.3 15.5 21.7 17.7 19.5 16.3 23.9 24.0 17.9 17.5 20.3 21.1 18.7 -34,5 22,9 21.5 Ж ‘5 11.7 10,0 28.4 18,0 21,9 17.1 14.1 17.2 21.5 27.3 23.5 17.6 11.4 27.4 29.8 26,2 25,0 25,3 20.6 И Д, 31,6 22,7 32,7 18,8 23,3 22,6 23,6 36,7 23,2 22.6 15,8» 14.0 ,, 22 8 19.5 21.3 18,7 19.5 ' 22.5 22.0 24.5 21.6 20.5 15.5 23.1 22.1 18.3 22.4 22.6 21,0 - ilk 25,5^ 21,7 24,0 22,7 23,5 21,7 20,3 22,8 21,5 Продолжение таблицы I № деревь­ ев 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 Диа­ метр, № j j деревь­ j ев Высота, м СМ 17,5 33,5 30,6 23,2 * 26,8 22,6 23,7 22,7 23,5 23,7 22,7 23,7 22,5 19,7 22,5 21,7 18,7 20,7 22,8 21,3 23,1 18,5 26,6 18,8 16,6 20,7 17,2 13,4 17,4 21,5 16,4 18,4 16,3 26,1 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 18,5 22,7 22,5 № деревь­ ев Вы­ сота, м Диа­ метр, см 21,8 21,7 20,5 23,4 22,7 13,0 22,5 20,0 21,6 11,7 25,9 21,9 13,6 17,4 16,4 17,9 23,7. 23,9 14,7 17,7 15,0 21,5 24,6 22,1 11,8 20,0 30,7 192 193 194 195 196 197 198 199 Диа­ метр, см Вы­ сота, м 18,3 27,2 19,5 22,7 20,7 14,4 16,8 22,0 13,1 18,5 26,6 25,8 21,2 22,7 21,0 20,2 20,2 200 201 202 18,0 19,0 21,3 18,5 18,5 11,4 22,5 23,9 15,7 19,5 9,4 203 В табл. 1 шисаны значения диаметров и высот 205 изме­ ренных деревьев ели. В качестве исходных данных для расчетных (контроль­ ных) работ выписывают значения двух указанных признаков следующих номеров деревьев (табл. 2). Таблица 2 Варианты заданий для контрольных работ 1 № варианта чадания 1 2 1— 110 1— 20 , 101— 200 6* 7 No деревьев из табл. 1 приложен. № варианта задания № деревьев из табл. 1 приложен. 96— 200 3 4 1— 50, 1—30, 146— 205 121— 205 5 1—60, 156— 200 9 8 11 — 110, 31— 60, 71— 130, 126— 135 121—205 146— 190 10 91— 205 Таблица 3 Мантиссы обыкновенных логарифмов чисел Числа П 1 2 0000 Числа П 11 12 9 ЗОЮ 4771 6021 6990 7782 8451 9031 9542 13 14 15 16 17 18 19 10 0000 20 3 4 5 6 7 8 70 Ман­ тиссы М ан­ тиссы 0414 0792 1139 1461 1761 2041 2304 2553 2784 ЗОЮ Числа | Ман­ тиссы П 21 22 23 24 25 26 27 28 29 30 3222 3424 3617 3802 3979 4150 4314 4472 4624 4771 Числа П 90 91 92 93 94 95 96 97 98 99 М ан­ тиссы 9542 9590 9638 9685 9731 9777 9823 9868 9912 9956 Числа П 100 105 110 115 120 125 130 140 150 М ан­ тиссы 0000 0212 0414 0607 0792 0969 1139 1461 1761 Таблица 4 Значений чётв<фтых моментов разрядных частот**пХк1 II Хк 2 хк ! хк” 4 Xк хк --=6 хк- 7 Хк---- 8 1296 2592 3888 5184 6480 7776 9072 10368 11664 12960 14256 15552 16848 18144 19440 20736 22032 23328 24624 25920 27216 28512 29808 31104 32400 33696 34992 36288 37584 38880 40176 41472 42768 44064 45360 46656 47952 49248 50544 5Т840 53136 54432 55728 57024 58320 59616 60912 62208 63504 64800 2401 4802 7203 9604 12005 14406 16807 19208 21609 24010 26411 28812 31213 33614 36015 38416 40817 43218 45619 48020 50421 52822 55223 57624 60025 62426 64827 67228 69629 72030 74431 76832 79233 81634 84035 86436 88837 91238 93639 96040 98441 100842 103243 105644 108045 110446 112847 115248 117649 120050 4096 8192 12288 16384 20480 24576 ’ 28672 32768 36864 40960 45056 49152 53248 57344 61440 65536 69632 73728 77824 81920 86016 90112 94208 98304 102400 106496 1\ 0592 114688 118784 122880 126976 131072 135168 139264 143360 147456 151552 155648 159744 163840 167936 172032 176128 180224 184320 188416 192512 196608 200704 204800 Хк~9 1 6 16 32 48 64 80 96 7 112 8 128 144 160 176 192 208 224 240 256 272 288 304 320 336 352 368 384 400 416 432 448 464 480 496 512 528 544 560 576 592 608 624 640 656 672 1 2 3 4 5 9 10 11 12* 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 688 704 720 736 752 768 784 800 256 512 768 1024 1280 Ш 486 1536 567 1792 648 2048 2304 729 2560 $ |0 2816 891 3072 972 1053 3328 3584 1134 3840 1215 1296 4096 1377 4352 4608 1458 4864 1539 1620 5120 5376 1701 5632 1782 1863 5888 1944 •' 6144 6400 2025 6656 2106 2187 6912 2268 7168 7424 2349 2430 7680 7936 2511 2592 8192 8448 2673 8704 2754 8960 2835 9216 2916 2997 9472 9728 3078 9984 3159 10240 3240 10496 3321 10752 3402 3483 11008 3564 11264 3645 11520 3726 11776 3807 12032 12288 3888 12544 3969 12800 4050 81 162 243 324 625 1250 1875 2500 3125 3750 4375 5000 5625 6250 6875 7500 8125 8750 9375 10000 10625 11250 11875 12500 13125 13750 14375 15000 15625 16250 16875 17500 18125 18750 19375 20000 20625 21250 21875 22500 23125 23750 24375 25000 25625 26250 26875 27500 28125 28750 29375 30000 30625 31250 6561 13122 19683 26244 32805 39366 45927 52488 59049 65610 72171 78732 85293 91854 98415 104976 111537 118098 124659 131220 137781 144342 150903 157464 164025 170586 177147 183708 190269 196830 203391 209952 216513 223074 229635 236196 242757 249318 255879 262440 269001 275562 282123 288684 295245 301806 308367 314928 321489 328050 Значения четвертых моментов разрядных частот nxi, 4 находят на перрееч ейни значения частоты п и условного отклонения х к • Таблица 5 Значения нормальной функции распределения и ее производных f(x) f ,v(x) Р »(т ) f vl( . ) <-Г V 0,39894 39892 39886 39876 39862 39844 39822 39797 39767 39733 + 0,00000 01197 02393 03588 04781 05972 07159 08344 09524 10699 + 1,19683 19653 19563 19414 19204 18936 18608 18221 17775 17271 0,50 51 52 53 54 55 56 57 58 59 0,35207 35029 34849 34667 34482 34294 34105 33912 33718 33521 +0,48409 48948 49465 49959 50431 50880 51306 51710 52091 52448 + 0,55010 52791 50556 48308 46048 43777 41497 39208 36913 34613 39695 39654 39608 39559 39505 39448 39387 39322 39253 39181 11869 13033 14190 15341 16484 17618 18744 19861 20968 22064 16708 16088 15410 14676 13885 13038 12137 11180 10170 09106 60 61 62 63 64 65 69 33322 33121 32918 32713 32506 32297 32036 31874 31659 31443 52783 53094 53383 53648 53891 54110 54306 54480 54630 54758 32309 30003 27696 25390 23085 20783 18486 16195 13912 11636 23 24 25 26 27 28 .29 .39104. 39024 38940 38853 38762 38667 38568 38466 38361 38251 23150 24224 25286 26336 27373 28396 29405 30401 31381 32346 07990 06823 05604 04335 03018 01651 1,00238 0,98778 JJZ2Zа . 95723 70 71 72 73 74 75 76 77 78 79 .31225 31006 30785 305G3 30339 30114 29887 29659 29430 29200 $ш д 54863 54945 07116 04874 55005 02646 55043 v 55058 +0,00433 55052 -0,01764 03944 55023 54973 06106 54901 08248 54808 10369 30 31 32 33 34 35 36 37 38 39 38139 38023 37903 37780 37664 37524 37391 37255 37115 36973 33295 34228 35145 36045 36927 37791 38638 39466 40275 41065 94130 92495 90819 89103 87348 85555 83726 81862 79963 78032 80 81 82 83 84 85 89 28969 28737 28504 28269 28034 27798 27562 27324 27086 26848 54694 54559 54403 54227 54031 53814 53579 53324 53049 52757 12468 14545 16597 18621 20626 22600 24546 26464 28351 30208 40 41 42 43 44 45 46 47 48 49 36827 36678 36526 36371 36213 36053 35889 35723 35553 35381 41835 42586 43317 44027 44717 45386 46034 46660 47265 47848 76070 74077 72056 70007 67932 65832 63709 61564 59398 57213 90 91 92 93 94 95 96 97 98 99 26609 26369 26129 25888 25647 25406 25164 24923 24681 24439 52445 52116 51769 51404 51023 50624 50210 49779 49332 48871 32034 33827 35587 37314 39005 40668 42283 43867 45414 46923 0,50 0,35207 + 0,48409 + 0,55010 1,00 0,24197 +0,48394 —0,48394 <т V 0,00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 72 66 67 68 86 87 88 f(x) l lu (x) Продолжение таблицы 5 f(x) f m (x) f'V(*) X f(x) + 0,48394 47903 47398 46879 46346 45801 45243 44673 44092 43499 —0,48394 49827 51220 52573 53887 55160 56393 57584 58734 59843 1,50 51 52 53 54 55 56 57 58 59 0,12952 12758 12566 12376 12188 21785 21546 21307 21069 20831 20594 20357 20121 19886 19652 42895 42281 41657 41023 40380 39728 39067 38399 37724 37041 60909 61934 62917 63857 64755 65611 66425 67196 67924 68610 60 61 62 63 64 65 gQ____19419 19186 22 18954 23 18724 24 18494 25 18265 26 18037 27 17810 28 17585 29 17360 36352 35656 34955 34248 33536 32820 32099 31375 30648 29917 .69255 69857 70417 70935 71411 71847 72241 72594 72907 73180 70 71 72 73 74 75 76 77 78 79 30 31 32 33 34 35 36 37 38 39 17137 16915 16694 16474 16256 16038 15822 15608 15395 15183 29184 28449 27712 26974 26235 25495 24755 24015 23276 22537 73413 73606 73760 73876 73953 73993 73995 73961 73890 73784 80 81 82 83 84 85 40 41 42 43 44 45 46 47 48 49 14973 14764 14556 14350 14146 13943 13742 13542 13344 13147 21800 21065 20331 19600 18871 18145 17423 16704 15988 15277 1*50 0,12952 + 0,14571 1,00 0,24197 01 23955 23713 02 23471 03 23230 04 22988 05 06 22747 22506 07 22265 08 22025 09 10 И 12 13 14 15 16 17 18 19 66 67 68 69 f 'V(T) 11816 11632 11450 11270 + 0,14571 13869 13172 12481 11795 11114 10440 09772 09111 08456 —0,70425 69937 69423 68881 68314 67721 67104 66463 65799 65113 11092 10915 10741 10567 10396 10226 10059 09893 09728 09566 07809 07168 06535 05910 05292 04682 04081 03487 02903 02326 64405 63677 62928 62161 61375 60571 59751 58914 58063 57202 12001 09405 01759 09246 01200 09089 00650 08933 + 0,00110 08780 --0,00422 00944 08628 08478 01456 08329 01959 '08185 02453 08038 02937 56316 55422 54516 53599 52671 51733 50785 49m 48865 47893 87 S8. 89 07895 07754 07614 07477 07341 07206 07074 06943 06814 06687 03411 03875 04329 04774 05208 05633 06047 06452 06846 07.231 46915 45932 4.4943 4*3950 42953 41953 40950 39946 38940 37934 73642 73466 73256 73012 72736 72427 72087 71716 71315 70885 90 91 92 93 94 95 96 97 98 99 06562 06438 06316 06195 06077 05959 05844 05730 05618 05508 07605 07969 08323 08667 09002 09326 09640 09944 10239 10523 36928 35923 34918 33916 32916 31919 30925 29936 28950 27970 — '0,70425 2,00 0,05399 —0,10798 —0,26996 86 73 Продолжение таблицы 5 X f(t) f vl(x) fw V "{ * ) 2,50 51 52 53 54 55 56 57 58 59 0,01753 01709 01667 01625 01585 01545 01506 01468 01431 01394 —0,14242 14160 14075 13986 13894 13798 13700 13599 13495 13388 + 0,07997 08360 08710 09047 09372 09683 09982 10268 10542 10804 67 01358 01323 01289 01256 01223 01191 01160 01130 68 01100 13279 13167 13053 12937 12818 12698 12576 12452 12326 12199 11053 11291 11517 11732 11935 124 27 1230& 12479 12638 12787 12071 11941 11810 11677 11544 11410 11274 11139 /Т V f ,vW \ 0,05399 05292 05186 05082 04980 04879 04780 04682 04586 04491 —0,10798 11063 11319 11565 11801 12028 12245 12454 12653 12844 — 0,26996 26027 25064 24109 23160 04398 04307 04217 04128 04041 03955 03871 03788 03706 03626 13024 13196 13359 13513 13659 13797 13926 14046 14159 14263 17646 16759 15883 15017 14162 13318 12486 11665 10856 10059 60 61 62 63 64 65 69 01071 22 23 24 25 26 27 28 29 03547 03470 03394 03319 03246 03174 03103 03034 02965 02898 14360 14449 14530 14604 14670 14729 14781 14826 14864 14895 09274 08502 07743 06996 06263 05542 04835 04141 03461 02794 70 71 72 73 74 75 76 77 78 79 01042 01014 00987 00961 00935 00909 00885 00861 00837 00814 10865 12926 13055 13174 13283 13383 13473 13555 13627 13691 13746 30 3"l 32 33 34 35 36 37 38 39 02833 02768 02705 02643 02582 02522 02463 02406 02349 02294 14920 14938 14950 14956 14955 14949 14937 14919 14896 14868 02141 - 01502 00877 —0,00265 + 0,00332 00915 01485 02040 02582 03109 80 81 82 83 84 85 00792 00770 00748 00727 00707 00687 00668 00649 00631 00613 10727 10589 10450 10312 10173 10034 09895 09755 09616 09478 13793 13832 13863 13886 13902 13910 13912 13906 13894 13875 40 41 42 14834 14795 14752 14703 14650 14593 14531 14464 14394 44320 03623 04122 04608 05079 05537 05981 06411 06828 07231 07621 90 91 92 93 94 46 47 48 49 02239 02186 02134 02083 02033 01984 01936 01888 01842 01797 00595 00578 00562 00545 00530 00514 96 о 00499 97 00485 00470 98 99 00457 09339 09201 09063 08925 08789 08651 08515 08380 08245 08111 13850 13819 13782 13739 13681 13638 13579 13515 13446 13373 50 0,01753 — 0,14242 +0,07997 3,00 —0,07977 +0,13296 ,00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 43 44 45 22220 21287 20363 19448 18542 66 86 87 88 89 0,00443 11002 Продолжение таблицы 5 f(x) 3,00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 f"i(x ) f lV(T) •z f(T) f!l!W 0,00443 00430 00417 00405 00393 00381 00370 00358 00348 00337 — 0,07977 07845 07713 07582 07452 07323 07195 07068 06943 06818 + 0,13296 13214 13128 13038 12944 12847 12747 12643 12536 12426 3,50 51 52 53 54 55 56 57 58 59 0,00087 00084 00081 00079 00076 00073 00071 00068 00066 00063 -—0,02825 02757 02689 02623 02558 02494 02432 02370 02310 02252 + 0,06943 06814 06685 06558 06432 06308 06184 06062 05941 05821 00327 00317 00307 00298 00288 00279 00271 00262 00254 00246 06694 06571 06450 06330 06211 06093 05977 05861 05747 05635 12313 12198 12080 11960 11838 11714 11588 11460 11330 11199 60 61 62 63 64 65 69 00061 00059 00057 00055 Т1Ш З 00051 00049 00047 00046 00044 02194 02138 02082 02028 01975 01923 01873 01823 01774 01727 05703 05585 05471 05357 05240 05133 05023 04915 04808 04703 00238 00231 00224 00216 11066 10933 10798 10662 10525 10387 10249 09370 09830 70 71 72 73 74 75 7£> 77 78 79 00042 00041 00039 00038 00037 00035 00034 00033 00031 00030 01680 01635 01590 01547 01504 01463 01422 01383 01344 01306 04599 04497 04396 04297 04200 04103 04009 03916 03824 03734 80 81 82 83 84 85 00029 00028 00027 00026 00025 00024 * 3 01269 01233 01198 01164 01130 01098 01066 01035 01004 00975 03646 03559 03473 03389 03307 03226 03146 03068 02991 02916 02842 02770 02690 02630 02562 02495 02430 02366 02303 02242 + 0,02181 66 67 68 23 24 25 26 27 28 29 00203 00196 00190 00184 00178 05523 05413 05305 05196 05092 04987 04884 04782 04682 04583 30 31 32 33 34 35 36 37 38 39 00172 00167 00161 00156 00151 00146 00141 00136 00132 00127 04485 04389 04294 04201 04109 04018 03929 03841 03755 93670 09690 09549 09409 09268 09128 08987 08847 08707 08567 08428 89 40 41 42 43 44 45 46 47 48 49 00123 00119 00115 00097 00094 00090 03586 03504 03423 03344 03266 03189 03114 03040 02967 * 02895 08290 08151 08014 07877 07741 07606 07471 07338 07205 07074 90 91 92 93 94 95 96 97 98 99 00018 00017 00016 00016 00015 00014 00014 00946 00918 00891 00864 00838 00813 00788 00764 00741 00718 0,00087 — 0,02825 + 0,06945 4,00 0,00013 -—0,00696 20 21 22 3,50 f ,v(x) 00210 00111 00107 00104 00100 10110 86 87 88 00022 00021 00021 00020 00019 0 0 0 1'8 75 В табл. 5 даны значения нормальной функции распреде­ ления f (т) и значения третьей и четвертой ее производных: fin(x) и flv(x). Значения f111 (г) даны для положительных отклонений т*. Для отрицательных отклонений знак, указанный в таблице, нужно менять на обратный. Для I (т) и f lv (т) знаки принима­ ют такими, какими они указаны в таблице, независимо от знака при отклонении т. При значениях т, вычисленных с тре­ мя значащими цифрами после запятой, т. е. с точностью до 0,001, значение функции и ее производных находят путем ин­ терполяции. Пример. Найдем значение нормальной функции распреде­ ления для т — 2,959, или, что то же самое, для т= 2,959. При т-2,95 f (т) =0,00514, а при т = 2,96 f ( r ) = 0,00499. Следовательно, разнице в нормированных отклонениях, равной 0,01, соответствует различие в функции, равное 0,00015, т. е. в 15 единиц разряда последней цифры функции. Разнице между т = 2,959 и ближайшим т, имеющимся п таблице (2,96), равной 0,01, соответствует различие в функ­ ции, равное 0,00001 или в единицах разряда последней цифры 15x0,001 1с функции: -- -------- =1,5, округлим до I. Прибавив эту поправку к значению функции 0,00499 (так как от т —2,96 к т = 2,95 значение функции возрастает), полу­ чим: при х = — 2,959 f (т) = 0,00500. Таблица G Значения критерия t (pt = 0,95, v число степеней свободы. v принимается ранным N— 1, i V t(),05 | Ь ,01 1 j для трех степеней вероятности р 2=0,99, р3= 0,999) При оценке средней величины признака при оценке показателей связи v = N— 2 . , То,00! V to,05 10,(11 to,001 2,2 2,1 2,1 2,1 2,1 3,0 3,0 2,9 2,9 4,1 4,1 4,0 3,9 3,8 3,7 3,7 3,7 3,6 3,5 3,4 3,3 г I 2 3 4 5 12,7 4,3 3,2 2,8 2,6 G ~7 / 2,4 2,4 2,3 2,3 8 9 10 11 12 76 2,2 2,2 2,2 63,7 9,9 5,8 4,6 Ш ,7 4,0 3,7 3,5 3,4 3,3 3,2 3,1 3,1 6,9 31,6 12,9 8,6 6,0 5,3 5,0 4,8 .4,6 4,4 4,3 13 14'— 15 16— 17 18— 20 21— 24 25— 28 29— 30 31— 34 35— 42 43— 62 63— 175 176 и больше 2,4. 2,0 2,0 2,0 2,0 2,0 2,0 2,8 2,8 2,8 2,7 2,7 2,7 2,6 2,6 Таблица 7 Значения величины z для значений г от 0 до 0,999 1 2 4 5 СО 0 со г 7 8 9 0,0 0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 0,090 J 0,100 0,110 0,121 0,131 0,141 0,151 0,161 0,172 0,182 0,192 2 0,203 0,213 0,224 0,234 0,245 0,255 0,266 0,277 0,288 0,299 з 0,310 0,321 0,332 0,343 0,354 0,365 0,377 0,388 0,400 0,412 4 0,424 0,436 0,448 0,460 0,472 0,485 0,497 0,510 0,523 0,536 5 0,549 0,563 0,576 0,590 0,604 0,618 0,633 0,648 0,662 0,678 {) 0,693 0,709 0,725 0,741 0,758 0,775 0,793 0,811 0,829 0,848 i 0,867 0,887 0,908 0,929 0,950 0,973 0,996 1,020 1,045 1,071 8 1,099 1,127 1,157 1,188 1,221 1,256 1,293 1,333 1,376 1,422 9 1,472 1,528 1,589 1,658 1,738 1,832 1,946 2,092 2,298 2,647 ОГЛАВЛЕНИИ - OrJO.;> ' ' : • * Стр. Предисловие .......................................................................................3 Глава I. Вариационная статистика, ее метод, теоретическая и опытная о с н о в а ..............................................................................5 Метод и теоретическая основа статистики ................................... Н а б л ю д е н и е ......................................................................................7 Глава II. Составление рядов и таблиц распределения числен­ ностей. Графическое их и з о б р а ж е н и е .................................. 8 Составление рядов и таблиц распределения . . . . Графическое изображение рядов и таблиц распределения . Глава III. Понятие о статистических показателях распределе­ ния численностей ..................................................................... Средняя а р и ф м е т и ч е с к а я ........................................................... 16 Среднее квадратическое о т к л он е н и е ..........................................17 Коэффициент вариации . . . . . . . . Показатель асимметрии и показатель эксцесса . . . Глава IV. Способы вычисления статистических показателе^ распределения численностей .................................................... Способ непосредственных в ы ч и с л е н и й ................................. 22 Способ условного начала ............................................................. Способ произведений . ., .................................................. 25 Понятие о моментах ряда ■распределения................................. 25 Вычисление начальных м о м е н т о в ......................................... 25 Вычисление статистических * показателей Гдля выборки диа­ метров) . . ». г. . / . . . . . .2 5 8 15 16 20 20 22 23 9 * Глава V Ошибки выборочных "наблюдений. Оценки пара­ метров .................................................................................... 30 Понятие о параметрах и методе их опенки . . . . Средняя ошибка выборочной средней величины . . .3 Показатель точности опыта * ..................................................32 Средние ошибки других выборочных статистических показа­ телей . ...................................................................32 Критерий t .................................................................................... 32 Оценки п а р а м е т р о в ...................................................................33 Оценка з н а ч и м о с т и ................................................................... 34 Значимость разности между с р е д н и м и .................................35 Значимость различия между стандартными отклонениями . Определение объема в ы б о р к и ..................................................36 Оценки параметров совокупности диаметров ивысот сосны . 30 1 36 37 Глава VI. Выравнивание рядов распределения. . . 38 Выравнивание рядов по уравнению нормального распределе­ ния . , . . . .................................................. 38 Выравнивание рядов по уравнению кривой распределения типа А .................................................................................... 41 Оценки согласия между эмпирическим и ''еоретическим рас­ пределением ........................................................................... 43 Глава VII. Понятие о статистических показателях связи. Спо­ соб вычисления их для малой выборочнойсовокупности . 46 Глава VIИ. Вычисление показателей связи для большой вы­ борочной совокупности . . . . . . . 4 8 78 Глава IX. Оценка показателей связи. Оценка связи между признаками .............................................................................53 Оценка показателей связи ........................................................... 53 Оценка связи между п р и з н а к а м и ...........................................55 Глава X. Уравнения связи . ...........................................56 Линейное корреляционное уравнение ........................................... 56 Уравнение прямой линии . . ........................................... 60 уравнение параболы 2 -го п о р я д к а ...........................................63 Уравнения логарифмических п а р а б о л .................................. 66 П р и л о ж е н и я ..................................................................................... 69 Таблица 1. Ведомость измеренных диаметров и высот де­ ревьев ..................................................................................... 68 Таблица 2. Варианты заданий для контрольных работ . . 70 Таблица 3. Мантиссы логарифмов ч и с е л .................................. 70 Таблица 4, Значения четвертых моментов разрядных частот 71 Таблица 5. Значения нормальной функции распределения и ее производных . .....................................................................72 Таблица 6 . Значения критерия t для трех степеней вероят­ ности, ........................................................................................ 76 Таблица 7. Значения величины г для значений от 0 до 0,999 77 1 \