Лекция 4. Закономерности распределения выборочных наблюдений и их использование в оценке результатов опытов. 1. 2. 3. 4. 5. План. Эмпирические и теоретические распределения. Нормальное распределение. Уровни вероятности, значимости и доверительные уровни. t – распределение Стьюдента. Оценка существенности различий в опыте по t – критерию. Закон нормального распределения проявляется при большой выборке (n>20-30). Полевой опыт выборка малая (n=3-8). Между показателями урожайности на повторных делянках изучаемых вариантов больших различий не будет. Стандартное отклонение S, подсчитанное по малой выборке, в большинстве случаев будет меньше, чем по генеральной совокупности Следовательно, в этих случаях полагаться на критерии нормального распределения нельзя. В 1908 году английским ученым для малых выборок В. Госсетом открыто t-распределение, получившее название распределение Стьюдента (англ. стьюдент – студент, псевдоним В. Госсета). Значение t (µ±tϭ) он поставил и разработал таблицу значений критериев t для различных значений уровней вероятности. Исключительное значение нормального и t – распределения заключается в том, что их закономерности распространяются и на разности между средними арифметическими (х – х ). 1 2 Кривая t – распределения по форме напоминает кривую нормального распределения, но с осью абцисс сближается медленнее .При увеличении числа наблюдений (n>20-30) распределение t приближается к нормальному и переходит в него при n→∞ Любой опыт в сущности сводится к сравнению средних значений между вариантами опыта. Если бы в исследовательской работе можно было бы работать с генеральной совокупностью вопрос о достоверности разности между генеральными совокупностями не возникал бы, даже если она и очень маленькая. Но так как полевой опыт это выборка и х , х и т.д. определение ошибкой (Sх , Sх и т.д.), то различия между вариантами могут быть порождены случайными факторами, обусловленными особенностями выборочного метода. Поэтому всегда возникает вопрос: правильно ли разность х - х характеризует, которая в действительности имеется между µ - µ . Иначе говоря существенна ли эта разность 1 1 2 1 2 1 2 2 90 76 79 45 (72) 70 79 77 72 79 80 109 102 82 (81) 59 68 67 78 76 91 85 Высота растений озимой пшеницы, см 79 81 90 (76) 70 (72) 73 99 101 115 68 72 69 80 80 100 69 64 99 98 102 84 68 83 (74) 94 94 88 60 63 78 81 79 81 84 86 103 84 87 77 (64) 61 100 (92) 69 77 82 86 89 83 89 93 72 80 81 77 88 79 94 (81) 79 84 98 (76) 90 73 82 91 87 (54) 93 91 79 72 93 80 84 94 µ=83, х =74, х =84; х ≠ х , х - х = 10 1 2 1 2 1 2 В большинстве случаев статистический анализ сводится к проверке нулевой гипотезе – Hо, которая формулируется так: Между выборочными средними нет различий х – х = 0. Фактически выборочные средние даже одной генеральной совокупности неравны х ≠ х , следовательно х – х ≠ 0, а х – х = d. Чтобы сохранить Hо надо доказать, что разность «d» обусловлена случайными ошибками. Чтобы отбросить Hо, надо доказать, что она существенна и обусловлена действием изучаемого вопроса. Проверяют гипотезу Hо с помощью статистических критериев 1 2 1 1 2 1 2 2 В полевом опыте при сравнении средних могут быть два случая. 1. Сравниваются средние двух независимых выборок, когда единицы наблюдения одной выборки не связаны общими условиями с единицами наблюдения другой выборки (метод неорганизованных повторений). 2. Сравниваются две сопряженные выборки, в которых единицы наблюдения одной выборки связаны (сопряжены) общим условием с единицами наблюдения другой выборки. В первом случае оцениваются по t – критерию Стьюдента существенность разности средних (d =х1 – х2), а во втором существенность средней разности ∑d (d = ) n Для оценки существенности различий между вариантами определяется критерий t фактический (tфакт.) и теоретический (tтеор.). Если tфакт≥ tтеор. , нулевая гипотеза отвергается. Разность между средними признается существенной. Если tфакт< tтеор. , нулевая гипотеза сохраняется. Разность между средними считается несущественной. Значение tтеор. определяется для принятого уровня значимости или вероятности. Оценка существенности различий в опыте по t – критерию. Выборки бывают несопряженными и сопряженными. Несопряженная или независимая выборка - такая выборка, при которой единицы наблюдения одной выборки не связаны каким-то общим условием с единицами наблюдениями другой выборки. Сопряженная или зависимая выборка – такая выборка, при которой наблюдения одной выборки связаны (сопряжены) каким-то общим условием с единицами наблюдения второй выборки. Оценка существенности различий в полевом опыте по t – критерию для несопряженной выборки. Существенность различий определяется сравнением tтеор. с tфакт. d - разность tф определяется по формуле: tф = Sd – ошибка разности Ошибка разности равна корню квадратному из суммы квадратов ошибок средней урожайности по вариантам опыта: 2 2 Sd = √Sx1 + Sx2 Ошибка средней урожайности по вариантам опыта: (∑ x)2 2 ∑x – n Sx = n (n-1) √ Оценка существенности различий в полевом опыте по t – критерию для сопряженной (зависимой) выборки. tф определяется по формуле: Ошибка разности равна: Sd = tф = √ d ∑d ; d= ; Sd n √ – d)2 n (n – 1) = ∑(d 2 (∑ d) 2 ∑d– n n (n -1) tтеор. определяем по таблице Стьюдента при принятом уровне вероятности и числе степеней свободы: = n -1. Вывод: Разность между вариантами считается существенной, если tф ≥ tтеор. Разность считается несущественной, если tф < tтеор. Оценка существенности различий по t – критерию для качественной изменчивости. tф = d ; d = p1 – p2, где р – доля признака. Sd Sd = √Sp1 + Sp2 , когда N1 = N2 Sd = √ 2 2 p1q1 p2q2 N1 + N2 , когда N1 = N2 = N1 + N2 – 2 tтеор – по таблице. Если метод статистической обработки выбран неправильно, без учета типа выборки, полученные критериями t дадут неправильную оценку результатам опыта. Урожайность озимой пшеницы, ц/га Вариант х Критерий t d tф t95 Сопряженная выборка Безостая 1 40 Одесская 51 37 -3 7,3 3,1 5 2,3 3,4 Несопряженная выборка Безостая 1 40 Одесская 51 37 -3 1,8 Дисперсионный анализ 1. Сущность и основы дисперсионного анализа. 2. Схемы дисперсионного анализа для однофакторных опытов. 3. Оценка существенности различий по критериям 3Е и НСР. 4. Особенности дисперсионного анализа опыта: 5. а) с выпавшими делянами; 6. б) с повышенном количеством контролей; 7. в) по наблюдениям и учетам. Оценка существенности различий по tкритерию Стьюдента применяется при небольшом числе вариантов в опыте, т.к. с увеличением числа вариантов увеличивается число пар сравнений и следовательно, число tкритериев. Число t критериев = ℓ (ℓ-1) / 2 ℓ = 4 tкр=4*3/2=6 ℓ = 10 tкр=10*9/2=45 ℓ = 50 tкр=50*49/2=1225 Дисперсионный анализ разработан и введен в практику с/х исследований Р.А. Фишером. Он базируется на строгой основе критерия Стьюдента и установленного Р.А. Фишером Fраспределения F=S1²/ S2², F>1, S1²> S2² На русском языке изложение дисперсионного анализа применительно к полевому опыту сделано впервые Н.Ф. Деревицким Преимущество дисперсионного анализа перед t-критерием. Дисперсионный анализ позволяет: 1. Определять в целом для всего опыта одну ошибку Sх, одну ошибку разности Sd. 2. Обрабатывать простые и сложные опыты, однофакторные и многофакторные, опыты с однолетними и многолетними культурами, опыты однолетние и многолетние. 3. Избежать громоздкости расчетов неизбежных оценке результатов опыта по t-критерию. х Не контролируемые условия Случайный фактор Действие изучаемого вопроса Контролируемые условия Неоднородность почвенного плодородия Сущностью дисперсионного анализа является расчленение общей суммы квадратов отклонений и общего числа степеней свободы на части компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F – критерию. Су = Ср + Сv + Сz, где Су – общая изменчивость признака, обусловленная действием изучаемого вопроса, неоднородностью почвенного плодородия и случайными ошибками в опыте. Ср – варьирование урожаев по повторениям полевого опыта. Сv – варьирование урожаев по вариантам опыта, связанное с действием изучаемого вопроса. Сz – варьирование урожаев, связанное со случайными ошибками в опыте. η 2 - доля влияния факторов. ηр = 2 ηр2 ηV2 η 2 z Ср Су ηV = 2 Сv Су ηz = - доля влияния повторения. - доля влияния вариантов. - доля влияния случайных факторов. 2 Сz Су Схемы дисперсионного анализа для однофакторных опытов. Схема дисперсионного анализа опыта, заложенного по методу организованных повторений Виды вариации S2 F (∑ квадратов) факт теор Су = Ср + Сv + Сz 2 Су = ∑х - C ∑р 2 Ср = -C l ∑v 2 Cv = n - C Cz = Cy – Cv - Cp N -1 - n-1 2 Sv = Сv l=1 (n-1)(l-1) 2 Sz = Сz (n-1)(l-1) l=1 2 Sv 2 Sz Схема дисперсионного анализа опыта, заложенного по методу неорганизованных повторений Виды вариации (∑ квадратов) Cy = ∑х2- C ∑v2 - C Cv = n Cz = Cy - Cv S 2 F факт. Cy = Cv + Cz N-1 2 l - 1 Sv = Cv l-1 2 N - l Sz = Cz N-l 2 Sv 2 Sz теор. Дисперсионный анализ опыта, заложенного по методу латинского квадрата Cy = Cp + Cv + Cz C ряды С столбцы Сy = Cряды + С столбцы + Сv + Cz S2 Cy Cряд Cст Cv Cz N–1 n-1 n-1 n-1 2 Cv Sv = n -1 Cz (n -1)(n -2 ) Sz = (n-1)(n-2) 2 Fфакт 2 Sv 2 Sz Fтеор по таблице Дисперсионный анализ опыта, заложенного по методу латинского прямоугольника Сy = Cряд + С ст + Cv + Cz S Су N-1 - Сряд Сст n-1 n-1 - Cv l-1 Cz (n-1)(l-1) 2 Sv = Cv l-1 2 Cz Sz = (n-1)(n-2) 2 Fфакт Fтеор 2 Sv 2 Sz Fтеор определяется по таблице Фишера для принятого уровня вероятности или значимости и числе степеней свободы для дисперсии вариантов и остатка. Если Fфакт≥Fтеор в опыте имеются существенные различия, если Fфакт<Fтеор в опыте существенных различий нет. Чтобы определить в каких вариантах есть существенные различия, определяются частые критерии дисперсионного анализа НСР и 3Е НСР=tтеор*Sd Sd=√2 *Sx=1.41*Sx Sx √Sz²/n Значение tтеор определяется по таблице Стьюдента для принятого уровня вероятности или значимости и числе степеней свободы статистической дисперсии 3Е =3Sx критерий 3Е применяется, если Vz ≥ 16 Разность (d) между вариантами считается существенной, если она равна или больше НСР и несущественной, если меньше НСР НСР число имменнованное (см, г, ц/га). По НСР варианты опыта разделяются на группы. I – d ≥ НСР и и указывает на повышение урожайности. II – d < НСР, не существенные различия. III – d ≥ НСР и указывает на снижение урожайности. Ошибка эксперимента Sx * 100 Sx% = x0 Дисперсионный анализ опыта с выпавшими делянками ОСОБЕННОСТИ: 1. Число степеней свободы Cz уменьшается на число выпавших делянок. 2. Определяется две наименьших существенных разности а) НСР определяется для сравнения вариантов с полным набором дат НСР95 = t95 * Sd Sd = √ 2Sz/n б) НСР определяется для сравнения вариантов в выпавшими датами 2 НСР95 = t95 * Sd Sd =√Sz (n1 + n2)/ (n1 * n2) 2 Дисперсионный анализ опыта с повышенным количественным контролей 1. НСР для сравнения опытного варианта с контролем Sd = √ 4Sz / (n1 + n2) НСР95 = t95 * Sd 2. НСР для сравнения опытного варианта с опытным вариантом 2 НСР95 = t95 * Sd Sd = √ 2Sz / n 2 Дисперсионный анализ наблюдений и учетов в опыте Перед математической обработкой результаты наблюдений преобразовывают по формулам: Если есть «0» значения, то √ х+1 Если «0» отсутствуют, √ х Если наблюдения в %, то преобразования проводят по таблице угол-арксинус √ %