Statisticheskaya obrabotka dannykh ucheb posobie

МИНИСТЕРСТВО СПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Российский государственный университет физической культуры, спорта, молодежи и туризма (ГЦОЛИФК)» Кафедра естественнонаучных дисциплин Попов Г.И., Конюхов В.Г., Маркарян В.С., Яшкина Е.Н. Статистическая обработка данных Учебное пособие для студентов ФГБОУ ВПО «РГУФКСМиТ» Москва-2015 Рекомендовано к изданию Экспертно-методическим советом ИТРРиФ ФГБОУ ВПО «РГУФКСМиТ» Протокол № 55 от 28 апреля 2015 г. УДК: 519.2(07) С 78 Авторы: Попов Г.И. – д.п.н., профессор, заведующий кафедрой естественнонаучных дисциплин РГУФКСМиТ; Конюхов В.Г. – к.т.н., доцент, доцент кафедры естественнонаучных дисциплин РГУФКСМиТ; Маркарян В.С. – к.т.н., доцент, профессор кафедры естественнонаучных дисциплин РГУФКСМиТ; Яшкина Е.Н. – к.п.н., доцент, профессор кафедры естественнонаучных дисциплин РГУФКСМиТ Рецензенты: Шалманов А.А. – д.п.н., профессор, профессор кафедры биомеханики РГУФКСМиТ В учебном пособии представлены теоретические основы статистической обработки данных и методы их практического использования в профессиональной деятельности. Содержание учебного пособия соответствует требованиям Государственного образовательного стандарта. Учебное пособие адресовано студентам высших учебных заведений физической культуры. 2 1. Основные определения и формулы, необходимые для проведения статистических расчетов при обработке экспериментальных данных 1.1. Описательная статистика 1.1.1. Генеральная совокупность и выборка Законы теории вероятностей представляют собой математическое выражение реальных закономерностей, фактически существующих в массовых случайных явлениях. Разработка методов регистрации, описания и анализа экспериментальных данных, полученных в результате наблюдения массовых случайных явлений, составляет предмет специальной науки – математической статистики. Задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму. Выбор объектов для исследования производится на основе обладания ими общими признаками. Именно наличие общего признака позволяет, с одной стороны, объединить их в одну группу, а с другой – сравнивать между собой. По характеру представления признаки подразделяются на качественные и количественные. Качественные признаки отражают определенные свойства, качества данного объекта и записываются в виде текста. Примерами качественных признаков являются: пол, принадлежность к той или иной команде, специализация и т.д. Количественные признаки характеризуются определенными численными значениями и подразделяются на дискретные и непрерывные. 3 Дискретным называется признак, множество значений которого является счетным множеством перенумерованы и (элементы выписаны в счетного множества соответствующей могут быть последовательности). Например, количество баллов, очков, забитых мячей и т.д. Непрерывным является признак, который может принимать любые значения из некоторого интервала числовой оси (скорость движения, время прохождения дистанции и т.д.). Предположим, что изучается поведение признака, являющегося случайной величиной, т.е. величиной, которая в результате опыта приобретает одно из своих возможных значений, неизвестно заранее какое. С этой целью над случайной величиной производится ряд независимых опытов – наблюдений. В каждом из этих опытов исследуемая случайная величина принимает определенное значение. Отдельные значения исследуемого признака принято называть вариантами и обозначать латинскими буквами x, y и т.п. из конца алфавита. Совокупность зафиксированных значений признака представляет собой первичный экспериментальный материал, подлежащий обработке, осмыслению и статистическому анализу. Такая совокупность называется статистической. Итак, статистической совокупностью называется множество зафиксированных в ходе наблюдений значений признака. Из всех возможных статистических совокупностей особое значение для исследования имеют две совокупности: генеральная и выборочная. Множество всех возможных значений признака, которое можно было бы получить в данном исследовании, называется генеральной совокупностью. Выборочной совокупностью, или просто выборкой, называется статистическая совокупность, состоящая из некоторого числа значений признака, случайным образом отобранная из соответствующей генеральной совокупности. 4 Случайность отбора необходима для того, чтобы свойства полученной выборки наилучшим генеральной способом совокупности, отражали т.е. соответствующие выборка была свойства репрезентативной (представительной). Выборка является случайной, если, во-первых, все измерения, составляющие выборку, независимы (т.е. результат каждого измерения не зависит от предыдущих) и, во-вторых, каждый из объектов генеральной совокупности имеет одинаковую вероятность быть представленным в выборке. Одной из главных характеристик выборки является число элементов в ней, которое называется объемом выборки и обозначается символом n. В большинстве практически важных случаев объем выборки существенно меньше объема генеральной совокупности, что позволяет считать, что выборка производится из генеральной совокупности, содержащей бесконечное число членов. Статистические исследования различаются по степени охвата рассматриваемой статистической совокупности. Исследования, охватывающие все объекты генеральной совокупности, называются сплошными, а использующие информацию лишь о некоторой части объектов генеральной совокупности – несплошными. Примером сплошного исследования является Всероссийская перепись населения. Несплошные исследования подразделяются на выборочные, способ основного массива и монографические. При выборочном исследовании изучению подвергаются элементы выборки. Репрезентативность выборочной совокупности основывается на соблюдении научно обоснованных правил ее формирования. В случае применения способа основного массива изучению подлежат наиболее существенные элементы совокупности, которые имеют в ней максимальный удельный вес. При подробное проведении изучение монографического характеристик 5 исследования отдельного объекта производится генеральной совокупности. Монографическое описание используется для характеристики, например, одного конкретного спортсмена. В области физической культуры и спорта экспериментальные данные, как правило, являются результатами измерений некоторых признаков (спортивный результат, двигательные способности и пр.) объектов, являющихся частью более широкой совокупности подобных объектов. Таким образом, они являются выборочными. Проведение сплошных исследований не характерно для физической культуры и спорта, да и вообще для статистических исследований. Например, просто невозможно, не говоря уже о том, что и нецелесообразно обследовать всех спортсменов, занимающихся определенным видом спорта и имеющих одинаковую квалификацию. Таким образом, проведение эксперимента для всей генеральной совокупности, как правило, или неосуществимо, или неоправданно, поэтому применяется выборочный метод. Выборочный метод является одним из основных методов математической статистики. При выполнении результаты используются для выборочных описания исследований свойств всей получаемые генеральной совокупности. Проводя каждое конкретное статистическое исследование, необходимо точно определить, что в данном случае является генеральной совокупностью. Так, например, если производится исследование роста российских студентов, то все они составляют генеральную совокупность, а студенты какого-либо института – выборку. В то же время все студенты нашей страны являются выборкой из более широкой совокупности – множества студентов нашей планеты. Объем и состав выборки зависят от объектов и целей проводимого исследования. Чем больше объектов включает в себя выборка, тем точнее отражает она свойства генеральной совокупности. Вместе с тем увеличение объема выборки приводит к усложнению проведения исследования и 6 повышению его стоимости, поэтому необходимо находить компромисс, так чтобы обследуемые выборки были и не слишком велики, и представительны. Далее будет рассмотрено применение выборочного метода для установления вида закона распределения случайной величины и оценки числовых характеристик статистического распределения. Статистическое исследование состоит из трех основных этапов. Первым этапом является наблюдение, при котором производится научно обоснованный сбор данных, характеризующих изучаемое явление или объект. Второй этап заключается в статистической сводке и группировке. На этом этапе данные систематизируются и определенным образом оформляются – чаще всего в виде статистических таблиц. Третьим этапом является анализ статистического материала. Применение того или иного метода статистического анализа определяется математической моделью, описывающей свойства генеральной совокупности. Для корректного проведения эксперимента выбор и обоснование математической модели должны быть произведены до его начала. На практике при проведении информации не обследований позволяет ограниченный сделать объем обоснованное предварительной предположение о математической модели генеральной совокупности. В таких случаях ее выбор осуществляется на основе построения эмпирического распределения и анализа его характеристик. Под эмпирическим распределением принято понимать распределение элементов выборки по значениям изучаемого признака. Построение эмпирических распределений является необходимым этапом применения статистических методов. Основной задачей при построении эмпирического распределения является формулирование на основе его анализа предположения о форме распределения изучаемого признака в генеральной совокупности. При проведении исследований могут использоваться различные типы шкал в зависимости от специфики регистрируемого показателя. Принято 7 различать следующие типы шкал: номинальная, порядковая (ординальная), интервальная, относительная (шкала отношения). В соответствии с этими типами шкал существует четыре типа переменных: номинальные, порядковые (ординальные), интервальные и относительные. Номинальная шкала (или шкала наименований) используются только для качественной классификации. Свойства, характеризуемые с помощью этой шкалы, могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам. Упорядочить эти классы невозможно. Примерами номинальных переменных являются пол, национальность, принадлежность к какому-либо виду спорта. Иногда номинальные переменные называют категориальными. Использование чисел в шкале наименований играет роль ярлыков, позволяющих различать изучаемые объекты. Например, номера игроков в команде. Шкала порядка позволяет упорядочить (ранжировать) исследуемые объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. В то же время она не позволяет определить «на сколько больше» или «на сколько меньше». Примером порядковой переменной является место, занятое спортсменом на соревновании. Номер места позволяет сказать, какой спортсмен сильнее, а какой – слабее, но не показывает «на сколько сильнее» или «на сколько слабее». Шкала интервалов позволяет не только упорядочивать исследуемые объекты, но и численно выразить и сравнить различия между ними. Особенностью интервальной шкалы является то, что точка отсчета (т.е. нулевая точка) может быть выбрана произвольно. Примерами интервальных переменных является температура, измеренная в градусах Фаренгейта или Цельсия, суставной угол. Шкала интервалов позволяет определить, на сколько одно измеренное значение больше (меньше) другого, но не дает возможности установить во сколько раз больше (или меньше). 8 Шкала отношений очень похожа на шкалу интервалов, но отличается от нее тем, что положение начала отсчета (точки абсолютного нуля) строго определено. Фиксирование точки отсчета дает возможность определять, во сколько раз одно измеренное значение больше (или меньше) другого. Примерами использования шкал отношений являются измерения времени прохождения дистанции или пространства (длины дистанции, прыжка). 1.1.2. Обработка результатов измерений по первичным данным Вариационные ряды Выборка, полученная при проведении экспериментального исследования, представляет собой неупорядоченный набор чисел, записанных в той последовательности, в которой производились измерения. Обычно выборка оформляется в виде таблицы, в первой строке (или столбце) которой стоит номер опыта i, а во второй (втором) - зафиксированное значение случайной величины признака. В таком виде выборка представляет собой первичную форму записи статистического материала, который может быть обработан различными способами. показанные на В качестве легкоатлетических примера рассмотрим соревнованиях результаты, толкателями ядра и приведенные в таблице 1.2. В первой строке этой таблицы записаны номера измерений, а во второй – их численные значения в метрах. Таблица 1.1 Результаты соревнований в толкании ядра № xi 1 2 3 4 5 6 16,36 14,91 15,31 14,26 14,77 13,88 7 14,97 8 14,01 9 10 14,07 14,48 № xi 11 12 13 14 15 16 14,44 14,81 13,81 15,15 15,23 15,69 17 14,29 18 14,15 19 20 14,57 13,92 № xi 11 12 13 14 15 16 14,44 14,81 13,81 15,15 15,23 15,69 17 14,29 18 14,15 19 20 14,57 13,92 9 Как видно из таблицы 1.1, простая статистическая совокупность перестает быть удобной формой представления статистического материала даже при относительно небольшом объеме выборки: она является достаточно громоздкой и мало наглядной. Проанализировать полученные экспериментальные данные и тем более сделать какие-либо выводы на их основе весьма затруднительно. Исходя из этого, полученный статистический материал должен быть обработан для проведения дальнейшего исследования. Простейшим способом обработки выборки является ранжирование. Ранжированием называют расстановку вариант в порядке возрастания или убывания их значений. Ниже в таблице 1.2 приведена ранжированная выборка, элементы которой расположены в порядке возрастания. Таблица 1.2 Ранжированные результаты соревнований в толкании ядра № xi 1 2 13,04 13,22 3 13,3 4 5 13,62 13,81 6 13,88 7 8 9 13,92 14,01 14,07 10 14,15 № xi 1 2 13,04 13,22 3 13,3 4 5 13,62 13,81 6 13,88 7 8 9 13,92 14,01 14,07 10 14,15 № xi 1 2 13,04 13,22 3 13,3 4 5 13,62 13,81 6 13,88 7 8 9 13,92 14,01 14,07 10 14,15 Но и в таком виде полученные экспериментальные данные плохо обозримы и малопригодны для непосредственного анализа. Именно поэтому для придания статистическому материалу большей компактности и наглядности он должен быть подвергнут дальнейшей обработке – строится так называемый статистический ряд. Построение статистического ряда начинается с группировки. Группировкой называется процесс упорядочения и систематизации данных, полученных в ходе проведения эксперимента, направленный на извлечение содержащейся в них информации. В процессе группировки 10 осуществляется распределение вариант выборки по группам или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака. Процесс группировки начинается с разбиения всего диапазона варьирования признака на интервалы группировки. Для каждой конкретной цели статистического исследования, объема рассматриваемой выборки и степени варьирования признака в ней существует оптимальное значение числа интервалов и ширины каждого из них. Ориентировочное значение оптимального числа интервалов k может быть определено, исходя из объема выборки п, либо с помощью данных, приведенных в таблице 1.3, либо с помощью формулы Стэрджесса: k = 1 + 3,322 lgn. Таблица 1.3 Определение числа интервалов группировки Объем выборки n Число интервалов k 10-30 4-5 30-60 5-6 60-100 7 100-300 8 300-400 9 Получаемое по формуле значение k почти всегда оказывается дробной величиной, которую необходимо округлить до целого числа, поскольку количество интервалов не может быть дробным. Практика показывает, что, как правило, лучше округлять в меньшую сторону, ибо формула дает хорошие результаты при больших значениях n, а при малых – несколько завышенные. Рассмотрим вариант выборки на конкретном примере. Для этого обратимся к примеру с толкателями ядра (см. таблицы 1.1, 1.2). Определение числа интервалов группировки будем производить на основе данных, приведенных в таблице 1.2. При объеме выборки n = 29 число интервалов целесообразно выбрать k = 5 (формула Стэрджесса дает значение k = 5,9). Условимся использовать в рассматриваемом примере интервалы равной ширины. В этом случае, после того, как число интервалов группировки определено, следует вычислить ширину каждого из них с помощью соотношения: 11 h xmax  xmin . k Здесь h- ширина интервалов, а хmax и хmin - соответственно максимальное и минимальное значение признака в выборке. Величины хmax и хmin определяются непосредственно по таблице исходных данных (см. таблицу 1.2). В рассматриваемом случае: h 16,36  13,04  0,664 (м). 5 Здесь необходимо остановиться на точности определения ширины интервала. Возможны две ситуации: точность вычисленного значения h совпадает с точностью проведения эксперимента или превышает ее. В последнем случае возможно использование двух подходов для определения границ интервалов. С теоретической точки зрения наиболее правильно использовать полученное значение h для построения интервалов. Такой подход не внесет дополнительных искажений, связанных с обработкой экспериментальных данных. Однако для практических целей в статистических исследованиях, относящихся к физической культуре и спорту, принято округлять полученное значение h до точности измерения данных. Связано это с тем, что для наглядного представления получаемых результатов удобно, чтобы границами интервалов являлись возможные значения признака. Таким образом, полученное значение ширины интервалов следует округлить с учетом точности проводимого эксперимента. Особо отметим, что округление необходимо производить не в общепринятом математическом смысле, а в сторону увеличения, т.е. с избытком, чтобы не уменьшить общий диапазон варьирования признака (сумма ширины всех интервалов не должна быть меньше разности между максимальным и минимальным значениями признака). В рассматриваемом примере экспериментальные данные определены с точностью до сотых (0,01 м), поэтому полученное выше значение ширины интервалов следует округлить с избытком с точностью до сотых. В результате получаем: 12 h = 0,67 (м). После определения ширины интервалов группировки следует определить их границы. Нижнюю границу первого интервала целесообразно принять равной минимальному значению признака в выборке xmin: xН1 = xmin. В рассматриваемом примере xН1 = 13,04 (м). Для получения верхней границы первого интервала (xВ1) следует к значению нижней границы первого интервала прибавить значение ширины интервала: xВ1 = хН1 + h. Заметим, что верхняя граница каждого интервала (здесь – первого) будет являться одновременно и нижней границей следующего (в данном случае второго) интервала: xН2 = xВ1. Подобным образом определяются значения нижних и верхних границ всех оставшихся интервалов: xВi = xНi+1 = xНi + h. В рассматриваемом примере: xВ1 = xН2= xН1+h=13,04+0,67=13,71 (м), xВ2 = xН3= xН2+h=13,71+0,67=14,38 (м), xВ3 = xН4= xН3+h=14,38+0,67=15,05 (м), xВ4 = xН5= xН4+h=15,05+0,67=15,72 (м), xВ5 = xН5+h=15,72+0,67=16,39 (м). Перед группировкой вариант введем понятие срединного значения интервала xi, равного значению признака, равноудаленного от концов этого интервала. Учитывая, что оно отстоит от нижней границы на величину, равную половине ширины интервала, для его определения удобно воспользоваться соотношением: xi = xНi + h/2, 13 где xНi – нижняя граница i-ro интервала, а h – его ширина. Срединные значения интервалов будут использоваться в дальнейшем при обработке сгруппированных данных. После определения границ всех интервалов следует распределить выборочные варианты по этим интервалам. Но предварительно следует решить вопрос о том, к какому интервалу отнести значение, находящееся в точности на границе двух интервалов, т. е. когда значение варианты совпадает с верхней границей одного и нижней границей соседнего с ним интервала. В таком случае варианта может быть отнесена к любому из двух соседних интервалов и, для исключения неоднозначности при группировке, условимся в таких случаях относить варианты к верхнему интервалу. В пользу такого подхода можно привести следующий довод. Поскольку минимальное значение признака совпадает с нижней границей первого интервала и входит в этот интервал, то варианту, попадающую на границу двух интервалов, следует отнести к тому из них, значение нижней границы которого равно рассматриваемой варианте. Перейдем к рассмотрению статистической таблицы 1.4, которая состоит из семи столбцов. Таблица 1.4 Табличное представление результатов в толкании ядра 1 Номер интерва ла i 1 2 3 4 5 Сумма В 2 Границы интервала xНi – xВi 13,04 – 13,71 13,71 – 14,38 14,38 – 15,05 15,05 – 15,72 15,72 – 16,39 первых трех 3 Срединное значение интервала xi 13,375 14,045 14,715 15,385 16,055 5 6 7 4 Накопленная Частость Накоплен Част ная ота частота частость ni fi Fi Ni 4 4 0,138 0,138 8 12 0,276 0,414 10 22 0,345 0,759 5 27 0,172 0,931 2 29 0,069 1 29 1 столбцах статистической таблицы содержатся соответственно номера интервалов группировки i, их границы xНi – xВi и срединные значения интервалов xi. 14 В четвертом столбце располагаются частоты интервалов. Частотой интервала называется число, показывающее сколько вариант, т.е. результатов измерений попало в данный интервал. Для обозначения этой величины принято использовать символ ni. Сумма всех частот всех интервалов всегда равна объему выборки п, что можно использовать для проверки правильности проведенной группировки. Пятый столбец таблицы 1.4 предназначен для занесения в него накопленной частоты интервала – числа, полученного суммированием частоты текущего интервала с частотами всех предыдущих интервалов. Накопленную частоту принято обозначать латинской буквой Ni. Накопленная частота показывает, сколько вариант имеют значения не больше, чем верхняя граница интервала. В шестой столбец таблицы помещается частость. Частостью называется частота, представленная в относительном выражении, т.е. отношение частоты к объему выборки. Сумма всех частостей всегда равна 1. Для обозначения частости используется символ fi: fi = ni/n. Частость интервала связана с вероятностью попадания случайной величины в этот интервал. Согласно теореме Бернулли, при неограниченном увеличении числа опытов частость события сходится по вероятности к его вероятности. Если понимать под событием попадание значения исследуемой величины в определенный интервал, то становится ясно, что при большом числе опытов частость интервала приближается к вероятности попадания измеряемой случайной величины в этот интервал. И частота, и частость характеризуют повторяемость результатов в выборке. Сравнивая их статистическое значение, следует отметить, что информативность частости существенно выше, чем у частоты. Действительно, если, как, например, в таблице 1.4 частота второго интервала равна 8 и, значит, 8 результатов попало в этот интервал, то трудно понять – мало это или много; 15 если в выборке 1000 вариант, то такая частота мала, а если 20, то велика. В таком случае для объективной оценки необходимо сопоставить значение частоты с объемом выборки. Если же воспользоваться частостью, то сразу можно сказать, какая доля результатов попала в рассматриваемый интервал (примерно 28% в приведенном примере). Поэтому частость дает более наглядное представление о повторяемости признака в выборке. Особо следует отметить другое важное достоинство частости. Ее использование позволяет сопоставлять выборки различного объема. Частота для таких целей не применима. В седьмом столбце таблицы расположена накопленная частость. Накопленной частостью является отношение накопленной частоты к объему выборки. Накопленная частость обозначается буквой Fi: Fi  Ni . n Накопленная частость показывает, какая доля вариант выборки имеет значения, не превосходящие значения верхней границы интервала. Последняя строка статистической таблицы используется для контроля над проведением группировки. После заполнения таблицы вернемся к определению статистического ряда. Как правило, статистический ряд оформляется в виде таблицы, в первой строке которой перечислены интервалы, а во второй – соответствующие им частости или частоты. Таким образом, статистическим рядом называется двойной числовой ряд, устанавливающий связь между численным значением исследуемого признака и его повторяемостью в выборке. Существенным достоинством статистических рядов является то, что они, в отличие от статистических совокупностей, дают наглядное представление о характерных особенностях варьирования признаков. 16 Графическое представление статистических рядов В целях упрощения анализа статистических рядов и придания им большей наглядности используют графические представления. Основными видами графического представления статистических рядов являются гистограмма, полигон частостей и полигон накопленных частостей. Для визуального представления можно использовать как частости, так и частоты. Ограничимся рассмотрением частости, поскольку этот параметр более информативен. Наиболее часто для анализа статистического ряда используется гистограмма, представляющая собой совокупность примыкающих друг к другу прямоугольников, основание каждого из которых равно ширине интервала группировки, а площадь – частости этого интервала. Гистограмма строится в декартовой (прямоугольной) системе координат следующим образом. По оси абсцисс откладываются отрезки, отображающие интервалы группировки, а затем на каждом из них строится прямоугольник, площадь которого равна частости данного интервала. Для удовлетворения этому требованию высота прямоугольника выбирается равной частному от деления частости интервала на его ширину Hi = fi/hi. Если все интервалы группировки имеют одинаковую ширину, высоты прямоугольников пропорциональны соответствующим частостям. Полная площадь гистограммы равна единице, что следует из способа ее построения. Действительно, площадь каждого из прямоугольников равна частости, а сумма всех частостей – единица. В качестве примера на рис. 1.1 приведена гистограмма распределения fi 0,4 0,3 0,2 0,1 17 0 13,04 13,71 14,38 15,05 15,72 16,39 результатов, показанных на соревновании в толкании ядра, и построенная для статистического ряда, образованного по данным столбцов 2 и 6 таблицы 1.5. С увеличением числа экспериментальных данных можно использовать большее количество интервалов, имеющих меньшие ширины. Гистограмма при этом будет все более и более приближаться к некоторой кривой, ограничивающей площадь, равную единице. Эта кривая представляет собой не что иное как график плотности распределения (или, по-другому, плотности вероятности) исследуемой случайной величины. Таким образом, гистограмма является экспериментальным аналогом плотности распределения. 1.1.3. Статистические параметры, которые в первую очередь необходимы для оценки результатов экспериментальных исследований Рассмотренные выше статистические ряды дают наиболее полную информацию о поведении признака. Однако в практических целях часто бывает достаточно указать только отдельные числовые параметры, до некоторой степени, характеризующие существенные черты распределения. Использование таких характеристик позволяет компактно выразить все существенные сведения с помощью минимального количества числовых параметров. Такие характеристики, назначение которых – выразить в сжатой форме наиболее существенные особенности распределения, называются числовыми характеристиками. Суть выборочного метода заключается в том, что на основании исследования ограниченного числа элементов генеральной совокупности судят об особенностях всей генеральной совокупности. Любое значение параметра распределения, вычисленное на основе ограниченного числа опытов, т.е. выборки, всегда содержит элемент случайности. Такое приближенное, случайное значение называется оценкой параметра. Значение оценки должно быть максимально близко к значению 18 соответствующего параметра генеральной совокупности, которое является истинным значением оцениваемого параметра. Исходя из этого, к оценке предъявляется ряд требований. При увеличении числа опытов (объема выборки) значение оценки должно приближаться (сходиться по вероятности) к истинному значению параметра. Это свойство оценки называется состоятельностью. Оценка не должна содержать систематической ошибки в сторону завышения или занижения. Иными словами, среднее значение оценки, вычисленное по данным различных выборок из одной и той же генеральной совокупности, должно сходиться к истинному значению параметра. Оценка, удовлетворяющая этому требованию, называется несмещенной. Желательно, чтобы выбранная несмещенная оценка обладала бы по сравнению с другими наименьшим разбросом – дисперсией. Оценка, удовлетворяющая этому требованию, называется эффективной. На практике не всегда удается удовлетворить этим требованиям. Среди числовых характеристик наибольшее практическое значение имеют характеристики положения, рассеяния и формы распределений. Характеристики положения Рассмотрение числовых характеристик выборки необходимо начать с тех из них, которые характеризуют положение значений исследуемого признака на числовой оси, т. е. указывают некоторое среднее, ориентировочное значение, около которого группируются экспериментальные данные. К ним относятся среднее арифметическое, мода и медиана. Среднее арифметическое равно сумме значений всех вариант выборки, деленное на объем выборки: x 1 n  xi . n i 1 Здесь п – объем выборки, а xi – варианты выборки. 19 Среднее арифметическое является наиболее важной характеристикой положения, поскольку при его определении используется вся имеющаяся информация о выборке. Для обозначения среднего арифметического используется та же буква, что и для вариант выборки, с той лишь разницей, что над буквой ставится черта – символ усреднения. В рассматриваемом случае исследуемый признак обозначен через X, его числовые значения – хi, а среднее арифметическое имеет обозначение x . Из определения среднего арифметического следует, что сумма отклонений выборочных значений признака от него равна нулю. Вычислять среднее арифметическое исходя из его определения при большом объеме выборки становится затруднительным и можно применить следующий прием: воспользоваться результатами группировки и считать приближенно значения вариант в каждом интервале постоянными и равными срединному значению, которое выступает в роли «представителя» интервала. Число вариант в интервале равно частоте интервала, поэтому среднее арифметическое для сгруппированных данных будет выражаться следующей приближенной формулой: 1 k x   ni xi , n i 1 где п – объем выборки; k – число интервалов группировки; ni – частоты интервалов; xi – срединные значения интервалов. Отметим, что платой за упрощение процесса вычислений является уменьшение их точности (точность вычислений по необработанным данным всегда выше, чем по обработанным). Исходя из этого, вычисление оценочных характеристик по первичным экспериментальным предпочтительным. 20 данным является Среднее арифметическое, вычисленное по результатам группировки, иногда называют взвешенным средним. Смысл такой формулировки заключается в том, что в формуле срединные значения суммируются с весами (коэффициентами), равными частотам попадания вариант в соответствующие интервалы группировки. В качестве примера определим среднее арифметическое результатов в толкании ядра для экспериментальных данных из таблицы 1.1 и сгруппированных в таблице 1.4. Среднее арифметическое, определенное по необработанным экспериментальным данным, равно: x  14,5331 (м). При использовании для упрощения вычислений результатов проведенной группировки получаем: x  (4*13,375+8*14,045+10*14,715+5*15,385+2*16,055)/29=14,55328 (м). Полученные двумя способами средние арифметические различаются на две сотых, что превышает точность измерений экспериментальных данных. Среди других характеристик положения наиболее важны мода и медиана. Они характеризуют величину варианты, занимающей определенное положение в статистической совокупности. Модой случайной величины называется значение признака, встречающееся в выборке наиболее часто. Условимся использовать для обозначения моды символы Mo. Геометрически мода соответствует максимуму кривой эмпирического распределения (см. рис. 1.2). 21 Рис. 1.2. Мода С точки зрения теории вероятностей модой случайной величины является ее наиболее вероятное значение. Прежде чем приступить к вычислению значения моды в случае сгруппированных данных, необходимо определить модальный интервал. Модальным называется интервал группировки, содержащий наибольшее число вариант, т.е. имеющий максимальную частоту (частость). Значение моды определяется по результатам группировки с помощью следующего соотношения: Mo  xMoH  h (nMo nMo  nMo1 ,  nMo1 )  (nMo  nMo1 ) где xMoH – нижняя граница модального интервала; h – ширина интервала группировки; пMo – частота модального интервала; пМо-1 – частота интервала, предшествующего модальному; пмо+1 – частота интервала, следующего за модальным. При проведении исследования может оказаться, что модальным оказывается первый или последний интервал группировки. В этом случае предыдущий или последующий интервал не существует и возникает вопрос о пути применения последней формулы. Если один из интервалов не существует, 22 то при проведении вычисления моды значение частоты, соответствующее этому интервалу, следует принять равным нулю. Это интуитивно очевидно раз нет интервала, то нет и вариант, относящихся к нему, потому и частота должна обращаться в нуль. В рассматриваемом примере модальным является третий интервал, а значение моды равно: Mo  14,38  0,67 10  8  14,38  0,19  14,57 (м). (10  8)  (10  5) Часто для характеристики распределения применяется еще одна характеристика положения – медиана. Медианой называется такое значение признака, при котором половина значений экспериментальных данных оказывается меньше его, а вторая половина – больше. Для обозначения медианы принято использовать символы Me. Геометрический смысл медианы – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам (см. рис. 1.3). Рис. 1.3. Медиана В случае не сгруппированных данных для нахождения медианы необходимо ранжировать выборку, т. е. расположить данные в порядке их возрастания или убывания. Медианой будет являться значение признака, находящееся в середине ранжированного ряда. В ранжированной выборке, содержащей п членов, ранг RMe, т.е. порядковый номер, медианы равен: 23 RMe  n 1 , 2 а сама медиана совпадает с членом выборки, имеющим номер RMe. Описанное правило дает однозначный результат, если выборка содержит нечетное число членов. Если же выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Действительно, RMe оказывается дробным. В этом случае берут два члена выборки с номерами большим и меньшим RMe и считают медиану, равной их среднему значению. Для определения медианы в случае сгруппированных данных необходимо найти медианный интервал. Интервал группировки, содержащий медиану, называется медианным. Медианным является интервал, в котором накопленная частота впервые окажется больше половины объема выборки (либо накопленная частость – больше 0,5). Значение медианы определяется по следующей формуле: Me  xMeH  h 0,5n  N Me1 , nMe где хМеH – нижняя граница медианного интервала; n – объем выборки; h – ширина интервалов группировки; NMe-1 – накопленная частота интервала, предшествующего медианному; пMe – частота медианного интервала. В рассматриваемом примере накопленная частота впервые превышает половину объема выборки (накопленная частость 0,5) в третьем интервале (см. таблицу 1.5), поэтому он и будет являться медианным. Само значение медианы равно: Me  14,38  0,67 0,5 * 27  12  14,38  0,17  14,55 (м). 10 24 В рассматриваемом примере все характеристики положения различаются между собой. Это свидетельствует об асимметрии эмпирического распределения. Значения среднего арифметического, моды и медианы совпадают только для симметричных одномодальных распределений. Напомним, что распределение является симметричным, если частости двух любых вариант, равно отстоящих в обе стороны от центра распределения, равны между собой. В таких случаях все характеристики положения равноправны, но предпочтение принято отдавать среднему арифметическому, поскольку оно опирается на всю имеющуюся информацию об изучаемой выборке. Чем сильнее форма распределения отклоняется от симметричной, тем большее различие наблюдается между значениями характеристик положения. Значение медианы наиболее важно при исследовании сильно асимметричных эмпирических распределений. В этих случаях значительная часть значений признака оказывается больше, либо меньше среднего арифметического и последнее оказывается малопригодным для описания положения центра распределения. Использование медианы, занимающей промежуточное значение между средней арифметической и модой, для характеристики центра распределения в описанной ситуации оказывается наиболее рациональным. Характеристики рассеяния Характеристики положения описывают центр распределения. В то же время значения вариант могут группироваться вокруг него как в широкой, так и в узкой полосе. Поэтому для описания распределения необходимо охарактеризовать диапазон изменения значений признака. Для описания диапазона варьирования признака используются характеристики рассеяния. Наиболее широкое применение нашли размах стандартное отклонение и коэффициент вариации. 25 вариации, дисперсия, Размах вариации определяется как разность между максимальным и минимальным значением признака в изучаемой совокупности: R = xmax – xmin. Очевидным достоинством рассматриваемого показателя является простота расчета. Однако поскольку размах вариации зависит от величин только крайних значений признака, то область его применения ограничена достаточно однородными распределениями. В остальных случаях информативность этого показателя весьма невелика, поскольку существует очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. В практических исследованиях размах вариации используется иногда при малых (не более 10) объемах выборки. Так, например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. В рассматриваемом примере: R = 16,36 – 13,04 = 3,32 (м). Второй характеристикой рассеяния является дисперсия. Дисперсия представляет собой средний квадрат отклонения значения случайной величины от ее среднего значения. Дисперсия есть характеристика рассеяния, разбросанности значений величины около ее среднего значения. Само слово «дисперсия» означает «рассеяние». При проведении выборочных исследований необходимо установить оценку для дисперсии. Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией и обозначается S2. На первый взгляд, наиболее естественной оценкой для дисперсии является статистическая дисперсия, вычисленная, исходя из определения, по формуле: n   2  (x 26 i 1 i  x)2 n . В этой формуле n  ( xi  x ) 2 - сумма квадратов отклонений значений i 1 признака хi от среднего арифметического x . Для получения среднего квадрата отклонений эта сумма поделена на объем выборки п. Однако такая оценка не является несмещенной. Можно показать, что сумма квадратов отклонений значений признака для выборочного среднего арифметического меньше, чем сумма квадратов отклонений от любой другой величины, в том числе от истинного среднего (математического ожидания). Поэтому результат, получаемый по приведенной выше формуле, будет содержать систематическую ошибку, и оценочное значение дисперсии окажется заниженным. Для поправочный коэффициент ликвидации смещения достаточно ввести n . В результате получается следующее n 1 соотношение для оценочной дисперсии: n 2  (x  x) 2 i i 1 n 1 . При больших значениях n, естественно, обе оценки – смещенная и несмещенная – будут различаться очень мало и введение поправочного множителя теряет смысл. Как правило, уточнение формулы для оценки дисперсии следует производить при n < 30. В случае сгруппированных данных последнюю формулу для упрощения вычислений можно привести к следующему виду: k 2   n (x i 1 i i  x)2 n 1 , где k – число интервалов группировки; ni – частота интервала c номером i; xi – срединное значение интервала c номером i. В качестве примера проведем вычисление дисперсии сгруппированных данных разбираемого нами примера (см. таблица 1.5): 27 для σ2 = [4 (13,375-14,5331)2+8 (14,045-14,5331)2+10 (14,715-14,5331)2+ 5 (15,385-14,5331)2+2 (16,055-14,5331)2]/28=0,5473 (м2). Дисперсия случайной величины имеет размерность квадрата размерности случайной величины, что затрудняет ее интерпретацию и делает не очень наглядной. Для более наглядного описания рассеяния удобнее пользоваться характеристикой, размерность которой совпадает с размерностью исследуемого признака. С этой целью вводится понятие стандартного отклонения (или среднего квадратического отклонения). Стандартным отклонением называется положительный корень квадратный из дисперсии:   2 . В разбираемом нами примере стандартное отклонение равно   0,547  0,7398 (м). Стандартное отклонение имеет те же единицы измерения, что и результаты измерения исследуемого признака и, таким образом, оно характеризует степень отклонения признака от среднего арифметического. Иными словами, оно показывает, как расположена основная часть вариант относительно среднего арифметического. Стандартное отклонение и дисперсия являются наиболее широко применяемыми показателями вариации. Связано это с тем, что они входят в значительную часть теорем теории вероятностей, служащей фундаментом математической статистики. Помимо этого, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов на вариацию исследуемого признака. Помимо абсолютных показателей вариации, которыми являются дисперсия и стандартное отклонение, в статистике вводятся относительные. Наиболее часто применяется коэффициент вариации. Коэффициент вариации равен отношению стандартного отклонения к среднему арифметическому, выраженному в процентах: 28 V  x 100% . Из определения ясно, что по своему смыслу коэффициент вариации представляет собой относительную меру рассеяния признака. Для рассматриваемого примера: V Коэффициент 0,7398  100%  0,05  100%  5% . 14,5331 вариации широко используется при проведении статистических исследований. Будучи величиной относительной, он позволяет сравнивать колеблемости как признаков, имеющих различные единицы измерения, так одного и того же признака в нескольких разных совокупностях с различными значениями среднего арифметического. Коэффициент вариации используется для характеристики однородности полученных экспериментальных данных. В практике физической культуры и спорта разброс результатов измерений в зависимости от значения коэффициента вариации принято считать небольшим (V < 10%), средним (11– 20%) и большим (V > 20%). Ограничения на использование коэффициента вариации связаны с его относительным характером – определение содержит нормировку на среднее арифметическое. В связи с этим при малых абсолютных значениях среднего арифметического коэффициент вариации может потерять свою информативность. Чем ближе значение среднего арифметического к нулю, тем менее информативным становится этот показатель. В предельном случае среднее арифметическое обращается в ноль (например, температура) и коэффициент вариации обращается в бесконечность независимо от разброса признака. По аналогии со случаем погрешности можно сформулировать следующее правило. Если значение среднего арифметического в выборке больше единицы, то использование коэффициента вариации правомерно, в 29 противном случае для описания разброса опытных данных следует использовать дисперсию и стандартное отклонение. В заключение этой части рассмотрим оценку варьирования значений оценочных характеристик. Как уже было отмечено, значения характеристик распределения, рассчитанные по данным эксперимента, не совпадают с их истинными значениями для генеральной совокупности. Точно установить последние не представляется возможным, поскольку, как правило, невозможно обследовать всю генеральную совокупность. Если использовать для оценки параметров распределения результаты разных выборок из одной и той же генеральной совокупности, то окажется, что эти оценки для разных выборок отличаются друг от друга. Оценочные значения флуктуируют около своих истинных значений. Отклонения оценок генеральных параметров от истинных значений этих параметров называются статистическими ошибками. Причиной их возникновения является ограниченный объем выборки – не все объекты генеральной совокупности входят в нее. Для оценки величины статистических ошибок используется стандартное отклонение выборочных характеристик. В качестве примера рассмотрим наиболее важную характеристику положения – среднее арифметическое. Можно показать, что стандартное отклонение среднего арифметического определяется соотношением: mx   n , где σ – стандартное отклонение для генеральной совокупности. Поскольку истинное значение стандартного отклонения неизвестно, то для оценки стандартного отклонения выборочного среднего используется величина, называемая стандартной ошибкой среднего арифметического. Величина m x характеризует ошибку, которая в среднем допускается при замене генерального среднего его выборочной оценкой. Согласно формуле, увеличение объема выборки при проведении исследования приводит к 30 уменьшению стандартной ошибки пропорционально корню квадратному из объема выборки. Для рассматриваемого примера значение стандартной ошибки среднего арифметического равно mx  0,7398  0,137 . В нашем случае она оказалась в 5,4 29 раза меньше значения стандартного отклонения. Характеристики формы При проведении статистических исследований встречаются распределения, имеющие самые разнообразные формы. Для характеристики отклонения формы распределения от симметричной используется коэффициент асимметрии или просто асимметрия, обозначаемая As и вычисляемая по формуле: n As  (x i 1 i  x )3 n 3 , где xi – значение i-й варианты; x - среднее арифметическое; σ – среднее квадратическое отклонение; n – объем выборки. Для симметричной формы распределения коэффициент асимметрии равен нулю. На рис. 1.4 и 1.5 показано два асимметричных распределения. Одно из них (рис. 1.4) имеет положительную асимметрию (As>0), а другое (рис. 1.5) – отрицательную (As<0). Иногда положительную асимметрию называют левосторонней, а отрицательную – правосторонней. Смысл этого заключается в том, что максимум распределения (и большая часть вариант) смещен влево (или соответственно вправо от значения среднего арифметического. 31 Рис. 1.4. Положительная (левосторонняя) асимметрия Рис. 1.5. Отрицательная (правосторонняя) асимметрия Для сгруппированных данных формула для вычисления коэффициента асимметрии имеет вид: k As   n (x i 1 i i  x )3 n 3 . Здесь ni – частота интервала с номером i; xi – его срединное значение; k – число интервалов группировки. В рассматриваемом примере о толкании ядра: As = [4 (13,375-14,5331)3+8 (14,045-14,5331)3+10 (14,715-14,5331)3+ 32 5 (15,385-14,5331)53+2 (16,055-14,5331)3]/[29* 0,73983]= 0,260663. Коэффициент асимметрии положителен, следовательно, можно предположить, что распределение признака в генеральной совокупности имеет левостороннюю асимметрию. Для быстрой предварительной оценки асимметрии распределения можно воспользоваться ее простейшим показателем – мерой скошенности. Мера скошенности (Sk) определяется как отклонение среднего арифметического ( x ) от моды (Мо): Sk  x  Mo . S Нормировка на среднее квадратическое отклонение S производится для обезразмеривания, что необходимо для сравнительного анализа степени асимметрии различных распределений. Применение этого показателя основано на том, что равенство среднего арифметического, моды и медианы имеет место только для симметричных распределений. Поэтому наиболее просто связать показатель асимметрии с соотношением характеристик положения: чем больше разница между средним арифметическим и модой, тем больше асимметрия распределения. В нашем примере: Sk  14,5331  14,57  0,052 . 0,7398 Как видим, и мера скошенности имеет значение, близкое к нулю. В рассматриваемом случае As>0, а Sk0. Никакого противоречия в этом нет, поскольку, с одной стороны, оба показателя являются выборочными, и, следовательно, вычислены с погрешностью, а с другой стороны, оба они близки к нулю. Это соответствует случаю или симметричного распределения, или распределения, мало отличающегося от симметричного. Следующий показатель эксцесс служит для характеристики, так называемой, крутости, т.е. островершинности или плосковершинности распределения. Эксцессом называется случайная величина, определяемая соотношением: 33 n Ex  (x i 1 i  x)4 3 n 4 . Число три вычитается из частного потому, что для весьма важного и широко распространенного в природе закона нормального распределения значение этого частного равно трем. Таким образом, для нормального распределения эксцесс равен нулю. Кривые, более островершинные по сравнению с кривой нормального распределения, обладают положительным эксцессом, а кривые более плосковершинные – отрицательным эксцессом. Таким образом, нормальное распределение служит эталоном, а эксцесс показывает крутизну эмпирического распределения относительно крутизны кривой нормального распределения (см. рис. 1.6). Рис. 1.6. Островершинное и плосковершинное распределения Для сгруппированных данных формула для вычисления эксцесса имеет следующий вид: k Ex   n (x i 1 i i  x)4 n 4  3. В нашем примере: Ex = [4 (13,375-14,5331)4+8 (14,045-14,5331)4+10 (14,715-14,5331)4+ 34 5 (15,385-14,5331)4+2 (16,055-14,5331)4]/[29∙0,73984] – 3 = -0,66. Отрицательное значение эксцесса свидетельствует о наличии тенденции к плосковершинности у рассматриваемого эмпирического распределения. 1.1.4. Предварительное перед статистическими расчетами рассмотрение выборки на предмет ее неоднородности (выявление и «отбраковывание» выпадающих данных) Как отмечалось выше, при проведении выборочных исследований предполагается, что выборка является однородной, т.е. она получена из одной генеральной совокупности, где отсутствуют объекты, резко выделяющиеся по значениям изучаемого признака. Однако на практике бывают случаи, когда при анализе данных выборки возникают так называемые «выбросы», или выпадающие из общих закономерностей значения. Это крайние значения признаков, не характерные для данной выборки, т.е. слишком большие или слишком малые значения. Они возникают как следствие грубых случайных ошибок измерения и расчета и могут искажать непропорционально распределение большое исходных влияние на данных, результаты оказывать всех типов могут быть статистического анализа. Причинами возникновения выпадающих значений следующие:  ошибка при получении данных (артефакт);  ошибка при подготовке данных (опечатка);  аномальное значение признака. Первые две ситуации могут быть обнаружены на этапе получения описательных статистик (например, при вычислении минимальных и максимальных значений признака). В последнем же случае от исследователя требуется особое внимание. 35 Известно, что при нормальном распределении признака 99,7% наблюдений (объектов исследования) располагаются внутри интервала с границами μ±3σ (μ – это среднее арифметическое, σ – среднее квадратическое отклонение, оцененное по выборке) – «правило трех сигм» (см. раздел 1.2.2.). Считается, что на основании этого правила можно исключать из анализа наблюдение (объект исследования), если значение признака не укладывается в интервал μ ± 3σ (причем μ и σ рассчитываются без учета резко отклоняющегося значения признака), и в дальнейшем анализировать данные без него. 1.2. Проверка статистических гипотез 1.2.1. Общие положения Проверка статистических гипотез тесно связана с теорией оценивания параметров. Часто для выяснения того или иного случайного факта прибегают к высказыванию гипотез, которые можно проверить статистически, т.е. по результатам наблюдений в случайной выборке. Под статистическими гипотезами подразумеваются такие гипотезы, которые относятся к виду функции распределения или к отдельным параметрам распределения случайной величины. Например, гипотеза о достоверности различий средних арифметических. Статистической будет также гипотеза о распределении генеральной совокупности по нормальному закону. Различают нулевую противоположную гипотезу, (альтернативную, которую обозначают конкурирующую или Н0, и единичную) гипотезу, которую обозначают Н1. Причём первоначально выдвинутая гипотеза Н0 нуждается в проверке относительно альтернативной гипотезы Н1. Эта проверка проводится на основании случайной выборки и называется статистической. Для проверки статистической гипотезы подбирают критерий, множество всех значений которого можно разделить на два непересекающихся подмножества (А и В) таких, что проверяемая гипотеза Н0 отвергается, если 36 критерий попадает в подмножество В, называемое критической областью, и принимается, если он принадлежит подмножеству А, называемому областью допустимых значений, или областью принятия гипотезы. В таблице 1.5 приведены значения вероятности события при различных значениях ошибки предположения. Таблица 1.5 Уровень значимости и вероятность события Уровень значимости α Полная уверенность 0,05 (5 %) 0,01 (1 %) 0,001 (0,1 %) Вероятность события р, % 100 % 95 % 99 % 99,9 % Доверительная вероятность q =1- α 1 0,95 0,99 0,999 Уровень значимости 0,01 означает, что ошибочное значение может встретиться в одном наблюдении из 100. В спортивных исследованиях, как правило, выбирается уровень значимости α = 0,05. Критерии проверки статистических гипотез можно условно разделить на три группы: критерии, предназначенные для выявления различий в распределениях признаков, параметрические критерии и непараметрические критерии. Из первой группы наиболее актуальными являются критерии согласия – критерии проверки гипотез о соответствии эмпирического распределения теоретическому. Иначе говоря, это критерии для проверки гипотезы о принадлежности наблюдаемой выборки некоторому теоретическому закону распределения. Например, критерий согласия Пирсона или хи-квадрат и критерий W Шапиро-Уилки. Эти критерии используются для проверки нормальности распределения. В две другие группы входят критерии, предназначенные для обоснования наличия или отсутствия различий между двумя или несколькими выборками. 37 Параметрические критерии включают в свой расчет показатели распределения – средние, дисперсии. Например, t-критерий Стьюдента, Fкритерий Фишера. Непараметрические критерии основаны на операциях с другими данными, в частности, частотами, рангами. К ним относятся, например, Tкритерий Вилкоксона, U-критерий Манна-Уитни. Параметрические критерии позволяют прямо оценить уровень основных параметров генеральных совокупностей, разности средних и различия в дисперсиях. Эти критерии способны выявить тенденции изменения признака, оценить взаимодействие двух и более факторов в воздействии на изменения признака. Параметрические критерии могут быть несколько более мощными, чем непараметрические, но при условии, что признак измеряется, как минимум, в интервальной шкале и нормально распределен. Однако далеко не все данные измеряются в интервальной шкале. К тому же проверка распределения «на нормальность» требует достаточно сложных расчетов. Непараметрические критерии лишены отмеченных ограничений. 1.2.2. Нормальное распределение Большинство экспериментальных исследований не только в области физической культуры и спорта, но и в биологии, медицине и др. связано с измерениями, результаты которых могут принимать любые значения в заданном интервале, и описываются моделью непрерывных случайных величин. Поэтому далее будем рассматривать в основном непрерывные случайные величины и связанные с ними непрерывные распределения. Среди всех непрерывных законов распределения вероятностей особое место занимает нормальное распределение, или распределение Гаусса, как наиболее часто встречающийся вид распределения. 38 Поскольку нормальному закону распределения подчиняются только непрерывные случайные величины, следовательно, распределение нормальной совокупности может быть задано в виде плотности распределения  f ( x)  Таким образом, это 1  2 e (x  )2 2 2 распределение . называется нормальным распределением, или распределением Гаусса, с параметрами  и  . О случайной величине Xс указанным законом распределения вероятностей говорят, что она распределена нормально с параметрами  ,  , и кратко называют нормальной. Параметр  – математическое ожидание нормальной случайной величины X,  – среднее квадратическое отклонение этой величины. График плотности вероятности нормального закона распределения приведён на рис. 1.7. График функции f(x) называют нормальной кривой, или кривой Гаусса. Как видно из рисунка, этот график представляет собой колоколообразную фигуру, симметричную относительно вертикальной прямой асимптотически приближающуюся к оси абсцисс при x   . Рис. 1.7. Плотность вероятностей нормального распределения 39 x, и Главная особенность нормального закона состоит в том, что он является предельным законом, к которому приближаются другие законы распределения. При достаточно многочисленной совокупности нормальное распределение проявляется и в эмпирическом распределении. Совокупность всех возможных значений случайной величины и соответствующих им вероятностей образует так называемое теоретическое распределение. Совокупность фактических значений случайной величины, полученных в результате наблюдений, с соответствующими частотами (или частостями) образуют эмпирическое распределение. Рассмотрим некоторые свойства нормального распределения. 1. Функция плотности нормального распределения определена на всей оси ОХ, т. е. каждому значению х соответствует вполне определённое значение функции. 2. При всех значениях х (как положительных, так и отрицательных) функция плотности распределения принимает положительные значения, т. е. нормальная кривая расположена над осью ОХ. 3. График функции плотности f(x) симметричен относительно прямой, проходящей через точку х = μ. Отсюда следует равенство для нормально распределённой величины моды, медианы и математического ожидания. 4. Коэффициенты асимметрии и эксцесса нормального распределения равны 0: A Е Отсюда следует важность 3 = 0; 3 4  3 = 0. 4 вычисления этих коэффициентов для эмпирических рядов распределения, т.к. они характеризуют скошенность и крутость данного ряда по сравнению с нормальным. 40 Для нормально распределенной случайной величины вероятность выхода за интервал (3;  + 3) очень мала, а именно равна 0,0027, т. е. это событие может произойти лишь в 0,27% случаев. Такие события можно считать практически невозможными. На основании этого формулируется правило трех сигм: если случайная величина имеет нормальное распределение, то отклонение этой величины от математического ожидания по абсолютной величине не превосходит утроенного среднеквадратического отклонения. 1.2.3. Критерии согласия. Проверка гипотезы о законе распределения Критерий согласия  2 В последующих подразделах будут рассмотрены гипотезы, относящиеся к отдельным параметрам распределения случайной величины, причём закон её распределения предполагался известным. Однако во многих практических задачах точный закон распределения исследуемой случайной величины неизвестен, т. е. является гипотезой, которая требует статистической проверки. Обозначим через Х исследуемую случайную величину. Пусть требуется проверить гипотезу о том, что эта случайная величина подчиняется определённому закону распределения F (x). Для проверки гипотезы произведём выборку, состоящую из п-независимых наблюдений над случайной величиной Х. По выборке исследуемой можно случайной теоретического построить эмпирическое величины. Сравнение распределений производится с распределение F*(x) эмпирическогоF*(x) помощью и специально подобранной величины – критерия согласия. Существует несколько критериев согласия:  2 Пирсона (хи-квадрат Пирсона), Колмогорова-Смирнова и др. Критерий согласия  2 Пирсона наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Рассмотрим этот критерий. Разобьём всю область изменения Х на lинтервалов Δ1, Δ2, …, Δl и подсчитаем количество элементов пi, попавших в 41 каждый из интервалов Δi. Предполагая известным теоретический закон распределения F (x), всегда можно определить рi (вероятность попадания случайной величины Х в интервал Δi), тогда теоретическое число значений случайной величины Х, попавших в интервал Δi, можно рассчитать по формуле прi. Результаты проведённых расчётов объединим в таблице 1.6. Таблица 1.6 Эмпирические и теоретические частоты Интервалы Δi Эмпирические частоты (ni) Теоретические частоты (прi) Δ1 n1 пр1 Δ2 n2 пр2 … Δi ni прi … … … Δl nl п Здесь п1+п2+…+ni…+nl=п; р1+р2+…+рl=1. Если эмпирические частоты сильно отличаются от теоретических, то проверяемая гипотеза Но (исследуемая случайная величина подчиняется нормальному закону распределения) отклоняется, в противоположном случае – принимается. В качестве меры расхождения между эмпирическими ni и теоретическими прi частотами для i= 1, …, l используют критерий l   2 i 1 n i  npi  npi 2 (1.6) Правило применения критерия значение  2  2 сводится к следующему. Рассчитав и выбрав уровень значимости критерия α=0,05 и число степеней свободы ν =k–3 (где k – количество интервалов), по таблице определяется 2; . Если  2  2  - распределения 2 > 2; , то нулевая гипотеза Но отвергается, если ≤ 2; , то гипотеза принимается. Заметим, что статистика l   2 n i i 1 42  npi  npi 2 имеет  2 - распределение лишь при п→∞. Поэтому необходимым условием применения критерия  2 Пирсона является наличие в каждом из интервалов, по меньшей мере 5 - 10 наблюдений. Если количество наблюдений в отдельных интервалах очень мало (порядка 1 - 2), то имеет смысл объединить некоторые разряды. Проиллюстрируем применение критерия  на примере, 2 когда ставится гипотеза о том, что исследуемая случайная величина подчиняется нормальному закону распределения. Если в формуле (1.6) заменить теоретические частоты буквой ni', формула примет вид k   2 n i 1 i 2  ni  , ni (1.7) где ni– эмпирические частоты; ni' – теоретические (ожидаемые) частоты; k – число интервалов группировки после объединения. Пример Группа пловцов II разряда (п = 50) выполняет контрольное проплывание на дистанцию 50 м на время. Результаты времени проплывания дистанции приведены в таблице 1.7. Таблица 1.7 Результаты времени проплывания дистанции № X i, с № X i, с № X i, с № X i, с № X i, с 1 35,3 12 36,8 23 34,5 34 36 45 36,4 2 36,2 13 34,3 24 34,2 35 35 46 36,2 3 36 14 33,7 25 36,1 36 36,4 47 35,8 4 35,4 15 36,6 26 34,8 37 36,2 48 35 5 34,2 16 35,5 27 35,6 38 34,2 49 35,6 6 37,8 17 35,8 28 34,8 39 35,6 50 35 43 7 8 9 10 36,1 36,2 35,3 34,7 18 19 20 21 34,6 35,9 35,5 33,6 29 30 31 32 32,8 35 35,5 36,1 40 41 42 43 35,8 35,2 35,8 36,9 11 35,3 22 35,4 33 34,2 44 34,2 1. Формулируем гипотезу Но: плотность распределения генеральной совокупности, из которой взята выборка, соответствует нормальному распределению; выбираем уровень значимости α = 0,05. 2. Для выборки объема п=50 строим интервальный вариационный ряд с числом интервалов k=7 (таблица 1.9). 3. Рассчитываем выборочные характеристики по приведенным данным: Х 4. = 35,4 с;  = 0,946 с ≈ 0,95 с. Вычисляем значения теоретических частот. Для этого нужно вероятность попадания в интервал умножить на объём выборки   x  x  x  x    Фo  нi  , ni  n  Фo  вi        где Фо(u) – функции Лапласа (таблица 1 Приложения); хвi и хнi – верхняя и нижняя границы интервала группировки. Предварительно нормируем границы интервалов группировки: uвi  xвi  x ;  u нi  xнi  x  . Нормированные границы занесены в 4-й столбец, а вычисленные теоретические частоты в 5-й столбец таблице 1.9. Так как в 1, 2 и 7-м интервалах теоретические частоты оказались меньше 5, то объединяем 1 и 2-й интервалы с 3-м, а 7-й интервал с 6-й, при этом суммируем эмпирические частоты объединённых интервалов, после чего получаем 4 интервала. Продемонстрируем вычисления на примере первого интервала:  определим нормированные границы интервала u в1  u н1  xв1  x  33,2  35,4  2,33 ; 0,946 x н1  x  32,4  35,4  3,17 0,946   44  вычислим значение теоретической частоты   x  x  x  x    Фo  н1   50   0,4901   0,4993  0,46 . n1  n  Фo  в1        Из таблицы 1 Приложения выбираем значения функции Лапласа и записываем их с учётом нечётности функции Лапласа Фо(-2,33) = -0,4901; Фо(-3,17) = -0,4993, затем подставляем их в формулу для вычисления теоретической частоты. Так же вычисляются теоретические частоты остальных интервалов;  после объединения теоретических частот первых трёх интервалов, как было сказано выше, вычисляем; ni-ni'= 12-13,1825 = -1,1825.  затем определяем; n i 2  ni    1,1825 =  0,106 . ni 13,1825 2 Таблица 1.8 Таблица для расчета критерия № Границы Частоты п/ интервалов интервал п ов 1 1 2 3 4 5 6 7 хнi- хвi ni 2 32,4 - 33,2 33,2 - 34 34 - 34,8 34,8 - 35,6 35,6 - 36,4 36,4 - 37,2 37,2 - 38 Сумма 3 5. 1 2 9 15 17 5 1 6 2 Теоретические частоты ni' u вi ; u нi 12 50 Нормирова нные границы  4 5 -3,17; -2,33 0,46 -2,33; -1,48 2,73 13,1825 -1,48; -0,63 9,9925 -0,63; 0,21 15,94 0,21; 1,06 13,615 1,06; 1,9 5,7925 1,9; 2,75 1,285 7,0775 49,815 ni- ni' 6 n i 2  ni  ni 7 -1,1825 0,106 -0,94 3,385 0,055 0,842 -1,0775 0,164 1,167 Значение критерия  , определяемое как сумма значений 7-го 2 столбца, исходя из формулы (2), равно: 45  2 = 1,167. В таблице 4 Приложения находим для уровня значимости α = 0,05 и 6. числа степеней свободы ν =k – 3 = 4 -3 = 1 критическое значение 2;  2 - критерия  02, 05 = 3,84. Вывод: так как 7.  2 <  02, 05 , считаем, что эмпирическое распределение соответствует нормальному распределению на уровне значимости 0,05. Критерий согласия W Шапиро-Уилки Критерий согласия W Шапиро-Уилки является наиболее мощным. Его применение позволяет сделать точные выводы при небольших объёмах выборок и обнаружить отклонения от нормальности эмпирического распределения уже при n≥10. Заметим, что при больших объёмах выборок (n≥40) для проверки на нормальность эмпирического распределения можно использовать критерий согласия χ2 (хи-квадрат) или критерий λ Колмогорова-Смирнова. Порядок применения критерия будет рассмотрен в разделе 2.3.1. 1.2.4. Проверка гипотез с помощью критериев, основанных на нормальном законе распределения (параметрические критерии) Сравнение двух выборочных характеристик вариации и проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей Рассмотрим две случайные величины X и Y, каждая из которых подчиняется нормальному закону распределения с дисперсиями σx2 и σy2. Для оценки вариативности (колеблемости) выборочных исследований, когда требуется определить, различаются ли по исследуемому показателю группы, т. е. относятся ли они к одной генеральной совокупности или нет, применяется критерий Фишера-Снедекора. 46 1. Записывается нулевая гипотеза Н0: σx2 = σy2. 2. Вычисляется коэффициент Фишера-Снедекора 2 F расч   большая > 1. 2  меньшая Значение этой дроби всегда больше единицы, поскольку в числителе дроби стоит дисперсия той выборки, величина которой больше, а в знаменателе – меньшая величина. 3. По таблице 2 Приложения определяется критическое значение теоретического распределения Фишера (Fкрит.) для выбранного уровня значимости α, числа степеней свободы ν1=n1-1 (числитель) и ν2=n2-1 (знаменатель). 4. Если Fрасч. <Fкрит., то нулевая гипотеза о равенстве дисперсий (Н0: σx2 = σy2) принимается; если Fрасч. >Fкрит., то нулевая гипотеза отклоняется с вероятностью q=1- α. Пример Две группы пловцов II разряда (пх = 31; пy = 25) выполняют контрольное проплывание на дистанцию 50 м на время. Получены следующие статистические характеристики: X Y  34 с; =35,4 с;  х2 = 0,96;  y2 = 0,86; пх=31; пy=25. Определим, как соотносятся между собой дисперсии двух групп. Решение:  предполагаем, что дисперсии двух групп совпадают Н0:  х2 =  y2 ;  Fрасч  х2 0,96  2   1,12 (т.к. первая выборка имеет большую  у 0,86 дисперсию, то ее значение подставляем в числитель); 47  из таблицы Fкрит  2,58 (таблица 2 Приложения) для уровня значимости α = 0,01, числа степеней свободы  1  n х  1  31  1  30 (большая дисперсия),  2  n у  1  25  1  24 (меньшая дисперсия);  так как Fрасч < Fкрит (1,12 < 2,58), то нулевая гипотеза принимается с вероятностью q = 1- α = 1-0,01 = 0,99. Вывод: в результате получили, что дисперсии двух групп пловцов совпадают. В дальнейшем этот факт будет использоваться для выбора формулы при расчете критерия Стьюдента. Сравнение средних арифметических двух независимых (несвязанных) выборок В спорте часто проводятся измерения на одних и тех же спортсменах через некоторое время (до и после тренировочного занятия). При этом стараются определить, изменилось ли состояние спортсменов. В таких случаях выборки всегда равны по числу измерений, все измерения могут быть объединены в пары. Каждая пара – результат измерения на одном человеке – в начале и конце эксперимента. Подобные выборки называются зависимыми (связанными), остальные выборки называются независимыми (несвязанными). При сравнении двух выборочных средних арифметических независимых выборок обычно проверяется предположение, что и первая, и вторая выборки принадлежат одной генеральной совокупности и, следовательно, значимо не отличаются друг от друга. В этом случае известны следующие статистические характеристики: X , 1 , n1 ; Y , 2 , n2 , где X ,Y - средние арифметические соответственно; 48 первой и второй выборок  1 , 2 - стандартные отклонения первой и второй выборок соответственно; n1 ,n2 - объем первой и второй выборок соответственно. 1. Записывается нулевая гипотеза Н0: 2. Вычисляется значение критерия Стьюдента ( t расч ) для трех случаев: X  Y .  в случае равных объемов выборок и равных дисперсий: n  n1  n2 ; 1   2: X Y t расч  1   2 2 2  n  в случае равных объемов выборок и неравных дисперсий: n  n1  n2 ; 1   2 : X Y t расч   n,  12   22  в случае неравных объемов выборок и неравных дисперсий: n1  n2 ; 1   2 : t расч  X Y  12 n1   22 , n2  в случае неравных объемов выборок и равных дисперсий: n1  n2 ; 1   2   : 49 t расч  3. По таблице 3 X Y 1 1   n1 n2 Приложения . находится критическое значение коэффициента Стьюдента t крит при заданном уровне значимости (α) и числе степеней свободы (  n1  n2  2 ); 4. Сравнивается t расч и t крит :  если t расч < t крит (α,ν), то гипотеза Н0: X  Y принимается с вероятностью q=1 – α;  если t расч ≥ t крит (α,ν), то гипотеза Н0: X  Y отвергается с вероятностью q=1 – α. Пример Сравнить результаты времени прохождения дистанции 15 км двух групп лыжников традиционным ходом Xi и коньковым ходом Yi (таблица 1.9). Таблица 1.9 Результаты времени прохождения дистанции № п/п 1 2 3 4 5 6 7 8 9 10 1. Xi, мин. 37,02 36,74 38,12 36,91 37,28 38,21 37,51 37,56 38,03 37,82 X = 37,52  х = 0,52 Yi, мин. 35,81 35,61 35,02 35,53 35,84 35,12 26,12 36,49 35,62 36,28 Y = 34,74  y = 3,06 Предполагаем, что средние результаты не отличаются Н0: X = Y . 50 X Y Вычисляем t расч  3. Выбираем уровень значимости α = 0,05, число степеней свободы  12   22  n 37,52  34,74  10  2,84 . 0,52 2  3,06 2 2.   n1  n2  2 =10+10-2=18. Находим по таблице 3 Приложения критическое значение критерия Стьюдента для α = 0,05 и   18 t крит = 2,1. 4. t расч > t крит (2,84 > 2,1), гипотеза о равенстве средних арифметических (Н0: X = Y ) отклоняется с вероятностью q = 1 – 0,05 = 0,95. Вывод: результаты времени прохождения дистанции 15 км двух групп лыжников традиционным ходом и коньковым ходом различаются. Результат времени прохождения коньковым ходом лучше, чем традиционным в среднем на 2,78 мин. Пример Сравнить силу кисти правой руки у двух групп спортсменов ( n1  22; n2  24 ), получены следующие статистические характеристики: Х  58 с Y  62 с  х = 7,8  y = 8,4 пх=22 пy=24 1. Предполагаем, что средние результаты не отличаются Н0: X = Y . 2. Вычисляем t расч  X Y  12 n1 3.   22 n2  58  62 7,82 8,4 2  22 24  1,7 . Выбираем уровень значимости α = 0,05, число степеней свободы   n1  n2  2 = 22+24-2 = 44. Находим по таблице 3 Приложения критическое значение критерия Стьюдента для α = 0,05 и   44 t крит = 2,015. 4. t расч < t крит (1,7 < 2,015), гипотеза о равенстве средних арифметических (Н0: X = Y ) принимается с вероятностью q=1 – 0,05 = 0,95. 51 Вывод: показатели силы кисти правой руки двух данных групп спортсменов не отличаются в 95% случаев. Сравнение средних арифметических двух зависимых (связанных) выборок При оценке достоверности различий средних арифметических значений связанных выборок объёмы выборок должны быть одинаковыми n1 = n2 = n. 1. Для каждого испытуемого определяется разность (сдвиг) между результатами первого и второго измерений (испытаний) – di. 2. Рассчитывается среднее арифметическое разностей, т.е. складываются все разности и делятся на число испытуемых n Xd  3. Рассчитывается d i 1 n i . среднеквадратическое (стандартное) отклонение разностей  d  X n d  i i 1  2 d n 1 . 4. Рассчитывается значение коэффициента Стьюдента t расч  Xd d  n. 5. По таблице 3 Приложения находится критическое (табличное) значение коэффициента Стьюдента для уровня значимости (α) и числа степеней свободы (  n  1, здесь n – число пар). 6. Сравнивается t расч и t крит :  если t расч < t крит (α,ν), то гипотеза принимается с вероятностью q=1 – α (различие статистически незначимо); 52  если t расч ≥ t крит (α,ν), то гипотеза Н0 отвергается с вероятностью q=1 – α (наблюдаемое различие статистически значимо). Пример У группы спринтеров измеряли результаты в тройном прыжке до начала тренировочных занятий Xi и через 1 месяц после тренировок Yi, (таблица 1.10). Определить, изменился ли этот показатель под влиянием интенсивных тренировок. Таблица 1.10 Вспомогательная таблица для сравнения средних арифметических двух связанных выборок № п/п 1 2 3 4 5 6 7 8 9 10 Xi,м 12,4 12,9 12,6 13,1 12,5 13,5 12,7 13,4 12,8 13,6 Y i, м 15,3 15 15,6 15,4 14,7 15,7 14,8 15,5 14,6 14,9 di= Yi - Xi 2,9 2,1 3 2,3 2,2 2,2 2,1 2,1 1,8 1,3 ∑=22 X d =2,2 d i- X d 0,7 -0,1 0,8 0,1 0 0 -0,1 -0,1 -0,4 -0,9 (di- X d )2 0,49 0,01 0,64 0,01 0 0 0,01 0,01 0,16 0,81 ∑=2,14 σd=0,49 n Xd  d i 1 i n  d  X n d   i 1 i   22  2,2 ; 10 2 d n 1  2,14  0,49 . 9 предполагаем, что отсутствует прирост результатов в тройном прыжке у спринтеров после месяца тренировок Н0: X d = 0;  определяем t расч  Xd d  n 2,2  10  14,2 ; 0,49 53  выбираем уровень значимости α = 0,05, число степеней свободы   n  1 = 9. Для α = 0,05 и   9 t крит = 2,26 (таблица 3 Приложения);  так как t расч > t крит , то нулевая гипотеза (Н0: X d = 0) отвергается с вероятностью 0,95 (95 %). Вывод: под влиянием тренировочных занятий у спринтеров наблюдается достоверный прирост результатов в тройном прыжке. 1.2.5. Проверка гипотез с помощью критериев, не использующих сведений о законе распределения (непараметрические критерии) Ранжирование При проведении статистических расчетов в ряде случаев необходимо ранжировать (упорядочить) варианты выборки. Ранжированием называется группировка экспериментальных данных в определенном порядке, либо по возрастанию, либо по убыванию. Проведение операции ранжирования осуществляется по следующему алгоритму: 1. Меньшему значению начисляется меньший ранг. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Наименьшему значению начисляется ранг равный 1. Например, если n= 7, то наибольшее значение получит ранг под номером 7, за исключением случаев, которые предусмотрены вторым правилом. 2. Если несколько значений равны, то им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. 3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:  Ri  n( n  1) , 2 где n – общее количество ранжируемых значений. 54 Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. В этом случае необходимо найти и исправить ошибку. Т-критерий Вилкоксона Критерий Вилкоксона для связанных совокупностей принадлежит к непараметрическим критериям и используется для оценки значимости различий двух связанных совокупностей количественных признаков. Он используется для сопоставления показателей, которые были измерены в двух разных условиях на одной выборке испытуемых. Данный критерий позволяет установить не только направленность изменений признака, но и их выраженность. С его помощью можно определить, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом. Его следует использовать при наличии у сравниваемых совокупностей признаков значительного числа разностей с противоположными знаками. При использовании критерия Вилкоксона минимальное количество испытуемых, прошедших измерения в двух условиях, должно быть не менее 5 человек, а максимальное количество испытуемых – не более 50 человек, что определяется границами имеющихся таблиц. Нулевые сдвиги исключаются, а количество наблюдений n уменьшается на количество имеющихся нулевых сдвигов. Существует возможность пренебречь данным ограничением, но для этого необходимо выдвинуть соответствующую гипотезу, например, «Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне». Критерий Вилкоксона применим в тех случаях, когда признаки измерены, по крайней мере, по шкале порядка, и сдвиги между вторым и первым замерами могут быть упорядочены. Желательно, чтобы они варьировали в достаточно широком диапазоне. 55 Метод заключается в сопоставлении сдвигов исследуемого признака в противоположных направлениях по абсолютной величине. Все абсолютные величины сдвигов необходимо ранжировать, а затем суммировать ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений будут приблизительно равными. Если же интенсивность сдвига в одном из направлений преобладает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях. Предположим, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным (редким) сдвигом – сдвиг в более редко встречающемся направлении. Сдвиги в противоположные стороны можно представить себе в виде двух массивов. Величина массива зависит не только от количества соответствующих сдвигов, но и от их интенсивности. При некоторых n, а именно при n > 18, можно вообще отказаться от понятия типичного сдвига. Сдвигов в ту и другую сторону может оказаться поровну, но если 9 меньших сдвигов будут относиться к одному направлению, а 9 больших сдвигов – к противоположному, то мы можем констатировать достоверное преобладание этого противоположного направления сдвигов. Для проверки достоверности интенсивности типичного направления сдвига выдвигаются следующие гипотезы: H0: интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении. H1: интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении. Применение критерия:  составить список значений исследуемого признака в любом порядке;  вычислить разность между индивидуальными значениями признака во втором и первом обследованиях (после – до). Определить, что будет считаться «типичным» сдвигом, и сформулировать соответствующие гипотезы; 56  перевести разности в абсолютные величины и записать их отдельной колонкой;  ранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг;  проверить совпадение полученной суммы рангов с расчетной;  подсчитать сумму рангов, соответствующих сдвигам в «нетипичном» направлении, по формуле: Тэмп=∑ Rr, где Rr - ранговые значения сдвигов с более редким знаком;  определить критические значения Т для данного n по таблице 6 Приложения. Если Тэмп ≤ Ткр, то сдвиг в «типичную» сторону по интенсивности достоверно преобладает. Пример Группа спортсменов прошла тренировочный цикл. До и после цикла тренировок были проведены контрольные тесты, результаты которых приведены в колонках 2 и 3 таблицы 1.11 (xi и yi соответственно). По результатам тестов определить, значимо ли изменилась спортивная подготовка группы. Таблица 1.11 Применение критерия Вилкоксона i xi yi di=yi-xi Rdi 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 240 250 270 240 260 240 220 250 250 240 260 280 270 260 280 260 290 260 250 220 270 270 40 20 -10 40 0 50 40 0 -30 30 10 8 3,5 1,5 8 10 8 5,5 5,5 1,5 57 12 240 260 20 3,5 Зададимся уровнем значимости α = 0,05.  Вычислим разность di=yi-xi между значениями признака во втором и первом тестах и занесем полученные значения в колонку 4 таблицы 1.11.  Определим, какой сдвиг будем считать типичным. Поскольку у восьми участников эксперимента зафиксировано улучшение результатов, а ухудшение – только у двух, то естественно считать типичным сдвиг в сторону улучшения результатов тестирования.  Сформулируем гипотезы: H0: интенсивность сдвигов в сторону улучшения результатов тестирования не превышает интенсивность сдвигов в сторону их ухудшения; H1: интенсивность сдвигов в сторону улучшения результатов тестирования превышает интенсивность сдвигов в сторону их ухудшения.  Исключаем из рассмотрения пары результатов, в которых не было зафиксировано изменений (№ 5 и № 8).  Ранжируем сдвиги независимо от их знака и заносим ранги в колонку 5 таблицы 1.12. Проверяем сумму рангов, она должна быть равна 55.  Для вычисления эмпирического значения критерия Вилкоксона суммируем ранги нетипичных сдвигов, т.е. сдвигов в сторону ухудшения: Тэмп= ∑Ri-. где Ri- - ранговые значения сдвигов с более редким знаком. В рассматриваемом случае Тэмп = 1,5 + 5,5 = 7.  По таблице 6 Приложения находим критические значения Ткр для n = 10 и уровня значимости α = 0,05: Ткр = 10.  Поскольку Тэмп < Ткр, то нулевая гипотеза Н0 отвергается, и, следовательно, интенсивность положительного сдвига результатов тестирования превышает интенсивность отрицательного сдвига (р < 0,05), и подготовленность спортсменов улучшилась. 58 U-Критерий Манна-Уитни Критерий Манна-Уитни предназначен для оценки различий между двумя независимыми выборками по уровню любого количественно измеренного признака. U-Критерий позволяет выявлять различия между малыми и сверхмалыми выборками, но имеет следующие ограничения: а) в каждой выборке должно быть не менее трех наблюдений (n1,n2 ≥ 3). Допустимо, чтобы в одной выборке было два наблюдения, но тогда во второй выборке их должно быть не менее пяти (n1 = 2, n2 ≥ 5); б) в каждой выборке должно быть не более 60 наблюдений; (n1,n2 ≤ 60), однако уже при n1,n2 > 20 ранжирование проводить довольно трудно. Если n1,n2 > 20, целесообразнее использовать другой критерий, например угловое преобразование Фишера в комбинации с критерием λ, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками. Метод позволяет определить, достаточно ли мала зона совпадающих значений между двумя рядами. Принято называть первой выборкой ту группу, в которой значения по предварительной оценке выше, а второй выборкой – ту, в которой значения предположительно ниже. Чем меньше область одинаковых значений, тем больше вероятность, что различия достоверны. Эмпирическое значение критерия U показывает, насколько велика зона совпадения между рядами. Следовательно, чем меньше Uэмп, тем более вероятно, что различия достоверны. Критерий использует следующие гипотезы: Н0: уровень признака во второй группе не ниже уровня признака в первой группе. Н1: уровень признака во второй группе ниже уровня признака в первой группе. 59 Применение U критерия Манна-Уитни:  Объединить две исследуемые выборки в одну, помечая каким-либо образом принадлежность элементов к той или иной выборке (например, цветом или подчеркиванием).  Ранжировать элементы объединенной выборки, располагая ее элементы в порядке возрастания.  Определить ранги элементов объединенной выборки, общая сумма рангов должна равняться 0,5 (n1 + n2) (n1 + n2 + 1).  Подсчитать отдельно суммы рангов элементов, принадлежащих к первой и ко второй выборкам. Проверить, совпадает ли общая сумма рангов с расчетной.  Определить большую из двух ранговых сумм.  Вычислить эмпирическое значение критерия Uэмп по формуле: U ýìï  (n1  n2 )  n x (n x  1)  Tx , 2 где п1 – объем первой выборки; п2 – объем второй выборки; Тх – большая из двух ранговых сумм; пх – объем выборки с большей суммой рангов.  Для заданного уровня значимости α и объемов обследуемых выборок n1 и n2 найти критическое значение Uкр по специальным таблицам (например, по таблице 7 Приложения).  Сравнить расчетное значение критерия Uэмп c критическим Uкр. Если Uэмп > Uкр, то гипотеза Н0 принимается. Если Uэмп ≤ Uкр, то гипотеза Н0 отвергается и принимается гипотеза Н1. Чем меньше оказывается значение Uэмп, тем выше достоверность различий между двумя выборками. Пример Рассмотрим две группы спортсменов, которые тренировалась по различным методикам. Первая – по экспериментальной, а вторая – по 60 традиционной. Эффективность методик оценивалась по результатам выполнения контрольного упражнения после цикла тренировок. Ниже приведены результаты выполнения контрольного упражнения (в баллах): первая группа (xi): 9.3, 9.0, 9.4, 8.9, 9.3, 9.5, 9.2, 9.0, 9.2, 9.3; вторая группа (yi): 9.0, 9.1, 8.7, 8.9, 9.0, 8.8, 9.2, 8.8, 9.0, 8.9. Сравнить результаты, показанные спортсменами двух групп при выполнении контрольного упражнения. Зададимся уровнем значимости α = 0,05. Сформулируем гипотезы: Н0: оценки за выполнение контрольного упражнения у студентов второй группы не ниже оценок студентов первой группы; Н1: оценки за выполнение контрольного упражнения у студентов второй группы ниже оценок студентов первой группы. Воспользуемся U-критерием Манна-Уитни, для чего выполним следующую последовательность действий:  Объединим два набора данных в один.  Проведем ранжирование элементов объединенной выборки, располагая их в порядке возрастания. Для удобства отметим данные, относящиеся к первой выборке, жирным курсивом, а ко второй – подчеркиванием. Для большей наглядности элементы двух выборок можно располагать в двух различных строках, как это сделано в таблице 1.12.  Определим ранги элементов объединенной выборки и отметим их аналогичным образом. 61 Таблица 1.12 Применение критерия Манна-Уитни. xi 8,9 yi 8,7 8,8 8,8 8,9 8,9 R 1 2,5 2,5 5 5 xi 9,0 9,2 14 yi R 9 9,1 9,2 12 14 9,0 9,0 9,0 9,0 5 9 9 9 9 9,2 9,3 9,3 9,3 9,4 9,5 14 17 17 17 19 20  Отдельно вычислим суммы рангов вариант, относящихся к первой и второй выборкам: R1 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19 + 20 = 141, R2 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69.  Проверим правильность вычислений сумм рангов R1 + R2 = 210 (R1 + R2 = 0,5 · (n1 + n2) · (n1 + n2 + 1) = 210).  Определим большую из двух ранговых сумм. Сумма рангов для первой выборки больше R1 = 141.  Вычислим эмпирическое значение критерия Uэмп: U эмп  (10  10)  10(10  1)  141  14 . 2  Для заданного уровня значимости α = 0,05 и объемов обследуемых выборок n1 = 10 и n2 = 10 по таблице 7 Приложения, находим критическое значение Uкр = 27.  Сравним расчетное значение критерия Uэмп c критическим Uкр. Поскольку в нашем случае расчетное значение критического оказалось меньше критического Uэмп < Uкр (14 < 27), то гипотеза Н0 отвергается, и принимается гипотеза Н1 – результаты спортсменов первой группы выше результатов 62 спортсменов второй группы (p < 0,05), что свидетельствует об эффективности экспериментальной методики тренировки. 1.3. Исследование взаимосвязи двух выборок Основные задачи:  определение формы связи между случайными переменными (линейная, нелинейная);  определение направления связи (положительная связь или отрицательная);  определение степени связи (слабая, средняя, сильная). 1.3.1. Виды взаимосвязи Исследования в области физической культуры и спорта носят, как правило, комплексный характер, при котором изучается не одна характеристика обследуемого объекта, а целая совокупность показателей. В ряде случаев между исследуемыми показателями обнаруживается взаимосвязь. Существует два вида взаимосвязи – функциональная и статистическая. Функциональной называется взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого. Например, средняя скорость V движения автомобиля на расстояние S связана со временем движения t: V  S . t Статистической взаимосвязью называется взаимосвязь, при которой одному значению первого показателя может соответствовать несколько значений второго показателя. В качестве примера можно привести зависимость веса человека от его роста. Одному значению роста может соответствовать несколько значений веса. Среди статистических зависимостей наибольший интерес представляют корреляционные. Корреляционная зависимость заключается в том, что средняя 63 величина одного показателя (Y) изменяется в зависимости от значения другого (X). Для изучения взаимосвязей используются корреляционный и регрессионный анализ. Корреляционный анализ состоит в определении степени связи между двумя случайными величинами (Y и X). Основной задачей корреляционного анализа является определение формы, направленности и тесноты взаимосвязи. При исследовании корреляции используются графический и аналитический подходы. Графический анализ начинается с построения корреляционного поля. Корреляционное поле (или диаграмма рассеяния) является графическим представлением зависимости между результатами измерений двух признаков. Для ее построения исходные данные наносят на график, отображая каждую пару значений (xi,yi) в виде точки с координатами xi и yi в прямоугольной системе координат. 1.3.2. Форма зависимости Визуальный анализ корреляционного поля позволяет сделать предположение о форме взаимосвязи двух исследуемых показателей. По форме взаимосвязи корреляционные зависимости принято разделять на линейные (см. рис. 1.8) и нелинейные (см. рис. 1.9). Рис.1.9. Нелинейная статистическая Рис.1.8. Линейная статистическая связь связь 64 При линейной зависимости огибающая корреляционного поля близка к эллипсу. Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (или убывать) по линейному закону. Выявление формы статистической зависимости необходимо для выбора метода оценки тесноты (силы) взаимосвязи. 1.3.3. Направленность взаимосвязи Направленность является положительной, если увеличение значения одного признака приводит к увеличению значения второго (см. рис. 1.10). Рис.1.10. Положительная направленность Рис.1.11. Отрицательная направленность Направленность является отрицательной, если увеличение значения одного признака приводит к уменьшению значения второго (см. рис. 1.11). Зависимости, имеющие положительные или отрицательные зависимость характеризуется направленности, называются монотонными. Таким образом, любая монотонная направленностью, которая может быть положительной, или отрицательной. Зависимость может и не иметь направленности. 65 1.3.4. Теснота (сила) взаимосвязи Теснота взаимосвязи может быть оценена качественно по ширине корреляционного поля – чем меньше его ширина, тем больше теснота и сильнее зависимость. Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Вид коэффициента корреляции и, следовательно, алгоритм его вычисления зависят от шкалы, в которой производятся измерения изучаемых показателей и от формы зависимости. Значение коэффициента корреляции может изменяться в диапазоне от -1 до +1: 1  r  1. Абсолютное значение коэффициента корреляции показывает силу взаимосвязи. Чем меньше его абсолютное значение, тем слабее связь. Если он равен нулю, то связь вообще отсутствует. Чем больше значение модуля коэффициента корреляции, тем сильнее связь и тем меньше разброс в значениях yi при каждом фиксированном значении xi. Знак коэффициента корреляции определяет направленность взаимосвязи: минус – отрицательная, плюс – положительная (см. рис. 1.12). r=1 r=-1 r=0,9 r=0,5 r=-0,5 r=-0,9 66 r=0,1 r=-0,1 r=0 r=0 r=0 Рис.1.12. Корреляционные поля при различных значениях коэффициента корреляции При проведении исследований в области спорта принята следующая классификация взаимосвязей по значению коэффициента корреляции (см. таблицу 1.13) Таблица 1.13 Интерпретация значений коэффициента корреляции 1 r 1 функциональная зависимость 2 0,7  r  0,99 сильная статистическая взаимосвязь 3 0,5  r  0,69 средняя статистическая взаимосвязь 4 0,2  r  0,49 слабая статистическая взаимосвязь 5 0,09  r  0,19 очень слабая статистическая взаимосвязь 6 r 0 корреляции нет В ряде случаев тесноту взаимосвязи определяют на основании коэффициента детерминации. Коэффициент детерминации равен квадрату коэффициента корреляции, выраженному в процентах: D  r 2 100% Выпадающие данные при корреляции Наличие выбросов в изучаемом процессе может привести к тому, что это отразится на расчете коэффициентов корреляции. На рис. 1.13 показан такой случай для некоей выборки. 67 Рис. 1.13. Расчет коэффициентов корреляции при резко отличающемся выбросе отдельного значения выборки Просматривается явно выраженная положительная корреляция параметров в рамках исследуемого процесса (r=0.88). Причем такой вид прямой обусловлен отдельно стоящим, выпадающим из общего массива отдельным значением. Это можно оценить как артефакт. Если исключить значение этого выброса из общего массива данных, то корреляционная зависимость изменится (рис. 1.14). 68 Рис 1.14. Расчет коэффициента корреляции при исключении из выборки отдельного выброса Оказывается, в рассматриваемом случае этой зависимости между переменными практически нет: коэффициент корреляции равен 0.08. Корреляции в неоднородных группах. Отсутствие однородности в выборке также является фактором, смещающим (в ту или иную сторону) выборочную корреляцию. Представьте ситуацию, когда коэффициент корреляции вычислен по данным, которые поступили из двух различных экспериментальных групп (мужчин и женщин), что, однако, было проигнорировано при вычислениях и была составлена единая выборка (рис. 1.15). Рис. 1.15. Расчет единого коэффициента корреляции по объединённой выборке из отличающихся по своему смысловому содержанию выборок Члены выборки собрались в два непересекающихся кластера. Это первый сигнал, что в основу расчетов были взяты неоднородные данные. Получился достаточно высокий коэффициент корреляции r = 0.90. В подобных ситуациях высокая корреляция может быть следствием объединения данных из двух групп, а вовсе не отражать «истинную» зависимость между двумя переменными, которая может практически отсутствовать. Это можно заметить, 69 взглянув на корреляционные зависимости каждой из групп в отдельности на рис. 1.16. Рис. 1.16. Величины корреляционных зависимостей при разделении отличающихся выборок Коэффициенты корреляции приняли значения r = 0.04 для мужчин и r =– 0.02 для женщин. Впрочем, опытному исследователю такие низкие значения коэффициентов корреляции были очевидны из вида поля корреляционных данных для каждой из групп испытуемых. Такой вид данных на математическом сленге носит название «дробовой выстрел». 1.3.5. Коэффициент корреляции Браве-Пирсона Коэффициент корреляции Браве-Пирсона применим в том случае, если измерение значений исследуемых признаков производятся в шкале отношений или интервалов и форма зависимости является линейной. Коэффициент корреляции характеризует только линейную взаимосвязь (степень ее тесноты). Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (убывать) по линейному закону. Для вычисления коэффициента корреляции Браве-Пирсона используется формула: 70 n r  ( xi  x )( yi  y ) i 1  ( x  x )2    ( y  y )2  i i      i 1 i 1 n , n либо n r (x i 1 i  x )( yi  y ) (n  1) x y . где x и y – средние, а  x и  y стандартные отклонения, рассчитанные по двум выборкам. Рассчитанный коэффициент корреляции является выборочным, так как он определен для ограниченной совокупности, являющейся выборкой из генеральной совокупности. Поэтому делать вывод о существовании корреляции в генеральной совокупности только исходя из его значения, особенно если его модуль не очень близок к 1, преждевременно. Необходимо проверить статистическую значимость обнаруженной корреляции. Определение статистической значимости коэффициента корреляции осуществляется с помощью критерия Стьюдента. Основные этапы проверки гипотезы о достоверности коэффициента корреляции заключаются в следующем. 1. Задаются уровнем значимости α. В области физкультуры и спорта принято использовать уровень значимости α = 0,05. 2. Нам предстоит определить: есть или нет корреляционной связи в генеральной совокупности на выбранном уровне значимости. 3. Рассчитывают эмпирическое значение t-критерия Стьюдента tэм п  4. По специальной r  n2 1  r2 таблице определяют критическое значение критерия tкр для числа степеней свободы  = n – 2 и уровня статистической значимости α (см. таблицу 3 Приложения). 71 5. Сравнивают эмпирическое значение критерия с критическим. Если tэмпtкр, то полученный коэффициент корреляции достоверен, и между исследуемыми показателями существует статистическая связь с вероятностью q=1-α. Если же tэмп < tкр, то полученный коэффициент корреляции недостоверен, и между исследуемыми показателями нет взаимосвязи. Существует и более простой способ проверки статистической значимости коэффициента корреляции. Он основан на использовании специальных таблиц критических значений коэффициента корреляции (см. таблицу 8 Приложения). Вычисленный коэффициент корреляции сравнивают с критическим значением rкр для объема выборки n и уровня значимости α. Если r  rкр , то делается вывод об отсутствии значимой корреляции. Если же оказывается, что r  rкр , то значение коэффициента корреляции в генеральной совокупности статистически значимо отличается от нуля на уровне значимости α. 1.3.6. Коэффициент ранговой корреляции rs Спирмена В случаях, если измерения исследуемых признаков проводятся в шкале порядка, или же форма взаимосвязи отличается от линейной, исследование взаимосвязи между двумя случайными величинами осуществляется с помощь ранговых коэффициентов корреляции. Рассмотрим коэффициент ранговой корреляции Спирмена. При его вычислении необходимо ранжировать (упорядочить) варианты выборки. Ранжированием называется группировка экспериментальных данных в определенном порядке, либо по возрастанию, либо по убыванию. Проведение операции ранжирования осуществляется по следующему алгоритму: 1. Меньшему значению начисляется меньший ранг. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Наименьшему значению начисляется ранг равный 1. Например, если 72 n=7, то наибольшее значение получит ранг под номером 7, за исключением случаев, которые предусмотрены вторым правилом. 2. Если несколько значений равны, то им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. В качестве примера рассмотрим упорядоченную по возрастанию выборку, состоящую из 7 элементов: 22, 23, 25, 25, 25, 28, 30. Значения 22 и 23 встречаются по одному разу, поэтому их ранги соответственно равны R22=1, а R23=2. Значение 25 встречается 3 раза. Если бы эти значения не повторялись, то их ранги были бы равными 3, 4, 5. Поэтому их ранг R25 равен среднему арифметическому 3, 4 и 5: R25  3 4  5  4 . Значения 3 28 и 30 не повторяются, поэтому их ранги соответственно равны R28=6, а R30=7. Окончательно имеем следующее соответствие: элемент выборки 22 23 25 25 25 28 30 его ранг 1 3. 2 4 4 4 6 7 Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:  Ri  n( n  1) 2 , где n – общее количество ранжируемых значений. Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. В этом случае необходимо найти и исправить ошибку. Коэффициент ранговой корреляции Спирмена является методом, позволяющим определить силу и направленность взаимосвязи между двумя признаками или двумя иерархиями признаков. Применение коэффициента ранговой корреляции имеет ряд ограничений: а) предполагаемая корреляционная монотонный характер; 73 зависимость должна носить б) объем каждой выборки должен быть больше или равен 5. Для определения верхней границы выборки пользуются таблицами критических значений (таблица 9 Приложения). Максимальное значение n в таблице – 40; в) при проведении анализа вероятна возможность возникновения большого количества одинаковых рангов. В этом случае, необходимо вносить поправку. Наиболее благоприятным является случай, когда обе изучаемые выборки представляют собой две последовательности несовпадающих значений. Для проведения корреляционного анализа исследователь должен располагать двумя выборками, которые могут быть ранжированы, например: - два признака, измеренные в одной и той же группе испытуемых; - две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков; - две групповые иерархии признаков; - индивидуальная и групповая иерархии признаков. Расчет начинаем с ранжирования изучаемых показателей отдельно по каждому из признаков. Проведем анализ случая с двумя признаками, измеренными в одной и той же группе испытуемых. Сначала ранжируют индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если меньшим рангам одного показателя соответствуют меньшие ранги другого показателя, а большим рангам одного показателя соответствуют большие ранги другого показателя, то два признака связаны положительно. Если же большим рангам одного показателя соответствуют меньшие ранги другого показателя, то два признака связаны отрицательно. Для нахождения rs, определяем разности между рангами (d) по каждому испытуемому. Чем меньше разности между рангами, тем ближе коэффициент ранговой корреляции rs будет к «+1». Если взаимосвязь отсутствует, то между ними не будет никакого соответствия, следовательно, rs 74 окажется близким к нулю. Чем больше разности между рангами испытуемых по двум переменным, тем ближе к «-1» будет значение коэффициента rs. Таким образом, коэффициент ранговой корреляции Спирмена является мерой любой монотонной зависимости между двумя исследуемыми признаками. Рассмотрим случай с двумя индивидуальными иерархиями признаков, выявленными у двух испытуемых по одному и тому же набору признаков. В данной ситуации ранжируют индивидуальные значения, полученные каждым из двух испытуемым по определенной совокупности признаков. Признаку с самым низким значением необходимо присвоить первый ранг; признаку с более высоким значением – второй ранг и т.д. Следует обратить особое внимание на то, чтобы все признаки были измерены в одних и тех же единицах. Например, невозможно ранжировать показатели, если они выражены в различных по «цене» баллах, поскольку невозможно определить, какой из факторов будет занимать первое место по выраженности, пока все значения не будут приведены к единой шкале. Если признаки, имеющие низкие ранги у одного из испытуемых, также имеют низкие ранги у другого и наоборот, то индивидуальные иерархии связаны положительно. В случае с двумя групповыми иерархиями признаков, ранжируют среднегрупповые значения, полученные в двух группах испытуемых по одинаковому для исследуемых групп, набору признаков. Далее следует придерживаемся алгоритма, приведенного в предыдущих случаях. Проведем анализ случая с индивидуальной и групповой иерархией признаков. Начинают с того, что ранжируют отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, при исключении того испытуемого, который не участвует в среднегрупповой иерархии, так как с ней будет сопоставляться его индивидуальная иерархия. Ранговая корреляция позволяет оценить степень согласованности индивидуальной и групповой иерархии признаков. 75 Рассмотрим, как определяется значимость коэффициента корреляции в перечисленных выше случаях. В случае с двумя признаками она будет определяться объемом выборки. В случае с двумя индивидуальными иерархиями признаков значимость зависит от количества признаков, входящих в иерархию. В двух последних случаях значимость обуславливается числом изучаемых признаков, а не численностью групп. Таким образом, значимость rs во всех случаях определяется числом ранжированных значений n. При проверке статистической значимости rs пользуются таблицами критических значений коэффициента ранговой корреляции, составленных для различных количеств ранжируемых значений и разных уровней значимости. Если абсолютная величина rs, достигает критического значения или превышает его, то корреляция достоверна. При рассмотрении первого варианта (случай с двумя признаками, измеренными в одной и той же группе испытуемых) возможны следующие гипотезы. Н0: Корреляция между переменными x и y не отличается от нуля. Н1: Корреляция между переменными x и y достоверно отличается от нуля. Если мы работаем с любым из трех оставшихся случаев, то необходимо выдвинуть другую пару гипотез: Н0: Корреляция между иерархиями x и y не отличается от нуля. Н1: Корреляция между иерархиями x и y достоверно отличается от нуля. Последовательность действий при вычислении коэффициента ранговой корреляции Спирмена rs такова: - Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные x и y. - Ранжировать значения переменной x, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Поместить ранги в первую колонку таблицы по порядку номеров испытуемых или признаков. 76 Ранжировать значения переменной y. Поместить ранги во вторую - колонку таблицы по порядку номеров испытуемых или признаков. Вычислить разности d между рангами xи y по каждой строке - таблицы. Результаты поместить в следующую колонку таблицы. Вычислить - квадраты разностей (d2). Полученные значения поместить в четвертую колонку таблицы. - Вычислить сумму квадратов разностей ∑ d2. - При возникновении одинаковых рангов вычислить поправки: 1 Tx  (t x3  t x ) 2 1 T y  (t 3y  t y ) 2 где tx – объем каждой группы одинаковых рангов в выборке x; ty – объем каждой группы одинаковых рангов в выборке y. Вычислить коэффициент ранговой корреляции в зависимости от - наличия или отсутствия одинаковых рангов. При отсутствии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле: d i2  rs  1  6 2 n( n  1) При наличии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле: rs  1  6  d i2 n( n 2  1)  (Tx  T y ) где ∑d2 – сумма квадратов разностей между рангами; Tx и Ty – поправки на одинаковые ранги; n – количество испытуемых или признаков, участвовавших в ранжировании. - Определить по таблице 9 Приложения критические значения rs, для данного количества испытуемых n. Достоверное отличие от нуля коэффициента 77 корреляции будет наблюдаться при условии, если rs не меньше критического значения. 1.3.7. Изучение зависимости математического ожидания случайной величины от одной или нескольких других случайных величин (регрессия) При изучении корреляционной зависимости между переменными было отмечено, что коэффициент корреляции показывает степень связи, направление связи, форму связи между двумя исследуемыми выборками, но он не дает возможности определить как количественно меняется одна переменная с изменением другой. Для определения вида этой связи служит регрессионный анализ, который дает возможность прогнозирования значения одной (зависимой) переменной, отталкиваясь от значения другой (независимой) переменной. Регрессия – это зависимость среднего значения случайной величины У от величины Х и, наоборот, зависимость среднего значения случайной величины Х от величины У, описанная уравнением, полученная путем построения эмпирической или теоретической линии регрессии, и, наконец, с помощью вычисления коэффициентов регрессии. Регрессионный анализ устанавливает формы зависимости между случайной величиной У и значениями одной или нескольких переменных величин. Такая зависимость чаще всего определяется уравнением регрессии. Уравнения регрессии могут быть разных типов. Существует линейная и нелинейная взаимосвязь между исследуемыми показателями, следовательно, можно составить уравнение линейной или нелинейной регрессии. Регрессионный анализ используется для прогноза, анализа временных рядов, тестирования гипотез и выявления скрытых взаимосвязей в данных. Можно привести пример использования регрессионного анализа: необходимо изучить, как в пубертатный период изменится масса тела девочек или мальчиков, если рост их увеличится на 1 см. 78 Основной подходящей этап регрессионного регрессионной анализа модели, т.е. заключается математического в выборе выражения, связывающего значения зависимой случайной величины Y и значение независимой величины X. В простейшем случае предполагается линейная зависимость, выраженная уравнением Y  a  b X . b называют коэффициентом регрессии, а a – свободным членом уравнения регрессии. Параметр а является ординатой точки пересечения прямой с осью ординат, а параметр b – тангенсом угла наклона прямой относительно оси абсцисс. Регрессия, выраженная таким уравнением, называется простой линейной регрессией. Она описывает зависимость только от одной контролируемой переменной. Значения а и b вычисляются с помощью метода наименьших квадратов по формулам: n b n n n  xi yi  (  xi )(  yi ) i 1 i 1 n i 1 n n  x i  (  xi ) 2 i 1 ; 2 i 1 a  y  bx . Мерой точности предсказания значений случайной величины Y по заданным значениям величины X является стандартное отклонение значений yi от регрессионной прямой, которое по-иному называется стандартной ошибкой предсказания. Стандартная ошибка предсказания вычисляется с помощью следующего соотношения: S yx  n n n i 1 i 1 i 1  yi2  a  yi  b xi yi n2 . Если провести две прямые, отстоящие от регрессионной прямой на расстояние ±Syx, то они ограничат область около прямой регрессии, в которую с 79 вероятностью 0,7 попадают экспериментальные значения yi. Это означает, что приблизительно 70% всех значений yi находятся в этой области. Поскольку вычисляемый по данным исследования коэффициент регрессии является выборочным, то следует проверить его статистическую значимость. Это делается с помощью t-критерия Стьюдента, эмпирическое значение которого вычисляется с помощью соотношения n t эм п  Вычисленное b  xi2  nx эмпирическое i 1 S yx . значение критерия сравнивается с критическим (см. таблицу 3 Приложения) для числа степеней свободы ν=n-2 и уровне значимости α. Если tэмпtкр, то делается вывод о значимости линейной регрессии на уровне значимости α. Если же оказывается, что tэмп<tкр, то регрессии не значима. Вопросы по разделу 1 1. Перечислите основные точечные числовые характеристики выборки. 2. Дайте определение вариационного ряда. 3. Какая форма графического представления экспериментальных данных вам известна? 4. Как построить доверительные интервалы статистических характеристик? 5. Дайте определение статистической гипотезы. 6. Что понимается под уровнем значимости? 7. Для каких целей используется F-критерий Фишера? 8. Опишите алгоритм оценки достоверности различий средних двух связанных выборок. 9. Как определить достоверность различий средних двух несвязанных выборок? 80 10. Как оценить достоверность различий показателей двух групп связанных наблюдений с помощью критерия Вилкоксона? 11. Как определить достоверность различий показателей двух групп несвязанных наблюдений с помощью критерия Манна-Уитни? 12. Для каких целей используется корреляционное поле? 13. Как определить форму, направленность и степень взаимосвязи двух случайных величин? 14. Как рассчитать коэффициент корреляции Браве-Пирсона? 15. Как оценить достоверность коэффициента корреляции Браве- Пирсона? 16. Опишите алгоритм расчета рангового коэффициента корреляции Спирмена. 17. Как оценить достоверность коэффициента корреляции Спирмена? 18. Дайте определение регрессии. 19. Каков алгоритм вычисления коэффициентов линейной регрессии? 81 2. Статистический анализ данных при сравнении выбранной системы показателей испытуемых двух групп до проведения педагогического эксперимента и после его проведения В данном разделе показаны подходы к обработке и анализу одних и тех же данных методами параметрической и непараметрической статистик, которые реализуются в рамках ручного расчета по известным формулам статистики, расчета по программе MS Excel и по программе Statistica. 2.1. Постановка задачи Была поставлена задача улучшения скоростных характеристик в техническом действии «бросок с захватом ног». Для решения этой задачи была разработана новая методика тренировки. Для проверки ее эффективности был проведен эксперимент с двумя группами спортсменов, в котором контрольная группа тренировалась по традиционной методике, а экспериментальная – по новой. До и после проведения эксперимента проводились контрольные измерения, результаты которых приведены в таблице 2.1. Таблица 2.1 Результаты проверки скоростных характеристик в техническом действии «бросок с захватом ног» Номер испытуемого 1 2 3 4 5 6 7 8 9 Контрольная группа До После подготовки, с подготовки, с 2,12 2,11 2,01 2,01 1,93 1,94 1,97 1,98 2 1,99 2,03 2 1,96 1,95 1,94 1,96 2,01 2 82 Экспериментальная группа До После подготовки, с подготовки, с 2,01 1,9 2,11 1,94 1,9 1,7 1,98 1,88 1,94 1,86 1,89 1,8 2,14 1,96 2 1,8 1,95 1,82 10 11 12 13 14 15 16 17 18 19 20 Задача: 2,07 2,1 1,98 1,99 1,9 1,89 1,9 2,01 2,11 1,9 1,88 2,09 2,07 1,97 1,98 1,91 1,88 1,88 2 2,11 1,9 1,88 обосновать 1,97 1,88 1,93 1,95 1,89 2,07 2 1,98 1,89 2,1 2 целесообразность применения 1,89 1,8 1,84 1,82 1,86 1,9 1,89 1,87 1,82 1,98 1,8 предлагаемой методики тренировки. Для решения поставленной задачи сначала необходимо сравнить результаты спортсменов двух групп до проведения подготовки. Они не должны иметь статистически значимых различий. В противном случае проводимый эксперимент не будет корректным. После этого сопоставляются результаты спортсменов двух групп после проведения некоторого мезоцикла подготовки. Кроме того, необходимо проследить изменение показателей в каждой группе, дабы выяснить влияние проведенной подготовки на показываемые результаты. И только на основании анализа четырех проведенных сравнений сделать вывод об эффективности применения новой (экспериментальной) методики. Анализ имеющихся данных начнем с оценки однородности выборок. Если окажется, что выборки являются неоднородными, то следует проанализировать и выявить причины случившегося. Необходимо обеспечить однородность выборок для проведения педагогического эксперимента. Проводить педагогический эксперимент в случае, если исходные выборки являются неоднородными, нельзя. Для оценки однородности, учитывая непрерывный тип данных, вычислим сначала средние арифметические и стандартные отклонения, а затем – коэффициенты вариации. 83 Предварительно проиллюстрируем, как построить статистический ряд (эмпирическое распределение) и вычислить наиболее значимые точечные характеристики. Описательные статистические характеристики 2.2. 2.2.1. Расчет основных статистических характеристик и графический анализ результатов до начала тренировочного мезоцикла (на примере показателей контрольной группы) Условие задачи: 20 спортсменов выполняли упражнение «Бросок с захватом ног». Результаты времени выполнения упражнения Хi (с) занесены в таблицу 2.2. Таблица 2.2 Таблица исходных данных выборки № п/п 1 2 3 4 5 Хi, с 2,12 2,01 1,93 1,97 2 ранжированная 1,88 1,89 1,9 1,9 1,9 выборка 6 2,03 7 1,96 8 1,94 9 2,1 10 2,07 1,93 1,94 1,96 1,97 1,98 № п/п 11 12 13 14 15 16 17 18 19 20 Хi, с 2,1 1,98 1,99 1,9 1,89 1,9 2,01 2,11 1,9 1,88 ранжированная 1,99 2 2,01 2,01 2,03 2,07 2,1 2,1 2,11 2,12 выборка Определим число интервалов по формуле Стерджеса k  1  3,32  lg n  1  3,32  lg 20  1  3,32 1,3  5 . Определим шаг или ширину интервала h Округлим шаг X max  X min 2,12  1,88 0,24    0,048  0,05 . k 5 5 интервала в большую измеряемого показателя. 84 сторону до размерности Нижнюю границу первого интервала выберем равной минимальному значению выборки из ранжированного ряда, то есть X min  1,88 . Заполним таблицу по результатам выборки (см. таблицу 2.1), распределив их в интервалы, т.е. результаты измерений представим в виде вариационного ряда. В первый столбец таблицы впишем номера пяти интервалов. Во второй столбец – границы интервалов. Нижней границей первого интервала выбрали 1,88, прибавим к ней шаг и получим верхнюю границу первого интервала (1,88+0,05=1,93). Этот же результат является нижней границей следующего интервала (1,93+0,05=1,98) и т. д. Значение верхней границы последнего интервала 2,13 больше максимального значения показателей выборки 2,12. Третий столбец – срединные значения интервалов. Середина интервала является средним арифметическим значением его границ. Середину первого интервала можно определить также прибавлением к нижней границе интервала половины шага: 1,88  0,05  1,88  0,025  1,905. 2 Середины следующих интервалов получим прибавлением шага интервала к предыдущим серединам интервалов: 1,905 + 0,05 = 1,955; 1,955 + 0,05 = 2,005 и т.д. Четвертый столбец – частота (ni), т. е. количество значений из ранжированного ряда, попавших в заданный интервал. Если результат оказался границей интервала, то он учитывается один раз в верхнем интервале. Пятый столбец – накопленная частота, рассчитывается суммированием частот предыдущих интервалов. В последней строке столбца 4 получилось число, равное объему выборки (20). Шестой столбец – частость (рi*) рассчитывается делением частоты на объём выборки. Седьмой столбец – накопленная частость получается суммированием частостей предыдущих интервалов. В последней строке столбца 7 получилась единица. 85 Распределение измерений, представленное в столбцах 2 (границы интервалов) и 4 (частота) или 2 (границы интервалов) и 6 (частость), называется вариационным рядом. Напомним, что интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины. Представим результаты измерений в виде вариационного ряда (таблица 2.3). Таблица 2.3 Результаты измерений, представленные в виде вариационного ряда № инте рвал а Границы интервала Срединное значение интервала Частота ni Накопленная частота Частость рi* Накопленная частость 1 1 2 3 4 5 2 1,88 – 1,93 1,93 – 1,98 1,98 – 2,03 2,03 – 2,08 2,08 – 2,13 3 1,905 1,955 2,005 2,055 2,105 4 5 4 5 2 4 5 5 9(5+4) 14(9+5) 16(14+2) 20(16+4) 6 5/20 4/20 5/20 2/20 4/20 7 5/20 9/20 14/20 16/20 20/20=1 Графическое представление вариационного ряда представим гистограммой (рис. 2.1) Для построения гистограммы по оси абсцисс отложим границы интервалов и на них восстановим прямоугольники до уровня частот, соответствующих интервалам, отложенных по оси ординат (рис. 2.1). 86 Рис 2.1. Гистограмма распределения результатов Площадь гистограммы равна сумме всех частот, т. е. объёму выборки (20), или сумме частостей, т. е. единице. Далее проведём расчёт основных статистических показателей ряда измерений, он сводится к расчёту характеристик положения, характеристик рассеяния результатов измерений и характеристик формы распределения. Точечные оценки Для расчета основных статистических характеристик будем применять формулы для данных сгруппированных в интервалы, которые удобнее в расчётах (хотя больше погрешностей в расчетах). Характеристики положения:  Среднее арифметическое значение (среднее значение) k X n x i i i 1 n  5 1,905  4 1,955  5  2,005  2  2,055  4  2,105 39,9   1,995  2 , 20 20 где n- объем выборки, k – число интервалов группировки, ni – частоты интервалов, 87 xi – срединные значения интервалов.  Мода Соглашения об использовании моды: 1. Когда все значения в группе встречаются одинаково часто, принято считать, что группа оценок не имеет моды. 2. Когда два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений. 3. Если два несмежных значения в группе имеют равные частоты и они больше частот любого значения, то существуют две моды, в таком случае говорят, что группа оценок является бимодальной. Mo1  xMoH  h nMo  nMо 1 50  1,88  0,05  1,92. nMo  nMo1   nMo  nMo1  5  0  5  4 Mo2  xMoH  h nMo  nMо 1 54  1,98  0,05  1,99. nMo  nMo1   nMo  nMo1  5  4  5  2 где xMoH - нижняя граница модального интервала. В нашем примере модальными являются первый и третий интервалы (таблица 2.3), т.к. модальным называется интервал группировки с наибольшей частотой. Тогда нижняя граница первого модального интервала 1,88, а второго 1,98. h - ширина интервала группировки, nMo - частота модального интервала, т.е. частота первого и третьего интервала 5, nMo1 - частота интервала, предшествующего модальному, nMo1 - частота интервала, последующего за модальным.  Медиана Me  xMeН  h 0,5n  nxMe 1 0,5  20  9  1,98  0,05  1,99 . nMe 5 где xMeН - нижняя граница медианного интервала. 88 В нашем примере медианным является третий интервал, т.к. медианным называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/2) или накопленная частость окажется больше 0,5. Половина объема выборки 20/2=10, именно в третьем интервале накопленная частота впервые оказалась больше 10, т.е. 14, а накопленная частость 14/20 = 0,7 (больше 0,5). h – ширина интервала группировки, 0,5n – половина объёма выборки (10), nMе – частота медианного интервала (5), nxMе1 – накопленная частота интервала, предшествующего медианному (9). Характеристики рассеяния результатов измерений:  Размах вариации R = Xmax - Xmin = 2,12 – 1,88 = 0,24.  Дисперсия Для данных, сгруппированных в интервалы, дисперсия определяется по формуле: k  n ( хi  х)  2  i 1 2 i  n 1 2 2 2 2 5  1,905  2  4  1,955  2   5  2,005  2   2  2,055  2   4  (2,105  2) 2   0,005 20  1 где хi – среднее значение i-того интервала группировки; ni – частоты интервалов.  Среднеквадратическое отклонение (стандартное отклонение) Для данных, сгруппированных в интервалы, стандартное отклонение определяется по формуле: 89 k  n ( xi  x)   i 1 2 i  0,005  0,071, n 1  Ошибка средней арифметической (ошибка средней) mx   n 0,071  0,016 . 20   Коэффициент вариации V  0,071  100%   100%  3,6% . 2 x Вывод: так как коэффициент вариации не превышает 10% (V < 10%), выборка считается однородной. Характеристики формы распределения:  Коэффициент асимметрии (во избежание погрешностей в расчёте используем формулу для не сгруппированных данных) k A  ( x  x) i 1 3 i n 3 Для упрощения расчётов воспользуемся вспомогательной таблицей 2.4, из которой сумму 4 столбца подставим в числитель формулы коэффициента асимметрии. Таблица 2.4 Вспомогательная таблица для вычисления коэффициента асимметрии № п/п 1 1 2 3 4 5 6 7 8 9 x (с) i xi  x 2 2,12 2,01 1,93 1,97 2 2,03 1,96 1,94 2,1 3 0,1305 0,0205 -0,0595 -0,0195 0,0105 0,0405 -0,0295 -0,0495 0,1105 90 xi  x 3 4 0,00222 0,0000086 -0,00021 -0,0000074 0,0000012 0,000066 -0,000026 -0,00012 0,0013 10 11 12 13 14 15 16 17 18 19 20 2,07 2,1 1,98 1,99 1,9 1,89 1,9 2,01 2,11 1,9 1,88 0,0805 0,1105 -0,0095 0,0005 -0,0895 -0,0995 -0,0895 0,0205 0,1205 -0,0895 -0,1095 0,00052 0,0013 -0,0000009 0,0000000001 -0,0007 -0,00099 -0,00072 0,0000086 0,0017 -0,00072 -0,0013 ∑=0,0025 X  1,99 A 0,0025  0,3 20  0,0713 Знак коэффициента асимметрии положительный, следовательно, у рассматриваемого эмпирического распределения наблюдается левосторонняя (положительная) асимметрия.  Эксцесс для сгруппированных данных k Ex  i 1 i i n 4 4 3  5  1,905  2  4  1,955  2  5  2,005  2  2  2,055  2  4  (2,105  2) 4  3  1,1 20  0,0052 4   n ( x  x) 4 4 4 где ni - частоты интервалов группировки; хi - срединное значение интервала группировки; σ - среднеквадратическое отклонение. Знак эксцесса отрицательный, следовательно, у рассматриваемого эмпирического распределения наблюдается тенденция к плосковершинности. 91 2.2.2. Расчет основных статистических характеристик с помощью программы MS Excel Для работы в программе MS Excel необходимо запустить программу и ввести исходные данные (рис. 2.2). Рис 2.2. Исходные данные в программе Excel Рассчитать статистические характеристики в программе можно двумя способами: 1. Используя встроенные функции программы MS Excel. Это можно осуществить тремя вариантами: вводя название нужных функций с помощью клавиатуры, с помощью инструмента Мастер функций вкладки Формулы или же с помощью блока Библиотека функций этой же вкладки (рис. 2.3): 92 Рис 2.3. Вызов статистических функций с использованием Библиотеки функций  В ячейках А22, А23 и т.д. ввести названия статистических характеристик (среднее, стандартное отклонение и т.д.), выделить текущую ячейку для ввода соответствующей формулы (например, В22).  Вызвать Мастер функций можно щелчком по кнопке fx в строке формул или на ленте на вкладке Формулы из Библиотеки функций выбрать категорию Статистические и нужную функцию (рис. 2.4). Рис 2.4. Вызов Мастера функций  В окне Мастера функций выбрать категорию Статистические и нужную функцию (например, Срзнач), ОК (рис. 2.5). 93 Рис 2.5. Вызов функции СРЗНАЧ  В следующем окне необходимо указать интервал ячеек с исходными данными (В1:В21), ОК.  Аналогично можно рассчитать и другие функции. Для организации вычислений в других столбцах можно скопировать формулы из соответствующих ячеек с формулами. В результате получим следующую таблицу 2.5. Таблица 2.5 Результаты вычислений с помощью Мастера функций К до К после Э до Э после Среднее 1,99 1,98 1,98 1,86 Стандартное отклонение 0,07 0,07 0,08 0,07 2. С помощью надстройки программы Анализ данных: 2.3. Вызвать Анализ данных можно щелкнуть по кнопке Office в правом верхнем углу окна программы, далее щелкнуть по кнопке Параметры Excel. 2.4. В открывшемся окне слева выбрать пункт Надстройки, в поле Управление выбрать Надстройки Excel, щелкнуть кнопку Перейти, в следующем окне включить Пакет анализа и ОК. 94 2.5. Далее на ленте на вкладке Данные вызвать Анализ данных, выбрать Описательная статистика, ОК (рис. 2.6). Рис 2.6. Вызов Описательной статистики с использованием Анализа данных 3. В следующем окне необходимо задать параметры для расчетов (рис. 2.7) Рис. 2.7. Окно ввода исходных параметров для расчета описательной статистики В поле Входной интервал указать область с исходными данными ($B$1:$B$21), включить параметр Метки в первой строке (обозначение столбцов), Итоговая статистика и указать выходной интервал для размещения результатов вычислений (например, ячейка $A$22, можно результаты разместить на новом рабочем листе или новом файле). После незначительного форматирования показаны в таблице 2.6. 95 результаты вычислений Таблица 2.6 Результаты вычислений основных статистических характеристик Среднее Стандартная ошибка Медиана Мода Стандартное отклонение Дисперсия выборки Эксцесс Асимметричность Интервал Минимум Максимум Сумма Счет К до К после 1,985 1,981 Э до 1,979 Э после 1,857 0,017 1,985 2,010 0,016 1,980 2,000 0,017 1,975 1,890 0,015 1,860 1,800 0,075 0,073 0,077 0,065 0,005 0,006 -0,575 -0,349 0,365 0,656 0,230 0,260 1,880 1,880 2,110 2,140 39,610 39,580 20,000 20,000 0,004 0,616 -0,183 0,280 1,700 1,980 37,130 20,000 0,006 -0,801 0,358 0,240 1,880 2,120 39,700 20,000 Исходя из полученных данных, вычислим коэффициенты вариации V. В программе Excel отсутствуют встроенные возможности для расчета коэффициента вариации. Формула для расчета коэффициента вариации достаточно простая и несложно ввести эту формулу прямо в ячейку. Для этого:  Выделить ячейку, в которой должен быть результат вычислений (В25), ввести соответствующую формулу (=В24/В23*100%) и скопировать эту формулу в ячейки слева для расчетов по другим столбцам (рис. 2.8). Рис. 2.8. Формулы для вычислений в программе Excel 96  Получим следующую таблицу 2.7 с результатами Таблица 2.7 Результаты вычислений по формулам Среднее Стандартное отклонение коэффициент вариации Как видно из 1,99 1,98 1,98 1,86 0,07 0,07 0,08 0,07 3,76 3,67 3,91 3,52 представленных результатов, выборки являются однородными (V<10%). 2.2.3. Расчет основных статистических характеристик с помощью программы STATISTICA Ниже будет рассматриваться 10-я русифицированная версия программы STATISTICA. В скобках будут приводиться англоязычные названия, которые соответствуют и более ранним версиям программы. Проведение вычислений в программе STATISTICA начинается, как и при работе с другими приложениями, с подготовки данных. Рабочее окно программы STATISTICA похоже на окна всех Windows-приложений (см. рис. 2.9). Рис. 2.9. Внешний вид рабочего окна STATISTICA 97 В левом верхнем углу окна находится заголовок в формате «Statistica – Имя файла.sta (размер таблицы)». Ниже следует строка основного меню, ряд пунктов которого является стандартным для Windows-приложений: Файл (File), Правка (Edit), Вид (View), Вставка (Insert), Формат (Format), Сервис (Tools), Окно (Window), Справка (Help). Имеются, однако, и специфические разделы – Анализ (Statistics), Графика (Graphs), Данные (Data). Под строкой меню располагается настраиваемая пользователем панель инструментов и рабочая область, занимающая основную часть окна программы. Анализируемые данные хранятся в STATISTICA в виде электронной таблицы, подобно тому, как это происходит, например, в программе MS Excel. Однако таблица с данными в STATISTICA, которая носит название Spreadsheet, имеет свои особенности. В отличие от обычных электронных таблиц, в которых столбцы и строки равноправны, в таблице программы STATISTICA столбцы называются Переменные (Variables), а строки – Наблюдения (Cases). В качестве переменных выступают исследуемые признаки (например, время, скорость, число набранных очков и т.д.). Под наблюдениями же понимаются конкретные значения, которые принимают переменные. Следует отметить, что программа STATISTICA может обрабатывать не только числовые, но и текстовые данные, что очень удобно при работе с качественными признаками. Кроме того, таблицы Spreadsheet поддерживают различные стандартные операции с ячейками, такие как выделение и перетаскивание диапазона, автозамена, копирование/вставка, импорт из других приложений (например, из MS Excel, Access) и др. Создание и сохранение файлов Для начала работы запустите программу STATISTICA (из меню Windows «Пуск» или кликнув по соответствующему ярлыку на Рабочем столе). По умолчанию откроется последний файл, с которым выполнялась работа в ходе 98 предыдущего сеанса (если таковой имеется). Закройте этот файл и создайте новый. Для этого можно воспользоваться одним из трех способов:  В пункте основного меню Файл (File) выбрать Создать (New);  Нажать кнопку «Создать» на панели инструментов;  Применить сочетание клавиш «Ctrl + N». В результате появится диалоговое окно создания нового документа (Createnewdocument); рис. 2.10, в котором необходимо указать, какой именно документ создается. Рис. 2.10. Диалоговое окно создания нового документа Для проведения вычислений создадим новую таблицу с данными, поэтому останемся на закладке «Таблица» (Spreadsheet), которая по умолчанию предстает перед пользователем первой. В рассматриваемом случае необходима таблица, состоящая из 4 столбцов и 20 строк. Чтобы сообщить об этом 99 программе, в поле Число переменных (Numberofvariables) выставим 4, а в поле Число наблюдений (Numberofcases) – 20. Остальные опции этой закладки оставим без изменений (поле Расположить (Placement): в отдельном окне (As a stand-alonewindow)). После нажатия кнопки ОК (или клавиши «Ввод» на клавиатуре) в рабочей области программы появится таблица с 4 столбцами и 20 строками. Сохраним созданный файл. Для этого можно воспользоваться тремя способами:  В пункте основного меню Файл (File) выбрать Сохранить (Save);  Нажать кнопку Сохранитьна панели инструментов;  Применить сочетание клавиш «Ctrl + S». При этом появится стандартное для Windows диалоговое окно, в котором необходимо указать имя нового файла, а также место, в котором он будет храниться. Введем числа и опять сохраним таблицу. Дважды кликнув по клетке с названием («1 пер1» и т.д.), введем названия анализируемых переменных. Условимся использовать следующие обозначения: «К до», «К после», «Э до», «Э после» для четырех колонок исходных данных таблицы 2.1. Расчет параметров описательной статистики Вычисление STATISTICA параметров осуществляется описательной при помощи статистики модуля в программе Descriptivestatistics (Описательная статистика). Для его запуска выполните одно из следующих действий1:  Выберете пункт Анализ (Statistics) основного меню и в раскрывающемся списке (рис. 2.11) выберете пункт Основные статистики и таблицы (Basicstatistics/Tables). Примечание: любой анализ в программе STATISTICA можно запустить, только если предварительно был открыт файл с данными. 1 100 Рис. 2.11. Основные статистики и таблицы  В появившемся окне (рис. 2.12) дважды кликните по пункту Описательные статистики (Descriptivestatistics). Рис. 2.12. Выбор модуля описательной статистики В результате появится окно модуля описательной статистики (см. рис. 2.13). 101 Рис. 2.13. Окно Описательные статистики, закладка Быстрый (Quick) В диалоговом окне модуля описательной статистики (Descriptivestatistics) (рис. 2.13) присутствует ряд элементов, встречающиеся в большинстве модулей программы:  кнопка Переменные (Variables), с помощью которой выбираются анализируемые переменные;  кнопка Ок – выводит результаты анализа;  кнопка Опции (Options) – позволяет настроить внешний вид программы и окон вывода результатов анализа;  стандартная для Windows кнопка Cancel (Отмена). Для определения переменных нажмем кнопку Переменные (Variables) и в появившемся окне выберем нужные переменные из списка (см. рис. 2.14) 102 Рис. 2.14. Выбор переменных для анализа Окно описательных статистик имеет несколько закладок. По умолчанию перед пользователем первой предстает закладка Быстрый (Quick). Находясь на ней, можно выполнить следующие операции:  Рассчитать показатели описательной статистики – кнопка Подробные описательные статистики (Summary:Descriptivestatistics). Перечень рассчитываемых показателей определяется настройками, заданными на другой закладке окна – Дополнительно (Advanced).  Получить таблицу частот встречаемости каждого значения анализируемой переменной – кнопка Таблица частот (Frequencytables);  Построить частотное распределение значений анализируемой переменной в виде гистограммы – кнопка Гистограммы (Histograms). Автоматически вместе с гистограммой программа нарисует теоретически ожидаемую нормальную кривую, глядя на которую можно заключить, подчиняются ли анализируемые данные нормальному закону распределения.  Построить для выбранной переменной (или для нескольких переменных одновременно) т.н. диаграмму размаха – кнопка Диаграмма размаха для всех переменных (Box&whiskerplotforallvariables). 103 Для определения списка показателей описательной статистики, подлежащих определению, следует воспользоваться второй закладкой модуля – Дополнительно (Advanced) (рис. 2.15). Рис. 2.15. Окно модуля Описательные статистики (DescriptiveStatistics), закладка Дополнительно (Advanced) Основную часть этой закладки занимает список статистических показателей:  N набл. (Valid N) – объем выборки;  процент годных наблюдений;  Среднее (Mean) – арифметическая средняя;  Сумма (Sum) – сумма значений анализируемой переменной;  Медиана (Median);  Мода (Mode);  Геометр. среднее (Geom. mean) – геометрическое среднее;  Гармонич. среднееHarm. mean) – гармоническое среднее;  Стандартное отклонение (StandardDeviation);  Доверительный интервал стандартного отклонения; 104  Коэффициент вариации  Дисперсия(Variance);  Стандартная ошибка среднего (Std. err. ofmean);  Доверительный интервал среднего (Conf. limitsformeans:Interval %);  Асимметрия (Skewness);  Станд. ош. симметрии Std. err., Skewness) – стандартная ошибка асимметрии;  Эксцесс (Kurtosis);  Станд. ош. Эксцесса (Std. err., Kurtosis) – стандартная ошибка эксцесса;  Минимум и максимум (Minimum&maximum);  Нижний и верхний квартили (Lower&upperquartiles);  Границыпроцентилей (Perсentile boundaries: First & Second);  Размах (Range);  Квартильный размах (Quartilerange).  На закладке Дополнительно (Advanced) имеются также следующие кнопки:  Выбрать все (Selectallstats) – позволяет выбрать для расчета сразу все имеющиеся статистические показателей;  Сброс (Reset) – сброс «галочек» у всех показателей;  Сохранить как умолчания (Savesettingsasdefault) – используя эту кнопку, можно сохранить определенный набор показателей, которые программа будет предлагать для расчета по умолчанию при каждом запуске модуля. Для расчета средних арифметических, стандартных отклонений и коэффициентов вариаций выбираем вкладку Дополнительноставим «галочки» в этих позициях Среднее, Стандартное отклонение, Коэффициент вариации и нажимаем кнопку Подробные описательные статистики или Ок (Summary). В итоге программа создаст рабочую книгу, содержащую таблицу с результатами расчета отмеченных характеристик (см. рис. 2.16). 105 Описательные статистики (зависимые) Переменная Среднее Ст.откл. Коэф.Вар. К до 1,985 0,075 3,765 К после 1,981 0,073 3,672 Э до 1,979 0,077 3,910 Э после 1,857 0,065 3,523 Рис. 2.16. Расчет средних арифметических и стандартных отклонений Полученные результаты позволяют сделать вывод об однородности выборок, поскольку коэффициент вариации для каждой из них оказался меньше 10%. Следует отметить, что в более ранних версиях программы вычисления коэффициента вариации не предусмотрено. Поэтому приходилось вычислять его по найденным значениям среднего арифметического и стандартного отклонения. 106 Исследование исходных данных в выборках 2.3. на нормальность их распределения В дальнейшем анализ можно выполнять двумя способами, используя параметрические или же непараметрические критерии. Критерии, включающие в формулу расчёта параметры распределения, то есть средние и дисперсии (t-критерий Стьюдента, F критерий Фишера и др.) называются параметрическими критериями. Критерии, не включающие в формулу расчёта параметров распределения и основанные на оперировании частотами и рангами (Q критерий Розенбаума, Т критерий Вилкоксона, критерий U Манна-Уитни и др.) называются непараметрическими критериями. При использовании параметрических критериев необходимо сначала проверить выборки на нормальность распределения данных в них. 2.3.1. Проверка на нормальность Для оценки эмпирического распределения на нормальность существует несколько разновидностей, так называемых, критериев согласия (критерий согласия χ2 (хи-квадрат), критерий λ Колмогорова-Смирнова, критерий W Шапиро-Уилки вычислительной и др.). Однако они требуют работы, поэтому целесообразно достаточно большой перед как тем, их использовать, проверить с помощью более простых методов соответствие экспериментальных данных нормальному распределению. Эти методы обладают меньшей мощностью и позволяют установить только значительные расхождения с нормальным распределением. В том случае, если такие расхождения будут установлены, то необходимость в применении более точных, но более сложных критериев отпадает. Для предварительной нормальность можно проверки использовать эмпирического основные распределения свойства на нормального распределения, изложенные 1.2.2. При этом эмпирическое распределение 107 представляется в виде вариационного ряда или гистограммы. В качестве параметров μ и σ нормального распределения примем их выборочные оценки х и σв, тогда для проверки можно использовать следующие свойства нормального распределения:  практически все отклонения от среднего значения (99,7%) должны быть меньше ± 3σв;  примерно 2/3 всех отклонений (68,3%) должны быть меньше ± σв;  половина всех отклонений от среднего значения должны быть меньше ± 0,657σв;  среднее арифметическое, мода и медиана равны друг другу;  коэффициенты асимметрии и эксцесса равны нулю. Нормальность эмпирического распределения можно проверить также путём расчёта показателей асимметрии и эксцесса двумя наиболее простыми способами: 1. Сравнением показателей асимметрии и эксцесса со своей ошибкой репрезентативности по Н.А. Плохинскому. 2. Сравнением эмпирических значений показателей асимметрии и эксцесса с критическими по Е.И. Пустыльнику. Произведем необходимые расчеты на примере проверки скоростных характеристик в техническом действии «бросок с захватом ног» для контрольной группы до мезацикла (см. таблицы 2.1 и 2.2). Для расчётов воспользуемся данными, полученными в раздел 2.2.1: X  1,99;   0,071; А  0,3; Ех  1,1. Первый способ. Ошибки репрезентативности показателей определяются по следующим формулам: mA  6 6   0,55 n 20 108 асимметрии и эксцесса mE  2  6 6  2  1,1 n 20 Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз: tA  tE  A 3 mA E 3 mE В данном случае: tA  0,3 0,55 tE   0,55  1,1 1,1 1 Мы видим, что оба показателя не превышают в три раза свою ошибку репрезентативности, из чего мы можем заключить, что распределение данного признака не отличается от нормального. Второй способ Расчеты проводятся по следующему алгоритму:  определим показатели асимметрии и эксцесса;  рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Пустыльника и сопоставим с ними полученные эмпирические значения;  если эмпирические значения показателей окажутся ниже критических, сделаем вывод о том, что распределение признака не отличается от нормального. Рассчитаем критические значения для показателей асимметрии и эксцесса: 109 Aкр  3  Eкр  5  6  (n  1) (n  1)  (n  3) 24  n  (n  2)  (n  3) (n  1) 2  (n  3)  (n  5) где n– количество наблюдений. В данном случае: Aкр  3  Eкр  5  6  (20  1) 114  3  1,46 (20  1)  (20  3) 483 24  20  (20  2)  (20  3) 146880  5  3,8 2 (20  1)  (20  3)  (20  5) 253575 Aэмп  0,3 Aэм п < Aкр Eэмп  1,1 Eэм п < Eкр Итак, оба варианта проверки и по Н.А. Плохинскому, и по Е.И. Пустыльнику, дают один и тот же результат: распределение результативного признака в данном примере не отличается от нормального распределения. Критерий W Шапиро-Уилки Рассмотрим применение критерия W Шапиро-Уилки для оценки соответствия эмпирического распределения нормальному распределению на примере проверки скоростных характеристик в техническом действии «бросок с захватом ног» для контрольной группы до тренировочного цикла. Порядок применения: 1. Формулируем гипотезу Н0 о том, что выборка исходных данных подчиняется нормальному закону распределения. Выберем уровень значимости 0,05. 2. Имеем выборку объема n = 20 независимых измерений (таблица 2.2). 3. Рассчитываем значение выборочной дисперсии: σ2 = 0,005 (см. раздел 2.2.1.). 110 4. Заносим ранжированную выборку из таблицы 2.2 в первый столбец таблицы 2.8. 5. Рассчитываем разности ∆k, для чего из максимального значения xn вычитаем минимальное x1, затем из xn-1 вычитаем x2 и т.д. Причём, если n – чётное число, то число разностей k = n/2. Если же n – нечётное число, то k n 1 , при этом центральный показатель выборки не участвует в 2 образовании разностей. Номера разностей k заносим в третий столбец таблицы, а результаты самих разностей ∆k – в четвёртый столбец таблицы. 6. По таблице 5 Приложения находим значения коэффициентов ank критерия W Шапиро-Уилки, соответствующие объёму выборки n = 20 и номерам разностей k. Заносим эти значения в столбец 5 таблицы 2.8. 7. Рассчитываем произведения ank∆k и заносим их в столбец 6 таблицы 2.8. k 8. Вычисляем величину b   ank   k  0,33134 . i 1 9. Рассчитываем значение критерия W по формуле: W b2 0,33134 2   1,16 (n  1) 2 (20  1)  0,005 Таблица 2.8 Расчет критерия W Шапиро-Уилки № п/п 1 1 2 3 4 5 6 7 8 хi (с) k ∆k ank ank∆k 2 1,88 1,89 1,9 1,9 1,9 1,93 1,94 1,96 3 1 2 3 4 5 6 7 8 4 0,24 0,22 0,2 0,2 0,17 0,1 0,07 0,05 5 0,4734 0,3211 0,2565 0,2085 0,1686 0,1334 0,1013 0,0711 6 0,1136 0,0706 0,0513 0,0417 0,0287 0,0133 0,0071 0,0036 111 9 10 11 12 13 14 15 16 17 18 19 20 1,97 1,98 1,99 2 2,01 2,01 2,03 2,07 2,1 2,1 2,11 2,12 9 10 0,03 0,01 Сумма 0,0422 0,0140 0,0013 0,00014 b=0,33134 10. Из таблицы 5а Приложения находим критическое значение критерия Шапиро-Уилки для уровня значимости α = 0,05: W0,05= 0,905. 11. Вывод: поскольку W>W0,05, то принимаем гипотезу Н0 и считаем, что выборка подчиняется нормальному закону распределения на уровне значимости 0,05. Заметим, что для критерия Шапиро-Уилки в отличие от других критериев, гипотеза Н0 принимается при W>Wα. Аналогично проверяются контрольная группа после цикла интенсивных тренировок и экспериментальная группа до и после тренировочного цикла. 2.3.2. Проверка выборки на нормальность с помощью программы STATISTICA Наиболее предпочтительным, особенно при небольших выборках, является использование W-критерия Шапиро-Уилка, поскольку он обладает наибольшей мощностью в сравнении со всеми другими критериями (т.е. чаще выявляет различия между распределениями в тех случаях, когда они действительно есть). Тест проверяет нулевую гипотезу об отсутствии различий между наблюдаемым распределением признака и теоретическим ожидаемым нормальным распределением. Если W статистика значима (p<0,05), то гипотеза 112 о нормальном распределении значений переменной отвергается (и принимается при p>0,05). W-тест Шапиро-Уилка можно найти в модуле Описательные статистики (Descriptivestatistics). Для доступа к нему выберете пункт Анализ (Statistics) основного меню и в раскрывающемся списке выберете пункт Основные статистики и таблицы (Basicstatistics/Tables) (см. рис. 2.11). В появившемся окне (рис. 2.12) дважды кликните по пункту Описательные статистики (Descriptivestatistics). После запуска этого модуля необходимо открыть закладку Нормальность (Normality) и в группе Распределение (Distribution) выбрать опции Критерий Шапиро-Уилка (Shapiro-Wilk’s W test), как это показано на рис. 2.17. Рис. 2.17. Окно Описательные статистики, закладка Нормальность (Normality) Для выбора теста достаточно поставить флажок рядом с его названием. После выбора анализируемой переменной (кнопка Переменные/Variables) и нажатия кнопки Гистограмма (Histograms) программа создаст гистограмму распределения значений признака и ожидаемую нормальную кривую (рис. 2.18). Результаты выбранных тестов на нормальность автоматически располагаются в заголовке этого графика. При p> 0,05 можно заключить, что 113 анализируемое распределение не отличается от нормального (W-критерий Шапиро-Уилка строится таким образом, что нулевая гипотеза о соответствии исследуемого закона распределения нормальному принимается при p> 0,05, в отличие от большинства критериев, для которых нулевая гипотеза H0 принимается при p < 0,05). Гистограм.: К до Шапиро-Уилка W=,93890, p=,22859 Ожидаемое нормальное 6 5 Число набл. 4 3 2 1 0 1,85 1,90 1,95 2,00 2,05 2,10 Верхние границы (x <= граница) 2,15 Р Рис. 2.18. Гистограмма и результаты W-теста Шапиро-Уилка В случае контрольной группой до проведения подготовки для теста Шапиро-Уилка получаем p = 0,22859 (рис. 2.18), что позволяет сделать вывод о соответствии распределения вариант выборки нормальному закону распределения. Аналогичным образом следует убедиться в нормальности остальных выборок. Если все они соответствуют нормальному закону распределения, то в дальнейшем можно использовать параметрические методы, а если не 114 соответствуют, то непараметрические. В рассматриваемом случае вычисления свидетельствуют о соответствии выборок нормальному закону распределения. Учитывая, что все выборки можно считать нормальными, начнем с использования параметрических методов. Сравнение независимых выборок 2.4. 2.4.1. Сравнение средних арифметических двух независимых (несвязанных) выборок по t-критерию Стьюдента Рассмотрим порядок применения критерия Стьюдента для сравнения двух независимых выборок по средним арифметическим (см. раздел 1.2.4) на примере сравнения результатов скоростных характеристик «броска с захватом ног» у спортсменов контрольной Xi и экспериментальной Yi групп до и после цикла интенсивных тренировок. Пример Сравним результаты скоростных характеристик «броска с захватом ног» у спортсменов контрольной Xi и экспериментальной Yi групп до мезоцикла тренировок (таблица 2.9). Таблица 2.9 Результаты скоростных характеристик «броска с захватом ног» контрольной и экспериментальной групп до мезоцикла тренировок № п/п Xi, с Yi, с 1 2,12 2,01 2 2,01 2,11 3 1,93 1,9 4 1,97 1,98 5 2 1,94 6 2,03 1,89 7 1,96 2,14 8 1,94 2 9 2,01 1,95 115 10 2,07 1,97 11 2,1 1,88 12 1,98 1,93 13 1,99 1,95 14 1,9 1,89 15 1,89 2,07 16 1,9 2 17 2,01 1,98 18 2,11 1,89 19 1,9 2,1 20 1,88 2 X =1,99 Y = 1,98  х = 0,071  y = 0,077 1. Предположим, что средние результаты не отличаются (гипотеза Н0): X=Y. 2. Вычислим средние арифметические значения и стандартные отклонения двух выборок (см. раздел 2.2.1) и занесем их в таблицу 2.9: X =1,99; Y = 1,98;  х = 0,071;  y = 0,077. 3. Применим F-критерий для проверки равенства дисперсий двух выборок:  предположим, что дисперсии двух выборок равны между собой (гипотеза Н0):  х2 =  y2 ;  Fрасч   y2 0,0059   1,18 (т.к. вторая выборка имеет бóльшую дисперсию,  x2 0,005 то её значение подставим в числитель);  из таблицы Fкрит  3,00 (таблица 2 Приложения) для уровня значимости α = 0,01, числа степеней свободы  1  nх  1  20  1  19 (бóльшая дисперсия),  2  nу  1  20  1  19 (меньшая дисперсия); 116  так как Fрасч < Fкрит (1,18<3,00), то гипотеза Н0 принимается с вероятностью q=1- α=1-0,01 = 0,99. Вывод: дисперсии двух выборок равны. Это позволяет нам выбрать формулу для расчета критерия Стьюдента (см. раздел 1.2.4.). 4. Вычислим t-критерий Стьюдента: X Y t расч   12   22 1,99  1,98  20  0,43 . 0,005  0,0059  n 5. Выбираем уровень значимости α = 0,05, число степеней свободы   n1  n2  2 =20+20-2=38. Находим по таблице 3 Приложения критическое значение критерия Стьюдента для α = 0,05 и   38 t крит = 2,02. 6. t расч < t крит (0,43<2,02), гипотеза о равенстве средних арифметических (Н0: X = Y ) принимается с вероятностью q=1 – 0,05=0,95. Вывод: результаты времени выполнения «броска с захватом ног» спортсменов контрольной и экспериментальной групп не различаются. Пример Сравним результаты скоростных характеристик «броска с захватом ног» у спортсменов контрольной Xi и экспериментальной Yi групп после мезацикла тренировок (таблица 2.10). Таблица 2.10 Результаты скоростных характеристик «броска с захватом ног» спортсменов контрольной и экспериментальной групп после мезацикла тренировок № п/п Xi, с Yi, с 1 2,11 1,9 2 2,01 1,94 3 1,94 1,7 4 1,98 1,88 5 1,99 1,86 6 2 1,8 117 7 1,95 1,96 8 1,96 1,8 9 2 1,82 10 2,09 1,89 11 2,07 1,8 12 1,97 1,84 13 1,98 1,82 14 1,91 1,86 15 1,88 1,9 16 1,88 1,89 17 2 1,87 18 2,11 1,82 19 1,9 1,98 20 1,88 1,8 X =1,98 Y = 1,86  х = 0,072  y = 0,065 7. Предположим, что средние результаты не отличаются (гипотеза Н0): X=Y. 8. Вычислим средние арифметические значения и стандартные отклонения двух выборок и занесем их в таблицу 2.10: X =1,98; Y = 1,86;  х = 0,072;  y = 0,065. 9. Применим F-критерий для проверки равенства дисперсий двух выборок:  предположим, что дисперсии двух групп равны между собой (гипотеза Н0):  х2 =  y2 ;  Fрасч  х2 0,0052  2   1,24  у 0,0042 (т.к. первая выборка имеет бóльшую дисперсию, то ее значение подставим в числитель); 118  из таблицы Fкрит  3,00 (таблица 2 Приложения) для уровня значимости α = 0,01, числа степеней свободы  1  nх  1  20  1  19 (бóльшая дисперсия),  2  nу  1  20  1  19 (меньшая дисперсия);  так как Fрасч < Fкрит (1,24<3,00), то гипотеза Н0 принимается с вероятностью q=1- α=1-0,01 = 0,99. Вывод: дисперсии двух выборок равны. 10. Вычислим t-критерий Стьюдента: t расч  X Y  12   22  n 1,98  1,86  20  5,63 . 0,072 2  0,065 2 11.Выбираем уровень значимости α = 0,05, число степеней свободы   n1  n2  2 =20+20-2=38. Находим по таблице 3 Приложения критическое значение критерия Стьюдента для α = 0,05 и   38 t крит = 2,02. 12. t расч > t крит (5,63>2,02), гипотеза о равенстве средних арифметических (Н0: X = Y ) отклоняется с вероятностью q=1 – 0,05=0,95. Вывод: результаты времени выполнения «броска с захватом ног» различаются, причём результат экспериментальной группы лучше (меньше по времени), чем контрольной. 2.4.2. Сравнение независимых выборок с помощью программы MS EXCEL Для проверки однородности двух выборок применяем F-критерий с помощью надстройки программы Анализ данных.  исходные данные уже введены (см. рис. 2.2) и располагаются в том же диапазоне ячеек (А1:Е21);  на ленте на вкладке Данные вызвать Анализ данных, выбрать Двухвыборочный F-тест для дисперсий, ОК (рис. 2.19). 119 Рис. 2.19. Окно вызова Двухвыборочного F-теста для дисперсий  в следующем окне необходимо задать параметры для расчетов (рис.2.20). В поле Интервал переменной 1 и Интервал переменной 2 указать области с исходными данными ($B$1:$B$21 и $D$1:$D$21), включить параметр Метки (обозначение столбцов), указать уровень значимости Альфа=0,05 и выходной интервал для размещения результатов вычислений (например, ячейка $A$23), можно результаты разместить на новом рабочем листе или новом файле, ОК. Рис. 2.20. Окно ввода исходных параметров для расчета Двухвыборочного F-теста 120 Получим таблицу 2.11 с результатами вычислений Таблица 2.11 Результаты вычислений Двухвыборочного F-теста для дисперсий Среднее Дисперсия Наблюдения df F P(F<=f) одностороннее F критическое одностороннее К до Э до 1,985 1,979 0,0056 0,00599 20 20 19 19 0,9325 0,4403 0,4612 Вероятность ошибки для F-теста Фишера оказалась p>0,05 (0,44), поэтому дисперсии сравниваемых выборок не различаются. Другой подход к анализу полученных результатов заключается в сравнении эмпирического и критического значений критерия. В рассматриваемом случае критерий строится как отношение меньшей дисперсии к большей. Эмпирическое значение критерия может лежать в интервале от 0 до 1. Чем меньше эмпирическое значение критерия, тем достовернее различия. Мы получили Fэмп=0,9 (близко к 1) больше чем Fкр=0,46, поэтому статистически значимых различий между дисперсиями нет. В некоторых версиях программы критерий строится как отношение большей дисперсии к меньшей. Эмпирическое значение критерия в этом случае будет больше 1. Тогда, если получим Fэмп < Fкр, то статистически значимых различий между дисперсиями не будет. Аналогично можно провести сравнение дисперсий (контрольной и экспериментальной групп) после проведения подготовки, указав в поле Интервал переменной 1 и Интервал переменной 2 области с соответствующими исходными данными и убедиться, что в этом случае дисперсии тоже не различаются. 121 Теперь проведем сравнение средних арифметических двух групп (контрольной и экспериментальной) до проведения подготовки (несвязанные выборки) с помощью надстройки программы Анализ данных.  исходные данные уже введены и располагаются в том же диапазоне ячеек (А1:Е21);  вызвать Анализ данных, выбрать Двухвыборочный t-тест с одинаковыми дисперсиями, ОК (рис. 2.21); Рис. 2.21. Окно вызова Двухвыборочного t-теста с одинаковыми дисперсиями  в следующем окне необходимо задать параметры для расчетов (рис. 2.22). В поле Интервал переменной 1 и Интервал переменной 2 указать области с исходными данными ($B$1:$B$21 и $D$1:$D$21), включить параметр Метки в первой строке (обозначение столбцов), указать уровень значимости Альфа=0,05 и указать выходной интервал для размещения результатов вычислений (например, ячейка $G$1). 122 Рис. 2.22. Окно ввода исходных параметров для расчета Двухвыборочного t-теста Получим следующую таблицу 2.12 с результатами вычислений Таблица 2.12 Результаты вычислений Двухвыборочного t-теста с одинаковыми дисперсиями Двухвыборочный t-тест с одинаковыми дисперсиями К до Э до Среднее 1,99 1,98 Дисперсия 0,01 0,01 Наблюдения 20,00 20,00 Объединенная дисперсия 0,01 Гипотетическая разность средних 0,00 df 38,00 t-статистика 0,25 P(T<=t) одностороннее 0,40 t критическое одностороннее 1,69 P(T<=t) двухстороннее 0,80 t критическое двухстороннее 2,02 Мы получили, что t-статистика < t-критического (0,25<2,02) и поэтому можно сделать вывод об отсутствии статистически значимых различий между средними значениями показателей экспериментальной групп до эксперимента. 123 спортсменов контрольной и Вывод можно было сделать и на основании вычисленного значения вероятности ошибки первого рода Р. Поскольку она оказалась больше 0,05, то статистически значимые различия между средними двух выборок отсутствуют. Аналогично можно провести сравнение средних арифметических двух групп (контрольной и экспериментальной) после проведения подготовки (несвязанные выборки). Получим следующую таблицу 2.13 с результатами вычислений. Таблица 2.13 Результаты вычислений Двухвыборочного t-теста с одинаковыми дисперсиями Среднее Дисперсия Наблюдения Объединенная дисперсия Гипотетическая разность средних df t-статистика P(T<=t) одностороннее t критическое одностороннее P(T<=t) двухстороннее t критическое двухстороннее 124 Э К после после 1,98 1,86 0,01 0,00 20,00 20,00 0,00 0,00 38,00 5,67 0,00 1,69 0,00 2,02 Поскольку P < 0,05 и t-статистика>t-критического (5,67 > 2,02) то статистически значимые различия между средними значениями показателей контрольной и экспериментальной групп после эксперимента достоверны. Если бы дисперсии оказались достоверно различными, то при сравнении средних арифметических двух групп (несвязанные выборки) использовался Двухвыборочный t-тест с различными дисперсиями. 2.4.3. Сравнение независимых выборок с помощью программы STATISTICA Проведем сравнение средних арифметических двух групп (контрольной и экспериментальной) до проведения мезоцикла подготовки. В этом случае мы имеем дело с независимыми, или несвязанными, выборками. Классическим методом, позволяющим решать эту задачу, является t-тест Стьюдента, или просто «t-тест». Нулевая гипотеза, проверяемая в ходе данного теста, заключается в том, что обе группы происходят из одной генеральной совокупности; другими словами, что наблюдаемые различия между средними значениями сравниваемых выборок случайны и не вызваны действием изучаемого фактора. Тест Стьюдента относится к группе параметрических методов анализа. Его корректное применение требует выполнения условий: 1. Измерение должно быть проведено в шкале интервалов или отношений. 2. Обе выборки должны подчиняться нормальному закону распределения. Наиболее «опасным» является несоблюдение требования о нормальности распределения значений признака в сравниваемых группах. Если условия применимости t-критерия не выполнены, следует использовать непараметрические альтернативы t-критерия. Рассмотрим, как тест Стьюдента можно выполнить при помощи программы STATISTICA. Для этого запустим программу и введем в таблицу исходные данные (см. рис. 2.23). 125 Рис. 2.23. Пример оформления данных для выполнения t-теста для независимых выборок Оформление данных имеет особенность, отображенную на рис. 2.23. Для каждого сравнения в таблице используются две переменные. Одна из них – группирующая (Groupingvariable) («Группа») – содержит коды, указывающие принадлежность данных к конкретной группе. В рассматриваемом случае код «К» использован для результатов спортсменов контрольной группы, а «Э» экспериментальной. Другая переменная так называемая зависимая переменная (Dependentvariable) («до») – содержит собственно данные. Возможен и другой вариант оформления – данные для каждой группы можно было бы просто внести в отдельные столбцы, не используя группирующую переменную. Для выполнения t-теста для независимых выборок необходимо выполнить следующие действия:  Запустить соответствующий модуль из меню Анализ (Statistics) > Основные статистики и таблицы (Basicstatistics/Tables) >t-критерий для 126 независимых выборок (t-test, independent, bygroups), если в таблице с данными есть группирующая переменная, или t-критерий для независимых переменных (t-test, independent, byvariables), если данные внесены в самостоятельные столбцы). (Примечание: рассмотрим вариант теста, при котором группирующая переменная присутствует, см. рис. 2.24). Рис. 2.24 Выбор t-критерия для независимых выборок (t-test, independent, bygroups)  В открывшемся окне нажать кнопку Переменные (Variables), см. рис. 2.25. 127 Рис. 2.25 Окно t-критерия для независимых выборок (t-test, independent, bygroups)  Указать программе, какая из переменных является группирующей, а какая – зависимой (рис. 2.26). Рис. 2.26. Выбор переменных для включения в t-тест  Нажать на кнопку Т-Критерий (Summary: T-tests) или Ок (рис. 2.27). 128 Рис. 2.27. Модуль t-теста для независимых выборок В итоге программа создаст рабочую книгу, содержащую таблицу с результатами t-теста (см. рис. 2.28). T-критерии; Группир.: группа (независимые до) Группа 1:К Группа 2:Э Среднее Среднее t-знач. сс p N набл. N набл. Ст.откл. Ст.откл. F-отн. p Переменная К Э К Э К Э дисперс. дисперс. до 1,985 1,979 0,249 38 0,804 20 20 0,0747 0,0774 1,0724 0,8805 Рис. 2.28. Результаты выполнения t-теста для независимых выборок до цикла тренировочных занятий Эта таблица имеет следующие столбцы (рис. 2.28):  Среднее (Mean) К: среднее значение показателя в контрольной группе;  Среднее (Mean) Э: среднее значение показателя в экспериментальной группе;  t-знач. t-value): значение рассчитанного программой t-критерия Стьюдента;  сс(df): число степеней свободы;  p: вероятность ошибочно отвергнуть нулевую гипотезу об отсутствии различий между средними. Фактически это самый главный интересующий исследователя результат анализа. В рассматриваемом примере p > 0,05, на 129 основании чего можно сделать вывод об отсутствии статистически значимых различий между средними значениями показателей спортсменов контрольной и экспериментальной групп (если оказывается, что p < 0,05, то следует сделать вывод о наличии статистически достоверных различий в средних; если же p>0,05, то статистически значимые различия отсутствуют и обнаруженные различия носят случайных характер).  N набл. (Valid N) К: объем выборки «контрольная группа»;  N набл. (Valid N) Э: объем выборки «экспериментальная группа»;  Ст. откл.(Std. dev.) К: стандартное отклонение для контрольной группы;  Ст. откл. (Std. dev.) Э: стандартное отклонение для экспериментальной группы;  F-отн. дисперс. (F-ratio, Variances): значение F-критерия Фишера, с помощью которого проверяется гипотеза о равенстве дисперсий в сравниваемых выборках;  рдисперс. (P, Variances): вероятность ошибки для F-теста Фишера. Поскольку в нашем случае p > 0,05, можно заключить, что дисперсии сравниваемых выборок не различаются). Аналогичным способом сравниваем средние арифметические контрольной и экспериментальной групп после проведения подготовки (см. рис. 2.29). T-критерии; Группир.: группа (независимые) Группа 1:К Группа 2:Э Среднее Среднее t-знач. сс p N набл. N набл. Ст.откл. Ст.откл. F-отн. p Переменная К Э К Э К Э дисперс. дисперс . после 1,9805 1,8565 5,6699 38 0,000002 20 20 0,0727 0,0654 1,2368 0,6479 Рис. 2.29 Результаты выполнения t-теста для независимых выборок после цикла тренировочных занятий 130 Вероятность ошибки для F-теста Фишера (см. последний столбец) оказалась p > 0,05 (0,6479), поэтому можно утверждать, что дисперсии сравниваемых выборок не различаются. Для критерия Стьюдента p < 0,05, что позволяет сделать вывод о статистически достоверном различии средних арифметических2 и, соответственно, лучшей подготовленности спортсменов экспериментальной группы, по сравнению со спортсменами контрольной. В случае статистически значимых отличий результаты расчетов выделяются красным цветом. 2.5. Сравнение зависимых выборок 2.5.1. Сравнение двух выборочных средних арифметических зависимых (связанных) выборок по t-критерию Стьюдента В спорте часто проводятся измерения показателей одних и тех же спортсменов через некоторое время (до и после тренировочного мезоцикла). При этом стараются определить, изменилось ли состояние спортсменов, характеризуемое выбранной системой показателей. В таких случаях выборки всегда равны по числу измерений (предполагается, что состав групп не изменился за время проведения экспериментального исследования, если по какой-то причине несколько испытуемых выбыли из группы, то их исходные данные не берутся в расчет). Все измерения могут быть объединены в пары. Каждая пара – результат измерения на одном человеке – в начале и конце эксперимента. Подобные выборки называются зависимыми (связанными), остальные выборки называются независимыми (несвязанными). Пример У группы спортсменов контрольной группы измеряли результаты скоростных характеристик «броска с захватом ног» до начала тренировочных Примечание: при наличии различий результаты анализа в STATISTICA обычно (но не во всех модулях) выделяются красным цветом. 2 131 занятий Xi и после мезоцикла тренировок Yi (таблица 2.14). Определить, изменился ли этот показатель после мезоцикла тренировок. Таблица 2.14 Вспомогательная таблица для сравнения выборочных средних арифметических связанных выборок контрольной группы № п/п 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Xi,с 2,12 2,01 1,93 1,97 2 2,03 1,96 1,94 2,1 2,07 2,1 1,98 1,99 1,9 1,89 1,9 2,01 2,11 1,9 1,88 Y i, с 2,11 2,01 1,94 1,98 1,99 2 1,95 1,96 2 2,09 2,07 1,97 1,98 1,91 1,88 1,88 2 2,11 1,9 1,88 di= Xi - Yi 0,01 0 -0,01 -0,01 0,01 0,03 0,01 -0,02 0,1 -0,02 0,03 0,01 0,01 -0,01 0,01 0,02 0,01 0 0 0 ∑=0,18 X d =0,009 di - X d 0,001 -0,009 -0,019 -0,019 0,001 0,021 0,001 -0,029 0,091 -0,029 0,021 0,001 0,001 -0,019 0,001 0,011 0,001 -0,009 -0,009 -0,009 n Xd   d n d  i 1 i d i 1 i  n  Xd n 1  0,18  0,009 ; 20 2  132 0,01238  0,026 . 19 (di - X d )2 0,000001 0,000081 0,000361 0,000361 0,000001 0,000441 0,000001 0,000841 0,008281 0,000841 0,000441 0,000001 0,000001 0,000361 0,000001 0,000121 0,000001 0,000081 0,000081 0,000081 ∑=0,01238  d  0,026  Предполагаем, что у спортсменов контрольной группы не произошло изменения показателей скоростных характеристик «броска с захватом ног» после месяца тренировок (гипотеза Н0): X d = 0.  Определяем t расч  Xd d  n 0,009  20  1,5 . 0,026  Выбираем уровень значимости α = 0,05, число степеней свободы   n  1 = 9. Для α = 0,05 и   19 t крит = 2,1 (таблица 3 Приложения).  Так как t расч < t крит , то гипотеза Н0 ( X d = 0) принимается. Вывод: под влиянием тренировочных занятий у спортсменов контрольной группы не наблюдается достоверного улучшения результатов скоростных характеристик «броска с захватом ног». Пример У группы спортсменов экспериментальной группы измеряли результаты скоростных характеристик «броска с захватом ног» до начала тренировочных занятий Xi и через 1 месяц после тренировок Yi (таблица 2.15). Определить, изменился ли этот показатель под влиянием мезоцикла тренировок. Таблица 2.15 Вспомогательная таблица для сравнения выборочных средних арифметических связанных выборок экспериментальной группы № п/п 1 2 3 4 5 6 7 8 9 10 11 Xi,м 2,01 2,11 1,9 1,98 1,94 1,89 2,14 2 1,95 1,97 1,88 Y i, м 1,9 1,94 1,7 1,88 1,86 1,8 1,96 1,8 1,82 1,89 1,8 di= Xi - Yi 0,11 0,17 0,2 0,1 0,08 0,09 0,18 0,2 0,13 0,08 0,08 133 di - X d -0,01 0,05 0,08 -0,02 -0,04 -0,03 0,06 0,08 0,01 -0,04 -0,04 (di - X d )2 0,0001 0,0025 0,0064 0,0004 0,0016 0,0009 0,0036 0,0064 0,0001 0,0016 0,0016 12 13 14 15 16 17 18 19 20 1,93 1,95 1,89 2,07 2 1,98 1,89 2,1 2 1,84 1,82 1,86 1,9 1,89 1,87 1,82 1,98 1,8 0,09 0,13 0,03 0,17 0,11 0,11 0,07 0,12 0,2 ∑=2,45 X d = 0,12 -0,03 0,01 -0,09 0,05 -0,01 -0,01 -0,05 0 0,08 0,0009 0,0001 0,0081 0,0025 0,0001 0,0001 0,0025 0 0,0064 ∑=0,0543  d  0,05 n d Xd   d i 1 n n d  i 1 i i  Xd n 1   2,45  0,12 ; 20 2  0,0543  0,05 . 19  Предполагаем, что отсутствует улучшение результатов скоростных характеристик «броска с захватом ног» после мезацикла тренировок (гипотеза Н0): X d = 0.  Определяем t расч  Xd d  n 0,12  20  10,7  11 . 0,05  Выбираем уровень значимости α = 0,05, число степеней свободы   n  1 = 19. Для α = 0,05 и   19 t крит = 2,1 (таблица 3 Приложения).  Так как t расч > t крит , то гипотеза Н0 ( X d = 0) отвергается и принимается альтернативная гипотеза Н1 с вероятностью 0,95 (95 %). Вывод: под влиянием тренировочных занятий у спортсменов наблюдается достоверное улучшение результатов скоростных характеристик в техническом действии «бросок с захватом ног». 134 2.5.2. Сравнение зависимых выборок с помощью программы MS EXCEL Исследуем изменение показателей спортсменов до и после проведения эксперимента в экспериментальной группе (связанные выборки) с помощью надстройки программы Анализ данных.  исходные данные уже введены (см. рис. 2.2) и располагаются в том же диапазоне ячеек (А1:Е21);  на ленте на вкладке Данные вызвать Анализ данных, выбрать Парный двухвыборочный t-тест для средних, ОК (рис. 2.30); Рис. 2.30. Окно вызова Парного двухвыборочного t-теста для средних  в следующем окне необходимо задать параметры для расчетов (рис. 2.31). В поле Интервал переменной 1 и Интервал переменной 2 указать области с исходными данными ($D$1:$D$21 и $E$1:$E$21), включить параметр Метки в первой строке (обозначение столбцов), указать уровень значимости Альфа=0,05 и указать выходной интервал для размещения результатов вычислений (например, ячейка $K$1), можно результаты разместить на новом рабочем листе или новом файле). 135 Рис. 2.31. . Окно ввода исходных параметров для расчета Парного двухвыборочного tтестадля средних Получим следующую таблицу 2.16 с результатами вычислений Таблица 2.16 Результаты вычислений Парного двухвыборочного t-теста для средних Парный двухвыборочный t-тест для средних Э до Э после Среднее 1,98 1,86 Дисперсия 0,01 0,00 Наблюдения 20,00 20,00 Корреляция Пирсона 0,78 Гипотетическая разность средних 0,00 df 19,00 t-статистика 11,16 P(T<=t) одностороннее 0,00 t критическое одностороннее 1,73 P(T<=t) двухстороннее 0,00 t критическое двухстороннее 2,09 Мы получили, что t-статистика > t-критического (11,16 > 2,09) и поэтому можно сделать вывод о статистически значимых различиях между средними значениями показателей спортсменов экспериментальной группы до и после эксперимента. 136 2.5.3. Сравнение зависимых выборок с помощью программы STATISTICA Исследуем изменение показателей спортсменов до и после проведения эксперимента. Эти выборки являются зависимыми. С зависимыми выборками исследователь имеет дело каждый раз, когда измерения значений изучаемого признака выполняются на одних и тех же объектах, но при разных условиях (в различные моменты времени). В этом случае для каждой группы и для каждого условия исследования используются отдельные столбцы. Всего таблица будет содержать четыре столбца (см. рис. 2.32). Рис. 2.32. Пример оформления данных для выполнения t-теста для зависимых выборок 137 Для выполнения этого варианта t-теста необходимо:  Запустить соответствующий модуль (см. рис. 2.33) из меню Анализ (Statistics) > Основные статистики и таблицы (Basicstatistics/Tables)>tкритерий для зависимых выборок (t-test, dependentsamples). Рис. 2.33. Запуск расчета t-критерия для зависимых выборок  В открывшемся окне (рис. 2.34) нажать на кнопку Переменные (Variables). 138 Рис. 2.34. Окно Т-критерия для зависимых выборок  Указать программе первую (Firstvariable) и вторую (Secondvariable) переменные, участвующие в анализе (см. рис. 2.35). Рис. 2.35. Выбор переменных для анализа  Нажать на кнопку Т-критерий (Summary: T-tests) или Ок. 139 В результате появится таблица с результатами (см. рис. 2.36), очень похожая на ту, что мы уже видели при выполнении t-теста для независимых выборок. T-критерий для зависимых выборок (зависимые) Отмечены разности, значимые на уровне p < ,05000 Среднее Стд.откл N разн. Стд.откл t сс p Доверит. Переменная разн. -95,000% К до 1,985000 0,074728 К после 1,980500 0,072727 20 0,004500 0,013945 1,443102 19 0,165277 -0,002027 Рис. 2.36. Результаты выполнения t-теста для зависимых выборок (контрольная группа) Она содержит следующие столбцы:  Средние (Mean) – средние значения показателей для каждой из сравниваемых групп;  Стд. откл (Std. dv.) – стандартные отклонения для каждой группы;  N – число наблюдений;  разн. (Diff.) – средняя разница показателей;  Стд. откл. разн. (Std. dv. diff.) – стандартное отклонение для средней разницы;  t – значение t-критерия;  сс (df)– число степеней свободы;  p – вероятность ошибочно отвергнуть нулевую гипотезу о том, что средние величины показателей в сравниваемых группах не различаются. В рассматриваемом случае p > 0,05, поэтому можно утверждать, что средние значения показателей спортсменов контрольной и группы до проведения подготовки и после статистически достоверно не различаются (если оказывается, что p < 0,05, то следует сделать вывод о наличии статистически достоверных различий в средних; если же p > 0,05, то статистически значимые различия отсутствуют и обнаруженные различия носят случайных характер). Аналогично сравним показатели спортсменов экспериментальной группы до и после проведения подготовки (см. рис. 2.37). 140 T-критерий для зависимых выборок (зависимые) Отмечены разности, значимые на уровне p < ,05000 Среднее Стд.откл N разн. Стд.откл t сс p Доверит. Переменная разн. -95,000% Э до 1,979000 0,077385 Э после 1,856500 0,065396 20 0,122500 0,049084 11,16127 19 0,000000 0,099528 Рис. 2.37. Результаты выполнения t-теста для зависимых выборок (экспериментальная группа) Поскольку в этом случае p << 0,05, из этого можно заключить, что средние значения показателей спортсменов экспериментальной группы до подготовки и после ее проведения статистически достоверно различаются. Наблюдается статистически значимое улучшение3. Подведем некоторые итоги. Оценки не выявили статистически значимых различий показателей спортсменов контрольной и экспериментальной групп до проведения подготовки, что свидетельствует, учитывая однородность выборок, о корректности проводимого эксперимента. Результаты сравнений показателей спортсменов контрольной группы до и после проведения подготовки не выявили достоверных различий, в то время как у спортсменов экспериментальной группы наблюдается статистически достоверное улучшение показателей. После проведения эксперимента показатели участников экспериментальной группы достоверно лучше, чем участников контрольной. Все это свидетельствует об эффективности новой методики подготовки. 2.6. Непараметрические методы сравнения средних значений исследуемых выборок Теперь используем для анализа непараметрические методы. Заметим, что параметрические методы могут оказаться несколько более мощными, чем непараметрические, т.е. они могут позволить выявлять более тонкие различия. Существенным же достоинством непараметрических методов является то, что Примечание: при наличии различий результаты анализа в STATISTICA обычно (но не во всех модулях) выделяются красным цветом. 3 141 они применимы и к выборкам, распределения показателей в которых могут отличаться от нормального и не требуют примерного равенства дисперсий. 2.6.1. Несвязанные выборки Критерий Манна-Уитни (критерий U) Рассмотрим порядок применения критерия Манна-Уитни на примере скоростных характеристик «броска с захватом ног» двух групп спортсменов, тренирующихся по разным методикам, для выявления эффективности применения новой методики тренировок. Первая (контрольная) группа тренировалась по традиционной методике, а вторая (экспериментальная) – по новой. Результаты приведены ниже (таблица 2.17, 2.18). Таблица 2.17 Первая выборка. №п/п 1 2 3 4 5 6 7 8 9 10 11 12 Хi(с) 2,11 2,01 1,94 1,98 1,99 2 1,95 1,96 2 2,09 2,07 1,97 №п/п 13 14 15 16 17 18 19 20 Хi(с) 1,98 1,91 1,88 1,88 2 2,11 1,9 1,88 Таблица 2.18 Вторая выборка. №п/п 1 2 3 4 5 6 7 8 9 10 11 12 Yi(с) 1,9 1,94 1,7 1,88 1,86 1,8 1,96 1,8 1,82 1,89 1,8 1,84 №п/п 13 14 15 16 17 18 19 20 Yi(с) 1,82 1,86 1,9 1,89 1,87 1,82 1,98 1,8 1. Предполагаем, что результаты времени выполнения «броска с захватом ног» спортсменов первой (контрольной) группы не отличаются от результатов второй (экспериментальной) группы (гипотеза Н0). 142 2. Составим объединенную таблицу исходных данных двух выборок (таблица 2.19). Таблица 2.19 Объединенная таблица исходных данных двух выборок №п/п 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Хi(с) 2 RХ 3 1,88 1,88 1,88 14,5 14,5 14,5 1,9 1,91 1,94 1,95 1,96 1,97 1,98 1,98 1,99 2 2 2 Yi(с) 4 1,7 1,8 1,8 1,8 1,8 1,82 1,82 1,82 1,84 1,86 1,86 1,87 1,88 RY 5 1 3,5 3,5 3,5 3,5 7 7 7 9 10,5 10,5 12 14,5 1,89 1,89 1,9 1,9 17,5 17,5 20 20 1,94 23,5 1,96 26,5 1,98 30 20 22 23,5 25 26,5 28 30 30 32 34 34 34 143 36 37 38 39 40 Сумма 2,01 2,07 2,09 2,11 2,11 36 37 38 39,5 39,5 572,5 247,5 3. Ранжируем объединенную выборку по степени возрастания признака. Определим общую сумму рангов по формуле: R i  (n1  n2 )( n1  n2  1) (20  20)( 20  20  1)   820 2 2 4. Посчитаем сумму рангов отдельно в каждой выборке и сравним с расчётной суммой. Сумма рангов первой выборки получается суммированием значений третьего столбца таблицы: RХ = 572,5; а сумма рангов второй выборки получается суммированием пятого столбца таблицы: RY = 247,5; тогда R= RХ+ RY = 572,5 + 247,5 = 820, что совпадает с вычислением в предыдущем пункте. 5. Определим большую из двух ранговых сумм. Сумма рангов первой выборки больше: RХ = 572,5. 6. Определим эмпирическое значение критерия Uэмп по формуле: U эм п  (n1  n2 )  nx (nx  1) 20(20  1)  Tx  (20  20)   572,5  37,5 , 2 2 где п1- объем первой выборки; п2 - объем второй выборки; Тх - большая из двух ранговых сумм; пх - объем выборки с большей суммой рангов. 7. Определим критическое значение для уровня значимости α = 0,05 и объемов обследуемых выборок n1 = 20 и n2 =20 по таблице 7 приложения: Uкр = 138. 8. Сравним расчетное значение критерия Uэмп c критическим Uкр: так как Uэмп < Uкр (37,5 < 138), то гипотеза Н0 отвергается и принимается альтернативная гипотеза Н1 – результаты времени выполнения «броска с 144 захватом ног» спортсменов первой (контрольной) группы хуже результатов второй (экспериментальной) группы (p < 0,05), что свидетельствует об эффективности экспериментальной методики тренировки. Такой же результат был получен в расчётах показателей скоростных характеристик «броска с захватом ног» спортсменов контрольной и экспериментальной групп с применением параметрического критерия Стьюдента для независимых выборок (см. раздел 2.4.1.). Сравнение независимых выборок с помощью программы STATISTICA непараметрическими методами Сравним результаты, показанные спортсменами контрольной и экспериментальной групп до проведения цикла подготовки (независимые выборки). Для сравнения двух независимых выборок, имеющих произвольное распределение, используется U-тест Манна-Уитни (Mann-Whitney U-test). В качестве исходных данных воспользуемся данными, подготовленными ранее для t-теста Стьюдента. Для проведения анализа необходимо все исходные данные для двух групп ввести в один столбец, а во втором столбце разместить значения группирующей переменной, являющейся признаком принадлежности значения показателя к той или иной группе (см. рис. 2.23). В программе STATISTICA U-тест Манна-Уитни выполняется следующим образом:  В меню Анализ (Statistics) выбрать Непараметрическая статистика (Nonparametrics), как это показано на рис. 2.38. 145 Рис. 2.38. Выбор пункта меню Непараметрическая статистика  Затем выбрать (см. рис. 2.39) Сравнение двух независимых групп (Comparingtwoindependentsamples) Рис. 2.39. Вид окна непараметрическая статистика 146  В появившемся окне (рис. 2.40) нажать на кнопку Переменные (Variables). Рис. 2.40. Окно Сравнение двух групп (Comparingtwogroups)  Выбрать зависимую и группирующую переменные (см. рис. 2.41). Рис. 2.41. Окно выбора переменных для анализа  В нижней правой части окна можно установить требуемый уровень значимости (0,05 для физической культуры и спорта) 147  Нажать на кнопку U критерий Манна-Уитни (Mann-Whitney U-test). Внешний вид появляющегося после этого окна представлен на рис. 2.42. U критерий Манна-Уитни (независимые до) По перем. группа Отмеченные критерии значимы на уровне p <,05000 Сум.ранг Сум.ранг U Z p-уров. Z p-уров. N N 2-х стор К Э скорр. К Э точное p Перем. до 427,5000 392,5000 182,5000 0,459852 0,645623 0,460977 0,644815 20 20 0,639514 Рис. 2.42. Результаты U-теста Манна-Уитни для данных, полученных до проведения цикла тренировок Наиболее важной величиной для исследователя в итоговой таблице теста (см. рис. 2.42) является величина вероятности ошибки p. При большом числе наблюдений в выборках (20 и более) значение p необходимо искать в 5-м столбце таблицы (вслед за «Z»), иначе – в 7-м (вслед за «Z-adjusted»). При p< 0,05 делается вывод о наличии статистически значимой разницы между сравниваемыми выборками4. В рассматриваемом примере n=20. Поэтому смотрим в 5 столбец, в котором р≈0,636 (0,635945). Поскольку значение р оказалось больше 0,05, то делаем вывод об отсутствии статистически значимого отличия результатов, показанных спортсменами контрольной и экспериментальной групп до проведения педагогического эксперимента (если оказывается, что p < 0,05, то следует сделать вывод о наличии статистически достоверных различий; если же p > 0,05, то статистически значимые различия отсутствуют и обнаруженные различия носят случайных характер). Аналогичным образом сравним результаты, показанные участниками контрольной и экспериментальной групп после проведенной подготовки (см. рис 2.43). Примечание: в отличие от t-теста, тест Манна-Уитни сравнивает не средние значения выборок, а суммы рангов по каждой из них. Ранг – положение определенного значения изучаемого признака в упорядоченном по убыванию или возрастанию ряду. 4 148 U критерий Манна-Уитни (независимые) По перем. группа Отмеченные критерии значимы на уровне p <,05000 Сум.ранг Сум.ранг U Z p-уров. Z p-уров. N N 2-х стор Перем. К Э скорр. К Э точное p после 572,5000 247,5000 37,50000 4,382114 0,000012 4,390566 0,000011 20 20 0,000002 Рис. 2.43. Результаты U-теста Манна-Уитни для данных, полученных после проведения цикла тренировок Поскольку значение p оказалось меньше 0,05 (0,000012, см. 5 столбец результатов рис. 2.43), то существует статистически значимое различие между сравниваемыми выборками. Спортсмены экспериментальной группы показали лучшие результаты по сравнению со спортсменами контрольной после проведения мезоцикла тренировок. 2.6.2. Связанные выборки Парный критерий Вилкоксона (критерий Т) Критерий Вилкоксона Т для связанных выборок является непараметрическим аналогом t-критерия Стьюдента. Рассмотрим порядок применения критерия Вилкоксона на примере сравнения результатов скоростных характеристик «броска с захватом ног» до начала тренировочных занятий ( X i ) и после мезоцикла тренировок (Yi ) спортсменов контрольной группы (таблица 2.19). Определить, изменился ли этот показатель под влиянием тренировочных упражнений в ходе мезоцикла тренировок. Таблица 2.19 Результаты скоростных характеристик «броска с захватом ног» для спортсменов контрольной группы № п/п 1 1 2 3 4 Хiс 2 2,12 2,01 1,93 1,97 Y iс 3 2,11 2,01 1,94 1,98 149 di= Yi- Хi 4 -0,01 0 0,01 0,01 |di| 5 0,01 0 0,01 0,01 R 6 5,5 5,5 5,5 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 2,03 1,96 1,94 2,1 2,07 2,1 1,98 1,99 1,9 1,89 1,9 2,01 2,11 1,9 1,88 1,99 2 1,95 1,96 2 2,09 2,07 1,97 1,98 1,91 1,88 1,88 2 2,11 1,9 1,88 -0,01 -0,03 -0,01 0,02 -0,1 0,02 -0,03 -0,01 -0,01 0,01 -0,01 -0,02 -0,01 0 0 0 0,01 0,03 0,01 0,02 0,1 0,02 0,03 0,01 0,01 0,01 0,01 0,02 0,01 0 0 0 5,5 14,5 5,5 12 16 12 14,5 5,5 5,5 5,5 5,5 12 5,5 0 0 0 1. Составим таблицу результатов скоростных характеристик «броска с захватом ног» спортсменов контрольной группы до и после мезацикла тренировок. 2. Вычислим разность между значениями после (Yi ) и до ( X i ) мезацикла тренировок. «Типичным» сдвигом будем считать улучшение результатов после тренировок, т.е. уменьшение времени (отрицательные сдвиги), поскольку количество отрицательных разностей 11, а положительных – 5 из 16. Сформулируем гипотезы: H0: интенсивность сдвигов в сторону улучшения результатов скоростных характеристик «броска с захватом ног» спортсменов контрольной группы не превышает интенсивности сдвигов в сторону их ухудшения; H1: интенсивность сдвигов в сторону улучшения результатов скоростных характеристик «броска с захватом ног» спортсменов контрольной группы превышает интенсивность сдвигов в сторону их ухудшения. 3. Переведем разности в абсолютные величины и запишем их в 5 столбец (таблица 2.19). 150 4. Ранжируем абсолютные величины разностей (таблица 2.20) и занесём ранги в 6 столбец (таблица 2.19). Таблица 2.20 Ранжированные абсолютные величины разностей № п/п 1 2 3 4 5 6 7 8 9 10 |di| 0,01 0,01 0,01 0,01 0,03 0,01 0,02 0,1 0,02 0,03 ранжированные 0,01 0,01 0,01 0,01 0,01 0,01 0,01 0,01 0,01 0,01 № п/п 11 12 13 14 15 16 |di| 0,01 0,01 0,01 0,01 0,02 0,01 ранжированные 0,02 0,02 0,02 0,03 0,03 0,1 сдвиги сдвиги Ранг числа определяется как среднее арифметическое значение его порядковых номеров в ранжированном ряду: для 0,01 ранг 5,5 = для 0,02 ранг 12 = 1  2  3  4  5  6  7  8  9  10 ; 10 11  12  13 ; 3 для 0,03 ранг 14,5 = 14  15 ; 2 для 0,1 ранг 16. 5. Определим эмпирическое значение критерия Вилкоксона Т, подсчитав сумму рангов сдвигов в «нетипичном» направлении по формуле: Тэмп=∑ Rr=5,5+5,5+12+12+5,5=40,5. 6. По таблице приложения определим критическое значение Ткр для объёма выборки n = 16 и уровня значимости  = 0,05: Ткр = 35. 7. Сравним Тэмп и Ткр: Тэмп>Ткр, то гипотеза Н0 принимается, и, следовательно, интенсивность положительного сдвига результатов скоростных характеристик «броска с захватом ног» спортсменов контрольной группы 151 достоверно не преобладает над интенсивностью отрицательного сдвига (р < 0,05). Это означает, что подготовленность спортсменов контрольной группы после мезоцикла тренировок не улучшилась. Такой же результат был получен в расчетах результатов скоростных характеристик «броска с захватом ног» спортсменов контрольной группы с применением параметрического критерия Стьюдента для зависимых выборок (см. раздел 2.5.1). Если непараметрические методы обнаруживают достоверные различия, то дальнейшие вычисления не требуются. Сравнение зависимых выборок с помощью программы STATISTICA непараметрическими методами Чтобы сделать окончательные выводы об эффективности предлагаемой подготовки, необходимо проанализировать изменение результатов, показанных спортсменом до и после проведения эксперимента. В качестве непараметрического критерия сравнения двух зависимых выборок применим тест Уилкоксона (Wilcoxonmatchedpairtest). Для его использования в меню Анализ (Statistics) выберем пункт Непараметрическая статистика (Nonparametrics), а затем Сравнение двух зависимых переменных (Comparingdependentsamples, variables), как это показано на рис. 2.44. 152 Рис 2.44. Выбор Сравнения двух зависимых переменных Далее необходимо:  В появившемся окне (рис. 2.45) нажать кнопку Переменные (Variables). Рис 2.45. Окно Сравнение двух зависимых переменных  Задать переменные для анализа, как это показано на рис. 2.46 (для примера используем данные, приведенные в таблице 2.1). 153 Рис. 2.46. Выбор переменных для анализа  Нажать кнопку Критерий Вилкоксона (Wilcoxonmatchedpairtest).  В итоговой таблице (рис. 2.47) найти величину p. При p < 0,05 следует сделать вывод о наличии статистически значимой разницы между сравниваемыми выборками (если же p > 0,05, то статистически значимые различия отсутствуют и обнаруженные различия носят случайных характер). Критерий Вилкоксона (зависимые) Отмеченные критерии значимы на уровне p <,05000 Число T Z p-уров. набл. Пара перем. К до & К после 16 39,50000 1,473700 0,140563 Рис. 2.47. Данные применения критерия Вилкоксона для результатов, показанных спортсменами контрольной группы В нашем случае p = 0,140563, поэтому следует сделать о том, что статистически значимых изменений (на уровне значимости 0,05) в изменении скоростных характеристик спортсменов контрольной группы не произошло. Аналогичным образом проанализируем изменение скоростных характеристик спортсменов экспериментальной группы (см. рис. 2.48). 154 Критерий Вилкоксона (зависимые) Отмеченные критерии значимы на уровне p <,05000 Число T Z p-уров. Пара перем. набл. Э до & Э после 20 0,00 3,919930 0,000089 Рис. 2.48. Данные применения критерия Вилкоксона для результатов, показанных спортсменами экспериментальной группы Поскольку уровень значимости оказывается меньшим 0,05 (0,000089), то делаем вывод об статистически значимом улучшении скоростных характеристик спортсменов экспериментальной группы после проведения педагогического эксперимента. Таким образом, результаты оценок, проведенных с использованием параметрических и непараметрических методов, совпадают. 2.7. Статистический анализ сверхмалых выборок В научных исследованиях в отрасли физической культуры и спорта встречаются случаи, когда нет возможности получать достаточно полные данные о количественных характеристиках некоего процесса подготовки спортсменов. Зачастую это связано с ограниченным составом испытуемых в исследованиях, например, когда мы имеем дело со спортсменами высшей квалификации на уровне национальных сборных. Также в практике могут иметь место и другие случаи, когда число испытуемых в экспериментальных исследованиях ограничено малым числом. Полученные в исследованиях данные можно обработать методами статистики, но нужно отчетливо понимать, что сформированные сверхмалые выборки очень чувствительны к любым малым вариациям исходных данных внутри них, например, за счет погрешностей измерений и расчетов. Это может исказить объективные закономерности структурных изменений у испытуемых, возникающих за счет целенаправленной организации учебно-тренировочного процесса. Поэтому всегда, если есть возможность, следует увеличивать объем выборок. 155 Рассмотрим результаты тройного прыжка спортсменов экспериментальной (первая) и контрольной (вторая) групп до и после мезоцикла тренировок. Результаты приведены в таблице 2.21. Таблица 2.21 Результаты тройного прыжка спортсменов экспериментальной и контрольной групп до и после мезоцикла тренировок Экспериментальная группа Хi(м) 1. 2. 3. 4. 5. До тренировок После тренировок 7,2 7,43 7,9 8 7,68 7,53 7,4 7,76 8,05 8,89 Особенностью рассматриваемого Контрольная группа Yi(м) До После тренировок тренировок 7,11 7,26 7,22 7,3 7,4 7,41 7,28 7,2 7,59 7,55 примера является малый объем изучаемых выборок (n=5). При таком объеме проверить принадлежность выборки к генеральной совокупности, подчиняющейся нормальному закону распределения, не представляется возможным. Поэтому для сравнения таких выборок следует пользоваться непараметрическими критериями. Поскольку выборки являются независимыми, воспользуемся U-критерием Манна-Уитни, применяемым для независимых выборок. Рассмотрим результаты тройного прыжка спортсменов экспериментальной (первая) и контрольной (вторая) групп до мезоцикла тренировок. Результаты приведены в таблицах 2.22 и 2.23. Таблица 2.22 Первая выборка. №п/п Хi(м) 1 2 3 7,2 7,43 7,9 4 8 5 7,68 Таблица 2.23 Вторая выборка. №п/п 1 2 Yi(м) 7,11 7,22 3 7,4 4 5 7,28 7,59 156 1. Сформулируем гипотезу Н0: результаты тройного прыжка спортсменов экспериментальной и контрольной групп до мезоцикла тренировок не отличаются. 2. Составим объединённую таблицу исходных данных двух выборок (таблица 2.24). Таблица 2.24 Результаты тройного прыжка спортсменов экспериментальной и контрольной групп до мезоцикла тренировок №п/п 1 1 2 3 4 5 6 7 8 9 10 Сумма Хi(с) 2 RХ 3 7,2 2 7,43 7,68 7,9 8 Yi(с) 4 7,11 RY 5 1 7,22 7,28 7,4 3 4 5 7,59 7 6 8 9 10 35 20 3. Ранжируем объединенную выборку по степени возрастания признака. Определим общую сумму рангов по формуле: R i  (n1  n2 )( n1  n2  1) (5  5)(5  5  1)   55 2 2 4. Посчитаем сумму рангов отдельно в каждой выборке и сравним с расчётной суммой. Сумма рангов первой выборки получается суммированием значений третьего столбца таблицы: RХ = 35, а сумма рангов второй выборки получается суммированием пятого столбца таблицы: RY = 20; тогда R = RХ + RY = 35 + 20 = 55, что совпадает с вычислением в предыдущем пункте. 157 5. Определим большую из двух ранговых сумм. Сумма рангов первой выборки больше: RХ = 35. 6. Определим эмпирическое значение критерия Uэмп по формуле: U эмп  (n1  n2 )  nx (nx  1) 5(5  1)  Tx  (5  5)   35  5 , 2 2 где п1 - объем первой выборки; п2 - объем второй выборки; Тх - большая из двух ранговых сумм; пх - объем выборки с большей суммой рангов. 7. Определим критическое значение для уровня значимости α =0,05 и объемов обследуемых выборок n1 = 5 и n2 =5 по таблице приложения: Uкр = 4. 8. Сравним расчетное значение критерия Uэмп c критическим Uкр: Uэмп>Uкр (5 > 4), то гипотеза Н0 принимается, т.е. результаты тройного прыжка спортсменов экспериментальной и контрольной групп до мезацикла тренировок не отличаются. Результаты применения U-критерия Манна-Уитни, полученные с помощью программы Statistica, приведены на рис. 2.49 Mann-Whitney U Test (Spreadsheet1) By variable гр Marked tests are significant at p <,05000 Rank Sum Rank Sum U Z p-level Z p-level Valid N Group 2 adjusted Group 1 variable Group 1 до 35,00000 20,00000 5,000000 1,566699 0,117186 1,566699 0,117186 5 Рис. 2.49. Результаты сравнения показателей двух групп до проведения цикла тренировок Как видно, значение р оказалось больше 0,05. Поэтому следует сделать вывод об отсутствии статистически достоверных различий между результатами, показанными спортсменами контрольной и экспериментальной групп до цикла тренировок. Перейдем к анализу данных, полученных после мезоцикла тренировок (таблица 2.25 и 2.26). 158 Таблица 2.25 Первая выборка №п/п 1 2 3 4 5 Хi(м) 7,53 7,4 7,76 8,05 8,89 Таблица 2.26 Вторая выборка №п/п 1 Yi(м) 7,26 2 7,3 3 7,41 4 7,2 5 7,55 1. Сформулируем гипотезу Н0: результаты тройного прыжка спортсменов экспериментальной и контрольной групп после мезоцикла тренировок не отличаются. 2. Составим объединённую таблицу исходных данных двух выборок (таблица 2.27). Таблица 2.27 Результаты тройного прыжка спортсменов экспериментальной и контрольной групп после мезоцикла тренировок №п/п 1 1 2 3 4 5 6 7 8 9 10 Сумма Хi(м) 2 RХ 3 7,4 4 7,53 7,76 8,05 8,89 Yi(м) 4 7,2 7,26 7,3 RY 5 1 2 3 7,41 5 7,55 7 6 8 9 10 37 18 3. Ранжируем объединенную выборку по степени возрастания признака. Определим общую сумму рангов по формуле: R i  (n1  n2 )( n1  n2  1) (5  5)(5  5  1)   55 2 2 159 4. Посчитаем сумму рангов отдельно в каждой выборке и сравним с расчетной суммой. Сумма рангов первой выборки получается суммированием значений третьего столбца таблицы: RХ = 37, а сумма рангов второй выборки получается суммированием пятого столбца таблицы: RY = 18; тогда R= RХ+ RY = 37 + 18 = 55, что совпадает с вычислением в предыдущем пункте. 5. Определим большую из двух ранговых сумм. Сумма рангов первой выборки больше: RХ = 37. 6. Определим эмпирическое значение критерия Uэмп по формуле: U эмп  (n1  n2 )  nx (nx  1) 5(5  1)  Tx  (5  5)   37  3 , 2 2 где п1- объем первой выборки; п2 - объем второй выборки; Тх - большая из двух ранговых сумм; пх - объем выборки с большей суммой рангов. 7. Определим критическое значение для уровня значимости α = 0,05 и объемов обследуемых выборок n1 = 5 и n2 = 5 по таблице 7 Приложения: Uкр = 4. 8. Сравним расчетное значение критерия Uэмп c критическим Uкр: Uэмп < Uкр (3 < 4), то гипотеза Н0 отвергается, и принимается альтернативная гипотеза Н1, следовательно, результаты тройного прыжка спортсменов экспериментальной группы больше результатов контрольной группы (p<0,05), что свидетельствует об эффективности экспериментальной методики тренировки. Результаты применения U-критерия Манна-Уитни к рассматриваемым данным, полученные с помощью программы Statistica, приведены на рис. 2.50. 160 Mann-Whitney U Test (Spreadsheet1) By variable гр Marked tests are significant at p <,05000 Rank Sum Rank Sum U Z p-level Z p-level Valid N variable Group 1 Group 2 adjusted Group 1 после 37,00000 18,00000 3,000000 1,984485 0,047203 1,984485 0,047203 5 Рис. 2.50. Результаты сравнения показателей двух групп после проведения цикла тренировок Как видно, значение р оказалось меньше 0,05. Поэтому следует сделать вывод о наличии статистически достоверных различий между результатами, показанными спортсменами контрольной и экспериментальной групп после цикла тренировок. Спортсмены экспериментальной группы оказались подготовленными лучше. Рассмотрим, как изменились результаты спортсменов двух групп вследствие проведения цикла тренировок. Для этого сравним результаты спортсменов каждой из рассматриваемых групп, показанные ими до и после цикла тренировок. Результаты применения Т-критерия Вилкоксона, полученные с помощью программы Statistica, приведены на рис. 2.51 и 2.52. Пара перем. к до & к после Критерий Вилкоксона (малые выборки Вилк) Отмеченные критерии значимы на уровне p <,05000 Число T Z p-уров. набл. 5 5,500000 0,539360 0,589639 Рис. 2.51. Результаты сравнения показателей спортсменов контрольной группы до и после проведения цикла тренировок Критерий Вилкоксона (малые выборки Вилк) Отмеченные критерии значимы на уровне p <,05000 Число T Z p-уров. набл. Пара перем. э до & э после 5 4,000000 0,943880 0,345232 Рис. 2.52. Результаты сравнения показателей спортсменов экспериментальной группы до и после проведения цикла тренировок 161 Как видно из рассмотрения результатов расчетов, приведенных на двух рисунках, значение р в обоих случаях оказалось больше 0,05. Поэтому считать достоверными изменения показателей нельзя. В экспериментальной группе у четырех спортсменов из пяти наблюдается улучшение показателей, и только у одного – ухудшение. Несмотря на такое соотношение различия оказываются статистически недостоверными. Поэтому для обоснования целесообразности применения выбранной системы тренировки следует продолжить исследования, увеличив количество его участников. Приведём пример некорректного подбора групп. В литературе встречаются данные, являющиеся результатом проведённого педагогического эксперимента. Из них был выбран конкретный пример. Приведены результаты бега на 30 метров спортсменов экспериментальной (первая) и контрольной (вторая) групп до и после мезацикла тренировок. Результаты даны в таблице 2.28. Таблица 2.28 Результаты бега на 30 метров спортсменов экспериментальной и контрольной групп до и после мезоцикла тренировок Экспериментальная группа Хi(с) 1. 2. 3. 4. 5. До тренировок После тренировок 4,4 4,4 4,3 4 4,1 4,3 4,4 4,4 4 4,1 Рассмотрим результаты бега Контрольная группа Yi(с) До После тренировок тренировок 4,5 4,5 4,5 4,4 4,8 4,8 4,6 4,8 4,6 4,6 на 30 метров спортсменов экспериментальной (первая) и контрольной (вторая) групп до тренировок. Они приведены в таблицах 2.29 и 2.30. 162 Таблица 2.29 Первая выборка. №п/п Хi(с) 1 4,4 2 4,4 3 4,3 4 4 5 4,1 Таблица 2.30 Вторая выборка. №п/п Yi(с) 1 4,5 2 4,5 3 4,8 4 4,6 5 4,6 9. Составим объединённую таблицу исходных данных двух выборок (таблица 2.31). Таблица 2.31 Объединённая таблица исходных данных двух выборок №п/п 1 1 2 3 4 5 6 7 8 9 10 Сумма Хi(с) 2 4 4,1 4,3 4,4 4,4 RХ 3 1 2 3 4 5 Yi(с) 4 RY 5 4,5 4,5 4,6 4,6 4,8 6 7 8 9 10 40 15 10. Ранжируем объединённую выборку по степени возрастания признака. Определим общую сумму рангов по формуле: R i  (n1  n2 )( n1  n2  1) (5  5)(5  5  1)   55 2 2 11. Посчитаем сумму рангов отдельно в каждой выборке и сравним с расчетной суммой. 163 Сумма рангов первой выборки получается суммированием значений третьего столбца таблицы: RХ = 15; а сумма рангов второй выборки получается суммированием пятого столбца таблицы: RY = 40; тогда R = RХ + RY = 15 + 40 = 55, что совпадает с вычислением в предыдущем пункте. 12. Определим большую из двух ранговых сумм. Сумма рангов второй выборки больше: RХ = 40. 13. Определим эмпирическое значение критерия Uэмп по формуле: U эмп  (n1  n2 )  n x (n x  1) 5(5  1)  Tx  (5  5)   40  0 , 2 2 где п1- объем первой выборки; п2 - объем второй выборки; Тх - большая из двух ранговых сумм; пх - объем выборки с большей суммой рангов. 14. Определим критическое значение для уровня значимости α = 0,05 и объемов обследуемых выборок n1 = 5 и n2 = 5 по таблице приложения: Uкр = 4. 15. Сравним расчетное значение критерия Uэмп c критическим Uкр: Uэмп < Uкр (0 < 4), то гипотеза Н0 отвергается и принимается Н1 – результаты бега на 30 метров спортсменов экспериментальной и контрольной групп до мезацикла тренировок различаются. Результаты применения U-критерия Манна-Уитни, полученные с помощью программы Statistica, приведены на рис. 2.53. U критерий Манна-Уитни (Таблица данных49) По перем. группа Отмеченные критерии значимы на уровне p <,05000 Сум.ранг Сум.ранг U Z p-уров. Z p-уров. N N 2-х стор Э К скорр. Э К точное p Перем. до 15,00000 40,00000 0,00 -2,50672 0,012186 -2,52982 0,011413 5 5 0,007937 Рис. 2.53. Результаты сравнения показателей двух групп до проведения цикла тренировок 164 Как видно, значение р оказалось меньше 0,05. Поэтому следует сделать вывод о наличии статистически достоверных различий между результатами, показанными спортсменами контрольной и экспериментальной групп до цикла тренировок. Спортсмены экспериментальной группы до начала проведения педагогического эксперимента оказались подготовленными лучше. Таким образом, сравнение фоновых данных экспериментальной и контрольной групп показало следующее: при таком подборе групп эксперимент нельзя было проводить, поскольку есть достоверные различия в ряде исходных показателей. Если, несмотря на это, проводить педагогический эксперимент, то его результаты нельзя считать доказательными и надежными. Даже в случае положительных сдвигов в экспериментальной группе по сравнению с контрольной, связать преимущество в результатах экспериментальной группы с влиянием новой экспериментальной методики группы подготовки и перед невозможно, мезоциклом т.к. испытуемые тренировок имели преимущество. В таком случае можно сделать следующее: 1. Перед началом эксперимента изменить состав экспериментальной и контрольной групп, перемещая испытуемых из одной группы в другую до тех пор, пока между фоновыми показателями групп не будет статистических различий. 2. Увеличить количество испытуемых в группах. Вопросы по разделу 2 1. Как создать файл с исходными данными в программе STATISTICA? 2. Чем различается подготовка данных для сравнения связанных и несвязанных выборок для программы STATISTICA? 3. Какие процедуры проверки статистических гипотез, реализованные в программе STATISTICA, вы знаете? 165 4. Как производится расчет параметров описательной статистики в программе STATISTICA? 5. Как указать в программе STATISTICA описательные характеристики, подлежащие определению? 6. Зачем нужна проверка гипотезы о нормальности распределения при сравнении выборочных данных? 7. Какой критерий проверки гипотезы о нормальности распределения является наиболее мощным? 8. Всегда ли исследование на нормальность является обязательным? 9. Опишите процедуру применения критерия Стьюдента для связанных выборок в программе STATISTICA. 10. В чем состоит процедура применения критерия Стьюдента для несвязанных выборок в программе STATISTICA? 11. Как установить требуемый уровень значимости при проведении расчетов? 12. На основе анализа какой величины делается вывод о принятии или отклонении нулевой гипотезы? 13. Опишите процедуру применения критерия Манна-Уитни в программе STATISTICA. Для каких выборок он применим? 14. Опишите процедуру применения критерия Вилкоксона в программе STATISTICA? В каком случае он используется? 15. Вычисление статистических характеристик в программе Excel. 16. Использование Мастера функций для вычисления статистических характеристик в программе Excel. 17. Использование надстройки Анализ данных для вычисления статистических характеристик в программе Excel. 18. Ввод формул в ячейки для вычисления статистических характеристик в программе Excel. 19. Сравнение дисперсий двух независимых выборок в программе Excel. 166 20. Сравнение средних арифметических двух независимых выборок в программе Excel. 21. Сравнение средних арифметических двух зависимых выборок в программе Excel. 167 3. Исследование взаимосвязи между выборками изучаемых показателей Постановка задачи. Даны результаты экспериментального исследования двух признаков. Исследовать, существует ли статистическая взаимосвязь между этими признаками. Сравнить вариацию двух обследуемых признаков. Рассчитать коэффициент ранговой корреляции Спирмена. Если между двумя наборами данных существует связь, то построить линию регрессии. 3.1. Коэффициент корреляции Браве-Пирсона 3.1.1. Пример исследования корреляционных зависимостей Пример. В соревнованиях по десятиборью участвовали 20 спортсменов. Результаты, показанные ими в метании диска и толкании ядра, приведены в таблице 3.1. Таблица 3.1 Результаты метания диска и толкания ядра i, порядк овый номер 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 xi, метание диска (м) 40,9 49,47 45,44 45,64 43,76 36,08 33,92 40,22 39,47 38,38 38,68 47,14 36,47 39,03 46,3 33,47 44,97 38,83 168 yi, толкание ядра (м) 13,84 16,51 15,83 16,47 13,40 13,45 13,88 15,06 14,68 13,97 13,70 14,68 12,85 14,84 15,65 12,27 14,97 13,99 19 20 42,68 30,79 15,03 11,77 Исследовать, существует ли связь между результатами, показанными спортсменами в метании диска и результатами в толкании ядра. Сравнить вариацию двух обследуемых признаков. Если между двумя наборами данных существует связь, то построить линию регрессии. Построим корреляционное поле, откладывая в прямоугольной системе координат по оси OX результаты, показанные в метании диска, а по оси OY – результаты, показанные в толкании ядра (рис. 3.1). Проведем огибающую для нанесенных точек. толкание ядра (м) 17,00 16,00 15,00 14,00 13,00 12,00 11,00 25 35 45 55 метание диска (м) Рис. 3.1. Корреляционное поле Как видно из рисунка, огибающая имеет форму, близкую к эллипсу. Это позволяет предположить, что два набора данных связаны между собой линейной связью. Из рис. 3.1 видно, что увеличение значения результата, показанного в метании диска, приводит к увеличению значения результата, показанного в толкании ядра. Следовательно, предполагаемая связь является положительной. Поскольку связь линейная, а измерения значений исследуемых 169 признаков производятся в шкале отношений, то для оценки ее силы можно воспользоваться коэффициентом корреляции Браве-Пирсона n  ( xi  x )( yi  y ) r Для i 1  ( x  x )2    n ( y  y )2  i i     i 1 i 1 n определения коэффициента корреляции Браве-Пирсона воспользуемся вспомогательной таблицей. Построим таблицу, содержащую 8 столбцов и 23 строки (таблица 3.2). В первом столбце разместим номера результатов (или спортсменов). Во втором и третьем столбцах – результаты, показанные спортсменами в метании диска (xi) и толкании ядра (yi). Таблица 3.2 Определение коэффициента корреляции 1 2 3 4 5 6 7 yi xi  x yi  y ( xi  x )( yi  y ) ( xi  x ) 8 2 ( yi  y ) 2 i xi 1 40,9 13,84 0,318 -0,502 -0,159636 0,101124 0,252004 2 49,47 16,51 8,888 2,168 19,269184 78,996544 4,700224 3 45,44 15,83 4,858 1,488 7,228704 23,600164 2,214144 4 45,64 16,47 5,058 2,128 10,763424 25,583364 4,528384 5 43,76 13,40 3,178 -0,942 -2,993676 10,099684 0,887364 6 36,08 13,45 -4,502 -0,892 4,015784 20,268004 0,795664 7 33,92 13,88 -6,662 -0,462 3,077844 44,382244 0,213444 8 40,22 15,06 -0,362 0,718 -0,259916 0,131044 0,515524 9 39,47 14,68 -1,112 0,338 -0,375856 1,236544 0,114244 10 38,38 13,97 -2,202 -0,372 0,819144 4,848804 0,138384 11 38,68 13,70 -1,902 -0,642 1,221084 3,617604 0,412164 12 47,14 14,68 6,558 0,338 2,216604 43,007364 0,114244 13 36,47 12,85 -4,112 -1,492 6,135104 16,908544 2,226064 14 39,03 14,84 -1,552 0,498 -0,772896 2,408704 0,248004 15 46,3 15,65 5,718 1,308 7,479144 32,695524 1,710864 16 33,47 12,27 -7,112 -2,072 14,736064 50,580544 4,293184 17 44,97 14,97 4,388 0,628 2,755664 19,254544 0,394384 18 38,83 13,99 -1,752 -0,352 0,616704 3,069504 0,123904 19 42,68 15,03 2,098 0,688 1,443424 4,401604 0,473344 170 20 30,79 11,77 -9,792 -2,572 25,185024 95,883264 6,615184 Сумма 811,64 286,84 0 0 102,40092 481,0747 30,97072 Вычислим суммы значений xi и yi и занесем их в соответствующие ячейки строки «Сумма» (последняя строка таблицы) столбцов 2 и 3: 20  xi  x1  x2  x3    x19  x20  811,64 ; i 1 20  yi  y1  y2  y3    y19  y20  286,84 . i 1 Рассчитаем средние значения признаков xi и yi: x 1 20 811,64  40,58 ;  xi  20 i 1 20 y 1 20 286,64  14,34 .  yi  20 i 1 20 В ячейках столбца 4 вычислим разность значений результатов метания диска xi и их среднего значения x : xi  x , а в ячейках столбца 5 – аналогичную разность для толкания ядра yi  y . Суммы элементов этих столбцов должны быть равны нулю, поскольку сумма отклонений значений признака от среднего значения равна нулю. В столбце 6 подсчитаем произведения отклонений двух исследуемых признаков от их средних значений ( xi  x )( yi  y ). В столбце 7 вычислим квадраты отклонений результатов метания диска от среднего их значения – ( xi  x )2, а в столбце 8 – квадраты отклонений результатов толкания ядра от их среднего значения – ( yi  y )2. Подсчитаем соответствующие суммы и занесем результаты в последнюю строку таблицы: 20  ( xi  x )  ( yi  y )  102,4009 ; i 1 20  ( xi  x )2  481,0747 ; i 1 20  ( yi  y )2  30,9707 . i 1 171 Используя полученные значения вспомогательных сумм, вычислим значение коэффициента корреляции Браве-Пирсона: n r  ( xi  y )  ( y i  y ) i 1  n ( x  x )2    n ( y  y )2  i i     i 1 i 1  102,4009  0,839 . 481,0747  30,9707 Коэффициент корреляции лежит в интервале 0,7  r  0,99 , поэтому можно сделать предположение о том, что между результатами, показанными спортсменами в метании диска, и результатами, показанными ими в толкании ядра, существует линейная положительная сильная статистическая взаимосвязь. Коэффициент детерминации в рассматриваемом случае равен D  r 2 100%  0,839  0,839 100%  70,4% . Таким образом, 70% взаимосвязи между двумя наборами данных объясняется их взаимовлиянием. Остальная часть вариации обусловлена воздействием других неучтенных причин. Для обоснования статистической значимости полученного коэффициента корреляции воспользуемся двусторонним критерием. статистической значимости α=0,05. Соответствующее Зададимся уровнем ему критическое значение коэффициента корреляции для объема выборки n=20 равно rкр=0,468 (таблица 8 Приложения). Так как значение выборочного коэффициента корреляции превосходит значение критического для заданного уровня значимости, то делаем вывод о статистической значимости коэффициента корреляции на уровне значимости 0,05. Приведем возможную интерпретацию полученных расчетов. Между результатами, показанными спортсменами в метании диска, и результатами, показанными ими в толкании ядра, существует значимая положительная взаимосвязь. В каждом из выбранных видов спорта результативность определяется, прежде всего, двумя причинами: соответствующим развитием физических качеств и техникой выполнения упражнения, т.е., в сущности, 172 умением реализовать свой физический потенциал в конкретном двигательном действии. Метание диска и толкание ядра – это два разных двигательных действия, отличающиеся по технике выполнения каждого из них. Зачастую сложно разделить вклад в результат физического потенциала спортсмена и уровня реализации его технического навыка. Установив наличие сильной корреляционной связи между результатами в каждом виде спорта, мы можем проинтерпретировать этот факт тем, что, во-первых, спортсмены в достаточной мере развили силовые и скоростно-силовые возможности мышечных групп, которые и в том и другом виде спорта являются ведущими при выполнении упражнений. И, во-вторых, техника выполнения спортивной попытки с большей или меньшей эффективностью позволяет реализовать физический потенциал натренированного мышечного аппарата. Чтобы убедиться, насколько техника исследуемых упражнений эффективна, полезно подсчитать коэффициенты вариативности для каждой из выборок. Для этого, используя значения сумм столбцов 7 и 8 таблицы 3, необходимо вычислить дисперсии и стандартные отклонения:  x2  1 n 481,0747  25,32  ( xi  xcp ) 2  n  1 i 1 20  1  y2  1 n 30,9707  1,63  ( yi  ycp ) 2  n  1 i 1 20  1  x   x2  25,53  5,03  y   y2  1,63  1,28 Подсчитаем коэффициенты вариации двух признаков: Vx  x Vy  x 100%  y y 5,03 100%  12,4% ; 40,58  100%  1,28 100%  8,9% . 14,3 Поскольку коэффициент вариации у результатов в метании диска больше, чем у результатов в толкании ядра, то это свидетельствует о большем разбросе 173 данных в выборке попыток метания диска. Можно проинтерпретировать этот факт тем, что техника толкания ядра у этой группы спортсменов более рациональна и отработана, чем техника метания диска. Обоснуем статистическую значимость коэффициента корреляции иным способом. Он используется тогда, когда таблицы критических значений коэффициента корреляции оказались по каким-либо причинам недоступными. В том случае для проверки статистической значимости применяется t-критерий Стьюдента, таблицы критических значений которого гораздо доступнее. Вычислим эмпирическое значение t-критерия t эм п : t эм п  r n2 1  r2  0,839  20  2 1  0,839 2  6,54 . Сопоставим полученное значение с критическим значением критерия t кр для числа степеней свободы  n  2  20  2  18 и уровня значимости α=0,05. Критическое значение определяется с помощью специальных таблиц (таблица3 Приложения). В рассматриваемом случае оно равно t кр = 2,101. Поскольку эмпирическое значение критерия оказалось больше критического, то можно сделать вывод о том, что на уровне значимости 0,05 коэффициент корреляции является статистически значимым. 3.1.2. Пример исследования корреляционной зависимости в программе MS EXCEL Запустим программу MS Excel и введем исходные данные. Построим корреляционное поле:  выделим два ряда исходных данных (метание диска и толкание ядра);  на вкладке Вставка, в группе Диаграммы, выберем Вставка точечной диаграммы, Точечная с маркерами;  получим корреляционное поле (рис. 3.2) 174 Рис. 3.2. Корреляционное поле Вычислим средние значения, стандартные отклонения, дисперсии, коэффициент корреляции Браве-Пирсона с помощью встроенных функций Excel и коэффициенты вариации и детерминации с помощью ввода прямых формул:  в ячейках А22, А23, А24, А25, А26, А27 ввести названия статистических характеристик (среднее, стандартное отклонение, дисперсия, коэффициент вариации, Пирсон – коэффициент корреляции, D – коэффициент детерминации);  выделить текущую ячейку для ввода соответствующей формулы (например, В22);  вызвать Мастер функций можно щелчком по кнопке fx в строке формул или на ленте на вкладке Формулы из Библиотеки функций (рис. 3.3) выбрать категорию Статистические и нужную функцию; Рис 3.3. Библиотека функций на вкладке Формулы 175  в окне Мастера функций (рис. 3.4) выбрать категорию Статистические и нужную функцию (например, Срзнач), ОК; Рис 3.4. Выбор функции СРЗНАЧ в окне Мастера функций  в следующем окне необходимо указать интервал ячеек с исходными данными (В2:В21), ОК;  аналогично в ячейках В23, В24 можно рассчитать стандартное отклонение и дисперсию для результатов метания диска. Для организации вычислений в ячейках С22, С23, С24 можно скопировать формулы из ячеек В22, В23, В24;  для вычисления коэффициента корреляции в ячейке В26 также можно воспользоваться Мастером функций, в категории Статистические (рис. 3.5), выбрать функцию PEARSON, ОК; 176 Рис 3.5. Выбор функции PEARSON в окне Мастера функций  в следующем окне необходимо указать интервал ячеек с исходными данными (В2:В21; С2:С21), ОК (рис. 3.6); Рис 3.6. Окно ввода аргументов функции  в ячейке В26 получим коэффициент корреляции;  в ячейке В25, С25 и В27 введем формулы для расчета коэффициентов вариации и детерминации;  формулы для расчета средних значений, стандартных отклонений, дисперсий, коэффициентов вариации, корреляции представлены на рис. 3.7; Рис 3.7. Формулы для вычислений  в результате вычислений получим (рис. 3.8): 177 и детерминации Рис 3.8. Таблица исходных данных и результатов вычислений 3.1.3. Пример исследования корреляционной зависимости в программе STATISTICA Рассмотрим пример о соревнованиях по десятиборью, в которых участвовали 20 спортсменов (см. таблицу 3.1). STATISTICA и введем исходные данные (см. рис. 3.9). 178 Запустим программу Рис. 3.9. Пример оформления данных для расчета коэффициента корреляции Браве-Пирсона Для расчета коэффициента корреляции Браве-Пирсона необходимо выполнить следующие действия:  Запустить модуль анализа из меню Анализ (Statistics)>Основные статистики и таблицы (Basic Statistics/Tables). См. рис. 3.10. 179 Рис.3.10. Выбор пункта «Основные статистики и таблицы» В появившемся окне (см. рис. 3.11) выбрать пункт Парные и частные корреляции (Correlation Matrices). Рис.3.11. Запуск модуля «Парные и частные корреляции»  В появившемся окне выбрать переменные, которые должны участвовать в анализе. Для этого следует нажать либо кнопку «Квадратная матрица» (One variable list) либо «Прямоугольная матрица» (Two lists rect. matrix). В первом случае, анализируемые переменные последовательно выбираются из одного списка и выводится корреляционная матрица, а во втором – из двух (рис. 3.12). 180 Рис. 3.12. Выбор способа задания переменных для расчета коэффициента корреляции Нажав кнопку «Прямоугольная матрица», выберем переменные для анализа (см. рис. 3.13). Рис. 3.13. Выбор переменных для расчета коэффициента корреляции Браве-Пирсона  Далее необходимо проверить условия применимости коэффициента Пирсона. Для визуальной оценки выполнения этих условий можно нажать 181 кнопку Матричная диаграмма рассе6яния (Scatterplot matrix for selected variables). В результате программа построит точечный график, по осям которого будут отложены значения соответствующих переменных (рис. 3.14). Рис.3.14. Визуальная оценка условий применимости коэффициента корреляции Браве-Пирсона Диагональная линия на этом графике служит для оценки линейности связи между анализируемыми признаками. Если точки-наблюдения укладываются вдоль этой линии на близком расстоянии, то можно говорить о существовании линейной зависимости. Вместе с диаграммой рассеяния 182 программа строит также распределения значений анализируемых признаков в виде гистограмм, по форме которых можно проверить условие о нормальности распределения.  Нажать на кнопку Матрица парных корреляций (Summary: Correlation matrix), или ОК. В результате появится таблица, содержащая рассчитанный программой коэффициент корреляции (рис. 3.15). Переменная Метание диска Толкание ядра Корреляции (Корреляция.sta) Отмеченные корреляции значимы на уровне p <,05000 N=20 (Построчное удаление ПД) Средние Ст.откл. Метание Толкание диска ядра 40,582 5,032 1,000 0,839 14,342 1,277 0,839 1,000 Рис. 3.15. Результат расчета коэффициента Браве-Пирсона В рассматриваемом случае коэффициент оказался очень высоким (r=0,839), что указывает на существование тесной связи между результатами, показанными спортсменами в метании диска и толкании ядра. Одновременно с расчетом коэффициента программа 183 оценивает и его статистическую значимость, т.е. проверяет нулевую гипотезу о том, что в действительности связь между признаками отсутствует. Статистически значимые коэффициенты корреляции Браве-Пирсона выделяются красным цветом (p < 0,05). Если необходимо вывести уровни значимости рассчитываемых коэффициентов корреляции, то перед вычислением следует перейти на вкладку «Опции» окна «Парные и частные корреляции» и выбрать пункт «Отображать p–уровень и N» (см. рис. 3.16) Рис. 3.16. Вкладка «Опции» В этом случае результаты расчетов примут вид, изображенный на рис. 3.17. Каждой строке корреляционной матрице будет соответствовать строка соответствующих уровней значимости. 184 Переменная Метание диска Толкание ядра Корреляции (Корреляция) Отмеченные корреляции значимы на уровне p <,05000 N=20 (Построчное удаление ПД) Метание Толкание диска ядра 1,0000 ,8389 p= --p=,000 1,0000 ,8389 p=,000 p= --- Рис. 3.17. Результаты расчета с уровнями значимостей 3.1.4. Множественная корреляция. Пример вычисления коэффициентов корреляции для большого количества показателей в программе MS EXCEL Для определения корреляционных зависимостей среди большого количества показателей в программе MS Excel удобно воспользоваться встроенной надстройкой программы Анализ данных. Таблица вычисленных коэффициентов корреляции по множеству показателей будет называться корреляционной матрицей. В корреляционной матрице легко увидеть наличие и отсутствие корреляционных зависимостей между соответствующими показателями. Чтобы воспользоваться Анализом данных, необходимо убедиться, что эта функция включена (на ленте на вкладке Данные обнаружить функцию Анализ данных). В случае отсутствия необходимо включить эту функцию: щелкнуть по 185 кнопке Office в правом верхнем углу окна программы, далее щелкнуть по кнопке Параметры Excel, в открывшемся окне слева выбрать пункт Надстройки, в поле Управление выбрать Надстройки Excel, щелкнуть кнопку Перейти, в следующем окне включить Пакет анализа и ОК. Рассмотрим пример, в котором необходимо выявить взаимосвязь контрольных упражнений у прыгунов в высоту с результатами в прыжках в высоту с разбега. В качестве контрольных упражнений были выбраны наиболее распространенные упражнения:  бег 100 м;  прыжок в длину с места;  прыжок тройной с места;  прыжок в длину с разбега;  метание ядра (7,257 кг) двумя руками назад через голову;  полный присед со штангой максимального веса. Для расчета корреляционной матрицы в программу введем следующие данные (см. таблицу 3.3). Таблица 3.3 высота 100 № (м) м (с) 1 2 3 4 5 6 7 8 9 10 11 12 13 2,1 2,1 2,1 2,15 2,08 2,08 2,18 2,24 2,15 2,15 2,15 2,24 2,21 11,3 11,7 11,4 11,6 11,4 11,7 11 10,8 11,7 11,1 11,4 11,2 11,6 длина длина тр ядро присед с/м с/р с/м (м) (кг) (м) (м) (м) 3,28 6,62 1,05 15,5 90 3,1 6,86 9,4 13,7 90 3,25 6,52 10,1 14,6 100 3,19 6,78 9,8 14,2 100 3,08 6,6 9,5 12,3 80 3,12 6,57 9,3 13,8 90 3,45 7,28 10,2 15,8 110 3,42 7,12 10,45 17,2 130 3,12 6,73 9,45 13,9 110 3,27 7,03 10,05 16,3 120 3,16 6,97 9,55 15,2 125 3,28 6,92 10,15 15,6 130 3,25 6,9 9,9 15,5 120 186 14 15 16 17 18 19 20 21 22 23 24 25 26 27 2,15 2,36 2,4 2,33 2,31 2,25 2,25 2,31 2,25 2,25 2,24 2,38 2,28 2,38 11,7 10,9 10,9 11 10,9 11,2 11,3 11 11,3 11,4 11,1 10,4 10,7 10,7 3,23 3,15 3,56 3,3 3,51 3,15 3,15 3,37 3,15 3,15 3,28 3,42 3,4 3,45 6,56 9,7 14,5 7,15 9,9 17,27 7,3 10,57 17,8 7,4 10,31 17,01 7,41 10,6 17,81 7,35 10,09 16,05 7,21 9,4 15,5 7,42 10,2 17,21 7,15 9,3 16 7,01 9,41 15,51 7,41 9,81 16,55 7,45 10,7 16,8 7,44 10,7 16 7,44 10,7 16,7 115 120 120 100 120 100 100 120 120 110 120 125 130 140 Далее на ленте на вкладке Данные вызвать Анализ данных (рис. 3.18), выбрать Корреляция, ОК. Рис. 3.18. Окно Анализ данных В следующем окне (рис.3.19) необходимо задать параметры для расчетов 187 Рис 3.19. Окно ввода параметров для вычисления корреляционной матрицы В поле Входной интервал указать область с исходными данными, включить параметр Метки в первой строке (обозначение столбцов), указать выходной интервал для размещения результатов вычислений, можно результаты разместить на новом рабочем листе или новом файле). После незначительного форматирования результаты вычислений показаны в таблице 3.4. Таблица 3.4 высота 100 м длина длина (м) (с) с/м (м) с/р (м) высота (м) 100 м (с) длина с/м (м) длина с/р (м) тр с/м (м) ядро (м) присед (кг) 1 -0,78 0,60 0,84 0,41 0,84 0,64 1 -0,74 -0,80 -0,27 -0,78 -0,59 1 0,59 0,21 0,72 0,58 тр с/м (м) 1 0,42 1 0,80 0,21 0,56 0,43 ядро (м) 1 0,66 присед (кг) 1 Проведенный корреляционный анализ позволяет выявить наиболее информативные контрольные тесты, отражающие силовую, скоростную и скоростно-силовую подготовленность прыгунов в высоту (первый столбец корреляционной матрицы). 188 Для выявления силовой подготовленности может служить упражнение в метании ядра двумя руками назад через голову, стоя спиной в направлении метания (r=0,84). Скоростная подготовка может оцениваться по результату в беге на 100 м по движению (r=-0,78). 3.1.5. Множественная корреляция. Пример вычисления коэффициентов корреляции для большого количества показателей в программе STATISTICA Введем исходные данные, приведенные в таблице 3.3 (см. рис. 3.20). Рис. 3.20 Общий вид исходных данных для анализа Запустим модуль Парные и частные корреляции (см. рис. 3.21) 189 Рис. 3.21 Выбор модуля для анализа Зададим способ выбора переменных для анализа Квадратная матрица (см. рис 3.22). Рис. 3.22 Окно «Парные и частные корреляции Выберем переменные для анализа (см. рис. 3.23). 190 Рис. 3.23 Выбор переменных для анализа Нажимая кнопку Матрица парных корреляций (или ОК), получим корреляционную матрицу, приведенную на рис. 3.24. 191 Корреляции (Корреляция 2.sta) Отмеченные корреляции значимы на уровне p <,05000 N=27 (Построчное удаление ПД) Высота 100 м длина с/м длина с/р Переменная Средние Ст.откл. Высота 2,22 0,10 1,00 -0,78 0,60 0,84 100 м 11,20 0,35 1,00 -0,78 -0,74 -0,80 длина с/м 3,27 0,14 1,00 0,60 -0,74 0,59 длина с/р 7,06 0,32 1,00 0,84 -0,80 0,59 тр с/м 9,64 1,78 -0,27 0,21 0,42 0,41 ядро 15,72 1,37 0,84 -0,78 0,72 0,80 присед 112,41 14,96 0,64 -0,59 0,58 0,56 тр с/м 0,41 -0,27 0,21 0,42 1,00 0,21 0,43 Рис. 3.24. Вид корреляционной матрицы в программе STATISTICA ядро 0,84 -0,78 0,72 0,80 0,21 1,00 0,66 присед 0,64 -0,59 0,58 0,56 0,43 0,66 1,00 Перед вычислением элементов корреляционной матрицы необходимо было проверить зависимости на линейность. Здесь этот шаг был пропущен, ибо он совершенно аналогичен описанному ранее в п. 3.1.3. Связь результатов тестов и спортивной результативности проявляется в значениях коэффициентов корреляции. Если указанный коэффициент как минимум более 0.5, то можно утверждать, что развитие физических качеств, фиксируемых тестом, влияет на спортивную результативность прыгуна. Чем выше значение коэффициента корреляции, тем в большей степени развитие конкретного физического качества определяет спортивный результат. 3.2. Коэффициент ранговой корреляции Спирмена 3.2.1. Пример вычисления коэффициента ранговой корреляции Спирмена Рассмотрим исследование взаимосвязи признаков с помощью коэффициента ранговой корреляции Спирмена. Пример. В ходе тренировок группа спортсменов из 20 человек выполняют упражнения «подъем-разгибом» и «отмах в стойку». Результаты, зафиксированные при выполнении этих упражнений, приведены в таблице 3.5. Результаты попыток выполнения упражнения «подъем-разгибом» каждым спортсменом приведены во второй колонке таблицы 8 и обозначены как x. Результаты попытки выполнений упражнения «отмах в стойку» приведены в третьей колонке таблицы 8 и обозначены как y. Задача: исследовать 192 зависимость между результатами выполнения упражнения «отмах в стойку» и результатами выполнения упражнения «подъем-разгибом». Таблица 3.5 Вычисление коэффициента ранговой корреляции Спирмена. 1 i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Сумма 2 xi 20 15 18 19 17 10 15 13 11 10 13 18 11 12 16 16 20 13 15 18 3 yi 10 7 9 8 5 3 7 5 3 3 6 8 3 4 6 7 11 2 7 9 4 RXi 19,5 10 16 18 14 1,5 10 7 3,5 1,5 7 16 3,5 5 12,5 12,5 19,5 7 10 16 210 5 RYi 19 12,5 17,5 15,5 7,5 3,5 12,5 7,5 3,5 3,5 9,5 15,5 3,5 6 9,5 12,5 20 1 12,5 17,5 210 6 di 0,5 -2,5 -1,5 2,5 6,5 -2 -2,5 -0,5 0 -2 -2,5 0,5 0 -1 3 0 -0,5 6 -2,5 -1,5 0 7 d i2 0,25 6,25 2,25 6,25 42,25 4 6,25 0,25 0 4 6,25 0,25 0 1 9 0 0,25 36 6,25 2,25 133 Построим корреляционное поле, откладывая по оси X декартовой системы координат результаты выполнения упражнения «подъем-разгибом», а по оси Y – соответствующие им результаты выполнения упражнения «отмах в стойку» (см. рис. 3.25). 193 "отмах в стойку" 11 9 7 5 3 1 8 10 12 14 16 18 20 22 "подъем разбигом" Рис. 3.25. Корреляционное поле Как видно из рассмотрения рисунка, увеличение значения одного признака, приводит к увеличению значения второго. Это позволяет предположить, что два набора данных связаны положительной связью. Поскольку предполагаемая связь является монотонной, то для оценки ее силы можно воспользоваться коэффициентом ранговой корреляции Спирмена. Вычислим ранги RXi и RYi значений исследуемых данных и занесем полученные результаты в 4 и 5 колонки таблицы 3.5. Вычислим разности рангов RXi и RYi. Полученные данные обозначим di и занесем в шестую колонку. Сумма разностей равна нулю, что может быть использовано для проверки корректности вычислений. 20 Определим квадраты разностей рангов и суммируем их (  d i2  133 ). i 1 Результат записываем в нижней строке таблицы. Поскольку как среди результатов выполнения упражнения «подъемразгибом», так и среди результатов выполнения упражнения «отмах в стойку» есть совпадающие значения, вычислим поправочные коэффициенты. Среди результатов выполнения упражнения «подъем-разгибом» есть 7 групп совпадающих значений – по два раза встречается значения 10, 11, 16, 20 и по три раза встречается значения 194 13, 15, 18. Поэтому 1 Tx  (4  (23  2)  3  (33  3))  48 . Среди результатов выполнения упражнения 2 «подъем-разгибом» по два раза встречаются значения 5, 6, 8, 9 и по четыре раза 1 встречаются значения 3, 7, поэтому Ty  (4  (23  2)  2  (43  4))  72 . 2 Подставим полученные значения в формулу для вычисления коэффициента корреляции Спирмена: rs  1  6  133  0,8985  0,9 . 20  (20  1)  48  72 2 Определим статистическую достоверность полученного коэффициента корреляции. Для n=20 и уровня значимости α=0,05 критическое значение rsкр=0,45 (см. таблицу 9 Приложения). Поскольку полученное значение rs превосходит критическое rsкр, то можно сделать вывод о статистически значимой положительной корреляции между результатами выполнения упражнения «отмах в стойку» и результатами выполнения упражнения «подъем-разгибом» (p<0,05). 3.2.2. Вычисление коэффициента корреляции Спирмена в программе STATISTICA Рассмотрим пример о взаимосвязи выполнения упражнений «подъемразгибом» и «отмах в стойку» (см. таблица 3.5). Рассчитаем для этого примера ранговый коэффициент корреляции Спирмена. Для этого необходимо выполнить следующие действия: Выполнить команду: Анализ (Statistics)> статистика (Nonparametrics) (см. рис. 3.26). 195 Непараметрическая Рис. 3.26. Выбор пункта «Непараметрическая статистика»  В появившемся окне выбрать пункт Корреляция Спирмена, тау Кендала, гамма (Correlations (Spearman, Kendalltau, gamma)). См. рис. 3.27. Рис 3.27. Выбор модуля «Ранговые корреляции» Нажать кнопку Переменные (Variables) в появившемся окне (рис. 3.28) 196 Рис. 3.28. Модуль непараметрического корреляционного анализа \  выбрать необходимые переменные для анализа (рис. 3.29) Рис. 3.29. Выбор переменных  Нажать кнопку Спирмена R (Spearman R) или ОК. Появится таблица с результатами анализа (рис. 3.30). 197 Ранговые корреляции Спирмена (Пирсон.sta) ПД попарно удалены Отмеченные корреляции значимы на уровне p <,05000 x y Перем. x 1,000 0,898 y 1,000 0,898 Рис. 3.30. Результат расчета коэффициента корреляции Спирмена Итоговая таблица содержит корреляционную матрицу. Статистически значимые коэффициенты корреляции выделяются красным цветом. В рассматриваемом примере коэффициент корреляции Спирмена равен 0,898 и является статистически значимым. При необходимости выведения численных значений уровня значимости следует выбрать пункт «Подробный отчет» (заголовок «Вычислить») окна «Ранговые корреляции», как это изображено на рис. 3.31. 198 Рис. 3.31. Модуль непараметрического корреляционного анализа Выбор переменных в этом случае осуществляется с помощью двух списков (см. рис. 3.32) Рис. 3.32. Выбор переменных из двух списков. 199 Вид результатов расчетов, появляющихся при нажатии кнопки «Спирмена R» или «Ок» приведен на рис. 3.33. Ранговые корреляции Спирмена (Пирсон) ПД попарно удалены Отмеченные корреляции значимы на уровне p <,05000 Число Спирмена t(N-2) p-уров. R Пара перем. набл. x&y 20 0,898 8,682794 0,000000 Рис. 3.33. Результаты анализа коэффициента ранговой корреляции В столбцах итоговой таблицы приведены Число наблюдений (Valid N), коэффициент корреляции Спирмена (Spearman R), t(N-2) – значение критерия Стьюдента для числа степеней свободы n-2), и p – вероятность ошибки для нулевой гипотезы об отсутствии связи между признаками. 3.3. Построение уравнения линейной регрессии При изучении корреляционной зависимости между переменными было отмечено, что коэффициент корреляции показывает степень связи, направление связи, форму связи между двумя исследуемыми выборками, но он не дает 200 возможности определить, как количественно меняется одна переменная с изменением другой. Регрессия – это зависимость среднего значения случайной величины У от величины Х, и, наоборот, зависимость среднего значения случайной величины Х от величины У, описанная уравнением, полученная путем построения эмпирической или теоретической линии регрессии, и, наконец, с помощью вычисления коэффициентов регрессии. Регрессионный анализ устанавливает формы зависимости между случайной величиной У и значениями одной или нескольких переменных величин. Такая зависимость чаще всего определяется уравнением регрессии. Уравнения регрессии могут быть разных типов. Существует линейная и нелинейная взаимосвязь между исследуемыми показателями, следовательно, можно составить уравнение линейной или нелинейной регрессии. 3.3.1. Пример исследования регрессии Определим значения коэффициентов регрессии для примера о метании диска и толкании ядра, рассмотренного ранее (см. п. 3.1. таблицы 3.1). Для этого воспользуемся вспомогательной таблицей 3.6. Таблица 3.6 Определение коэффициентов регрессии 1 2 3 4 5 6 i xi yi xi2 xiyi yi2 1 40,9 13,84 1672,81 566,056 191,5456 2 49,47 16,51 2447,2809 816,7497 272,5801 3 45,44 15,83 2064,7936 719,3152 250,5889 4 45,64 16,47 2083,0096 751,6908 271,2609 5 43,76 13,40 1914,9376 586,384 179,56 6 36,08 13,45 1301,7664 485,276 180,9025 7 33,92 13,88 1150,5664 470,8096 192,6544 8 40,22 15,06 1617,6484 605,7132 226,8036 9 39,47 14,68 1557,8809 579,4196 215,5024 201 10 38,38 13,97 1473,0244 536,1686 195,1609 11 38,68 13,70 1496,1424 529,916 187,69 12 47,14 14,68 2222,1796 692,0152 215,5024 13 36,47 12,85 1330,0609 468,6395 165,1225 14 39,03 14,84 1523,3409 579,2052 220,2256 15 46,3 15,65 2143,69 724,595 244,9225 16 33,47 12,27 1120,2409 410,6769 150,5529 17 44,97 14,97 2022,3009 673,2009 224,1009 18 38,83 13,99 1507,7689 543,2317 195,7201 19 42,68 15,03 1821,5824 641,4804 225,9009 20 30,79 11,77 948,0241 362,3983 138,5329 Сумма 811,64 286,84 33419,0492 11742,9418 4144,8300 Первые три столбца совпадают с соответствующими столбцами таблицы 6. В столбце 4 таблицы 7 вычисляем квадраты значений результатов метания диска xi2 , в столбце 5 произведения двух исследуемых признаков xi  yi . В последней строке таблицы подсчитаем соответствующие суммы: 20  xi2  33419 ,0419 ; i 1 20  xi  yi  11742 ,9418 . i 1 Вычислим коэффициент регрессии: n b n n n  xi yi  (  xi )(  yi ) i 1 i 1 n i 1 n n  x i  (  xi ) i 1 b 2 20  2 i 1 20 20 20 xi yi  (  xi )(  yi ) i 1 i 1 20 i 1 20 20 x i  (  xi ) 2 i 1 ; 2 i 1 20 11742 ,9418  811,64  286,84  0,213 . 20  33417 ,0492  811,64 2 Рассчитаем значение свободного члена уравнения регрессии a  y  bx  14,34  0,213  40,48  5,7 . Таким образом, уравнение регрессии имеет вид: y  5,7  0,213  x . 202 Определим стандартную ошибку предсказания. Для этого в столбце 6 таблицы 3 вычислим квадраты значений результатов толкания ядра yi2 и занесем их сумму в последнюю строку: 20  yi2  4144 ,83 . i 1 Используя полученные результаты, вычислим стандартную ошибку предсказания: S yx  n n n i 1 i 1 i 1  yi2  a  yi  b xi yi n2  4144 ,83  5,7  286,84  0,213  11742 ,9418  0,7 . 20  2 Стандартная ошибка предсказания является характеристикой точности предсказания значений случайной величины y по известным значениям случайной величины x. Зона, ограниченная двумя прямыми, отстоящими от регрессионной прямой на расстояние ±0.7, является областью, в которую с вероятностью 0,7 попадают экспериментальные значения yi. Это означает, что приблизительно 70% всех значений yi находятся в этой области. Проверим регрессии. Это статистическую осуществляется значимость с полученного помощью коэффициента t-критерия Стьюдента, эмпирическое значение которого вычисляется с помощью соотношения n t эмп  b  xi2  nx i 1 S yx 0,213  33419 ,0492  20  40,58 2   6,7 0,7 Зададимся уровнем статистической значимости α=0,05. Соответствующее ему критическое значение для объема выборки n=20 и числа степеней ν=n2=20-2=18 равно tкр=2,101 (см. таблицу 3 Приложения). Сравним эмпирическое значение t-критерия с критическим для выбранного уровня значимости. tэмп >tкр (tэмп > 2,101), поэтому коэффициент регрессии b=0,213 является статистически значимым на уровне статистической значимости α=0,05. 203 3.3.2. Пример исследования регрессии в программе MS EXCEL Построим линию регрессии на корреляционном поле и определим значения коэффициентов регрессии:  в программе Excel после построения корреляционного поля необходимо на диаграмме щелкнуть правой кнопкой мыши по любой точке на корреляционном поле и выбрать команду Добавить линию тренда (рис. 3.34); Рис. 3.34. Построение линии регрессии на корреляционном поле  в следующем окне Формат линии тренда (рис. 3.35) выбрать тип линии Линейная, Закрыть; Рис. 3.35. Окно выбора типа линии регрессии  в результате получим следующую диаграмму (корреляционное поле с линейной линией регрессии) (рис. 3.36); 204 Рис. 3.36. Корреляционное поле с линейной линией регрессии  для вычисления коэффициентов (а и b) уравнения регрессии ( Y  a  b  X ) с помощью Мастера функций (категория Статистические) в соответствующие ячейки (например, В28, В29) необходимо ввести следующие формулы (рис. 3.37): Рис. 3.37. Формулы для вычисления коэффициентов уравнения регрессии  в программе Excel коэффициент а называется функцией Отрезок, а коэффициент b называется функцией Наклон;  в результате получим (рис. 3.38), что а=5,7, b=0,21 и уравнение регрессии будет иметь вид: Y  5,7  0,21  X . 205 Рис. 3.38. Таблица с исходными данными и результатами вычислений 3.3.3. Пример исследования регрессии в программе STATISTICA Даже если связь между исследуемыми признаками носит нелинейный характер (например, экспоненциальный), практически всегда можно выделить участки, хорошо аппроксимируемые линейной регрессией. Именно поэтому построение уравнения линейной регрессии имеет большое значение. Построим уравнение регрессии для примера о метания диска и толкании ядра (см. таблица 3.1). Рассчитаем коэффициенты линейного уравнения регрессии, описывающего связь между этими результатами. Введем исходные данные (см. рис. 3.39). 206 двумя спортивными Рис. 3.39. Исходные данные для проведения регрессионного анализа Расчет коэффициентов регрессионных уравнений можно выполнить в нескольких модулях программы STATISTICA. Воспользуемся модулем Множественная регрессия (Multiple Regression Analysis). Для выполнения регрессионного анализа необходимо:  Запустить соответствующий модуль из главного меню: Анализ (Statistics) – Множественная регрессия (MultipleRegressionAnalysis) (см. рис. 3.40) Рис. 3.40. Запуск модуля «Множественная регрессия» 207  В появившемся окне (рис. 3.41) нажать на кнопку Переменные (Variables). Рис. 3.41. Общий вид окна «Множественная регрессия»  Указать (рис. 3.42), какая из анализируемых переменных является зависимой (Dependent variable), а какая – независимой (Independent variable) (в рассматриваемом примере результат толкания ядра зависит от результата метания диска) и нажать кнопку ОК. 208 Рис. 3.42. Выбор переменных для построения линии регрессии Нажать кнопку ОК. В итоге появится окно предварительных результатов (см. рис. 3.43). Рис. 3.43. Окно предварительных результатов регрессионного анализа 209 В этом окне приводятся следующие результаты: 1) зав.перем. (Dependent): имя зависимой переменной; 2) число набл. (No. of cases): число наблюдений; 3) множест. R (Multiple R): коэффициент множественной корреляции; 4) R2: коэффициент детерминации. Это очень важный показатель в регрессионном анализе. Он изменяется от 0 до 1 и отражает «качество» рассчитанной регрессии, показывая долю (%) общего разброса выборочных точек, которая «объясняется» построенной регрессией (например, при R2 = 0,85, следует вывод о том, что 85% дисперсии зависимой переменной y объясняется вариацией независимой переменной х); 5) скоррект.R2 (Adjusted R2): скорректированный на число степеней свободы коэффициент детерминации (Adjusted R-square = 1 - (1 - Rsquare)[n/(n - p)], где n – число наблюдений, р – число независимых переменных плюс 1); 6) F, сс (df) и p: F-критерий, число степеней свободы, принятое при его расчете, и вероятность ошибки для нулевой гипотезы F-теста. F-тест в регрессионном анализе применяется для оценки статистической значимости модели. При Р < 0,05 можно заключить, что рассчитанная регрессия удовлетворительно описывает связь между исследуемыми признаками; 7) стандартная ошибка оценки (Standard error of estimate): параметр, отражающий степень разброса выборочных значений относительно линии регрессии; 8) св.член (Intercept): значение свободного члена регрессионного уравнения; 9) ст.ошибка (Std. Error): стандартная ошибка свободного члена регрессионного уравнения; 210 10) t(df) и p: критерий Стьюдента t используется для проверки нулевой гипотезы о равенстве 0 свободного члена регрессионного уравнения. Р – вероятность ошибки для этой нулевой гипотезы; 11) бета (beta): стандартизованный коэффициент регрессии – это коэффициент регрессии, который мы получили бы в случае предварительной стандартизации обеих переменных (т.е. при таком преобразовании, когда их средние значения стали бы равны 0, а стандартные отклонения -1). Расчет бета позволяет оценить, в какой степени значения зависимой переменной определяются значениями независимой переменной. Бета может оказаться особенно полезным показателем при включении в анализ нескольких независимых переменных, выражающихся в разных единицах измерения – в таком случае коэффициент отражал бы удельный вклад каждой из этих переменных в вариацию зависимой переменной. При наличии одной независимой переменной коэффициент бета идентичен Множесмтв. R.  Нажать кнопку Итоговая таблица регрессии (Summary: Regression results). Появится таблица со следующими результатами анализа (рис. 3.44): 211 N=20 Св.член Метание диска Итоги регрессии для зависимой переменной: Толкание ядра (Корреляция.sta) R= ,83892269 R2= ,70379128 Скоррект. R2= ,68733524 F(1,18)=42,768 p<,00000 Станд. ошибка оценки: ,71390 БЕТА Ст.Ош. B Ст.Ош. t(18) p-знач. БЕТА B 5,703770 1,330498 4,286945 0,000444 0,838923 0,128281 0,212859 0,032549 6,539722 0,000004 Рис. 3.44. Результаты регрессионного анализа 1) БЕТА (Beta): стандартизованный коэффициент регрессии; 2) Ст. Ош. БЕТА (Std. err. of Beta): стандартная ошибка стандартизованного коэффициента регрессии; 3) В: один из самых важных столбцов в этой таблице, поскольку именно он содержит искомые значения свободного члена регрессионного уравнения (в строке Св. член (Intercept)) и коэффициента регрессии (нижняя строка таблицы- Метание диска); 4) Ст. Ош. В (Std. err. of B): стандартные ошибки коэффициентов уравнения; 5) t(df): значения t-критерия Стьюдента, который используется для проверки гипотезы о равенстве обоих коэффициентов уравнения 0; 6) р-знач. (p-level): вероятность ошибки для нулевой гипотезы о равенстве коэффициентов уравнения нулю. Из рис. 3.44 видно, что оба коэффициента регрессии статистически значимо отличаются от 0 (p << 0,05) и что в целом построенная регрессионная модель отлично описывает связь между результатом в толкании ядра и результатом метания диска. Само же уравнение линейной регрессии записывается следующим образом: y = 0,213·x + 5,704, где y – результатом в толкании ядра, x – результатом метания диск. 212 Вопросы по разделу 3 1. Назовите коэффициенты, характеризующие взаимосвязь, использующиеся в программе STATISTICA. 2. Каков первый шаг при исследовании зависимостей? 3. Опишите процедуру расчета коэффициента корреляции БравеПирсона в программе STATISTICA. 4. Как определить статистическую значимость коэффициента корреляции? 5. Опишите процедуру расчета коэффициента корреляции Спирмена в программе STATISTICA. 6. Как определить статистическую значимость коэффициента корреляции Спирмена? 7. Опишите процедуру расчета коэффициентов линейной регрессии в программе STATISTICA. 8. Как оценить статистическую значимость коэффициентов линейной регрессии? 9. Построение корреляционного поля в программе Excel. 10. Использование Мастера функций для вычисления коэффициента корреляции в программе Excel. 11. Ввод формул в ячейки для вычисления коэффициентов вариации и детерминации в программе Excel. 12. Использование надстройки Анализ данных для вычисления корреляционной матрицы в программе Excel. 13. Построение линейной линии регрессии в программе Excel. 14. Использование Мастера функций для вычисления коэффициентов линейного уравнения регрессии в программе Excel. 213 Литература Основная 1. Высшая математика и математическая статистика: Учебное пособие для вузов/ под общ. ред. Г.И. Попова. – М.: Физическая культура, 2007. – 368 с. 2. Шестаков М.П. Статистика. Обработка спортивных данных на компьютере. – М.: ТВТ Дивизион, 2009. – 248 с. 3. Основы математической статистики: Учебное пособие для институтов физической культуры / Под общ. ред. В. С. Иванова. – М.: Физкультура и спорт, 1990. – 176 с. 4. Селиванова Т.Г. Учебное пособие для студентов РГАФК. – М.: С.Принт, 1999. – 87 с. 5. Спортивная метрология: Учебник для институтов физической культуры / Под ред. В. М. Зациорского. – М.: Физкультура и спорт, 1982. – 256 с. Дополнительная 1. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1969. – 564 с. 2. Гмурман В. Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2006. – 479 c. 3. Ивченко Г.И., Медведев Ю.Я. Математическая статистика. – М.: Высшая школа, 1994. – 328 с. 4. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. – М.: Инфра-М, 1997. – 302 с. 214

Statisticheskaya obrabotka dannykh ucheb posobie

Похожие документы

Разделы

Поддержка

Statisticheskaya obrabotka dannykh ucheb posobie

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib