§ 1. Основные понятия педагогического эксперимента 1.1

advertisement
§ 1. Основные понятия педагогического эксперимента
1.1. Структура педагогического эксперимента
Экспериментальные исследования играют существенную роль во всех науках. При
этом эксперимент1 в педагогике зачастую является единственным способом подтверждения
справедливости гипотезы и результатов теоретического исследования. Например, можно ли
априори сказать, что та или иная новая методика обучения или воспитания более эффективна, чем известные и применяемые до нее?
При планировании и подведении результатов эксперимента существенную роль играют
статистические методы, которые дают, в том числе, возможность устанавливать степень
достоверного сходства и различия исследуемых объектов на основании результатов измерений их показателей.
Рассмотрим модель педагогического эксперимента. Пусть имеется некоторый педагогический объект, изменение состояния которого исследуется в ходе эксперимента. В качестве объекта может выступать отдельный индивид, группа, коллектив и т.д., например, множество учащихся, обучаемых по новой методике. Состояние объекта измеряется теми или иными показателями (характеристиками) по критериям, отражающим его существенные характеристики. Примерами критериев являются: успеваемость, уровень знаний и т.д., примерами
характеристик – время выполнения заданий, число сделанных учащимися ошибок, число
правильно решенных задач и т.д.
Эксперимент заключается в целенаправленном воздействии на объект, призванном изменить его определенным образом. Примерами воздействия являются новые содержание и
формы, методы, средства обучения и т.д.
При проведении педагогического эксперимента необходимо обосновать, что состояние
объекта изменилось, причем именно в результате произведенного воздействия и в требуемую сторону. Чтобы выделить в явном виде результат целенаправленного воздействия на
исследуемый объект, необходимо взять аналогичный объект и посмотреть, что происходит с
ним в отсутствии воздействий.
Эти два объекта в экспериментальных исследованиях называют соответственно экспериментальной группой (например, обучаемой по предложенной методике) и контрольной
группой (например, обучаемой по традиционной методике).
На рисунке 1 представлена в общем виде структура любого педагогического эксперимента (пунктирными стрелками отмечены процедуры сравнения характеристик объектов).
Экспериментальная
группа
III
Экспериментальная
группа
Экспериментальная
методика
I
Контрольная
группа
II
IV
Контрольная
группа
Традиционная
методика
Рис. 1. Структура педагогического эксперимента
1
Эксперимент – общий эмпирический метод исследования, суть которого заключается в том, что явления и
процессы изучаются в строго контролируемых и управляемых условиях. Основной принцип любого эксперимента – изменения только одного фактора при неизменности и контролируемости всех остальных факторов.
1
Констатации (в результате сравнения III – см. рис. 1) различий начального и конечного
состояний (динамики) экспериментальной группы недостаточно – возможно, аналогичные
изменения происходят и с контрольной группой, что может быть установлено сравнением IV. Поэтому алгоритм действий исследователя заключается в следующем:
1) На основании сравнения I установить совпадение (различие или отсутствие статистически значимого различия) начальных состояний экспериментальной и контрольной
групп.
2) Реализовать воздействие на экспериментальную группу.
3) На основании сравнения II установить различие конечных состояний экспериментальной и контрольной групп.
Роль статистических методов заключается в том, чтобы корректно и достоверно обосновать совпадение или различие состояний контрольной и экспериментальной групп.
Описательная статистика включает в себя табулирование, представление и описание
совокупностей данных. Она служит инструментом, описывающим, обобщающим или сводящим к желаемому виду свойства массивов данных.
Задача теории статистического вывода состоит в том, чтобы предсказать свойства всей
совокупности, зная свойства только выборки из этой совокупности. Статистические выводы
строятся на описательной статистике. Они делаются от частных свойств выборок к частным
свойствам совокупности; описания свойств как выборок, так и совокупностей производятся с
помощью методов описательной статистики.
Статистика – область практической деятельности, включающая в себя сбор, обработку, анализ и интерпретацию статистических данных, которая используется, в том, числе при
изучении количественной стороны массовых социально-экономических явлений.
Статистическая совокупность – это множество объектов, объединенных одним или
несколькими признаками. Статистическая совокупность состоит из единиц совокупности.
Признаки бывают количественные (количество рожденных детей, возраст и пр.) и описательные (национальность, цвет и пр.). Описательные признаки обычно сводят к числовым
(ранжируют).
1.2. Измерение, шкалы
Под измерением понимается приписывание чисел объектам в соответствии с определенными правилами. Например, измерить рост человека – значит, приписать число расстоянию между макушкой человека и подошвой его ног, найденному с помощью линейки. Измерение коэффициента интеллектуальности (IQ) ребенка – это присвоение числа характеру ответной реакции, возникающей у него на группу типовых задач.
Измерение играет важную роль в педагогике и почти в каждом социальном предприятии.
Измерительные шкалы
Рассмотрим различные шкалы и их применение в статистике.
Номинальные измерения
Под номинальным измерением понимают процесс группирования предметов в классы,
когда объекты, принадлежащие одному классу, идентичны (или почти идентичны) в отношении некоторого признака. Например, можно "закодировать" пол человека, обозначая женский пол, например, нулем, а мужской пол – единицей. Другой пример – мы выполнили бы
номинальное измерение, если бы присвоили 1 англичанам, 2 – французам, 3 – русским.
Такой способ является очень простым, но в нем имеются некоторые неудобства: в примере с национальностями сумма одного англичанина и одного француза, конечно, не будет
равна одному русскому. Таким образом, в номинальном измерении действия с величиной,
2
порядком и прочими свойствами чисел вообще не будут иметь никакого смысла по отношению к самим предметам. При номинальных измерениях используется исключительно та особенность чисел, что 1 отличается от 2 или 4 и что если предмет А имеет 1, а В – 4, то А и В
различаются в отношении измеряемого свойства.
Порядковые измерения
Порядковое измерение возможно тогда, когда измеряющий может обнаруживать в объектах различие степеней признака или свойства. В этом случае используется свойство "упорядоченности" чисел и числа присваиваются предметам таким образом, что если число, присвоенное объекту А, больше числа, присвоенного В, то это значит, что в А содержится больше данного свойства, чем в В.
Но такое измерение не дает точного измерения, на сколько больше объект А обладает
признаком, чем В. Например, если проранжировать четырех девочек (Алису, Женю, Свету и
Катю) с точки зрения роста. Допустим, в порядке убывания роста девочки будут расположены следующим образом: Катя, Женя, Светлана, Алиса. Порядковое измерение имеет место в
том случае, когда мы присваиваем им номера соответственно 1, 2, 3 и 4 (заметим, что номера
12, 23, 45, 61 тоже подойдут, поскольку расстояние между соседними номерами не имеет
значения). Но по этим измерениям невозможно узнать, насколько велика разница в росте у
Кати и Жени, и будет ли она больше разницы в росте между Светой и Алисой.
Над числами, которые присвоены объектам в ходе порядкового измерения, можно проводить различные арифметические действия, но результаты этих операций могут ничего не
говорить о количествах свойства, которым фактически обладают объекты.
Частным случаем порядковой шкалы является дихотомическая шкала, в которой имеются всего две упорядоченные градации – например, "справился с заданием", "не справился с
заданием".
Интервальные измерения
Интервальное измерение возможно, когда измеритель способен определить не только
количества свойства в объектах, но и также фиксировать равные различия между количеством свойства объектов. Для интервального измерения устанавливается единица измерения
(градус, метр и пр.). Объектам присваивается число, равное количеству единиц измерения,
которое эквивалентно количеству имеющегося свойства. Точка нуль на интервальной шкале
произвольна.
Пример. Исчисление лет – интервальная шкала. Первый год был выбран произвольно
как год рождения Христа. Единица измерения – период в 365 дней. 1931 г. ближе к настоящему, чем любой год с меньшим номером. Время между 1776 и 1780 гг. равно времени между 2000 и 2004 гг.
Таким образом, интервальное измерение – это такое присвоение чисел объектам, когда
равные разности чисел соответствуют равным разностям значений измеряемого признака
или свойства предметов.
Измерение отношений
Измерение отношений отличается от интервального только тем, что нулевая точка не
произвольна, а указывает на полное отсутствие измеряемого свойства. Равные различия чисел, присвоенных при измерении, отражают равные различия в количестве свойства, которым обладают оцениваемые объекты. Из того, что нулевая точка не произвольна, а абсолютна, мы можем говорить о том, что у А в два (три, четыре) раза больше свойства, чем у В.
Примерами измерений отношений могут служить рост и вес. Нулевого роста вообще
не существует, а мужчина ростом 183 см в два раза выше мальчика, имеющего рост 91,5 см.
В педагогических исследованиях большинство измерений относится к номинальному,
порядковому и интервальному уровням.
3
Таблица 1 подводит итог изложенному относительно шкал измерений.
Таблица 1
Сводка характеристик и примеры измерительных шкал
Шкала
Характеристики
Примеры
Наименований Объекты классифицированы, а классы обозначены Раса, цвет глаз,
номерами. Различие номеров ничего не говорит о пол, диагнозы, носвойствах объектов, за исключением того, что эти мера страховок.
объекты различны.
Порядковая
Соответствующие значения чисел, присваиваемых Награды за заслуги,
предметам, отражают количество свойства, принад- ранжирование по
лежащего предметам. Равные разности чисел не оз- индивидуальным
начают равных разностей в количествах свойств.
чертам личности.
Интервальная Существует единица измерения, при помощи кото- Календарное время,
рой объектам можно приписать числа так, чтобы шкала температур
равные разности чисел, присвоенных объектам, от- по Цельсию.
ражали равные различия в количествах измеряемого
свойства. Нулевая точка интервальной шкалы произвольна и не указывает на отсутствие свойства.
Отношений
Числа, присвоенные объектам, обладают всеми Рост, вес, время,
свойствами объектов интервальной шкалы, на шкале температура
по
существует абсолютный нуль, значение нуль гово- Кельвину.
рит об отсутствии оцениваемого свойства. Отношения чисел, присвоенных в измерении, отражают количественные отношения измеряемого свойства.
Применение шкал измерений в педагогических исследованиях
Наиболее распространенная мера педагогических оценок – шкала оценки знаний и
умений учащихся в баллах. Школьные оценки – удобный аппарат для практики обучения,
который выполняет не только оценивание, но и определенные воспитательные функции.
В педагогических исследованиях также и другие шкалы балльных оценок (порядковые
шкалы). Например, выделив какие-то уровни сформированности у учащихся определенных
качеств овладения той или иной деятельностью, исследователь приписывает этим уровням
соответствующие значения баллов: "1", "2", "3" и т.п. Но в этой шкале, как уже отмечалось
раньше, ничего нельзя сказать о равномерности или неравномерности интервалов между соседними значениями оценок. Кроме того, некорректно использование величины среднего
балла (по классу, группе учащихся), поскольку усреднение предполагает сложение значений
величины, а операция суммы для порядковых шкал не может быть корректно определена.
Целесообразно, таким образом, использовать такие способы оценки, которые позволяют применить шкалу отношений или шкалу интервалов, а не шкалу порядка (шкалы наименований в педагогических исследованиях практически не используются). Можно, например,
использовать тесты – серии коротко и точно сформулированных вопросов, заданий и т.д., на
которые учащийся должен дать краткие и однозначные ответы, в правильности (или неправильности) которых нельзя сомневаться. Результатом измерений будет число правильных
ответов, которое уже может измеряться в шкале отношений.
Характеристики, измеряемые в шкале отношений:
– временные (время выполнения действия, операции, время реакции, время, затрачиваемое на исправление ошибки, и т.д.);
– скоростные (производительность труда, скорость реакции, движения и т.д. – величины, обратные времени);
– точностные (величина ошибки в мерах физических величин (миллиметрах, углах),
количество ошибок, вероятность ошибки, вероятность точной реакции, действия и т.п.);
4
– информационные (объем заучиваемого материала, перерабатываемой информации,
объем восприятия и т.д.).
Примеры типичных характеристик: уровень (степень) знаний, усвоения, обучаемости,
компетентности, подготовки, адаптируемости, отношения, сформированности, удовлетворенности, профессионализма, самостоятельности, становления, развития и т.д.; качество
обучения; эффективность деятельности (учебной, преподавательской, воспитательной,
управленческой).
1.3. Оценки в педагогических исследованиях
Агрегированные оценки
В любом педагогической эксперименте имеется значительное число участников – учеников, учителей, образовательных учреждений и т.д. В результате измерения показателей
этих участников получается набор их индивидуальных оценок. Сравнивать между собой и
анализировать одновременно все индивидуальные оценки невозможно да и нецелесообразно.
Для того чтобы, во-первых, получить обозримое число характеристик и, во-вторых, сгладить
индивидуальные колебания (каждый человек неповторим), используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись индивидуальные оценки успеваемости учеников, то агрегированной оценкой будет успеваемость группы.
Для нахождения агрегированных оценок не следует складывать, вычитать, умножать
или делить баллы друг на друга – это абсолютно бессмысленные операции!
Если имеется набор индивидуальных баллов, то единственной адекватной характеристикой группы будет число ее членов, получивших тот или иной балл1 (например, 20 человек
получили балл "4"). Аналогично агрегируется и информация о выделении уровней – если
введены три уровня (например, уровни знаний: низкий, средний, высокий) и имеется информация о распределении всех ее членов нескольких групп (контрольных или экспериментальных) по этим уровням, то агрегированной информацией об объединенной группе будет число ее членов, обладающих тем или иным уровнем знаний.
Комплексные оценки
Нередко встречаются случаи, когда какое-либо изучаемое явление, процесс характеризуются несколькими показателями. При этом часто возникает вопрос о возможности однозначной оценки этого явления, процесса или изучаемых их свойств одной величиной – комплексной оценкой. Например, во многих спортивных состязаниях победитель выявляется по
сумме очков, баллов, набранных на отдельных этапах состязания или в отдельных играх.
Другой пример – аккредитация учебного заведения производится на основании оценки результатов его деятельности по фиксированному и утвержденному набору показателей (квалификация преподавателей, обеспеченность учащихся методическими материалами и т.д.).
Комплексные оценки, применяемые в повседневной жизни, являются либо результатом определенных общественных соглашений, которые признаются всеми участниками, либо установлены каким-либо нормативным актом.
При применении комплексных оценок в исследованиях необходимо руководствоваться
требованиями научной строгости. Например, суммирование затрат времени на выполнение
учащимися отдельных заданий или количества ошибок, допущенных учащимися допустимо,
так как здесь суммируются однородные величины, заданные шкалами отношений. Суммирования же баллов, полученных учащимся за выполнение разных заданий, уже выходит за рамки научной строгости – операция суммы для порядковой шкалы не определена.
Упражнения
1
Такая агрегированная характеристика группы как число ее членов, получивших данный балл, является величиной, измеренной в шкале отношений
5
1. Отнесите каждое из следующих измерений к одному из классов: наименований, интервалов или отношений:
а) Числа, кодирующие темпераменты.
б) Академический ранг (ассистент, старший преподаватель, доцент, профессор) как мера продвижения по службе.
в) Метрическая система измерения расстояний.
г) Телефонные номера.
2. Студенты изучали дисциплины по выбору у разных преподавателей. В таблице приведены данные об итоговых оценках. Агрегируйте оценки по каждому преподавателю, постройте столбиковые и круговые диаграммы по результатам агрегированных оценок.
Преподаватель:
ФИО студента
Итоговая оценка
Орлова И.В.
Антонова Е.Н.
отлично
Аргоков О.В.
хорошо
Кононова П.И.
хорошо
Лихварева Н.Е.
удовлетворительно
Мишин А.К.
отлично
Мягких А.В.
хорошо
Николаенко И.И.
хорошо
Федорова Н.А.
удовлетворительно
Фефлер Е.А.
хорошо
Чеботарев Ф.В.
удовлетворительно
Симакин П.И.
Антонова Е.Н.
хорошо
Аргоков О.В.
хорошо
Кононова П.И.
отлично
Лихварева Н.Е.
хорошо
Мишин А.К.
хорошо
Мягких А.В.
удовлетворительно
Николаенко И.И.
хорошо
Федорова Н.А.
удовлетворительно
Фефлер Е.А.
хорошо
Чеботарев Ф.В.
хорошо
Кузнецов Н.Е.
Антонова Е.Н.
отлично
Аргоков О.В.
хорошо
Кононова П.И.
удовлетворительно
Лихварева Н.Е.
удовлетворительно
Мишин А.К.
хорошо
Мягких А.В.
хорошо
Николаенко И.И.
удовлетворительно
Федорова Н.А.
хорошо
Фефлер Е.А.
отлично
Чеботарев Ф.В.
хорошо
Толстова И.В.
Антонова Е.Н.
хорошо
Аргоков О.В.
удовлетворительно
Кононова П.И.
хорошо
Лихварева Н.Е.
хорошо
Мишин А.К.
отлично
Мягких А.В.
хорошо
Николаенко И.И.
хорошо
Федорова Н.А.
отлично
Фефлер Е.А.
хорошо
Чеботарев Ф.В.
отлично
6
3. В течение "недели математики" в школе проводились различные мероприятия, в которых учащиеся по желанию могли принимать участие. При подведении итогов каждого тура соревнования учитывались правильность выполнения задания, затраченное время и количество ошибок, допущенных конкурсантом. Итоги соревнований занесены в таблицу. По результатам комплексных оценок определите, как распределились места.
№ тура Участник
Затраченное время
Количество ошибок
1
Агутин Сергей
20 мин
3
Дёмкин Максим
25 мин
2
Кольцова Татьяна
20 мин
1
Минаева Анна
15 мин
2
Тихонова Ирина
30 мин
0
Ярославцева Ольга
25 мин
2
2
Агутин Сергей
30 мин
1
Дёмкин Максим
25 мин
3
Кольцова Татьяна
29 мин
5
Минаева Анна
30 мин
3
Тихонова Ирина
40 мин
2
Ярославцева Ольга
33 мин
1
3
Агутин Сергей
26 мин
2
Дёмкин Максим
22 мин
0
Кольцова Татьяна
25 мин
1
Минаева Анна
31 мин
1
Тихонова Ирина
27 мин
0
Ярославцева Ольга
24 мин
2
4
Агутин Сергей
23 мин
0
Дёмкин Максим
24 мин
1
Кольцова Татьяна
26 мин
0
Минаева Анна
18 мин
0
Тихонова Ирина
24 мин
0
Ярославцева Ольга
26 мин
1
5
Агутин Сергей
40 мин
2
Дёмкин Максим
42 мин
1
Кольцова Татьяна
50 мин
1
Минаева Анна
38 мин
2
Тихонова Ирина
45 мин
2
Ярославцева Ольга
50 мин
0
§ 2. Методы представления статистических данных
Существует три способа представления данных: они могут быть включены в текст,
представлены в виде таблицы или изображены графически.
2.1. Статистические таблицы
Табличный метод представления числовых данных встречается в статистике наиболее
часто. Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы
– это перечень единиц совокупности или перечень групп. Сказуемое – это система показателей, которыми характеризуется подлежащее таблицы. Обычно подлежащее располагается
слева в виде названий строк, сказуемое – сверху в виде названий граф (столбцов):
Сказуемое
Подлежащее
7
Рекомендуются следующие правила составления статистических таблиц:
1) таблица должна быть по возможности небольшой, т.к. краткую таблицу легче проанализировать; иногда лучше построить 2-3 небольшие таблицы, чем одну большую;
2) название таблицы, заголовки строк и граф должны быть краткими и ясными и иметь единицы измерения, если это требуется; пояснения и инструкции лучше вынести в примечание;
3) строки и графы часто нумеруют (для удобства ссылок на них);
4) при заполнении клеток таблицы пользуются условными обозначениями: если данное
явление совсем не имеет места, ставят тире; если отсутствуют данные, пишут "нет сведений"; если числовое значение меньше принятой точности, ставят 0.0;
5) округление чисел внутри отдельных граф производится с одинаковой точностью.
2.2. Статистические графики
В статистике графиком называют наглядное изображение статистических величин при
помощи геометрических линий и фигур (диаграммы) или географических картосхем (картограммы). Наиболее распространенные виды графических изображений:
1) столбиковые диаграммы (гистограммы)
2) полосовые (ленточные) диаграммы
3) линейные графики
4) круговые (секторные) диаграммы
Примеры.
1. Столбиковая диаграмма.
100
90
80
70
60
50
40
30
20
10
0
1991
1992
1993
1994
1995
год
Процент продолживших обучение после окончания 11 класса
2. Ленточная (полосчатая) диаграмма распределения по роду занятий после окончания
школы в 1997 г по сравнению с 1990 г.
Безработные
Устройство на работу
ВУЗы
Средние учебные заведения
-30
-20
-10
0
8
10
20
30
3. Линейные графики.
100
90
80
70
60
50
40
30
20
10
0
1991
1992
1993
1994
1995
Процент продолживших обучение после окончания 11 класса
4. Круговые (секторные) диаграммы. Применяется для отображения структуры.
Количество учащихся
% к итогу
Начальные классы
360
37,11
Средние классы
490
50,52
Старшие классы
120
12,37
Всего:
970
100,00
Старшие
классы
12,37%
Начальные
классы
37,11%
Средние
классы
50,52%
Площадь круга обычно принимается за 100%. Круг делится на секторы, площади которых соответствуют долям некоторого статистического признака. Например, круг – количество учащихся в школе. Он разбит на секторы, соответствующие количеству учащихся по
звеньям (младшее, среднее, старшие классы). (100% – 360°, 1% – 3,6°).
5. Сглаженная кривая
Иногда вместо гистограммы или линейного графика строят сглаженную кривую. Разница состоит в том, что сглаженная линия проводится по точкам настолько близко, насколько это возможно, а для других двух фигур используются линии с острыми углами или зубцами. Для построения сглаженной кривой (например, огивы) в случае неравномерностей, стоит
пропустить некоторые точки, чтобы получить плавную правильную кривую; но следует позаботиться о том, чтобы оставить приблизительно одинаковое количество точек по обе стороны от кривой. Тогда кривая будет лучше сглаживать отклонения точек.
9
100
90
80
70
60
50
40
30
20
10
0
Рекомендации при построении графиков
1. Общая структура графиков должна предполагать чтение слева направо и снизу вверх.
2. Вертикальную шкалу для кривой независимо от ее назначения следует выбрать так,
чтобы на рисунке оказалась нулевая отметка.
3. Нулевые линии шкал для кривой следует резко отграничить от других координатных
линий.
4. Для кривых, имеющих шкалу, изображающую проценты, желательно выделить какимто образом линию 100% или другие линии, используемые в качестве основы для сравнения.
5. Рекомендуется показывать не больше координатных линий, чем это необходимо,
чтобы облегчить чтение диаграммы.
6. Кривые линии диаграммы должны резко отличаться от координатных прямых.
2.3. Абсолютные и относительные статистические величины
Результатами статистических наблюдений являются первичные абсолютные величины, измеряемые в конкретных единицах (штуках, рублях и пр.).
Относительная величина в статистике – обобщающий показатель, результат соотношения двух абсолютных величин. В зависимости от статистической задачи рассчитывают
различные относительные величины.
Наиболее часто рассчитывают следующие относительные величины:
1) относительные величины сравнения
– показывают, во сколько раз сравниваемый показатель больше или меньше базового
показателя.
Пример. В школах района обучается 1663 мальчика и 1568 девочек. Определить относительную величину сравнения.
1663
Приняв за базу количество девочек, найдем относительную величину:
 1,06.
1568
Таким образом, в городе мальчиков обучается в 1.06 раза больше, чем девочек, т.е.
можно сказать, что на 100 школьниц приходится 106 школьников.
2) условные единицы измерения
10
Сущность метода состоит в том, что отдельные разновидности совокупности выражаются в единицах одного признака, условно принятого за единицу измерения. Например, общий объем выпуска различных тетрадей на предприятии дается в пересчете на тетради из 12
листов. Покажем это на примере:
Наименование
Наличие, Коэффициент
Наличие
единиц
пересчета
в условных единицах
Тетрадь школьная,
500
1,0
500
12 листов
Тетрадь школьная,
100
1,5
150
18 листов
Тетрадь школьная,
200
8,0
1600
96 листов
Тетрадь школьная,
500
1,0
500
12 листов
Итого условных тетрадей (12 листов)
2750
3) относительные величин интенсивности
– характеризуют степень насыщенности изучаемым явлением определенной среды. Это
чаще всего производство какого-либо продукта на душу населения или, например, число
браков или разводов на 1000 человек.
Пример. Количество выпускников средних учебных заведений составило 5760 человек, среднегодовая численность населения – 320 000 человек.
5760
Найдем относительную величину интенсивности: КИН =
= 0,018.
320 000
Следовательно, в городе на 1000 человек пришлось 18 выпускников.
Упражнения
1. Имеются данные по области по обеспечению учебниками школ в сентябре 2000 г. по
сравнению с соответствующим периодом 1999 г.
Возросло: количество учебников по новейшей истории на 8%, алгебре на 67%, физике
на 40 %, химии на 37%, геометрии на 4%.
Снизилось: количество учебников по валеологии на 18%, черчению на 4%, зоологии
на 29%.
По этим данным построить ленточную диаграмму.
2. Принято решение построить в районе новую школу, для чего необходимо рассчитать
количество учащихся.
Имеются данные о распределении населенных пунктов по числу дворов. Подсчитать %
к итогу, построить столбиковую диаграмму по второму столбцу и секторную диаграмму по
третьему столбцу.
Число дворов Число населенных Процент
пунктов
к итогу
До 100
15
101-200
28
201-300
22
301-400
20
свыше 400
14
3. Имеются следующие данные: количество учащихся в школе №3 района составляет
938 детей, из них 485 девочек и 453 мальчика, всего в районе проживает 18769 человек. Оп-
11
ределите относительную величину сравнения (девочки и мальчики) и относительную величину интенсивности (кол-во учащихся в школе на 1000 человек населения).
4. Имеются данные о наличии расходных материалов (бумаги):
Упаковка
Кол-во листов, Кол-во пачек,
шт.
тыс. шт.
Снегурочка
500
186
Ксерокс Бизнес
150
250
Ксерокс Премиум
200
205
Определите общее количество запаса бумаги, приняв за условную единицу пачку в
250 листов.
§ 3. Табулирование и представление данных
3.1. Табулирование данных
До анализа и интерпретации количественных данных обычно необходимо их обобщить.
В таблице 2 приведены результаты контрольной по чтению, проведенной в начале учебного
года.
Таблица 2
Результаты контрольной по чтению (38 учеников)
Ученик
Оценка
Ученик
Оценка
Ученик
Оценка
Абинов А.
90
Калмыкова О.
70
Петренко С.
59
Авдейчук Н.
66
Кишина С.
47
Путилин К.
72
Агеева С.
106
Коленова А.
95
Пыко Н.
74
Бикзянова Е.
84
Колесников П.
100
Рахова Н.
75
Борисова Д.
105
Куприянов М.
69
Санникова Л.
81
Бутаков Н.
83
Лызин С.
44
Строева К.
71
Ваниева Т.
104
Мартынова М.
80
Тимофеев Д.
68
Васильев П.
82
Матросов А.
75
Федорченко Н.
112
Веников И.
97
Мельникова С.
75
Черненко Г.
62
Ермакова Р.
97
Николаенко Е.
51
Шикин П.
91
Железнова А.
59
Носов И.
109
Юрцев А.
93
Исаев Н.
95
Нуриев Р.
89
Якимова Т.
84
Ихтин В.
78
Пахомов А.
58
Оценки представлены в алфавитном порядке, но в такой форме для анализа они не
слишком удобны, например, трудно судить о том, будет ли первый по списку ученик (Абинов А.) с оценкой 90 из 128 возможных преуспевающим или это только средний результат в
сравнении с одноклассниками.
Ранговый порядок
Первый этап представления данных – это обычно упорядочивание оценок по величине
от максимальной до минимальной – несгруппированный ряд – (таблица 3).
Таблица 3
Оценки контрольной по чтению упорядоченные по величине,
проранжированные и протабулированные
Убывающая
Ранг
Табулирование
последовательность
Оценка
Частота
112
1
112
1
109
2
109
1
106
3
106
1
105
4
105
1
12
104
5
104
1
100
6
100
1
97
7,5
97
2
97
7,5
95
2
сумма = 19
95
9,5
93
1
95
9,5
91
1
93
11
90
1
91
12
89
1
90
13
84
2
89
14
83
1
84
15,5
82
1
84
15,5
81
1
83
17
середина
82
18
80
1
частот
81
19
78
1
80
20
75
3
78
21
74
1
75
23
72
1
75
23
71
1
75
23
70
1
74
25
69
1
72
26
68
1
сумма = 19
71
27
66
1
70
28
62
1
69
29
59
2
68
30
58
1
66
31
51
1
62
32
47
1
59
33,5
44
1
59
33,5
_____________
58
35
51
36
n = 38 = 19 + 19
47
37
44
38
В этом процессе можно встретить равные оценки, так, в нашем примере два ученика
получили по 97 очков. Поскольку в данном случае нельзя утверждать, что один ранг выше
другого, необходимо приписать им одинаковые ранги – усредненное значение их следующих
по счету рангов (здесь – 7 и 8 ранги дают усредненное значение 7,5). Имеется также три ученика с оценкой 75 (у 21 ученика ранг выше); среднее следующих трех рангов (22, 23 и 24)
равно 23, что и является рангом для каждой оценки 75.
Такое ранжирование с одной стороны, несложное, но с другой стороны требует для
много времени для составления, кроме того, он неудобен для сравнения с другими группами
(большими или меньшими). Так ранг 19-й в классе из 38 человек хуже, чем ранг 19-й в группе из 70 человек.
Распределение частот
Этот список можно сократить, классифицируя оценки по распределению частот. Третий и четвертый столбцы таблицы 3 показывают простейший вид распределения. Различные
оценки размещаются по величине в данном случае от 112 до 44, а справа от каждой оценки
указано число ее повторений (частота f, сумма частот – n).
Распределение сгруппированных частот
13
Для большого числа оценок может иметь смысл обобщение данных. Часто целесообразнее сгруппировать оценки по величинам, например, в группы, объединяющие все оценки
от 105 до 109 включительно, от 110 до 114 и т.д. В этом случае говорят о распределении
сгруппированных частот.
Процесс построения сгруппированных частот состоит из четырех этапов (таблица 4).
Этап 1. Определение общего размаха внутри всей выборки – равен разности между
максимальной и минимальной оценками плюс 1. В нашем примере размах равен 69.
Этап 2. Выбор интервала группирования разрядов. Представляет собой ширину разрядов, по которым должны быть классифицированы оценки. Принято, чтобы разрядов было не
менее 12, но и не более 15.
Для нахождения интервала разделим диапазон на 12 и найдем наибольший интервал
разряда оценок. Затем разделим на 15 и найдем наименьший возможный интервал разряда. В
нашем случае 69 : 12 = 5,75, 69 : 15 = 4,60. Так как в рассматриваемом примере использовать нецелый интервал неудобно, то наибольшее число (5,75) округляется с уменьшением
(до 5), а наименьшее – с увеличением (до 5).
Замечание. Интервал с шириной, определяемой нечетным числом, например 5, с целочисленным средним значением, обычно предпочитают интервалу с четной шириной, но дробными средними. В нашем случае, середина разряда 100 – 114 равна 112.
Этап 3. Определение границ разрядов. Табулирование всегда начинается с величины,
кратной разрядному интервалу. Если самый низкий разряд начать с 40, кратного 5, то он
включит самую низкую (в нашем примере) оценку 44, если же начать с 45, то он не включит
ее. Следующий разряд начинается с 45, затем с 50 и т.д. до тех пор, пока самая высокая
оценка 112 не попадет в разряд 110 – 114.
Этап 4. Табулирование. Подсчет ведется для каждой оценки против разряда, в который
она попадает. В первоначальном алфавитном списке первая оценка 90. В столбце таблицы
против разряда, в который попадает 90 (90 – 94) ставится пометка и т.д.
В итоговой таблице не приводятся этапы построения сгруппированных частот. В простейшей форме распределения есть только 2 столбца. В первом приводятся разряды, обычно
расположенные в убывающем порядке сверху вниз, а второй содержит частоты – число оценок в каждом разряде.
3.2. Графическое представление распределения частот
Для графического отображения частот используют обычно три типа графиков: гистограмма, полигон распределения и сглаженная кривая. Рассмотрим некоторые особенности
отображения частот на этих графиках.
Гистограмма
Гистограмма – последовательность столбцов, каждый из которых опирается на один
разрядный интервал, а высота отражает число случаев (или частоту) в этом разряде. Построим гистограмму распределения частот для таблицы 5.
Таблица 4
Исходные оценки
Построения распределения сгруппированных частот
Этапы построения распределения
14
90
66
106
84
105
83
104
82
97
97
59
95
78
70
47
95
100
69
44
80
75
75
51
109
89
58
59
72
74
75
81
71
68
112
62
91
93
84
Этап 1. Определение размаха
Самая высокая оценка
112
Самая низкая оценка
44
_____________________________________________
Размах = Разность + 1 = 68 + 1 = 69
Этап 2. Выбор интервала разрядов
69 : 12 = 5,75 наибольший возможный разрядный интервал
Округление с уменьшением до 5
69 : 15 = 4,60 наименьший возможный разрядный интервал
Округление с увеличением до 5.
Этапы 3 и 4. Определение границ разрядов и табулирование
Внутренние численные
границы 15 разрядов
110 – 114
105 – 109
100 – 104
95 – 99
90 – 94
85 – 89
80 – 84
75 – 79
70 – 74
65 – 69
60 – 64
55 – 59
50 – 54
45 – 49
40 – 44
Подсчет
+
+++
++
++++
+++
+
++++++
++++
++++
+++
+
+++
+
+
+
Частота (f)
1
3
2
4
3
1
6
4
4
3
1
3
1
1
1
n = 38
Таблица 5
Проценты качества, присвоенные бумаге в клетку 42 оценщиками
Интервал процентов Число оценщиков Интервал процентов Число оценщиков
29,5 – 34,5
1
54,5 – 59,5
8
34,5 –39,5
2
59,5 – 64,5
9
39,5 – 44,5
4
64,5 – 69,5
4
44,5 – 49,5
5
69,5 – 74,5
1
49,5 – 54,5
7
74,5 – 77,5
1
Обратим внимание, что наибольшая частота равна 9 (для интервала 59,4 – 64,5), значит,
по оси Y нет необходимости тянуть вертикаль выше 10 пунктов. Аналогично, ось Х необхо-
15
димо изображать лишь в диапазоне от 27 до 80-82 пунктов (на один разрядный интервал
вправо и влево от диапазона). Середина столбца совмещается с серединой интервала разряда.
10
9
Число оценщиков
8
7
6
5
4
3
2
1
0
27
32
37
42
47
52
57
62
67
72
77
82
Проценты
Рис. 3. Гистограмма процентов качества, присвоенных бумаге в клетку (по данным табл. 5)
Полигон распределения
Построение полигона распределения во многом схоже с построением гистограммы. В
гистограмме каждый столбец заканчивается горизонтальной линией на высоте, соответствующей частоте в этом разряде. В полигоне он заканчивается точкой над серединой своего
разрядного интервала на той же высоте, полученные точки соединяются отрезками прямых.
Часто часть координатной плоскости, лежащая ниже нарисованной линии, часто штрихуется.
10
9
Число оценщиков
8
7
6
5
4
3
2
1
0
27
32
37
42
47
52
57
62
67
72
77
82
Проценты
Рис. 4. Полигон распределения, представляющий процентные значения,
присвоенные бумаге в клетку (по данным табл. 5)
Существенное преимущество полигонов перед гистограммами в представлении группы
распределений заключается в том, что полигоны можно наложить друг на друга при меньшем пересечении линий, т.о. при этом легче сравнивать распределения. Рисунок 5 показывает это на примере результатов теста (по 100 учеников каждой параллели).
16
12
10
Число учащихся
Седьмой
Восьмой
8
Девятый
6
4
2
0
9,5
29,5
49,5 69,5 89,5 109,5 129,5 149,5 169,5 189,5 209,5 229,5 249,5
Оценки
Рис. 5. Полигоны распределения оценок в тесте для учащихся 7-х, 8-х, 9-х классов
3.3. Квантили
Одним из наиболее эффективных и полезных методов описания группы наблюдений
является описание с помощью квантилей. Квантиль – общее понятие, а процентили, децили и
квартили – три его примера.
Квантиль – это точка на числовой шкале, по предположению, основанная на группе
наблюдений; квантиль делит совокупность наблюдений на две группы с известными пропорциями в каждой из них.
Существуют три квартиля (Q1, Q2, Q3); они делят группу наблюдений на четыре равные
части (кварты). Четвертая часть наблюдений лежит ниже Q1, половина наблюдений лежит
ниже Q2, а три четверти наблюдений – ниже Q3. Таким образом, три квартиля делят совокупность наблюдений на четыре части, которые равны в смысле пропорциональности наблюдений.
99 возможных процентилей (Р1, ..., Р99) делят множество наблюдений на 100 частей с
равным числом наблюдений в каждой. Девять децилей (D1, ..., D9) делят множество наблюдений на десять равных частей.
Квантили очень удобны для обобщения данных. Простое сообщение, что Р5 есть 10,75,
а Р15 – 16,80, сразу же говорит нам о том, что 5% наблюдений меньше 10,75, а 10% наблюдений лежит между 10,75 и 16,80.
3.4. Определение процентилей
Р-й процентиль представляет собой точку, ниже которой лежит Р процентов оценок.
Для вычисления процентиля необходимо сначала упорядочить оценки по возрастанию.
Для больших групп оценок целесообразно использовать сгруппированные данные.
Метод нахождения точки процентиля (подходящий как для ранжированных, так и для
сгруппированных оценок) рассмотрим на примерах.
Пример 1. Преподаватель предложил 125 учащимся контрольное задание, состоящее
из 40 вопросов. В качестве оценки теста выбиралось количество вопросов, на которые были
получены правильные ответы. Негрупповое распределение частот 125 оценок теста приводится в таблице 6. Каков 25 процентиль в группе 125 оценок теста (т.е. чему равна величина
Р25 – точка, ниже которой лежат 25% 125 оценок)?
17
Таблица 6
Оценка
в тесте
38
37
36
35
34
33
32
31
30
29
28
27
26
25
24
Определение Р25 (интервал оценок – единица)
Накопленная
Частота
Вычисления
частота
1
125
Шаг 1. 0,25 n = 0,25 · 125 = 31,25
1
124
3
123
Шаг 2. Найти фактическую нижнюю
5
120
границу разряда оценок, содержащего
9
115
оценку 31,25: L = 28,5
8
106
17
98
Шаг 3. Вычесть накопленную к L час23
81
тоту из 31,25:
24
58
31,25 – 16 = 15,25
18
34
10
16
Шаг 4. Разделить результат 3-го шага
3
6
на частоту а в интервале, содержащем
1
3
оценку 31,25:
0
2
15,25 : 18 = 0,85
2
2
––––––
Шаг 5. Прибавить результат 4-го шага
n = 125
к L: Р25 = 28,5 + ,085 = 29,35
Для вычисления процентилей удобно использовать накопленные частоты, которые
представляют собой суммарное количество частот на этой оценке или ниже ее (третий столбец таблицы 6). Например, накопленная частота оценки 33 равна 106, это значит, что существует 106 лиц с тестовыми оценками 33 или меньше.
Вычисление Р25:
Шаг 1. Найти 0,25 n = 125 · 0,25 = 31,25.
Шаг 2. Определить фактическую нижнюю границу L разряда оценок, содержащего лицо с оценкой 31,25 снизу.
Так как 16 человек имеют оценки 28 или меньше, а 34 – оценки 29 или меньше, то частота 31,25 лежит в интервале разрядов оценок 28,5 – 29,5. L = 28,5.
Шаг 3. Вычесть накопленную к L частоту (cum f) из 0,25 n: к L накоплено 16 частот,
следовательно, имеем 31,25 – 16 = 15,25. На этом шаге определили, сколько частот в интервале 28,5 – 29,5 лежит ниже 0,25 n.
Шаг 4. Разделить рез-т 3-го шага на частоту f в интервале, содержащем частоту 0,25 n:
15,25 : 18 = 0,85.
Этот шаг помогает определить ту долю интервала разрядов, которая лежит под частотой 0,25 n.
Шаг 5. Прибавить результат 4-го шага к L, сумма равна искомому значению Р25.
Р25 = 28,5 + 0,85 = 29,35.
Таким образом, 25% из 125 оценок лежит ниже 29,5 (аналогично 75% из 125 оценок
лежит выше 29,35).
Шаги с 3-го по 5-й можно выразить одной формулой:
Р25 = L + 0,25n  (сит. f ) .
f
Для определения любого процентиля распределения частот в случае, когда интервал
разряда оценок равен 1 применяется следующая формула:
Рр = L + pn  ( сит. f ) ,
f
18
где L – фактическая нижняя граница интервала оценок, содержащего частоту рn; (сum. f) –
накопленная к L частота; f – частота оценок в интервале, содержащем оценку pn.
Пример 2. Найдем Р60 по данным таблицы 6.
0,60  125  58
Р60 = 30,5 +
= 31,24
23
Вычисление любой точки процентиля группового распределения частот идентично вычислениям для несгруппированного распределения. Общая формула определения процентиля р в группе n оценок выглядит так:
Рр = L + pn  ( сит. f ) W ,
f
где L – фактическая нижняя граница интервала, содержащего частоту рn снизу; (cum f) – накопленная к L частота; f – частота интервала, содержащего частоту pn; W – ширина любого
интервала оценок.
Таблица 7
Вычисление процентиля по сгруппированным данным
Интервал возрастов Частота
Накопленная
Вычисления
частота
64 – 67
4
1982
0,20 n = 0,20 · 1982 = 396,4
60 – 63
38
1978
рn – 396 – лежит в интервале 24 – 27
56 – 59
82
1940
его фактическая нижняя граница L=23,5
52 – 55
120
1858
(cum f) = 135
48 – 51
125
1738
pn – (cum f) = 396,4 – 135 = 261,4.
44 – 47
160
1613
Частота интервала, включающего 396
40 – 43
221
1453
оценку, равна 295, ширина интервала
36 – 39
204
1232
равна 4.
32 – 35
307
1028
261,4
Р20 = 23,5 +
· 4 = 27,04.
28 – 31
291
721
295
24 – 27
295
430
20 – 23
135
135
–––––––
n = 1982
Пример 3. Определим Р20 по данным таблицы 7, представляющими собой возраст, округленный до года, 1982 преподавателей, принимавших участие в специальных летних курсах повышения квалификации.
В условиях, принятых для вычисления процентилей, можно сказать, что 20% преподавателей моложе 27,04 лет.
Однако в процедуру определения процентиля вошли ошибки по двум причинам.
1) Возраст определялся с точностью до года, а не месяца, дня, часа или минуты.
2) Предполагалось, что частоты внутри каждого интервала оценок были равномерно
распределены по всему интервалу. Это предположение было ложным: для молодых возрастов частоты, вероятно, группировались у верхней границы каждого интервала оценок, для
пожилых – наоборот, у нижней границы интервала.
Тем не менее, ошибка при вычислении Р20 или любого другого процентиля несущественна по сравнению с трудностями, которые могли бы возникнуть, если исходить из неравномерного распределения частот по каждому интервалу оценок.
Упражнения
1. Построение группового распределения частот. Имеются оценки 75 человек на определение коэффициента интеллектуальности Стенфорда-Бине.
а) Определите включающий размах приведенной группы оценок.
19
б) Разделите найденный включающий размах соответственно на 12 и 15, выберите величину разряда, являющуюся целым числом, которое находится между двумя полученными
значениями.
в) Постройте сгруппированные частоты для 75 оценок (закончите табл. 8)
Оценки
141
104
101
130
148
92
87
115
91
96
100
133
124
92
123
132
118
98
101
107
97
124
118
146
107
110
111
138
121
129
106
135
97
108
108
107
110
101
129
105
105
110
116
113
123
83
127
112
114
105
127
114
113
106
139
95
105
95
105
106
109
102
102
102
89
108
92
131
86
134
104
94
121
107
103
Таблица 8
№ интервала
Интервал
Подсчет
Частота
Накопленная
оценок
частота
14
13
12
11
10
9
8
7
6
5
4
3
2
1
n = 75
Таблица 9
Мужчины
Женщины
Интервал
Относительная
Относительная
оценок
Частота
Частота
частота
частота
750 – 800
1
1 : 903 = 0,001
4
4 : 547 = 0,007
700 – 749
27
27 : 903 = 0,030
28
28 : 547 = 0,051
650 – 699
63
...
56
...
600 – 649
138
85
550 – 599
174
117
500 – 549
202
128
450 – 499
171
86
400 – 449
96
32
350 – 399
25
9
300 – 349
4
1
20
250 – 299
200 – 249
1
1
nм = 903
1
0
1,000
nж = 547
1,000
2. Определите 50-й процентиль (Р50) для оценок задачи 1.
3. Постройте полигон для группового распределения задачи 1.
4. Изобразите два полигона относительных частот на одном графике по следующим
групповым распределениям частот оценок речевых способностей для 903 мужчин и 547
женщин – студентов первого курса восточного университета (таблица 9). Определите 35-й
процентиль для мужчин и 65-й процентиль для женщин.
§4. Динамические ряды
Одна из задач статистики – изучение, как изменяются статистические показатели во
времени. Например, как изменяется год за годом изменяется оплата труда, каковы колебания
численности населения и есть ли тенденции роста или снижения показателей. На такие вопросы можно ответить, изучая динамический ряд статистических показателей.
Динамический ряд (ДР) – это последовательность измерений некоторого статистического показателя через равные единицы времени.
ДР состоит обычно из двух строк: в первой строке отмечаются промежутки или моменты времени, во второй строке – значения статистического показателя. Если в ДР представлено несколько статистических показателей, ДР называется комплексным, если один показатель – имеем индивидуальный ДР.
Пример. Комплексный ДР количество учащихся,
олимпиадах (чел):
Предмет
1995
1996
Математика
505
521
Русский язык
423
430
Химия
510
490
принимавших участие в районных
1997
497
405
507
1998
460
418
520
Рассмотрим основные задачи, которые возникают при анализе ДР.
4.1. Показатели интенсивности ДР.
Интенсивность изменения во времени значений ДР характеризуется следующими показателями:
1) абсолютный прирост
2) коэффициент роста
3) темп роста
4) темп прироста
5) абсолютное значение одного процента прироста
В случае, когда сравнение проводится с начальным периодом (моментом) времени, получают базовые (базисные) показатели. Если сравнение производится с предыдущим периодом, то получают цепные показатели.
Абсолютный прирост: равен разности двух уровней ряда динамики в единицах измерения исходной информации. АП может иметь и отрицательный знак, показывающий, насколько уровень изучаемого периода ниже базисного.
21
Между цепными и базисными абсолютными приростами имеется связь: сумма цепных
абсолютных приростов равна базисному абсолютному приросту последнего ряда динамики,
а разность последующего и предыдущего базисных абсолютных приростов равна соответствующему цепному абсолютному приросту.
АПn(б) = АП1(ц) + АП2(ц) + ... + АПn(ц) = АПi(ц)
АПk(б) – АПk–1(б) = АПk(ц).
Распространенными статистическими показателями динамики являются темп роста и
темп прироста. Эти два показателя в расчетах опираются на коэффициент роста.
Коэффициент роста характеризует отношение двух уровней ряда.
Если коэффициент роста больше единицы, то это показывает на увеличение изучаемого
уровня по сравнению с принятым за базу. Коэффициент роста, равный единице, показывает,
что уровень изучаемого периода по сравнению с базисным не изменился. Коэффициент роста, меньший единицы, показывает на уменьшение уровня изучаемого периода по сравнению
с базисным. Коэффициент роста всегда положителен.
Между базисными и цепными коэффициентами роста имеется взаимосвязь: произведение последовательных цепных коэффициентов роста равно базисному коэффициенту роста, а
частное от деления последующего базисного коэффициента роста на предыдущий равно соответствующему цепному коэффициенту роста.
Кр(ц)1 · Кр(ц)2 · ... · Кр(ц)k = Кр(б)k
Kp(á )k
= Кр(ц)k
Kp(á )k 1
Коэффициент роста, выраженный в процентах, называют темпом роста.
Темп прироста характеризует абсолютный прирост в относительных величинах (процентах). Темп прироста показывает, на сколько процентов изменился сравниваемый уровень
с уровнем, принятым за базу сравнения. Если уровни ряда динамики сокращаются, то соответствующие показатели темпа прироста будут отрицательными, т.к. они характеризуют относительное уменьшение прироста уровня ряда динамики.
Формулы расчета показателей интенсивности ДР приведем в таблице:
Показатель
Абсолютный прирост (АПi)
Коэффициент роста (Кр)
Темп роста (Тр = Кр · 100%)
Темп прироста (Тпр)
Абсолютное значение 1% прироста (А)
Базисный
АПi(б) = Yi – Y1
Кр(б) = Yi / Y1
Тр(б) = (Yi / Y1) · 100%
Тпр(б) = Тр(б) – 100%
–
Цепной
АПi(ц) = Yi – Yi-1
Кр(ц) = Yi / Yi-1
Тр(ц) = (Yi / Yi-1) · 100%
Тпр(ц) = Тр(ц) – 100%
А = АПi(ц)/ Тпр(ц)
Пример. Расчет показателей интенсивности ДР.
Имеются данные об объемах продаж учебников по математике за 5 месяцев. Рассчитать
показатели интенсивности ДР.
Месяцы
Объем продаж, т.р.
Абсолютный прирост, баз.
цепной
Коэффициент роста, баз.
цепной
Темп роста, %, баз.
цепной
Темп прироста, %, баз.
цепной
Абсолютное значение
1% прироста (цепной)
Июль
710,0
Август
1602,6
892,6
892,6
2,257
2,257
225,7
225,7
125,7
125,7
Сентябрь
651,8
–58.2
–950,8
0.918
0,407
91.8
40,7
–8.2
–59,3
Октябрь
220,8
–489.2
–431,0
0.311
0,339
31.1
33,9
–68.9
–66,1
Ноябрь
327,7
–382.3
106,9
0.462
1,484
46.2
148,4
–53.8
48.4
7,10
16,03
6,52
2,21
4.2. Определение среднего уровня и средних показателей ДР.
22
Существуют несколько подходов к определению среднего уровня динамического ряда.
В общем случае средний уровень ряда определяется по формуле простого среднего:
y
у =  i
(4.1)
n
где n – число уровней динамического ряда.
Эта формула обычно используется для вычисления среднего уровня интервального динамического ряда (когда имеются данные по годам, месяцам, декадам...).
В случае моментных динамических рядов (уровни характеризуют состояние явления на
определенные моменты времени, даты – на начало года, на первое число месяца и т.д.) используется формула средней хронологической:
1
1
y1  y 2  ...  yn 1  y n
2
у = 2
(4.2)
n 1
где n – число уровней динамического ряда.
Пример 1. Имеются данные о количестве беспризорных детей за 5 лет по области.
Найти среднегодовой уровень количества беспризорников.
Год
1998 1999 2000 2001 2002
Кол-во детей,
2,6
3,1
3,8
3,4
4,6
тыс.чел.
Данный ряд – интервальный. Среднее значение в этом случае рассчитывается по формуле простой средней:
у = (2,6 + 3,1 + 3,8 + 3,4 + 4,6)/ 5 = 3,5 (т.чел.)
Пример 2. Имеются данные о количестве высших учебных заведений на начало учебного года. Определить среднее число учебных заведений.
Годы
1992/93 1993/94 1994/95 1995/96
Число ВУЗов
535
548
553
569
Приведенный динамический ряд – моментный, следовательно, нахождение его среднего
уровня производится по средней хронологической:
1
1
 535  548  553   569
2
у = 2
= 551.
4 1
Еще один подход рассмотрим на примере.
Пример 3. За январь произошли следующие изменения в списочном составе воспитанников школы-интерната:
По списку на 1/1
342
Выбыло с 5/1
4
Зачислено с 12/1
5
Зачислено с 26/1
2
Требуется определить среднедневную численность воспитанников за январь.
Для решения этой задачи необходимо разбить рассматриваемый месяц на периоды, в
течение которых количество воспитанников не изменялось, найти длины (в днях) этих периодов и вычислить вспомогательную величину, с помощью которой и будет найдено искомое среднее значение.
Составим вспомогательную таблицу:
Календарные периоды
Число
Длина периода в
T*Y
января
воспитанников
днях, T
(число человеко*дней)
1–4
342
4
1368
5 – 11
338
7
2366
23
12 – 25
343
14
4802
26 –31
345
6
2070
Итого:
31
10606
10606
Yср =
= 342 (чел.)
31
Для нахождения среднегодовых темпов роста и прироста используется среднегодовой
коэффициент роста:
y
Кр = n 1 n = n 1 Kp n (á ) ,
(4.3)
y1
Тр = Кр · 100%, Тпр = Тр – 100%.
Среднегодовой абсолютный прирост находится по формуле:
AÏ i (ö )
y  y1
ÀÏ n (á )
ÀÏ =
= n
=
,
(4.4)
n 1
n 1
n 1
где n – число уровней ряда.
Пример 4. В условиях примера 2 найти среднегодовые темпы роста и прироста и
среднегодовой прирост.
569  535
569
ÀÏ =
= 11,3 (ед.); Кр = 41
= 1,021 => Тр = 102,1% => Тпр = 2,1%.
4 1
535
Таким образом, за рассматриваемый период в среднем количество ВУЗов составляло
551 учебное заведение. В среднем за год количество ВУЗов увеличивалось на 2,1%, что составляло 11,3 учебных заведения в год.
4.3. Определение общей тенденции развития в ДР.
При изучении в ДР общей тенденции развития применяют различные методы.
1. Метод укрупнения интервалов.
Пример. Имеются данные о выпуске продукции школьной мастерской за год (т.р.):
Январь
23,2
Май
24,5
Сентябрь
26,3
Февраль
19,1
Июнь
27,5
Октябрь
29,1
Март
22,3
Июль
28,4
Ноябрь
30,3
апрель
25,1
Август
24,1
Декабрь
26,5
Для выявления четкой тенденции роста выпуска продукции произведем укрупнение интервалов – рассчитаем выпуск продукции по кварталам:
1 кв. –64,6; 2 кв. – 77,1; 3 кв. – 78,8; 4 кв. – 85,9.
В результате укрупнения интервалов общая тенденция роста выпуска продукции выступает отчетливо: 64,6 < 77,1 < 78,8 < 85,9.
2. Метод скользящей средней.
Метод заключается в последовательном расчете среднего уровня из определенного числа
первых по счету уровней ряда, затем из того же числа уровней, но начиная со второго элемента,
затем с третьего и т.д. Лучше брать нечетное число уровней (обычно берут 3, 5 или 7).
Например, расчет скользящих средних для 3-х уровней:
Ā1 = (y1 + y2 + y3) / 3; Ā2 = (y2 + y3 + y4) / 3; Ā3 = (y3 + y4 + y5) / 3 и т.д.
Полученные средние обычно относятся к середине уровня: Ā1 к y2, Ā2 к y3 и т.д.
Аналогично для пяти уровней:
Ā1 = (y1 + y2 + y3 + y4 + y5) / 5; Ā2 = (y2 + y3 + y4 + y5 + y6) / 5 и т.д.
(Ā1 относится к y3, Ā2 к y4 и т.д).
24
Пример. Динамика ВП школьной мастерской по рабочим дням месяца.
Рабочие дни месяца Выпуск продукции
Āi
Āi
(т.р.)
(3-х дневные) (5-ти дневные)
1
3,7
–
–
2
4,2
3,7
–
3
3,3
4,0
4,3
4
4,5
4,5
4,7
5
5,8
5,3
4,9
6
5,5
5,6
5,7
7
5,6
6,0
6,2
8
7,0
6,5
6,5
9
6,9
7,1
6,8
10
7,4
7,1
7,4
11
7,1
7,7
7,4
12
8,6
7,6
7,9
13
7,0
8,3
7,7
14
9,2
7,7
8,2
15
6,8
8,4
8,1
16
9,3
8,1
8,5
17
8,1
8,8
8,5
18
8,9
8,8
9,2
19
9,4
9,5
9,5
20
10,3
10,2
27,7
21
10,9
40,1
48,1
22
99,0
73,6
–
23
111,0
–
–
4.4. Статистические индексы
В статистике индекс – это относительная величина, показывающая во сколько раз один
статистический показатель больше другого. Индексы выражают в коэффициентах или в процентах.
Индексы в статистике подразделяют:
1) индексы динамики (при сравнении элементов ДР);
Ik,m = Yk/Ym
Если Ik,m = 1,05, то это означает, что Yk > Ym на 5%
Если Ik,m = 0,98, то Yk < Ym на 2%
2) территориальные индексы (при сравнении статистических показателей по регионам; например, продолжительность жизни в разных странах);
3) индекс планового задания (плановый уровень сравнивают с уровнем предыдущего
периода).
Существует два способа расчета индексов: цепной и базисный.
Цепным индексом называется отношение последующего элемента ДР к предыдущему:
Ik+1,k = Ik+1,k / Ik – цепной индекс
Базисный индекс – отношение любого элемента ДР к элементу, выбранному в качестве
базового (обычно это первый элемент ДР):
Ik,1 = Ik,k / I1 – базовый индекс
25
Пример. Имеются данные об успеваемости за 6 лет.
Рассчитать цепные и базисные индексы.
Годы
Кол-во учащихся
Из них
Кол-во отличников
Кол-во хорошистов
Кол-во имеющих тройки
Кол-во неуспевающих
1997
1100
1998
1020
1999
952
2000
937
2001
892
2002
834
65
200
811
24
62
207
731
20
58
201
675
18
45
197
679
16
39
187
649
17
35
176
608
15
2001
892
0,952
95,2
0,811
81,1
2002
834
0,935
93,5
0,758
75,8
Расчет индексов по общему количеству учащихся.
Годы
1997
1998
1999
2000
Кол-во учащихся
1100
1020
952
937
Цепные индексы
0,927 0,933
0,984
%
92,7
93,3
98,4
Базисные индексы
0,927 0,865
0,852
%
92,7
86,5
85,2
Приведенные данные по успеваемости несопоставимы, так как общее количество учащихся изменяется. Можно использовать два подхода: сравнить удельные веса каждой группы по успеваемости или привести данные к сопоставимым.
Рассмотрим второй подход, т.е. сначала приведем данные к сопоставимым (по последнему году рассматриваемого периода).
Годы
Кол-во учащихся
Коэффициент перевода
Сопоставимые данные
Всего учащихся
Кол-во отличников
Кол-во хорошистов
Кол-во имеющих тройки
Кол-во неуспевающих
1997
1100
0,758
1998
1020
0,818
1999
952
0,876
2000
937
0,890
2001
892
0,935
2002
834
1
834
49
152
615
18
834
51
169
598
16
834
51
176
591
16
834
40
175
604
14
834
36
175
607
16
834
35
176
608
15
2001
175
1,000
100,0
1,151
115,1
2002
176
1,006
100,6
1,158
115,8
Рассчитаем для примера индексы для хорошистов
Годы
1997
1998
1999
2000
Кол-во хорошистов
152
169
176
175
Цепные индексы
1,112 1,041
0,994
%
111,2 104,1
99,4
Базисные индексы
1,112 1,158
1,151
%
111,2 115,8
115,1
Замечани е. Существует отличие между коэффициентами роста и индексами. При расчете коэффициентов роста сравниваются два фактических значения, при расчете индексов
можно сравнивать два фактических значения, а можно фактическое значение сравнивать с
так называемым рекомендуемым значением.
26
Упражнения
1. Имеются данные о количестве детей, посещающих занятия, организованные домом
творчества. Определите: 1) абсолютные приросты, темпы роста и прироста (цепные и базисные); 2) абсолютное содержание 1% прироста; 3) среднегодовые темпы роста и прироста количества за 5 лет; 4) средний уровень ряда и среднегодовой прирост количества детей. Изобразите динамический ряд на графике. Сделайте выводы.
Год
Количество детей
(чел.)
1
322
2
350
3
368
4
383
5
394
Решение.
Год Кол-во детей Абс. прирост, т.р. Темп роста, % Темп прироста, % Абс. зн. 1%
чел.
прироста, т.р.
ц
б
ц
б
ц
б
1
322
2
350
28
28
108,7 108,7
8,7
8,7
3,2
3
368
18
46
105,1 114,8
5,1
14,3
3,5
4
383
15
61
104,1 118,9
4,1
18,9
3,7
5
394
11
72
120,9 122,4
2,9
22,4
3,8
1817
72
3) Среднегодовой темп роста – для его нахождения используем коэффициент роста Кр
(Тр = Кр·100).
y
394
Кр = n 1 n = 4
= 1,052 => Тр = 105,2% – среднегодовой темп роста.
y1
322
Среднегодовой темп прироста посещаемости: Тпр = Тр – 100 = 105,2 – 100 = 5,2%.
 yi
1817
4) Средний уровень ряда: у =
=
= 363,4 (чел.)
n
5
Среднегодовой абс. прирост количества детей: y = АПц/(n – 1) = 72/4 = 18 (чел.).
Выводы:
Отчетливая тенденция роста.
В среднем за год фонд колво детей увеличивалось на 18
человек.
Средний прирост составлял
5,2%
Больше всего кол-во посещающих занятия выросло во 2м году (на 8,7%), меньше всего
– в 5-м году (цепной Тр = 2,9%)
Фонд з/пл
т.руб.
Фонд з/пл
т.руб.
500
400
300
200
100
0
1
2
3
4
5
Годы
2. Имеются данные о количестве заявок на посещение группы продленного дня в сентябре (чел). Определить среднее детей, посещавших группу в течение сентября.
Заявлений на 1/9
50
5/9 поступило новых заявлений
10
15/9 уехали с родителями
1
8/9 отпросились по болезни
6
20/9 выздоровели
2
12/9 выздоровели
4
26/9 отпросились до конца месяца 7
27
3. Имеется динамика посещения учащимися дополнительных занятий за учебный год.
Рассчитать скользящие средние.
Месяцы Количество учащихся
Āi
Āi
(человек)
(3-х месячные)
(5-ти месячные)
сентябрь
25
–
–
октябрь
63
–
ноябрь
77
декабрь
91
январь
34
февраль
56
март
78
апрель
65
май
95
–
июнь
15
–
–
4. Имеются данные об успеваемости за 6 лет.
Рассчитать цепные и базисные индексы по отличникам, троечникам и неуспевающим.
Годы
1997
1998
1999
2000
2001
2002
Кол-во учащихся
1100
1020
952
937
892
834
Из них
Кол-во отличников
65
62
58
45
39
35
Кол-во хорошистов
200
207
201
197
187
176
Кол-во имеющих тройки
811
731
675
679
649
608
Кол-во неуспевающих
24
20
18
16
17
15
28
§ 5. Описательная статистика
В практических задачах обычно имеется совокупность наблюдений (десятки, сотни и
более результатов измерений индивидуальных характеристик), поэтому возникает задача
компактного описания имеющихся данных. Для этого используют методы описательной
статистики – описания результатов с помощью различных агрегированных показателей и
графиков. Кроме того, некоторые показатели описательной статистики используются в статистических критериях.
Для результатов измерений в порядковой шкале при небольшом числе различных значений единственным информативным показателем описательной статистики является гистограмма. если же число значений велико, то можно использовать также моду и медиану.
Для результатов измерений в шкале отношений показатели описательной статистики
можно разбить на несколько групп:
– показатели положения описывают положение экспериментальных данных на числовой оси. Примеры таких данных – максимальный и минимальный элементы выборки, среднее
значение, медиана, мода и др.;
– показатели разброса описывают степень разброса данных относительно своего центра (среднего значения). К ним относятся: выборочная дисперсия, разность между максимальным и минимальным элементами (размах, интервал выборки) и др.;
– показатели асимметрии: положение медианы относительно среднего и др.;
– гистограммы и др.
5.1. Мода, медиана
Мода (Мо) – значение в множестве наблюдений, которое встречается наиболее часто.
Пример. На вопрос анкеты: “укажите степень владения иностранным языком”, ответы распределились следующим образом:
1 – владею свободно
– 25
2 – владею в достаточной степени для общения
– 54
3 – владею, но испытываю трудности при общении
– 253
4 – понимаю с трудом
– 173
5 – не владею
– 28
Очевидно, что наиболее типичным значением здесь является – "владею, но испытываю
трудности при общении", которое и будет модальным.
Некоторые соглашения об использовании моды
1. В случае, когда все значения в группе встречаются одинаково часто, принято считать, что группа оценок не имеет моды. Таким образом, в группе (0,5; 0,5; 1,6; 1,6; 3,9; 3,9)
моды нет.
2. Когда два смежных значения в группе имеют равные частоты и они больше частоты
любого другого значения, мода есть среднее этих двух значений. Так, мода группы значений
(0,1; 1; 2; 2; 2; 3; 3; 3; 4) равна 2,5.
3. Если два несмежных значения в группе имеют равные частоты и они больше частот любого значения, то существует две моды. В группе значений (10, 11, 11, 11, 12, 13, 14, 14, 14, 17)
модами являются и 11, и 14; в такой случае говорят, что группа оценок является бимодальной.
Большие множества данных часто рассматривают как бимодальные, когда они образуют полигон частот, похожий на спину двугорбого верблюда, даже если частоты на двух вершинах не строго равны. Можно условиться различать большие и меньшие моды.
Медианой (Ме, Md) называется значение исследуемого признака, справа и слева от которого находится одинаковое число элементов выборки. Таким образом, она делит упорядоченное множество данных пополам.
29
Вычисление медианы
1. Если данные содержат нечетное число различных значений, например: 11, 13, 18, 19,
20, то медиана есть среднее значение для случая, когда они упорядочены, т.е. Ме = 18.
2. Если данные содержат четное число различных значений, например: 4,9,13,14, то ме9  13
диана есть среднее арифметическое между двумя центральными значениями: Ме =
=11.
2
5.2. Среднее значение
Пусть имеется n значений случайной величины X: x1, x2, …, xn
Простая арифметическая средняя вычисляется по формуле:
x =
 xi ,
n
где n – об-
щее число значений.
№ п/п Возраст № п/п Возраст № п/п Возраст № п/п Возраст
1
18
6
20
11
22
16
21
2
18
7
19
12
19
17
19
3
19
8
19
13
19
18
19
4
20
9
19
14
20
19
19
5
19
10
20
15
20
20
19
Средний возраст по формуле простой средней (N = 20 – число наблюдений):
х = (18+18+19+...+19)/20 = 388/20 = 19.4 года.
Средняя арифметическая взвешенная х:
х =
 x i fi
 fi
, где хi – значение изучаемого
признака, fi – частоты (веса).
Сгруппируем исходные данные:
Возраст, лет
18 19 20 21 22 Всего
Число студентов 2 11 5 1 1
20
Средний возраст по формуле взвешенной средней:
х = (18·2 + 19·11 + 20·5 + 21·1 + 22·1)/(2 + 11 + 5 + 1 + 1) = 19,4 года.
В случае, когда мы имеем дело с данными сгруппированного частотного распределения,
необходимо найти середины интервалов (хi) и далее применять формулу взвешенной средней.
Таблица 10
Интервал
значений
Частота
fi
Середина
инт-ла (xi)
fi · хi
70 – 74
1
72
72
65 – 69
0
67
0
60 – 64
3
62
186
55 – 59
2
57
114
50 – 54
6
52
312
45 – 49
10
47
470
40 – 44
8
42
336
n =  fi = 50,  fi · середина = 2085 =>
Интервал
значений
Частота
fi
Середина
инт-ла (xi)
fi · хi
35 – 39
30 – 34
25 – 29
20 – 24
15 – 19
10 – 14
8
4
2
4
1
1
37
32
27
22
17
12
296
128
54
88
17
12
х = 2085 / 50 = 41,70.
5.3. Дисперсия
Дисперсия (выборочная исправленная дисперсия) рассчитывается как средняя сумма
квадратов разностей между элементами выборки и средним значением. Она характеризует
разброс элементов выборки вокруг среднего значения.
2
S =
 ( x i  x )2
n 1
30
Примеры вычисления дисперсии.
1. Найдем дисперсию следующего ряда чисел: 1, 3, 3, 0, 4, 1.
n=6
 среднее
x
1 3 3 0 4 1 12 2
x –x –1 1 1 –2 2 –1 – –
(x –x)2 1 1 1 4 4 1 12 –
2
S = 12 / (6 – 1) = 2,4.
2. В случае сгруппированных данных для вычисления взвешенной дисперсии исполь2
зуют формулу: S2 =  (x i  x ) f i .
 f i 1

–
6
12
–
–
12
x
–
–
2
–
–
–
x
1 3 0 4
частота f 2 2 1 1
xf
2 6 0 4
–1
1 –2 2
x –x
2
1 1 4 4
(x –x)
2
(x –x) f 2 2 4 4
2
S = 12 / 5 = 2,4.
3. В случае интервального распределения необходимо сначала найти середины интервалов и далее воспользоваться формулой взвешенной дисперсии.
Интервал значений
40 – 44 45 – 49 50 – 54 55 – 59 60 – 64
х

Частота, f
1
6
10
7
3
27
–
Середины интервалов, хi
42
47
52
57
62
–
–
f · xi
42
282
520
399
186
1429 52,9
–
x –x
-10,9
-5,9
-0,9
4,1
9,1
–
2
–
(x –x)
118,81 34,81
0,81
16,81
82,81
–
2
–
(x –x) f
118,81 208,86
8,1
117,67 248,43 701,87
2
S = 701,87 / (27 – 1) = 26,995
Замечани е 1. Если первоначальные варианты хi – большие числа, то для упрощения
расчетов целесообразно вычесть из каждой варианты одно и то же число С, т.е. перейти к условным вариантам ui = xi – C (в качестве С выгодно принять число, близкое к выборочной
средней; поскольку выборочная средняя неизвестна, число С выбирают "на глаз"). Тогда
 ui .
x = С +
n
Замечани е 2. Если первоначальные варианты хi – большие числа, то для вычисления
дисперсии целесообразно вычесть из всех вариант одно и то же число С, равное выборочной
средней или близкое к ней, т.е. перейти к условным вариантам ui = xi – C (дисперсия при
этом не изменится!).
Пример. Найти выборочную среднюю и выборочную дисперсию по данному распределению выборки объема n = 20.
хi
2560
2600
2620
2650
2700
fi
2
3
10
4
1
Решение. Первоначальные варианты – большие числа, поэтому перейдем к условным
вариантам ui = xi – 2620. В итоге получим распределение в условных вариантах:
ui
–60
–20
0
30
80
fi
2
3
10
4
1
31
Тогда выборочная средняя равна: х = 2620 +
 60  2  20  3  30  4  80  1
= 2621
2  3  10  4  1
Найдем выборочную дисперсию.
ui
–60
–20
0
30
80
fi
2
3
10
4
1
Для данных значений средняя равна 1. Тогда имеем:
ui –u
–61
–21
–1
29
79
2
(ui –u) 3721
441
1
841
6241
2
(ui –u) fi 7442
1323
10
3364
6241
7442

1323

10

3364

6241
S2 =
= 967,3684
19
Замечани е 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями, первоначальные
варианты умножают на постоянное число С = 10k, т.е. переходят к условным вариантам
ui = Схi. При этом дисперсия увеличится в С2 раз. Поэтому, найдя дисперсию условных вариант, надо разделить ее на С2.
Замечани е 4. Для вычисления дисперсии можно пользоваться более удобной формулой:
S2 =
 fi xi2  [ fi xi ]2 / n
(n = fi).
n 1
При этом в условных вариантах она имеет вид:
fi u i2  [ fi u i ]2 / n

2
Su=
n 1
причем, если ui = xi – C, то S2 = S2u, если ui = Cxi, то S2 = S2u/C2.
Пример. Найти выборочную дисперсию по данному распределению выборки объема
n = 10:
хi
0,01
0,04
0,08
fi
5
3
2
Решение. Для того, чтобы избежать действий с дробями, перейдем к условным вариантам ui = 100 xi. Получим распределение:
ui
1
4
8
fi
5
3
2
2
ui
1
16
64
S2u = ((5 · 1 + 3 · 16 + 2 · 64) – (5 · 1 + 3 · 4 + 2· 8)2/10)/(10 – 1) = 8,01
Тогда искомая выборочная дисперсия величины Х равна: 8,01/1002 = 0,0008.
5.4. Другие показатели вариации
Стандартным отклонением S называется величина, равная корню из дисперсии. Таким
образом, если дисперсия равна 0,0008, то стандартное отклонение равно: 0,0008 = 0,0283.
Стандартное отклонение называют еще средним квадратическим отклонением и обозначают
символом .
Коэффициент вариации
Отношение стандартного отклонения к среднему арифметическому называют коэффициентом вариации. Коэффициент вариации V часто выражают в процентах:
S
V  ·100%
X
Чем меньше коэффициент вариации, тем меньше разброс значений случайной величины относительно среднего арифметического (до 10% – небольшой разброс, от 10% до 30%
(35%) – средний, свыше 30% (35%) – большой).
32
частота
частота
Асимметричность
Одно из наиболее важных свойств распределения частот – степень асимметрии. Практически точно симметричные полигоны частот и гистограммы почти никогда не встречаются. Степень асимметрии распределения частот для выборки называется его асимметрией. На
рис. 6 показаны примеры асимметричных распределений частот.
Выборочным коэффициентом асимметрии называется число, определяемое формулой:
( x  x )3
( x  x )3  f i
AS =  i 3
или AS =  i 3
n S
n S
Асимметрия положительна, если "длинная часть" полигона расположена справа от математического ожидания (М(Х) – средней), и отрицательна, если "длинная часть" полигона
расположена слева от математического ожидания.
М(X)
X
М(X)
X
Рисунок 6. Два асимметричных распределения частот
Эксцесс
Для оценки "крутости", т.е. большего или меньшего подъема полигона распределения
по сравнению с нормальной кривой, пользуются характеристикой – эксцессом.
Выборочным эксцессом (или коэффициентом крутости) называется число Еk, определяемое формулой:
 ( x i  x )4
или Ek =
частота
–3
 ( x i  x ) 4  fi
–3
n  S4
n  S4
Для нормального распределения эксцесс равен 0. Поэтому, если эксцесс некоторого
распределения отличен от нуля, то кривая этого распределения отличается от нормальной
кривой: если эксцесс положительный, то кривая имеет более высокую и "острую" вершину,
чем нормальная кривая (рис. 7 а), если эксцесс отрицательный, то сравниваемая кривая имеет
более низкую и "плоскую" вершину, чем нормальная кривая (рис. 7 б).
частота
Ek =
Нормальная
кривая
а)
X
б)
X
Рисунок 7
Упражнения
1. Найдите среднее, медиану и моду следующего множества: 1,2; 1,5; 1,6; 2,1; 2,4; 2,4;
2,7; 2,8; 3,0; 3,0; 3,1; 3,1; 3,1; 3,4.
2. Пусть к каждому из 14 значений примера 1 прибавлено 0,5. Чему будут равны среднее, медиана и мода этих увеличенных значений?
33
3. Определите среднее значение для следующего сгруппированного распределений частот:
Интервал Частота
5–7
8
8 – 10
14
11 – 13
41
14 – 16
26
17 – 19
7
20 – 22
4
4. Каково будет среднее значение в условиях предыдущего примера, если каждое из
значений умножено на 3?
5. В группе А содержится 10 значений, среднее которых равно 14,5. В группе Б – 20
значений, среднее которых равно 12,7. Чему равно среднее 30 значений, полученных в результате объединения групп А и Б?
6. Найти выборочную среднюю, выборочную дисперсию и коэффициент вариации по
данному распределению:
а) хi
2502
2804
2903
3028
fi
8
30
60
2
б) хi
0,1
0,5
0,6
0,8
fi
5
15
20
10
в) хi
23,5
26,1
28,2
30,4
fi
2
3
4
1
7 В таблице представлены результаты измерения роста (в см) случайно отобранных
100 студентов. Найти среднюю, выборочную дисперсию и коэффициент вариации роста обследованных студентов.
Рост
154 – 158 158 – 162 162 – 166 166 – 170 170 – 174 174 – 178 178 – 182
Число
10
14
26
28
12
8
2
студентов
8. Найти все показатели вариации (среднюю, дисперсию, коэффициент вариации,
асимметрию и эксцесс) по данному распределению.
а) хi
3,5
6,1
8,2
0,4
fi
2
3
4
1
б) хi
3,2
23,5
34,5
38,1
fi
1
2
8
1
34
§ 6. Методы социально-педагогических исследований:
К методам социально-педагогических исследований относятся:
– наблюдение
– эксперимент
– беседа
– изучение школьной документации
– монографическое изучение личности
– включенное наблюдение
– анкетирование
– интервьюирование
– тестирование
и т.д.
Наблюдение. Это специально организованное восприятие исследуемого объекта, процесса или явления в естественных условиях.
Наблюдение – самый старый в педагогике метод, впервые он был введен Яном Амосом
Коменским. Самый древний, но до сих пор до конца не разработан. Наблюдение требует
очень большой как подготовительной, так и организационной работы. Для повышения эффективности наблюдения оно должно быть длительным, систематическим, разносторонним,
объективным и массовым. Особенно сложно соблюсти последнее требование, так как человек по своей природе субъективен. Проводили даже такой эксперимент: за одним ребенком
одновременно наблюдали несколько человек, при сравнении результатов наблюдения выяснилось, что совпало всего 10% информации.
Для грамотного организованного наблюдения необходима программа наблюдения, которая состоит из 3 частей.
а) выбор объекта наблюдения.
Например, ученик, которого учителя считают "светилом школы", а все ученики не любят, надо выяснить, с чем это связано и помочь; или у ученика нет никаких интересов, а потому у него нет стремления учиться; или полная неуверенность в своих силах, отстраненность от всех – ему никто не нужен, но и он никому не нужен и т.д.
б) определение целей и задач наблюдения:
– выявление положительных качеств,
– выявление отрицательных качеств.
в) разработка схемы наблюдения, создание условия для наблюдения: наблюдения на
уроках разных учителей, наблюдения во всех внеклассных мероприятиях (иногда приходится даже специально для этого их планировать), в домашних условиях и т.д.
При наблюдении результаты обязательно фиксируются, полученные данные обрабатываются.
Достоинства:
– не только изучаем ученика, но можем иногда и сразу предпринять какие-то действия,
попытаться изменить ситуацию.
Недостатки:
– большое количество времени,
– большое количество затраченных сил и энергии,
– нет вариантов программ наблюдений, учитель каждый раз, для каждого ученика разрабатывает все сам,
– не вскрывает внутренние стороны педагогических явлений,
– невозможно обеспечить полную объективность информации,
– люди меняют свое поведение под наблюдением.
Поэтому, наблюдение чаще всего применяется на начальных этапах исследования.
35
Метод включенного наблюдения: наблюдатель сам является членом коллектива, участвует в делах коллектива.
Положительное:
– не надо специально разрабатывать программы наблюдения.
– люди не меняют своего поведения.
Отрицательное:
– может спровоцировать нездоровую обстановку в коллективе, фискальство,
– субъективность наблюдателя возрастает.
БЕСЕДА – один из самых древних методов.
Подготовительный этап беседы включает в себя: выбор объекта беседы, определение
цели беседы, определение времени и места проведения беседы. Необходимо составить план
беседы.
Беседа может быть плановой, по ЧП, трагедии. Беседа не должна проводится в
учительской (нервозное состояние ученика), в коридоре или в классе во время перемены
(вызывает любопытство учеников, тем самым заставляя ученика опять нервничать).
Лучше всего оставить ученика после урока или попросить его проводить домой и донести
тетради, или в лаборантской, попросить помочь подготовится к следующему уроку и т.д.
План беседы: беседа должна состоять из трех этапов – ознакомительного (кто родители, интересы, отношения, какие кружки посещает, с кем дружит, кто является авторитетом,
какие идеалы, кем собирается стать и т.д.); кульминационный – основные вопросы, ради которых задумывалась беседа; третий – советы, пожелания.
Организационные особенности беседы: вопросы составляются только для себя, их ни в
коем случае не должен видеть ученик, тем более их нельзя зачитывать, ответы на вопросы
тоже надо запоминать, учитывать тембр речи.
После беседы самые важные моменты необходимо зафиксировать. Можно записать беседу на магнитофон, но только для себя: ни в коем случае этого не должен видеть ученик и
нельзя давать прослушивать эту запись никому, иначе доверие со стороны учеников будет
подорвано и ни один из них не пойдет на откровенный разговор с вами в дальнейшем.
Для повышения надежности результатов беседы и снятия неизбежного оттенка субъективизма, используют специальные меры:
– наличие четкого плана,
– обсуждение интересующих исследователя вопросов в различных ракурсах и связях,
– варьирование вопросов, постановка их в удобной для собеседника форме.
Достоинства:
– учитель по ходу беседы чувствует, удалось ли установить контакт с учеником, может
попытаться повлиять на ученика, легче в последующем построить программу воспитания и
самовоспитания с этим учеником.
Недостатки:
– достаточно большое количество времени,
– сложность фиксации результатов беседы,
– для хороших результатов необходим опыт и умение вести беседу.
МЕТОД НЕЗАВИСИМЫХ ХАРАКТЕРИСТИК. Каждый из нас субъективен; любой
учитель, характеризуя ученика, в первую очередь руководствуется его отношением и его результатами обучения по своему предмету, а потому, для того, чтобы сделать субъективную
характеристику каждого отдельного человека более объективной и используют метод независимых характеристик.
Выбираются компетентные люди, которые хорошо знают этого ученика: учителя, ученики, кто-нибудь из администрации, работающий в этом классе. Каждый из них пишет характеристику на ученика, а потом составляется общая; в нее включают то, что есть во всех
характеристиках, потом то, что встречается в большинстве, затем то, что встречается 4,3
36
раза. Можно указать проблемные положения, которые встречаются и реже, но если они характеризуют этого ученика с необычной стороны и требует проверки или уточнения.
МЕТОД ИНТЕРВЬЮИРОВАНИЯ. Промежуточный вариант между беседой и анкетой.
Проводится индивидуально, по заранее подготовленным бланкам. Интервьюер задает по тексту вопросы и сам записывает ответы. По ходу интервью, если ученику, что-либо непонятно, то дает сразу пояснения.
Особенности:
– проводится не анонимно,
– одни и те же вопросы задаются всем ученикам,
– заполняется сразу.
Недостатки:
– не дает большой гарантии в достоверности ответа
– требует большего количества времени, чем анкета.
Достоинства:
– легко поддается обработке,
– дает возможность объяснить смысл непонятных вопросов.
МЕТОД АНКЕТИРОВАНИЯ. Это самый распространенный метод социальнопедагогических исследований. Метод массового сбора материала с помощью специально
разработанных опросников – анкет.
Требования к проведению и составлению анкет:
– составлять должны только профессионалы;
– должна отвечать требованиям репрезентативности (выводы по классу, школе, региону): по классу должно быть опрошено – 80%, по школе – 25-30%, по району – 15-20%, по городу – 7-10%, по области – 3-5%, по региону – 1-2%, по стране – 0,1%.
– должны проводиться не чаще, чем 2 раза в год в одном и том же коллективе, так как
иначе пропадает интерес и теряется доверие у опрашиваемых к проводимым исследованиям.
т.д.
Требования к вопросам анкеты:
1. Анкета должна быть пронизана единой теоретической мыслью (не представлять собой винегрет).
2. Вопросы в анкете должны подаваться с однозначной интерпретацией, иначе их невозможно будет обрабатывать.
Например, "нравится ли тебе коллектив твоего класса?" Ответы "да", "нет", "не знаю".
3. Рекомендуется использовать в анкете вопросы закрытого или полузакрытого типа.
Пример вопроса полузакрытого типа: Где бы ты хотел работать после окончания
университета?
Возможные варианты ответа:
– в университете;
– в ССУЗ;
– в городской школе;
– в сельской школе;
– __________________ укажи сам где.
Пример вопроса закрытого типа: Какое из ниже приведенных суждений выражает
твое мнение?
Возможные варианты ответа:
– для меня самым важным является величина зарплаты, смысл работы не имеет никакого значения;
– для меня важным является величина зарплаты, но хотелось бы, чтобы работа была
интересной;
– для меня в равной степени важны и зарплата и смысл работы;
37
– для меня важен смысл работы, но хотелось бы, чтобы она и хорошо оплачивалась;
– для меня важен смысл работы, величина зарплаты для меня не имеет никакого значения.
Анкеты открытого типа использовать также можно, но только на небольшие коллективы (не больше класса), так как они сложны в обработке и не поддаются анализу.
4. Не рекомендуется использовать в анкете вопросы, которые вызывают напряжение в
ходе опроса или стереотипный ответ.
Например, не стоит задавать вопрос: "Кого из учителей своей школы Вы уважаете, а
кого не уважаете", если анкета проводится кем-то из работников школы. Такие вопросы могут задаваться только посторонними для этой школы людьми, да и то должна быть выдана
гарантия, что точка зрения отдельного ученика не будет разглашена.
5. Можно использовать вопросы, которые оказывают давление на нравственные качества ученика.
Например:
а. Напишите, какие у Вас есть замечания по организации процесса обучения в Вашей
школе. Учтите, что Ваша точка зрения никому не будет сообщена.
б. Если бы Вы были классным руководителем, как бы Вы изменили организацию процесса обучения в школе? Учтите, что Ваша точка зрения будет обсуждаться на классном собрании.
в. Если бы Вы были директором школы, как бы Вы изменили процесс обучения в школе? Учтите, что ваша точка зрения будет обсуждаться на педагогическом совете школы.
6. Рекомендуется использовать в анкете вопросы, ответы на которые ранжируются.
Например: Каковы твои мотивы выбора профессии?
Мотивы и факторы (мотив – внутренний импульс к действию: интерес к профессии; фактор –
внешнее воздействие: совет семьи)
– интерес к профессии
0 1 2 3 4 5
– величина зарплаты
0 1 2 3 4 5
– обстоятельства сложились так, что иного выбора не было
0 1 2 3 4 5
– традиции семьи
0 1 2 3 4 5
– совет родителей
0 1 2 3 4 5
– совет учителя
0 1 2 3 4 5
– организация учебного процесса в школе
0 1 2 3 4 5
– влияние друзей
0 1 2 3 4 5
– встречи с представителями этой профессии
0 1 2 3 4 5
– средства массовой информации
0 1 2 3 4 5
– книги
0 1 2 3 4 5
Это пример шестиранговой анкеты. Для анализа ответы по классу приводятся в систему, т.е. высчитывается какие мотивы для класса в целом являются ведущими, а какие вообще
выпадают. (Можно привести пример по юридическому классу лицея).
7. Анкета начинается с обращения к опрашиваемому, где обязательно аргументируется
цель анкеты, даются методические рекомендации по ее заполнению.
8. Анкета может быть анонимной или авторской. Для большей объективности лучше
проводить анонимную, но если ставится цель оказать помощь каждому отдельному ученику,
то она должна быть авторской.
Одна из разновидностей анкеты – "полярная" анкета с бальной оценкой. По этому
принципу составляются анкеты самооценки и оценки других людей.
Например, при исследовании качеств личности можно использовать пятибальную шкалу.
Организованный
5 4 3 2 1 Неорганизованный
Трудолюбивый
5 4 3 2 1 Ленивый
Одаренный
5 4 3 2 1 Малоспособный
Отмечается один балл по принципу, если очень организован, то "5", а если очень неорганизован – то "1".
38
Достоинства:
– охват большого количества опрашиваемых;
– не требует большого количества времени;
– простая обработка.
Недостатки:
– нет уверенности в объективности опрашиваемых.
– нельзя делать выводы только на основании одной анкеты.
ИЗУЧЕНИЕ ШКОЛЬНОЙ ДОКУМЕНТАЦИИ.
Изучение личных дел, характеристик, классных журналов, расписания учебных занятий, правил внутреннего распорядка, календарных и поурочных планов учителей, личных
работ, школьных сочинений и т.д. Обязательно должно использоваться при знакомстве с новым классом.
МЕТОД ЭКСПЕРИМЕНТА. Слово "эксперимент" латинского происхождения и в переводе означает "опыт", "испытание". Это научно поставленный опыт преобразования педагогического процесса в точно учитываемых условиях. В отличие от методов, лишь регистрирующих то, что уже существует, эксперимент в педагогике имеет созидательный характер.
Экспериментальным путем, например, пробивают дорогу в практику новые приемы, методы,
формы, системы воспитательно-образовательной деятельности. Педагогический эксперимент
может охватывать группу учеников, класс, школу или несколько школ. Осуществляются и
очень широкие региональные эксперименты. Исследования могут быть длительными или
краткосрочными в зависимости от темы и цели. Необходимо помнить, что эксперимент ни в
коем случае не должен принести вред ученику. Для эксперимента необходима соответствующая база.
Педагогический эксперимент требует:
– обоснования рабочей гипотезы,
– разработки исследуемого вопроса,
– составления детального плана проведения эксперимента,
– строгого соблюдения намеченного плана,
– точной фиксации результатов,
– тщательного анализа полученных данных,
– формулировки окончательных выводов.
Надежность экспериментальных выводов зависит от соблюдения условий эксперимента. Все факторы, кроме проверяемых, должны быть тщательно уравнены. Если, например,
проверяется эффективность нового приема, то условия обучения, кроме проверяемого приема, необходимо сделать одинаковыми как в экспериментальном, так и в контрольном классе.
Так как в реальной жизни причин, влияющих на эффективность воспитательнообразовательного процесса очень много, то соблюсти это требование очень трудно.
Существует классификация экспериментов по цели проведения:
1. констатирующий – изучаются существующие педагогические явления;
2. проверочный, уточняющий – проверяется гипотеза, созданная в процессе осмысления проблемы;
3. преобразующий, формирующий – в его процессе конструируются новые педагогические явления.
В основном, эти виды эксперимента применяются в последовательности.
По месту проведения различают естественный и лабораторный педагогический эксперимент.
Объектом педагогического эксперимента могут сталь планы, программы, учебники и
учебные пособия.
Пример эксперимента: в Х веке до н.э. правитель Спарты Ликург поставил эксперимент, подтверждающий силу воспитания. Он отобрал у ощенившейся суки двух щенков и
39
посадил их в глубокую яму. Воду и пищу спускали вниз на веревке. Других щенков из того
же помета он оставил расти на свободе. Пусть проходят курс "собачьей науки" в жизни. Когда щенята выросли, Ликург велел выпустить на виду у собак зайца. Как и следовало ожидать, щенки, выросшие на свободе, погнались за зайцем, догнали его и задавили. А щенки,
выросшие в яме, бросились наутек.
МЕТОД ТЕСТИРОВАНИЯ
"Тест" – короткое испытание, проба. Тестирование – целенаправленное, одинаковое для
всех испытуемых обследование проводимое в строго контролируемых условиях, позволяющее объективно измерять изучаемые характеристики педагогического процесса.
В педагогике тесты используется: как форма опроса на уроке – тесты успеваемости,
тесты элементарных умений, таких, как письмо, чтение, простейшие арифметические операции, а также различные тесты для диагностики уровня обученности – выявление степени усвоения знаний, умения по всем учебным предметам. Так же тесты используются для изучения личности.
Выделяется два вида тестов: скорости и мощности. По тестам скорости у испытуемого
обычно не хватает времени ответить на все вопросы, по тестам мощности у каждого такая
возможность есть.
Пример теста, известного в истории: войско после длительного перехода должно было
принять сразу же участие в сражении. Полководец привел их к реке и разрешил напиться.
Некоторые от усталости падали на колени и пили воду прямо из реки, другие же черпали
шлемами и пили, не теряя человеческого облика. Именно они и приняли участие в битве и
победили. Таким простым тестом полководец отобрал тех, у кого силы еще остались.
Достоинства:
– точность,
– простота,
– доступность,
– возможность автоматизации.
40
§ 7. Проверка статистических гипотез
При решении многих задач необходимо уметь статистически грамотно анализировать
большие наборы информации, выделять существенные факторы, делать строго обоснованные выводы и рекомендации.
Выделяют два вида статистического анализа:
пассивный статистический анализ; суть его в том, что с помощью классических методов математической статистики обрабатываются имеющиеся статистические данные;
активный статистический анализ; в этом случае реализуется по определенному плану
статистический эксперимент, результаты эксперимента анализируются методами математической статистики. Существует много методов планирования экспериментов. Все они гораздо эффективнее методов пассивного статистического анализа.
Все допустимые значения случайной величины называются генеральной совокупностью.
На практике при анализе какой-то случайной величины обычно невозможно охватить
всю генеральную совокупность. Поэтому изучается часть генеральной совокупности, которую называют выборкой из этой совокупности.
Выборка называется репрезентативной или представительной, если она дает достаточное представление об особенностях генеральной совокупности.
Статистической гипотезой называют любое предположение о свойствах генеральной
совокупности, которое проверяется по выборке (по результатам наблюдений).
Способ, с помощью которого решается вопрос в пользу принятия или отвержения гипотезы, называют критерием. В общем случае проверка статистической гипотезы состоит в
сравнении некоторой величины, рассчитанной по результатам наблюдений (обозначим ее
Твыб), с ее табличным значением Ттаб. Например, гипотеза принимается, если Твыб < Tтаб.
Существуют специальные статистические таблицы для проверки гипотез.
При проверке статистических гипотез нельзя быть уверенным, что выводы будут правильными на 100%. Поэтому вводится понятие уровня значимости.
Уровень значимости характеризует, в какой степени мы рискуем ошибиться, отвергая
или принимая проверяемую гипотезу.
Если мы совершили ошибку, отвергнув правильную гипотезу, то эта ошибка называется ошибкой первого рода. Вероятность такой ошибки обозначают греческой буквой .
В статистических таблицах имеются данные для разных уровней значимости . В практических задачах чаще всего выбирают уровень значимости равным 0,05 или 5%. Для более
ответственных исследований можно взять уровень значимости 0,01.
В статистических таблицах используются еще одно важное понятие – это число степеней свободы. Числом степеней свободы некоторого статистического параметра называется
число независимых величин, участвующих в образовании этого параметра. Обычно число
степеней свободы обозначается f (f рассчитываются специалистами по математической статистике).
Рассмотрим примеры проверки некоторых статистических гипотез.
Типовые задачи анализа данных
С точки зрения анализа исходных данных можно выделить три типа задач:
– описание данных (компактное и информативное отражение результатов измерений
характеристик исследуемых объектов);
– установление совпадения характеристик двух групп (например, экспериментальной и
контрольной);
– установление различия характеристик двух групп (например, экспериметальной и
контрольной).
Кроме того, после проведения измерений необходимо проверить полученные результаты на содержание ошибок.
41
7.1. Гипотеза об однородности результатов наблюдений
Задачи такого рода возникают, если получен результат, резко отличающийся по величине от остальных. Математическая статистика позволяет ответить на вопрос, является ли
этот подозрительный результат грубой ошибкой или он принадлежит к той же генеральной
совокупности, хотя и редко встречается.
Пусть имеется выборка: Х1, X2, ... , Xn.
Xm – наибольшее (или наименьшее) значение из этой выборки. Необходимо проверить,
принадлежит ли Хm к генеральной совокупности.
Для проверки гипотезы о принадлежности резко выделяющегося значения к генеральной совокупности вычисляют величину:
| X  Xm |
r
,
n 1
S
n
где X – среднее значение, S – стандартное отклонение, n – число наблюдений.
Величина r имеет специальное распределение, которое зависит от числа степеней свободы f = n – 2. В таблице приведены значения r(таб.) для уровня значимости 0,05.
Если r > r(таб.), то подозрительное значение Xm с вероятностью 95% является результатом грубой ошибки и может быть отброшено.
Таблица значений r(таб.) ( = 0,05).
f
f
f
r(таб.)
r(таб.)
r(таб.)
f
r(таб.)
1
2
3
4
5
6
1.412
1.689
1.869
1.996
2.093
2.172
7
8
9
10
11
12
2.237
2.294
2.343
2.387
2.426
2.461
13
14
15
16
17
18
2.493
2.523
2.551
2.557
2.600
2.623
19
20
21
22
23
2.644
2.664
2.683
2.701
2.717
Пример. Имеются результаты опытных данных:
0.40 0.45 0.47 0.50 0.50 0.51
Проверить, не является ли значение Х1 = 0,40 грубой ошибкой.
Xs = (0.40 + … + 0.51)/6 = 2.83/6 = 0.47;
S2 = ((0.40 – 0.47)2 + … + (0.51 – 0.47)2))/5 = 0.0087/5 = 0.00174; S = 0.0417
5/6 = 0.9129; r = |0.47 – 0.40| / (0.0417 · 0.9129) = 0.07/0.038 = 1.84
Для f = 4 r(таб.) = 1,996 > 1,84
Следовательно, Xm = 0,40 не явл. грубой ошибкой и его следует оставить в выборке.
7.2. Проверка гипотезы о различии средних
Во многих случаях бывает важно выяснить, можно ли считать полученные два средних
значения случайной величины различными или их различие несущественно. Например,
средний вес новорожденных мальчиков 3,5 кг, а девочек 3,45. Существенно ли это различие
или его можно считать случайным?
В подобных задачах проверяют гипотезу о том, что обе выборки принадлежат к одной
генеральной совокупности (должны совпадать как дисперсии, так и средние арифметические). Существует несколько подходов к решению этой задачи.
7.2.1. Критерии Фишера и Стьюдента
Сначала проверяют гипотезу о равенстве дисперсий, если гипотеза о равенстве дисперсий принимается, переходят к сравнению средних арифметических (иначе дальнейший анализ не имеет смысла).
42
Пример. По данным двух серий наблюдений получены следующие результаты:
Номер серии
Среднее значение
Дисперсия
Число наблюдений
Число степеней свободы
1
X = 20.5
Sx2 = 0.09
n1 = 5
f1 = n1 – 1 = 4
2
Y = 21.3
Sy2 = 0.16
n2 = 6
f2 = n2 – 1 = 5
1) проверяем гипотезу о незначимости различия двух дисперсий Sх2 и Sу2, используя
критерий Фишера (F-критерий). Для этого вычисляют отношение дисперсий (в числителе
должна быть та дисперсия, которая больше):
F= Sу2/ Sx2 = 0.16/0.09= 1.8;
В таблице Фишера Fтаб(f2, f1) = 6.3
1.8 < 6.3 – поскольку экспериментальное значение коэффициента Фишера меньше табличного значения, принимается гипотеза о равенстве двух выборочных дисперсий. Поэтому
можно перейти к сравнению средних значений.
2) приступаем к проверке гипотезы о равенстве средних;
сначала находим среднюю дисперсию:
S2 =(S2х · f1 + S2у · f2)/(f1 + f2) =(0.09 · 4 + 0.16 · 5)/9 = 0.13; S = 0.36
Гипотезу о равенстве средних Хs и Уs проверяем по критерию Стьюдента:
|XY |
n1  n 2
| 20.5  21.3 | 5  6



 3.68
S
n1  n 2
0.36
56
В таблице распределения Стьюдента при числе степеней свободы f = f1 + f2 находим
tтаб(4+5)=2.26.
3.68 > 2.26 – гипотеза о равенстве средних отвергается.
t
7.2.2. Критерии Крамера-Уэлча
Аналогично критериям Фишера и Стьюдента, эмпирическое значение данного критерия
рассчитывается на основании информации об объемах N и M выборок х и у, выборочных
средних х и у и выборочных дисперсиях Dx и Dy сравниваемых выборок.
MN x  y
Расчетная величина вычисляется по формуле: Т =
.
M  Dx  N  Dy
Алгоритм заключается в следующем:
1. Вычислить для сравниваемых выборок Т – эмпирическое значение критерия Крамера-Уэлча.
2. Сравнить это значение с критическим значением Т0,05 = 1,96: если Тр  1,96 то сделать вывод: "характеристики сравниваемых выборок совпадают на уровне значимости 0,05";
если Тр > 1,96, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%".
7.2.3. Критерий Вилкоксона-Манна-Уитни
Различия, которые могли быть не выявлены критерием Крамера-Уэлча, могу быть выявлены критерием Вилкоксона-Манна-Уитни.
Данный критерий оперирует не с абсолютными значениями элементов двух выборок, а
с результатами их парных сравнений. Например, существенно, что учащийся Петров решил
больше задач, чем учащийся Иванов, а на сколько больше – не важно.
43
Пусть имеется две выборки1: х1, х2, ..., хn и у1, у2, ..., уm (n < m). Для каждого элемента
первой выборки хi определим число аi элементов второй выборки, которые превосходят его
по своему значению (т.е. число таких уj, что yj > xi). Сумма а1 + а2 + ... + аn = U этих чисел по
всем N членам первой выборки называется эмпирическим значением критерия МаннаУитни.
Эмпирическое значение критерия Вилкоксона вычисляется по формуле:
nm
U
2
W=
.
n  m  (n  m  1)
12
Алгоритм определения достоверности совпадений и различий для экспериментальных
данных заключается в следующем:
1. Вычислить для сравниваемых выборок Wр – эмпирическое значение критерия.
2. Сравнить это значение с критическим значением W0.05 = 1,96. Если Wр  1,96, то сделать вывод: "характеристики сравниваемых выборок совпадают с уровнем значимости 0,05";
если Wр > 1,96, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%".
7.3. Оценка результатов с помощью критерия Пирсона 2
Одной из классических проблем в проведении эксперимента является оценка его эффективности. Предположим, что в учебном заведении внедряется новый метод обучения.
Необходимо оценить, сможет ли этот метод улучшить восприятие учащимися изучаемого
предмета. Для решения этой задачи можно использовать критерий Пирсона (критерий 2)
Пример. В группе учащихся был внедрен. Результаты проверочных работ приведены в
таблице:
Вариант ответа
1
Отлично
Хорошо
Удовлетворительно
Всего
До внедрения
метода
2
72
128
29
229
После внедрения
метода
3
81
121
35
237
Ожидаемое число
учащихся
4
74,52
132,47
30,01
237
5
0,56
0,99
0,83
2выб=2,38
С помощью критерия 2 проверяется гипотеза: "метод не дал результатов".
Данные в таблице не сопоставимы, так как общее число учащихся до и после проведения эксперимента неодинаково.
Находим, какая часть учащихся учились на "отлично" до проведения эксперимента:
72/229.
Если метод не дал результатов, то этот коэффициент сохранился бы – находим по нему
ожидаемое число покупателей в 1-й строке: 237 · (72/229) = 74,52
237 · (128/229) = 132,47 – ожидаемое число ответов во 2-й сроке
237 · (29/229) = 30,01 – ожидаемое число ответов во 3-й сроке
Разница между (3) и (4) столбцами может характеризовать результаты внедрения новой
методики.
Обозначим значения столбца (3) за Мi, столбца (4) (или (2), в случае, когда общее количество учащихся до и после эксперимента совпадает) – за Ni (i – номер строки)
1
Существует ограничение на использование критерий Вилкоксна-Манна-Уитни: каждая выборка должна содержать не менее трех элементов, если же в одной из выборок всего два элемента, то во второй должно быть не
менее пяти.
44
Для критерия Пирсона нужно вычислить: ((Мi) – (Ni))2 / (Ni) – получаем значения столбца (5).
Сумма значений по столбцу (5) – это 2выб (= 2,38).
Число степеней свободы f = n – 1, где n – число разных ответов (строк): f = 3 – 1 = 2.
2таб(f=2) = 5,99 > 2,38 – гипотеза о том, что метод не дал результатов, подтвердилась.
Табличные значения 2
f
1
2
3
4
5
6
7
8
9
10
 таб
3,84
5,99
7,82
9,49
11,07
12,59
14,07
15,51
16,92
16,98
2
Пример. Оценить эффективность нового метода, если получены результаты:
Оценка
1
Отлично
Хорошо
Удовлетворительно
Всего
До внедрения
метода
2
72
128
29
229
После внедрения
метода
3
100
105
32
237
Ожидаемое число
учащихся
4
74,52
132,47
30,01
237
5
8,71
5,70
0,13
2выб=14,54
5.99 < 14.54 – гипотеза о том, что метод не дал результатов, отвергается.
Замечание. При проведении эксперимента нужно проверять, не повлияли ли на результаты другие факторы, например, посещение подготовительных курсов или непосещение занятий.
Данный критерий применим при условии, что для любого значения балла в любой из
сравниваемых выборок не менее пяти ее членов
Существует еще один способ вычисления величины 2, который не требует приведения
данных к сопоставимому виду.
Формула для вычисления значения 2 по выборке:
2выб = N · M ·
L
(

i 1
n i mi 2
 )
N M ,
n i  mi
где N и М – соответственно общее количество участников эксперимента, например, до и после эксперимента (или экспериментальной и контрольной групп), ni и mi – соответственно
число давших i-й ответ (из градации, например, "высокий балл", "средний балл" и т.п.). Число степеней свободы и таблица те же, что и для предыдущего способа.
Балл
1
Высокий
Средний
Низкий
Всего
До внедрения
метода (ni)
2
72
128
29
N = 229
После внедрения
метода (mi)
3
100
105
32
M = 237
4
5
((4)-(5))2
(ni + mi)
6
0,3144
0,5590
0,1266
0,4219
0,4430
0,1350
0,01156
0,01344
0,00007
ni / N
mi / M
(6) · N · M
3,65
3,13
0,06
7
2выб=6,84
2таб(2) = 5,99 => принимается гипотеза о том, что метод дал результаты.
Замечание 1. Данный критерий применим при условии, что для любого значения балла
в любой из сравниваемых выборок не менее пяти ее членов получили данный балл. Кроме
того, желательно, чтобы число градаций L было не менее трех. Если L = 2, то есть используется дихотомическая шкала ("да" – "нет", "решил" – "не решил" и т.п.), то можно применять
критерий Фишера.
Замечание 2. (простейший алгоритм принятия решения относительно использования
критерия в данной ситуации): если данные получены в результате измерений в шкале отно45
шений, то следует использовать критерии о сравнении средних (Фишера, Стьюдента, Крамера-Уэлча, Вилкоксона-Манна-Уитни); если же данные получены по порядковой шкале – критерий Пирсона. В случае измерений по шкале отношений можно использовать все рассмотренные критерии.
7.4. Корреляционный и регрессионный анализ
7.4.1. Корреляционный анализ
Часто бывает, что между случайными величинами Х и У существует такая связь, при
которой с изменением одной случайной величины изменяется и другая. В математической
статистике имеются показатели, оценивающие силу такой связи. Важнейшим из этих показателей является коэффициент корреляции. Коэффициент корреляции характеризует не всякую
зависимость, а только линейную. Линейная зависимость случайных величин заключается в
том, что при возрастании одной случайной величины другая случайная величина возрастает
(или убывает) по линейному закону. Наличие или отсутствие корреляции между случайными величинами Х и У можно увидеть на графиках.
Если случайные величины Х и У связаны точной линейной зависимостью, то есть
У=А + В·Х, то коэффициент корреляции Rху равен +1 или –1.
Rху = +1, если В >0 и Rху = –1, если В <0.
В остальных случаях коэффициент корреляции принимает значения в промежутке от –1
до 1.
Если Rху = 0, то это свидетельствует об отсутствии линейной связи между случайными
величинами.
Y
..
. . . . .
. . .
. .
. . .
. ..
. ..
. . ..
. .
...
. .
.
.
Х
Х
Х
а) довольно тесная
б)не очень сильная
в) отсутствие корреположительная связь
отрицательная связь
ляции между Х и У
Вычисление коэффициента корреляции.
Пусть у нас имеются результаты наблюдений над двумя случайными величинами:
Х1 Х2 ... Хn
Y1 Y2 ... Yn
Выборочный коэффициент корреляции вычисляется по формуле:
n
 (Xi  X)(Yi  Y )
Rxy 
i 1
,
(n  1)  Sx  Sy
где Xs, Ys – средние значения случайных величин, Sx, Sy – стандартные отклонения.
Значимость коэффициента корреляции оценивается по критерию Стьюдента (tкритерий). Для этого сначала вычисляют величину Sr:
1  Rxy 2
Sr 
n2
Затем tвыб= |Rxy| / Sr.
Табличное значение t берут для уровня значимости 0,05 и числе степеней свободы
f = n – 2.
46
Если tвыб > tтаб, то коэффициент корреляции Rxy является значимым, т.е. принимается
гипотеза о наличии линейной связи между случайными величинами Х и У.
7.4.2. Регрессионный анализ
Иногда бывает интересно проверить не только гипотезу о существовании линейной
связи между случайными величинами, но и получить математическое уравнение, связывающее случайные величины между собой. Таким образом, можно получить математическую
модель некоторого процесса или явления. Математические модели называют также формулами, функциями или регрессиями – отсюда термин "регрессионный" анализ. В качестве
уравнений регрессии используют обычно полиномы различных порядков. Напомним, что
полином первого порядка – это линейная функция, а полином второго порядка – это квадратичная функция. На практике для уравнений регрессии редко используют полиномы более
высоких порядков.
Решение по МНК обычно достаточно сложно. В случае же наличия линейной связи
между двумя случайными величинами, т.е. для расчета коэффициентов уравнения вида
У=А+ВХ, формулы имеют вид:
A = (S3 · S4 – S5 · S2)/(S1 · S4 – S2 · S2)
B = (S1 · S5 – S2 · S3)/(S1 · S4 – S2 · S2)
где S1 = n; S2 =  Xi;
S3 =  Yi;
S4 =  Xi2;
S5 =  Yi · Xi;
Пример. Имеются результаты наблюдений над двумя случайными величинами Х и У.
Провести корреляционный и регрессионный анализ.
N п/п
1
2
3
4
5
6
7
8
9
10
Сумма
Среднее
X
36
57
10
18
14
37
16
49
19
1
257
25.7
Y
17
35
5
20
12
16
25
49
24
1
204
20.4
X–Xs
10,3
31,3
–15,7
–7,7
–11,7
11,3
–9,7
23,3
–6,7
–24,7
Y–Ys
–3,4
14,6
–15,4
–0,4
–8,4
–4,4
4,6
28,6
3,6
–19,4
S2 =
S=
(X–Xs)2
106.1
979.7
246.5
59.3
136.9
127.7
94.1
542.9
44.9
610.1
2948.1
327.567
18.0988
(Y–Ys)2
11.6
213.2
237.2
0.16
70.6
19.4
21.2
817.6
20.0
376.4
1780.4
197.822
14.0649
(X–Xs)(Y–Ys)
–35.02
458.98
241.78
3.08
98.28
–49.72
–44.62
666.38
–24.12
479.18
1792.2
X2
1296
3249
100
324
196
1369
258
2401
361
1
9553
X·Y
612
1995
50
360
168
592
400
2401
456
1
7035
Yr
26,7
39,4
10,8
15,7
13,3
27,3
14,5
34,6
16,3
5,4
1792
1 – Rxy2
1 – 0.64
Rxy= -------------------– = 0,8
Sr = ----------– = ---------– = 0,14
9 · 18,1 · 14,1
(n-2)
 (10-2)
tвыб=|0,8|/0,14 = 5,6
tтаб = t(8) = 2,31
5,6 > 2,31 – принимаем гипотезу о наличии линейной связи между Х и У.
Рассчитаем коэффициенты линейной регрессии.
S1 = n = 10; S2 = 257 ; S3 = 204 ; S4 = 9553 ; S5 = 7035
A = (S3 · S4 – S5 · S2)/(S1 · S4 – S2 · S2) = (204 · 9553 – 7035 · 257)/(10 · 9553 – 257 · 257) = 4,8;
B = (S1 · S5 – S2 · S3)/(S1 · S4 – S2 · S2) =(10 · 7035 – 257 · 204)/(10 · 9553 – 257 · 257) = 0,6.
Итак: Y = 4,8 + 0,6 X.
Рассчитаем по этой формуле значения Yr – результаты занесем в последний столбец
таблицы.
7.5. Дисперсионный анализ
Часто возникают задачи выяснить, какие факторы влияют на изменение случайной величины. Мы говорили, что разброс статистической величины оценивается дисперсией.
47
Дисперсионный анализ позволяет ответить на вопрос, оказывают ли факторы существенное влияние на случайную величину.
Рассмотрим классический метод дисперсионного анализа, в котором варьируется только один фактор, а остальные остаются постоянными.
Идея дисперсионного анализа заключается в том, что сравниваются между собой две
дисперсии: S2a – дисперсия, связанная с исследуемым фактором А, и S2ош – дисперсия воспроизводимости, которая связана со всеми остальными случайными факторами. Сравнение
проводят по критерию Фишера.
Пример. Различные группы студентов изучают одну и ту же тему различными методами (использование краткого конспекта, конспектирование книги, использование программированного учебника или использование компьютерной программы). Необходимо выяснить, что является причиной разброса результатов обучения: различные методы, не позволяющие добиться хорошей воспроизводимости, или неодинаковая работа студентов.
Обозначим k – число групп студентов, в каждой из которых n студентов.
Yij – оценка за тест, полученная в i-й группе студентов в j-м студентом.
Общее число наблюдений N = k · n.
Данные заносят в таблицу:
День
1
2
...
n
Итоги
Средние
Уровни
а1
Y11
Y12
…
Y1n
A1 = Y1j
Y1 = A1/n
фактора А
а2
Y21
Y22
…
Y2n
A2 = Y2j
Y2 = A2/n
(группы студентов)
...
…
…
…
…
…
…
аk
Yk1
Yk2
…
Ykn
Ak = Ykj
Yk = Ak/n
Алгоритм дисперсионного анализа
Вычисляются следующие величины:
1)Аi = Yij
2) S1 = Yij2

1k
1 K
3) S2 =  A i2
4) S3 =   Ai 
n i 1
N  i 1 
Результаты расчета заносят в таблицу:
Источник дисперсии
Фактор А
Остаток (случайные факторы)
Сумма квадратов
Sa = S2 – S3
Sост = S1 – S2
2
Число степеней свободы
f1 = k – 1
f2 = k(n – 1)
Вычисляют дисперсионное отношение F = S2a / S2ош.
Дисперсия
S2a = Sa/f1
2
S ош. = Sост/f2
Влияние фактора А считается значимым, если F > Fтаб(f1,f2)
Значение F (f1, f2) находят в таблице Фишера при выбранном уровне значимости.
Пример. Дисперсионный анализ применялся для выяснения влияния метода обучения
(фактор А) на оценки, получаемые студентами во время обучения (параметр оптимизации Y).
Результаты обследования приведены в таблице (суммы баллов, полученных студентами):
День
Уровни фактора А (метод)
а1
а2
а3
а12
а22
а32
1
79
87
42
6241
7569
1764
2
86
69
64
7396
4761
4096
3
86
81
78
7396
6561
6084
4
92
77
61
8464
5929
3721
5
76
84
31
5776
7056
961
Итоги
A1 = 419
A2 = 398
А3 = 276
35273
31876
16626
2
Ai
175561
158404
76176
48
Средние
(Аi/5)
Y1 = 83,8
Y2 = 79,6
Y3 = 55,2
n = 5; N = 15
S1 = 35273 + 31876 + 16626 = 83775
S2 = (175561 + 158404 + 76176)/5 = 82028,2
S3 = (419 + 398 + 276)2 / 15 = 1194649 / 15 = 79643,27
По схеме дисперсионного анализа заполняем таблицу:
Источник
дисперсии
Фактор А
Остаток (случайные
факторы)
Сумма квадратов
Число степеней свободы
Дисперсия
2
SA = S2 – S3 = 2384,93
f1 = k – 1 = 2
S a = SA/f1 = 1192,465
Sост = S1 – S2 = 1746,8
f2 = k(n – 1) = 3·(5-1) =12
S2ош. = Sост/f2 = 145,57
Fвыб = 1192,465 / 145,57 = 8,2;
В таблице Фишера для уровня значимости 0,05 находим F(2, 12) = 3,9 .
Так как 8,2 > 3,9, различия в результатах в зависимости от метода следует признать
значимыми. Самый лучший – 1-й метод (У1 = 84,3), худший – 3-й вид метод (У3 = 55,6).
Упражнения.
1. Имеются результаты опытных данных: 0,28 0.43 0.45 0.47 0.51 0.52 0.53
Проверить, не является ли значение 0.28 грубой ошибкой.
2. Имеются две серии наблюдений: X: 50 46 52 54 48 48 46 56 50 50; Y: 48 44 44 50
52 48 48 54 54 48.
Проверить гипотезу о равенстве средних по критериям Фишера и Стьюдента. Привести
все необходимые формулы.
3. По данным таблицы 11 провести анализ эффективности экспериментальной методики обучения по критериям Крамера-Уэлча и Вилкоксона-Манна-Уитни. Определите, к какой шкале измерений относятся эти данные?
4. По данным таблицы 11 составить таблицу, отражающую число учащихся, показавших высокий, средний и низкий уровень знаний. В качестве критерия используется таблица
12. К какой шкале измерений относятся полученные данные?
5. По данным таблицы, построенной в задаче 4, с помощью критерия Пирсона определить эффективность применения экспериментальной методики.
Результаты измерений уровня знаний в контрольной
и экспериментальной группах до и после эксперимента
Контр. группа
(число правильно
решенных задач до начала эксперимента)
15
13
11
18
10
8
20
7
8
12
15
16
Экспер. группа (число
правильно решенных
задач до начала
эксперимента)
12
11
15
17
18
6
8
10
16
12
15
14
Контр. группа
(число правильно
решенных задач после
окончания эксперимента)
16
12
14
17
11
9
15
8
6
13
17
19
49
Таблица 11
Экспер. группа (число
правильно решенных
задач после окончания эксперимента)
15
18
12
20
16
11
13
7
14
17
19
16
13
14
14
19
7
8
11
12
15
16
13
5
11
19
18
9
6
15
19
13
19
12
11
16
12
8
13
7
15
8
9
–
–
–
–
–
15
11
9
19
8
6
9
12
11
17
10
8
8
20
19
6
14
10
12
15
19
18
14
13
18
13
13
15
18
9
14
–
–
–
–
–
Результаты измерений уровня знаний в контрольной
Таблица 12
и экспериментальной группах до и после эксперимента
Максимальное число
Уровень знаний
правильно решенных задач
Низкий
10
Средний
15
Высокий
20
6. Выяснить с помощью дисперсионного анализа, оказывает ли фактор А (особенности характера) существенное влияние на процесс обучения (уровни фактора А – количество правильно сделанных тестовых заданий при одинаковом методе обучения). Для каждой из трех групп учащихся, объединенных по чертам характера, было проведено по 5 тестов:
Номер
Уровни фактора А (группы учащихся)
теста
а1
а2
а3
1
78
52
92
2
83
31
76
3
65
61
87
4
67
62
82
5
75
58
90
50
Приложение 1
Значения t-критерия Стьюдента при уровне значимости 0,05.
Число
Число
степеней
t
степеней
свободы
свободы
f
f
1
12.71
7
2
4.30
8
3
3.18
9
4
2.78
10
5
2.57
11
6
2.45
12
t
2.37
2.31
2.26
2.23
2.20
2.18
Число
степеней
свободы
f
13
14
15
16
17
18
t
2.16
2.15
2.13
2.12
2.11
2.10
Число
степеней
свободы
f
19
20
21
22
23
24
t
2.09
2.09
2.08
2.07
2.07
2.06
Число
степеней
свободы
f
25
26
27
28
29
30
t
2.06
2.06
2.05
2.05
2.04
2.04
Приложение 2
Значения F-критерия Фишера при уровне значимости 0,05.
f1
1
2
3
4
5
6
7
8
9
10
161
18.5
10.1
7.7
6.6
6.0
5.6
5.3
5.1
5.0
4.8
4.8
4.7
4.6
4.5
4.5
4.5
4.4
4.4
4.4
200
19.0
9.6
6.9
5.8
5.1
4.7
4.5
4.3
4.1
4.0
3.9
3.8
3.7
3.7
3.6
3.6
3.6
3.5
3.5
216
19.2
9.3
6.6
5.4
4.8
4.8
4.1
3.9
3.7
3.6
3.5
3.4
3.3
3.3
3.2
3.2
3.2
3.1
3.1
225
19.3
9.1
6.4
5.2
4.5
4.1
3.8
3.6
3.5
3.4
3.3
3.2
3.1
3.1
3.0
3.0
2.9
2.9
2.9
230
19.3
9.0
6.3
5.1
4.4
4.0
3.7
3.5
3.3
3.2
3.1
3.0
3.0
2.9
2.9
2.8
2.8
2.7
2.7
234
19.3
8.9
6.2
5.0
4.3
3.9
3.6
3.4
3.2
3.1
3.0
2.9
2.9
2.8
2.7
2.7
2.7
2.6
2.6
237
19.4
8.88
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.92
2.84
2.77
2.70
2.66
2.62
2.58
2.54
2.60
239
19.4
8.94
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.7
2.64
2.59
2.55
2.51
2.48
2.51
241
19.4
8.81
6.00
4.78
4.10
3.68
3.39
3.18
3.02
2.9
2.8
2.72
2.65
2.59
2.54
2.50
2.46
2.42
2.45
242
19.4
8.78
5.96
4.74
4.06
3.63
3.34
3.13
2.97
2.86
2.76
2.67
2.60
2.55
2.49
2.45
2.41
2.38
2.39
11
12
24
>24
249
19.5
8.6
5.8
4.5
3.8
3.4
3.1
2.9
2.7
2.6
2.5
2.4
2.3
2.3
2.2
2.2
2.1
2.1
2.1
254
19.5
8.5
5.6
4.4
3.7
3.2
2.9
2.7
2.5
2.4
2.3
2.2
2.1
2.1
2.0
2.0
1.9
1.9
1.8
f2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
18
20
51
243 244
19.4 19.4
8.76 8.7
5.93 5.9
4.70 4.7
4.03 4.0
3.60 3.6
3.31 3.3
3.10 3.1
2.94 2.9
2.82 2.8
2.72 2.7
2.63 2.6
2.56 2.5
2.51 2.5
2.45 2.4
2.41 2.4
2.37 2.3
2.34 2.3
2.31 2.3
Download