ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА. СТРУКТУРНЫЕ СРЕДНИЕ Мода – значение признака, наиболее часто встречающегося в исследуемой совокупности. Медиана – значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечётное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из чётного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда. Пример. Рассчитаем моду и медиану по данным табл. 7.10. Т а б л и ц а 7.10. Распределение обуви, проданной коммерческой фирмой в январе 2008г. 40 41 42 44 и Размер 34 35 36 37 38 39 43 Итого Me Mo более Количество проданных пар, % к 3 5 7 9 10 13 15 14 20 3 8 15 24 34 47 62 3 1 100 итогу Накопленные частоты - В этом ряду распределения мода равна 42. Именно этот размер обуви в январе 2008 г. пользовался наибольшим спросом. Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание продолжается до получения накопленной суммы частот, впервые превышающей половину. В нашем примере сумма частот составила 100, её половина – 50. Накопленная сумма частот ряда равна 62. Ей соответствует значение признака равное 40. Таким образом, 40-й размер обуви является медианным. Для интервальных вариационных рядов мода определяется по формуле: Mo x Mo i f f Mo1 , Mo (f f ) (f f ) Mo Mo Mo1 Mo1 Mo где xMo – нижняя граница значения интервала, содержащего моду; iMo – величина модального интервала; fMo – частота модального интервала; fMo–1 – частота интервала, предшествующего модальному; fMo+1 – частота интервала, следующего за модальным. Медиана интервального ряда распределения определяется по формуле: 1 f S Me1 Me x i 2 Me Me , f Me где xMe – нижняя граница значения интервала, содержащего медиану; iMe – величина медианного интервала; ∑f – сумма частот; SMe-1 – сумма накопленных частот, предшествующих медианному интервалу; fMe – частота медианного интервала. Пример. Рассчитаем моду и медиану по данным табл. 7.11. Mo 700 100 2500 1700 772 руб. (2500 1700) (2500 2200) Следовательно, наибольшее число семей имеют среднедушевой доход 772 руб. 1 10000 3000 Me 700 100 2 780 руб. 2500 Таким образом, половина семей города имеет среднедушевой доход менее 780 руб., остальные семьи – более 780 руб. Т а б л и ц а 7.11. Распределение семей города по размеру среднедушевого дохода в январе 1998 г. Группы семей по размеру дохода, руб. До 500 Число семей fi Накопление частоты Накопление частоты, % к итогу 600 600 6 500 – 600 700 1300 13 600 – 700Me 170 3000 30 700 – 800 2500 5500 55 800 – 900 2200 7700 77 900 – 1000 1500 9200 92 Свыше 1000 800 10000 100 Итого 10000 - - Mo ∑fi Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти значение признака у единиц, делящих ряд на четыре равных части, десять или сто частей. Эти величины называются «квартили», «децили» и «перцентили». Квартили делящее представляют собой значение ранжированную совокупность на признака, четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий ¼ часть совокупности с наименьшим значением признака, и квартиль верхний (Q3), отсекающий ¼ часть с наибольшими значениями признака. Это означает, что 25% единиц будут заключены меньше по величине Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3 и остальные 25% превосходят Q3. Средним квартилем Q2 является медиана. Для расчёта квартилей по интервальному вариационному ряду используют формулы: 1 f SQ 4 11 Q x i 1 Q f 1 Q 1 3 f SQ 4 31 Q x i 3 Q f 3 Q 3 ; , где xQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%); xQ3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%); SQ1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль; SQ3-1 – накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль; fQ1 – частота интервала, содержащего нижний квартиль; fQ3 – то же для верхнего квартиля. Рассмотрим расчёт нижнего и верхнего квартилей по данным табл. 7.11. Нижний квартиль находится в интервале 600-700, накопленная частота которого равна 30%. Верхний квартиль лежит в интервале 800900 с накопленной частотой 77%. Поэтому получим: 1 10000 1300 671 Q 600 100 4 1 1700 руб. 3 10000 5500 Q 800 100 4 891 руб. 3 2200 Вывод: 25% семей имеют среднедушевой доход менее 671 руб., 25% семей – свыше 891 руб., а остальные имеют доход в пределах 671 – 891 руб. Децили – вариации, делящие ранжированный ряд на десять равных частей. Первый дециль d1 делит совокупность в соотношении 1/10 к 9/10; второй дециль d2 – в соотношении 2/10 к 8/10 и т. д. Вычисляются они по той же схеме, что медиана и квартили: 1 f i Sd11 d x i 10 1 di fd 1 2 f i Sd21 d x i 10 2 di fd 2 Значения признака, делящие ряд на сто частей, называются перцентилями. Характеристики, применяемые для изучения структуры вариационного ряда, позволяют глубоко и детально охарактеризовать совокупность. Децили Перцентили Медиана Квартили Моменты распределения Для характеристики вариационных рядов используют начальные и центральные моменты k-того порядка. Начальные моменты обозначаются через m : k xi f i m . k f i Тогда начальный момент первого порядка: xi f i m1 x fi (средняя арифметическая); начальный момент второго порядка: xi 2 m2 fi fi x 2 ; начальный момент третьего порядка: xi f i 3 x 3 m3 Практически fi при анализе и т. д. вариационных рядов ограничиваются расчётом моментов первых четырёх порядков. Центральные моменты записать в общем виде: обозначаются через k, можно xi x k fi k fi , а моменты первых четырёх порядков в виде: xi x f i 1 fi 2 =0; 3 xi x f i 3 fi 2 x x fi i fi xi x 4 4 ; fi =2; fi . Как видно из записанных формул, центральный момент второго порядка представляет собой не что иное, как дисперсию. Центральный момент третьего порядка (3) используется для характеристики асимметричности распределения, ибо для симметричных рядов всегда: 3 x x 0 . Момент k-того порядка mk – это средняя арифметическая kй степени отклонений отдельных вариантов от какой-то велечины.