Лекция №5 Средние величины и показатели вариации. Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др. Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления. Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл. При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения. Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д. Средняя выработка отражает общее свойство всей совокупности. Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон. Существуют различные средние: * средняя арифметическая; * средняя геометрическая; * средняя гармоническая; * средняя квадратическая; * средняя хронологическая. Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике. Средняя арифметическая Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений. Отдельные значения признака называют вариантами и обозначают через х ( x , x , x ,..., x ); число единиц совокупности обозначают через n, среднее значение признака - через арифметическая простая равна: 1 2 3 n х . Следовательно, средняя x x x ... xn x x 1 2 3 n n Пример 1. Имеются следующие данные о производстве рабочими продукции А за смену: № раб. 1 2 3 4 5 6 7 8 9 10 Выпущено изделий за 16 17 18 17 16 17 18 20 21 18 смену В данном примере варьирующий признак - выпуск продукции за смену. Численные значения признака (16, 17 и т. д.) называют вариантами. Определим среднюю выработку продукции рабочими данной группы: x 16 17 18...18 178 17,8 10 10 Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если данные представлены в виде рядов распределения или группировок, то средняя исчисляется иначе. Пример 2. Имеются следующие данные о заработной плате рабочих - сдельщиков: Таблица 5.1. Месячная з/п (варианта Число рабочих, n xn х), руб. х = 110 n=2 220 х = 130 n=6 780 х = 160 n = 16 2560 х = 190 n = 12 2280 х = 220 n = 14 3080 ИТОГО 50 8920 По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х встречается в совокупности 2 раза, а варианта х-16 раз и т.д. Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается символом n. Вычислим среднюю заработную плату одного рабочего x в руб.: x 110 * 2 130 * 6 160 * 16 190 * 12 220 * 14 8920 178,4 50 50 Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту, а сумма этих произведений дает общий фонд заработной платы всех рабочих. В соответствии с этим, расчеты можно представить в общем виде: x x1n1 x2 n2 x3 n3 ... xn nn n1 n2 n3 ...nn x x n n i i i Полученная формула называется средней арифметической взвешенной. Из нее видно, что средняя зависит не только от значений признака, но и от их частот, т.е. от состава совокупности, от ее структуры. Изменим в условии задачи состав рабочих и исчислим среднюю в измененной структуре. Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами. Рассмотрим расчет средней арифметической для таких рядов. Пример 3. Имеются следующие данные: Таблица 5.2. Группы рабочих по количеству Число Середина хn произведенной продукции за рабочих, n интервала, х смену, шт. 3—5 10 4 40 5—7 30 6 180 7—9 40 8 320 9 — 11 15 10 150 11 — 13 5 12 60 ИТОГО 100 750 Исчислим среднюю выработку продукции одним рабочим за смену. В данном ряду варианты осредняемого признака (продукция за смену) представлены не одним числом, а в виде интервала "от - до". Рабочие первой группы производят продукцию от 3 до 5 шт., рабочие второй группы - от до 7 шт. и т. д. Таким образом, каждая группа ряда распределения имеет нижнее и верхнее значения вариант, или закрытые интервалы. Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной: x x n n i i i Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значения интервала. Так, для первой группы дискретная величина х будет равна: (3 + 5) / 2 = 4 Дальнейший расчет производится обычным методом определения средней арифметической взвешенной: x 750 / 100 7,5 Итак, все рабочие произвели 750 шт. изделий за смену, а каждый в среднем произвел 7,5 шт. Преобразуем рассмотренный выше ряд распределения в ряд с открытыми интервалами. Пример 4. Имеются следующие данные о производстве продукции за смену: Таблица 5.3. Группы рабочих по Число Середина хn количеству произведенной рабочих, n интервала, х продукции за смену, шт. до 5 10 4 40 5—7 30 6 180 7—9 40 8 320 9 — 11 15 10 150 свыше 11 5 12 60 ИТОГО 100 750 В таких рядах условно величина интервала первой группы принимается равной величине интервала последующей, а величина интервала последней группы - величине интервала предыдущей. Дальнейший расчет аналогичен изложенному выше. В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная. Пример 5. Определим средний процент выполнения плана по выпуску продукции по группе заводов на основании следующих данных: Таблица 5.4. Номер завода Выпуск продукции по плану, млн.руб. 18 22 25 20 40 125 1 2 3 4 5 ИТОГО Выполнение плана, % 100 105 90 106 108 — В этой задаче варианты (процент выполнения плана) являются не индивидуальными, а средними по заводу. Весами являются выпуск продукции по плану. При вычислении среднего процента выполнения плана следует использовать формулу средней арифметической взвешенной: x x n n i i , i где x n i i — фактически выпущенная продукция, получаемая путём умножения вариант (процент выполнения плана) на веса (выпуск продукции по плану). Производя вычисления, варианты (х) лучше брать в коэффициентах. x x n n i i i 1,00 * 18 1,05 * 22 0,9 * 25 1,06 * 20 1,08 * 40 125 128 1,024 125 или 102,4% Основные свойства средней арифметической. Средняя арифметическая обладает рядом свойств: 1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится. Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится. 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней: Kx Kx 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних: xy xy 4. Если х = с, где с - постоянная величина, то x c c . 5. Сумма отклонений значений признака Х от средней арифметической х равна нулю: 0 Мода. Характеристиками вариационных рядов, наряду со средними, являются мода и медиана. Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой. Пример 8. Распределение проданной обуви по размерам характеризуется следующими показателями: размер 36 37 38 39 40 обуви число пар, — 1 6 8 22 в % к итогу 41 42 43 44 45 30 20 11 1 1 и выше — В этом ряду распределения мода равна 41. Именно этот размер обуви пользовался наибольшим спросом покупателей. Для интервальных рядов распределения с равными интервалами мода определяется по формуле: M o x M o iM o * где f f M o f M o1 Mo f M o1 f M o f M o1 . x Mo - начальное значение интервала, содержащего моду; i Mo - величина модального интервала; f Mo - частота модального интервала; f Mo1 - частота интервала, предшествующего модальному; f Mo1 - частота интервала, следующего за модальным. Медиана Рассмотрим расчет медианы в интервальном вариационном ряду. Медиана интервального вариационного ряда распределения определяется по формуле Me x Me i Me где 0,5 f S Me1 f Me x Me — начальное значение интервала, содержащего медиану; i Me — величина медианного интервала; f — сумма частот ряда; S Me1 — сумма накопленных частот, предшествующих медианному интервалу; f Me — частота медианного интервала. Понятие вариации признаков. Показатели вариации. Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Поэтому необходимо учитывать и вариацию значений отдельных единиц совокупности. Значительной вариации подвержены объемы спроса и предложения, процентные ставки в различные периоды времени. Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Вариация – это изменение (колеблемость) значений признака внутри совокупности. Величина признаков варьирует под действием различных причин и явлений. Поскольку изменение (колеблемость) признаков, бывает большей или меньшей возникает задача измерения ее величины. Измерение вариации признака необходимо при: определении надежности средних величин, результатов выборочных наблюдений для различных совокупностей и т.д. Для измерения размера вариации в статистике используют различные показатели, которые принято делить на абсолютные и относительные. К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия признака и среднее квадратическое отклонение. Размах вариации (R) – представляет собой разность между max и min значениями признака в изучаемой совокупности. R = X max – X min Размах вариации измеряется в тех же единицах, что и варианты ряда. Пример 1. Группы предприятий по объему товарооборота, млн.руб. 90 — 100 100 — 110 110 — 120 120 — 130 ИТОГО xi Число предприятий ni 28 48 20 4 100 Определяем показатель размаха вариации: R = 130 - 90 = 40 млн. руб. Этот показатель улавливает только крайние отклонения и не отражает отклонений всех вариант в ряду. Чтобы дать обобщающую характеристику распределению отклонений, исчисляют среднее линейное отклонение. Среднее линейное отклонение (d) представляет собой среднюю величину из отклонений индивидуальных значений признака от средней арифметической Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней: / x x / / x1 x / / x2 x / ... / xn x / . Простое: d n n Если данные наблюдения представлены в виде дискретного ряда распределения с частотами, среднее линейное отклонение исчисляется по формуле средней арифметической взвешенной: / xi x / ni / x1 x / n1 / x2 x / n2 ... / xn x / nn d n1 n2 ... nn ni Порядок расчета среднего линейного отклонения следующий: 1) по значениям признака исчисляется средняя арифметическая: x ; x n 2) определяются отклонения каждой варианты xi от средней xi x ; 3) рассчитывается сумма абсолютных величин отклонений: / xi x / ; 4) сумма абсолютных величин отклонений делится на число значений: / xi x / . n Порядок расчета среднего линейного отклонения взвешенного следующий: 1) вычисляется средняя арифметическая взвешенная: xn ; n 2) определяются абсолютные отклонения вариант от средней / xi x /; 3) полученные отклонения умножаются на частоты / xi x / f ; 4) находится сумма взвешенных отклонений без учета знака: / xi x / f ; 5) сумма взвешенных отклонений делится на сумму частот: / xi x / f . f Основными обобщающими показателями вариации в статистике являются дисперсии и среднее квадратическое отклонение. Дисперсия - это средний квадрат отклонений каждого значения признака от средней. Дисперсия обозначается (S²). В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной: ( xi x ) 2 — дисперсия невзвешенная (простая); S² n (x x)2 f i — дисперсия взвешенная. f Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии признака и обозначается S: S 2 S S (x x )2 — среднее квадратическое отклонение невзвешенное; n i (x x) f 2 i f — среднее квадратическое отклонение взвешенное. Пример 3. Произведено продукции одним рабочим, шт. ( xi варианта) Число рабочих, xi ni x i x Таблица 6.3. x i x x ni 2 i ni 8 7 56 -2 9 10 90 -1 10 15 150 0 11 12 132 1 12 6 72 2 ИТОГО 50 500 Исчислим среднюю арифметическую взвешенную: x x 2 4 1 0 1 4 28 10 0 12 24 74 xn 500 10 шт. n 50 Значения отклонений от средней и их квадратов представлены в таблице 6.3. Определим дисперсию: S 2 (x x) f 2 i f 74 =1,48 50 Среднее квадратическое отклонение будет равно: S (x x) f i 2 f 1,48 1,216 шт. К относительным показателям вариации относятся: Коэффициент осцилляции, относительное линейное отклонение, коэф. вариации. Они используются как при сравнении вариаций различных признаков в одной и той же совокупности, так и при сравнении вариаций одного признака в нескольких совокупностях. Относительные показатели вариации выражаются в % и находятся по отношению к средней или к медиане ряда. - Коэффициент осцилляции (Vr) - отношение размаха вариации к средней арифметической. R Vr *100% (1) x Коэффициент вариации (V) – отношение среднего квадратического отклонения к средней арифметической. S *100% (3) x Относительное линейное отклонение (Vd)- это отношение среднего линейного отклонения к средней величине. d Vd *100% (2) x V