Теория статистики Описательная статистика и получение статистических выводов Часть 2. 1 Тема Показатели среднего и вариации 2 Средняя величина • Средняя величина - наиболее распространенная форма показателей, используемая в статистических исследованиях • Средняя величина представляет обобщающую характеристику признака в исследуемой совокупности в конкретных условиях места и времени 3 Свойства средней величины • Важнейшее свойство средней величины заключается в том, что она выражает то общее, что присуще всем единицам исследуемой совокупности: x f x1 , x2 ,..., xk ,..., x N f x , x ,..., x ,..., x 1 n x xk n k 1 1 n ( x k ) n k 1 4 Свойства средней величины • Типичность средней зависит от степени однородности совокупности • Сумма отклонений от среднего равно 0: 1 n 1 n 1 n ( xk x ) xk x 1 n k 1 n k 1 n k 1 xx 0 5 Логическая формула среднего • Определить среднее во многих случаях можно через исходное соотношение средней: Суммарное значение признака ИСС Число единиц совокупности 6 Примеры • Средняя заработная плата: Фонд заработной платы ИСС Число работников • Средний размер банковского вклада: Сумма всех вкладов ИСС Число вкладов 7 Основные расчетные формулы • Среднее агрегатное: w x f k k • Среднее взвешенное: x f x f k k k • Среднее гармоническое: w x w x k k k 8 Основные расчетные формулы • Среднее геометрическое: x n n x k k 1 • Применение конкретной формулы зависит от вида имеющихся данных 9 Пример 10 Пример • Расчет средней заработной платы зависит от имеющихся данных: Средняя агрегатная: w x f k k 500 900 4000 54 5 15 80 Средняя взвешенная: x f x f k k k 100 5 60 15 50 80 54 5 15 80 11 Пример Средняя гармоническая: w x w x k k k 500 900 4000 54 500 900 4000 100 60 50 12 Упражнение • Каковы средние затраты времени двух служащих фирмы на обработку одного заказа клиента, если каждый из них затрачивает соответственно 2 и 3 минуты? 13 Упражнение: решение • Было бы ошибкой считать, что среднее время обработки заказа составляет: 23 t 2,5 (мин.) 2 Тогда бы за 1 час обрабатывались бы 60 60 48 заказов, а на самом деле: 2,5 60 60 30 20 50 2 3 14 Расчет средней по сгруппированным данным 1060 • Средний возраст: x 28,6 37 15 Структурные средние • Мода ряда распределения – значение признака наиболее часто встречающееся в исследуемой совокупности • Медиана ряда распределения – значение признака, приходящееся на середину ранжированной (упорядоченной) по данному признаку совокупности 16 Случай дискретных рядов распределения • Для дискретного вариационного ряда: Модой будет вариант признака с наибольшей частотой Медианой будет: - для ряда с нечетным числом членов – центральный вариант, находящийся в середине ранжированной совокупности - для ряда с четным числом членов – среднее значение из двух соседних центральных вариантов 17 Примеры моды и медианы • Мода ряда распределения объема продаж (частота) размеров женской обуви: • Медиана ряда распределения по уровню ежемесячного дохода 11 человек: 18 Расчет моды и медианы по интервальным рядам распределения • • Мода составляет: • Медиана составляет: 26,2 37 19 Расчет моды по интервальным рядам распределения • Мода определяется по формуле: f м о f м о1 x м о x0 I 2 f м о f м о1 f м о1 20,1 15,4 20 10 26,2 2 20,1 15,4 17,2 20 Расчет медианы по интервальным рядам распределения • Медиана определяется по формуле: 1 f м е1 f x м е x0 I м е 2 f ме 50 37,9 30 10 37 17,2 21 Расчет квантилей других порядков • Для определения 1-ой квартили: 1 f q11 f xq1 x0 I q1 4 f q1 Для определения 3-ей квартили: 3 f q 31 f xq 3 x0 I q 3 4 f q3 22 Показатели вариации (рассеяния) • Пусть дан следующий вариационный ряд: 13 15 17 25 30 100 x 20 5 5 • Размах вариации: R xmax xmin 30 13 17 23 Показатели вариации (рассеяния) • Среднее линейное отклонение: n d x k x k 1 n 13 20 15 20 17 20 25 20 30 20 5 7 5 3 5 10 30 6 5 5 24 Показатели вариации (рассеяния) • Дисперсия вариационного ряда: n 1 2 ( xk x ) 2 n k 1 n n 1 n 2 ( xk 2 x xk ( x )2 ) n k 1 k 1 k 1 1 n 2 xk ( x ) 2 n k 1 25 Показатели вариации (рассеяния) • Дисперсия вариационного ряда, пример: 2 2 2 2 2 13 15 17 25 30 2 2 20 5 2208 2 20 441,6 400 41.6 5 26 Показатели вариации (рассеяния) • Среднее значение минимизирует средний квадрат отклонений вариантов вариационного ряда: n 1 n 1 2 2 ( xk c ) ( xk x x c ) n k 1 n k 1 n 1 n 1 2 2 ( xk x ) ( x c ) n k 1 n k 1 2 ( x c)2 27 Показатели вариации (рассеяния) • Меру рассеяния желательно характеризовать величиной, имеющей ту же единицу измерения, что и исследуемый признак Среднее квадратическое отклонение: n ( x k k 1 n x) 2 41.6 6.45 28 Показатели вариации (рассеяния) • Коэффициент вариации признака (относительная величина): СV 100% x 6.45 100% 32.25% 20 29 Начальные моменты вариационного ряда • Среднее и дисперсия вариационного ряда являются частным случаем более общего понятия – моменты вариационного ряда • Начальный момент k-го порядка определяется по формуле: n 1 0 k k xi n i 1 10 x ( ) 2 0 2 0 2 1 30 Центральные моменты вариационного ряда • Центральный момент k-го порядка определяется по формуле: 1 n k ( xi x ) k n i 1 • Центральный момент: 1-го порядка равен нулю: 1 0 2-го порядка – дисперсия : 2 2 31 Показатели формы распределения вариационного ряда • Коэффициент асимметрии: n 3 A 3 3 ( x x ) l l 1 n 3 Если A = 0, то распределение имеет симметричную форму Если A < 0, то распределение скошено влево Если A > 0, то распределение скошено вправо 32 Показатели формы распределения вариационного ряда 33 Показатели формы распределения вариационного ряда • Эксцесс вариационного ряда: n 4 E 4 3 4 ( x x ) l l 1 n 4 3 Эксцесс нормального распределения равен 0 Если E < 0, то распределение имеет более пологую вершину чем нормальное Если E > 0, то распределение более островерхое чем нормальное 34 Показатели формы распределения вариационного ряда 35 Показатели формы распределения вариационного ряда • По данным примера получаем: 3 ( 7)3 ( 5)3 ( 3)3 53 103 A 3 3 5 6.45 630 0.0728 3 5 6.45 4 74 54 34 54 104 E 4 3 3 4 5 6.45 13732 3 1.41 4 5 6.45 36 Показатели формы распределения вариационного ряда • Вывод по данным примера для формы распределения вариационного рада: Имеет место: - правая скошенность распределения (A = 0,07 > 0) - а вершина полигона более пологая, чем у нормального распределения (E = - 1,41 < 0) 37 Показатели формы распределения: ящичная диаграмма 38 Правило сложения дисперсий • Если наблюдения распределены по группам (G), то общая дисперсия вариационного ряда равна сумме средней из групповых дисперсий и межгрупповой дисперсии: 2 гр2 2 G g 1 Ng N G Ng g 1 N 2 g ( xg x )2 39 Правило сложения дисперсий: пример • Пусть задано распределение по группам: • Для групп имеем 8 N1 3; x1 15; 3 N 2 2; x2 27.5; 22 6.25 2 1 40 Правило сложения дисперсий: пример N1 2 N 2 2 1 2 N N 3 8 2 6,25 1,6 2,5 4,1 5 3 5 2 гр N1 N2 2 ( x1 x ) ( x2 x ) 2 N N 3 2 2 (15 20) ( 27,5 20) 2 15 22,5 37,5 5 5 2 41 Правило сложения дисперсий: пример • Правило сложения дисперсий дает то же значение дисперсии признака, которое было вычислено ранее: 2 гр2 2 4,1 37,5 41,6 42