Средняя величина

advertisement
Теория статистики
Описательная статистика и получение
статистических выводов
Часть 2.
1
Тема
Показатели среднего и вариации
2
Средняя величина
• Средняя величина - наиболее
распространенная форма показателей,
используемая в статистических
исследованиях
• Средняя величина представляет
обобщающую характеристику признака в
исследуемой совокупности в конкретных
условиях места и времени
3
Свойства средней величины
• Важнейшее свойство средней величины
заключается в том, что она выражает то
общее, что присуще всем единицам
исследуемой совокупности:
x  f  x1 , x2 ,..., xk ,..., x N 
 f  x , x ,..., x ,..., x 
1 n
x   xk
n k 1
1 n
  ( x  k )
n k 1
4
Свойства средней величины
• Типичность средней зависит от степени
однородности совокупности
• Сумма отклонений от среднего равно 0:
1 n
1 n
1 n
( xk  x )   xk  x 1

n k 1
n k 1
n k 1
 xx 0
5
Логическая формула среднего
• Определить среднее во многих случаях
можно через исходное соотношение
средней:
Суммарное значение признака
ИСС 
Число единиц совокупности
6
Примеры
• Средняя заработная плата:
Фонд заработной платы
ИСС 
Число работников
• Средний размер банковского вклада:
Сумма всех вкладов
ИСС 
Число вкладов
7
Основные расчетные формулы
• Среднее агрегатное:
w

x
f
k
k
• Среднее взвешенное:
x f

x
f
k
k
k
• Среднее гармоническое:
w

x
w
x
k
k
k
8
Основные расчетные формулы
• Среднее геометрическое: x  n
n
x
k
k 1
• Применение конкретной формулы
зависит от вида имеющихся данных
9
Пример
10
Пример
• Расчет средней заработной платы
зависит от имеющихся данных:
 Средняя агрегатная:
w

x
f
k
k
500  900  4000

 54
5  15  80
 Средняя взвешенная:
x f

x
f
k
k
k
100  5  60  15  50  80

 54
5  15  80
11
Пример
 Средняя гармоническая:
w

x
w
x
k
k
k
500  900  4000

 54
500 900 4000


100 60
50
12
Упражнение
• Каковы средние затраты времени двух
служащих фирмы на обработку одного
заказа клиента, если каждый из них
затрачивает соответственно 2 и 3
минуты?
13
Упражнение: решение
• Было бы ошибкой считать, что среднее
время обработки заказа составляет:
23
t
 2,5 (мин.)
2
Тогда бы за 1 час обрабатывались бы
60  60
 48 заказов, а на самом деле:
2,5
60 60

 30  20  50
2
3
14
Расчет средней по сгруппированным
данным
1060
• Средний возраст: x 
  28,6
37
15
Структурные средние
• Мода ряда распределения – значение
признака наиболее часто встречающееся
в исследуемой совокупности
• Медиана ряда распределения –
значение признака, приходящееся на
середину ранжированной
(упорядоченной) по данному признаку
совокупности
16
Случай дискретных рядов
распределения
• Для дискретного вариационного ряда:
 Модой будет вариант признака с
наибольшей частотой
 Медианой будет:
- для ряда с нечетным числом членов –
центральный вариант, находящийся в
середине ранжированной совокупности
- для ряда с четным числом членов –
среднее значение из двух соседних
центральных вариантов
17
Примеры моды и медианы
• Мода ряда распределения объема продаж
(частота) размеров женской обуви:
• Медиана ряда распределения по уровню
ежемесячного дохода 11 человек:
18
Расчет моды и медианы по
интервальным рядам распределения
•
• Мода составляет:
• Медиана составляет:
26,2
37
19
Расчет моды по интервальным
рядам распределения
• Мода определяется по формуле:
f м о  f м о1
x м о  x0  I 
2 f м о  f м о1  f м о1
20,1  15,4
 20  10 
 26,2
2  20,1  15,4  17,2
20
Расчет медианы по интервальным
рядам распределения
• Медиана определяется по формуле:
1
f  м е1 f

x м е  x0  I м е  2
f ме
50  37,9
 30  10 
 37
17,2
21
Расчет квантилей других порядков
• Для определения 1-ой квартили:
1
f  q11 f

xq1  x0  I q1  4
f q1
Для определения 3-ей квартили:
3
f  q 31 f

xq 3  x0  I q 3  4
f q3
22
Показатели вариации (рассеяния)
• Пусть дан следующий вариационный ряд:
13  15  17  25  30 100
x

 20
5
5
• Размах вариации:
R  xmax  xmin  30  13  17
23
Показатели вариации (рассеяния)
• Среднее линейное отклонение:
n
d
x
k
x
k 1
n
13  20  15  20  17  20  25  20  30  20

5
7  5  3  5  10 30


6
5
5
24
Показатели вариации (рассеяния)
• Дисперсия вариационного ряда:
n
1
 2   ( xk  x ) 2
n k 1
n
n
1 n 2
 (  xk  2 x  xk   ( x )2 )
n k 1
k 1
k 1
1 n 2
  xk  ( x ) 2
n k 1
25
Показатели вариации (рассеяния)
• Дисперсия вариационного ряда, пример:
2
2
2
2
2
13

15

17

25

30
2
2
 
 20
5
2208
2

 20  441,6  400  41.6
5
26
Показатели вариации (рассеяния)
• Среднее значение минимизирует
средний квадрат отклонений вариантов
вариационного ряда:
n
1 n
1
2
2
( xk  c )   ( xk  x  x  c )

n k 1
n k 1
n
1 n
1
2
2
  ( xk  x )   ( x  c )
n k 1
n k 1
  2  ( x  c)2
27
Показатели вариации (рассеяния)
• Меру рассеяния желательно
характеризовать величиной, имеющей ту
же единицу измерения, что и
исследуемый признак
Среднее квадратическое отклонение:
n

( x
k
k 1
n
 x)
2
 41.6  6.45
28
Показатели вариации (рассеяния)
• Коэффициент вариации признака
(относительная величина):
СV 

 100%
x
6.45

 100%  32.25%
20
29
Начальные моменты вариационного
ряда
• Среднее и дисперсия вариационного
ряда являются частным случаем более
общего понятия – моменты
вариационного ряда
• Начальный момент k-го порядка
определяется по формуле:
n
1
0
k
k   xi
n i 1
10  x
    ( )
2
0
2
0 2
1
30
Центральные моменты
вариационного ряда
• Центральный момент k-го порядка
определяется по формуле:
1 n
k   ( xi  x ) k
n i 1
• Центральный момент:
 1-го порядка равен нулю: 1  0
 2-го порядка – дисперсия : 2   2
31
Показатели формы распределения
вариационного ряда
• Коэффициент асимметрии:
n
3
A 3 

3
(
x

x
)
 l
l 1
n 3
 Если A = 0, то распределение имеет
симметричную форму
 Если A < 0, то распределение скошено
влево
 Если A > 0, то распределение скошено
вправо
32
Показатели формы распределения
вариационного ряда
33
Показатели формы распределения
вариационного ряда
• Эксцесс вариационного ряда:
n
4
E  4 3

4
(
x

x
)
 l
l 1
n
4
3
 Эксцесс нормального распределения
равен 0
 Если E < 0, то распределение имеет более
пологую вершину чем нормальное
 Если E > 0, то распределение более
островерхое чем нормальное
34
Показатели формы распределения
вариационного ряда
35
Показатели формы распределения
вариационного ряда
• По данным примера получаем:
3 ( 7)3  ( 5)3  ( 3)3  53  103
A 3 
3

5  6.45
630

 0.0728
3
5  6.45
4
74  54  34  54  104
E  4 3
3
4

5  6.45
13732

 3  1.41
4
5  6.45
36
Показатели формы распределения
вариационного ряда
• Вывод по данным примера для формы
распределения вариационного рада:
Имеет место:
- правая скошенность распределения
(A = 0,07 > 0)
- а вершина полигона более пологая, чем у
нормального распределения
(E = - 1,41 < 0)
37
Показатели формы распределения:
ящичная диаграмма
38
Правило сложения дисперсий
• Если наблюдения распределены по
группам (G), то общая дисперсия
вариационного ряда равна сумме
средней из групповых дисперсий и
межгрупповой дисперсии:
 2   гр2   2
G

g 1
Ng
N
G
Ng
g 1
N
 
2
g
( xg  x )2
39
Правило сложения дисперсий:
пример
• Пусть задано распределение по группам:
• Для групп имеем
8
N1  3; x1  15; 
3
N 2  2; x2  27.5; 22  6.25
2
1
40
Правило сложения дисперсий:
пример
N1 2 N 2 2
 
1 
 2
N
N
3 8 2
    6,25  1,6  2,5  4,1
5 3 5
2
гр
N1
N2
2
 
 ( x1  x ) 
 ( x2  x ) 2
N
N
3
2
2
  (15  20)   ( 27,5  20) 2  15  22,5  37,5
5
5
2
41
Правило сложения дисперсий:
пример
• Правило сложения дисперсий дает то же
значение дисперсии признака, которое
было вычислено ранее:
 2   гр2   2  4,1  37,5  41,6
42
Download