Лекция №2. Показатели вариации и способы их вычисления..

advertisement
СТАТИСТИКА.
Описательная статистика.
Лекция 2. Показатели вариации и способы их
вычисления.
Авторы: Равичев Л.В., Ломакина И.А.
Кафедра менеджмента и маркетинга
РХТУ им. Д.И.Менделеева.
Москва - 2007
Размах (амплитуда) колебаний
Размах (амплитуда) колебаний (размах вариации) - это
разность между наименьшей и наибольшей вариантой.
R  xmax  xmin
Пример. Даны два ряда набора чисел:
6, 10, 14, 26, 34
x1 
90
 18
5
R1  34  6  28
14, 16, 18, 20,22.
x2 
90
 18
5
R2  22  14  8
2
Квартильное отклонение
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием
крайних значений.
Q3  Q1
dk 
2
где Q1 и Q3 – соответственно третья и первая квартили распределения.
3
Среднее линейное отклонение
Для несгруппированных данных:
n
|
d   i 1
xi  x |
где
n
x1  x2  ...  xn
x 
n
Взвешенное линейное отклонение:
n
d 
|
i 1
xi  x | f i
n

i 1
где
fi
x1  f1  x2  f 2  ...  xn  f n
x
f1  f 2  ...  f n
4
Среднее квадратическое отклонение
Простое квадратическое отклонение:
n
 
 x)
 ( xi
i 1
2
где
n
x1  x2  ...  xn
x 
n
Взвешенное квадратическое отклонение:
n
 
 ( xi
i 1
 x) f i
2
n

i 1
fi
где
x1  f1  x2  f 2  ...  xn  f n
x
f1  f 2  ...  f n
5
Среднее квадратическое отклонение
Пример. Имеются следующие данные о распределении кип шерсти по весу при отгрузке:
Вес одной кипы, кг.
Количество отгруженных
кип, шт.
86
10
90
20
94
10
96
30
100
15
110
15
ИТОГО
100
Требуется определить среднюю арифметическую простую и взвешенную, среднее
квадратическое отклонение простое и взвешенное.
6
Среднее квадратическое отклонение (простое)
1. Средний вес одной кипы:
x1  x2  ...  xn 86  90  94  96  100  110
x 

 96 кг
n
6
2. Среднее квадратическое простое отклонение:
Данные для расчета квадратичного отклонения
Вес одной кипы,
кг.
Отклонение от
среднего значения
Квадраты
отклонений
86
-10
100
90
-6
36
94
-2
4
96
0
0
100
4
16
110
14
196
-
Сумма = 352
n
 
 
 ( xi
i 1
 x) 2
n
352
 7,66 кг
6
Вес кипы  96  7,66 кг
7
Среднее квадратическое отклонение
(взвешенное)
n
Данные для расчета взвешенного квадратичного отклонения
 
 x) 2 f i
 ( xi
i 1
n

i 1
fi
Вес одной
кипы, кг.
Количе
ство
Общий
вес, кг.
Отклонение от
средней взвешенной
Квадраты
отклонений
Произведение квадратов
отклонений на
количество
86
10
860
-10,3
106,09
1060,9
90
20
1800
-6,3
39,69
793,8
94
10
940
-2,3
5,29
52,9
96
30
2880
-0,3
0,09
2,7
100
15
1500
3,7
13,69
205,4
110
15
1650
13,7
187,69
2815,4
Сумма
100
9630
-
-
4931,1
8
Среднее квадратическое отклонение
(взвешенное)
1. Средний вес одной кипы (взвешенный):
x1  f1  x2  f 2  ...  xn  f n 9630
x

 96,3 кг
f1  f 2  ...  f n
100
2. Среднее квадратическое отклонение (взвешенное):
4931,1
 
 7,02 кг
100
Вес кипы  96,3  7,02 кг
9
Относительные показатели вариации
Коэффициент осцилляции:
R
K R  100%
x
Относительное линейное отклонение:
d
K d  100%
x
Относительный показатель квартильной вариации:
Kdk
dk

100%
Me
Q3  Q1
KQ 
100%
2Q2
10
Коэффициент вариации
Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической и
показывает величину отклонения (в процентах) от средней величины.
Простое квадратическое отклонение:
V1 

x
100%
7,66
V1 
100%  8,02%
96
Взвешенное квадратическое отклонение:
V2 

x
100%
7,02
V2 
100%  7,29%
96,3
11
Дисперсия
Дисперсия – это средний квадрат отклонения всех значений
признака ряда распределения от средней арифметической
Дисперсия
Общая дисперсия
Межгрупповая
дисперсия
Средняя
внутригрупповая
дисперсия
12
Общая дисперсия
Общая дисперсия характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц
данной совокупности.
n
Dx 
(x
i 1
 x) fi
2
i
n
f
i 1
где
x
i
- общая средняя для всей изучаемой совокупности.
13
Межгрупповая дисперсия
Межгрупповая дисперсия отражает те различия в величине
изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки.
n
Dмг 
 ( xi
i 1
 x) mi
2
n
 mi
i 1
где x i - средняя по отдельной группе;
определенной группе.
mi - число единиц в
14
Средняя внутригрупповая дисперсия
Средняя внутригрупповая дисперсия характеризует случайную
вариацию, возникающую под влиянием других, неучтенных
факторов, и не зависит от условия, положенного в основу группировки.

n
D вг  i 1 n
2
i
mi
 mi
i 1
где  - дисперсия по отдельной группе.
2
i
15
Правило сложения дисперсий
Величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии.
Dx  Dмг  D вг
Пример №1. Имеются следующие данные о времени простоя автомобиля под разгрузкой:
№ пункта
разгрузки
1
2
3
4
5
6
7
8
9
10
Число
грузчиков
3
4
4
3
3
4
4
4
3
4
Время простоя, мин.
12
10
8
15
19
12
8
10
18
8
Проверить закон сложения дисперсий.
16
Правило сложения дисперсий
Решение:
n
Dx 
(x
i 1
i
 x )2 fi
n
f
i 1
i
Время простоя
под погрузкой,
мин., x
Число
выполненных
разгрузок, f
x f
xx
( x  x) 2
( x  x) 2  f
8
3
24
-4
16
48
10
2
20
-2
4
8
12
2
24
0
0
0
15
1
15
3
9
9
18
1
18
6
36
36
19
1
19
7
49
49
Сумма
10
120
-
-
150
120
x
 12 мин.
10
150
 
 15
10
2
17
Правило сложения дисперсий
Расчет внутригрупповой дисперсии по первой группе
(число грузчиков, участвующих в разгрузке – 3)
Время простоя
под погрузкой,
мин., x
Число
выполненных
разгрузок, f
x f
x  x1
12
1
12
-4
16
16
15
1
15
-1
1
1
18
1
18
2
4
4
19
1
19
3
9
9
Сумма
4
64
-
-
30
64
x1 =
=16 мин.
4
2
( x  x1 ) 2 ( x  x1 )  f
30
σ = =7,5
4
2
1
18
Правило сложения дисперсий
Расчет внутригрупповой дисперсии по второй группе
(число грузчиков, участвующих в разгрузке – 4)
Время простоя
под погрузкой,
мин., x
Число
выполненных
разгрузок, f
x f
x  x2
( x  x 2 )2
( x  x2 )2  f
8
3
24
-1,33
1,77
5,31
10
2
20
0,67
0,45
0,90
12
1
12
2,67
7,13
7,13
Сумма
6
56
-
-
13,34
56
x2 
 9,33 мин.
6
13,34
 
 2,22
6
2
2
19
Правило сложения дисперсий
Средняя внутригрупповая дисперсия:
 i
n
D вг 
2
i 1
mi
n
 mi
7,5  4  2,22  6

 4,33
10
i 1
Межгрупповая дисперсия:
n
 ( xi
Dмг  i 1
 x) 2 mi
n
 mi
(16  12) 2  4  (9,33  12) 2  6

 10,67
10
i 1
Общая дисперсия:
Dx  Dмг  D вг  10,67  4,33  15,00
20
Правило сложения дисперсий
Пример №2. Имеются следующие данные о результатах обследования
рабочих предприятия по размеру месячной заработной платы:
Группы рабочих
по возрасту, лет
Число рабочих
Дисперсия
заработной
платы
До 20
100
300
20-30
120
400
30 и старше
150
500
Общая дисперсия заработной платы в обследованной совокупности рабочих составила 450. Определить, в какой степени вариация заработной
платы рабочих предприятия зависит от возраста.
21
Правило сложения дисперсий
Решение.
Средняя внутригрупповая дисперсия характеризует случайную вариацию
под влиянием неучтенных факторов:
 i
n
D вг 
2
i 1
n
mi
 mi

300 100  400 120  500 150
 413,5
100  120  150
i 1
Межгрупповая дисперсия отражает систематическую вариацию под
влиянием фактора, положенного в основу группировки (возраста рабочих):
Dмг  Dx  D вг  450  413,5  36,5
Соотношение дисперсий:
Dмг 36,5

 0,08 (8%)
Dx 450
22
Преобразование формулы для расчёта общей
дисперсии
Формула для расчёта общей дисперсии может быть преобразована:
n
Dx 
(x
i 1
fi  1
 x )2 fi
i
n
 ( xi
Dx  i1
n
f
i 1
n
 ( xi
Dx  i1
 x)
n
n
Учитывая, что  xi
i 1
получаем:
n
i
n
2
2
i
[ x
 i1
 2 xi x  ( x) ]
n
2
n
2
i
x
 i1
 x) 2
n
 2 x  xi  n( x) 2
i 1
n
 n x , и разделив полученное выражение на n,
n
Dx 
2
 xi
i 1
n
 2( x)  ( x)  x  ( x)
2
2
2
2
23
Преобразование формулы для расчёта общей
дисперсии
Пример. Дисперсия признака равна 600. Объем совокупности равен 10. Сумма квадратов
индивидуальных значений признака равна 6250. Найти среднюю величину.
Dx  x  (x)
2
x  x  Dx
2
2
n
2
i
x
6250
x 

 625
n
10
2
i 1
x  625  600  5
24
Вариации альтернативного признака
Альтернативный признак – качественный признак, имеющий две взаимоисключающие разновидности. Альтернативный признак принимает всего два
значения: 1 – наличие признака; 0 – отсутствие признака.
p  q 1
где p - доли единиц, обладающих признаком; q - доли единиц, не обладающих признаком.
Среднее значение альтернативного признака:
x
(1  p )  (0  q )
p
pq
Дисперсия альтернативного признака:
(1  p) 2  p  (0  p) 2  q
Dап 
 pq
pq
25
Вариации альтернативного признака
Пример. Удельный вес основных рабочих в трех цехах предприятия составил: 80,
75 и 90% общей численности рабочих. Определить дисперсию и среднее квадратическое отклонение доли основных рабочих по предприятию в целом, если
численность всех рабочих трех цехов составила соответственно 100, 200 и 150
человек.
Решение.
1. Общая численность основных рабочих по предприятию:
n
 moi
i 1
 100  0,8  200  0,75  150  0,9  365 чел.
2. Доля основных рабочих по предприятию:
n
 moi
365
365
p


 0,811
100

200

1500
450
 mi
i 1
n
i 1
3. Дисперсия альтернативного признака:
Dап  p  q  p  (1  p)  0,811 (1  0,811)  0,1533
4. Среднее квадратическое отклонение:
  Dап  0,1533  0,3915
26
Download