Построение групп торговых точек по объему ежедневного

advertisement
Содержание
Задача 1
Задача 2
Приложения
Задача 1
Обследовано 50 торговых точек по объему ежедневного дохода. Данные обследования
приведены в приложении 1.
1. Провести группировку торговых точек по объему ежедневного дохода.
2. Построить гистограмму, полигон, кумуляту.
3. Вычислить выборочные характеристики:
a. среднее,
b. дисперсию,
c. среднее квадратическое отклонение,
d. моду,
e. медиану,
f. нижний и верхний квартили,
g. коэффициент вариации.
4. На основе анализа полученных данных выдвинуть гипотезу о законе распределения
дохода.
Решение:
Количество групп определим по формуле Стерджесса:
n = 1 + 3.222*lgN,
где n - число групп;
N - число единиц совокупности.
n = 6 групп.
Величина равного интервала:
h = R / n,
где R - размах вариации;
n - число групп.
h = 145.7
Получим интервалы для построения групп:
1-я группа: (638-783.67];
2-я группа: (783.67-929.34];
3-я группа: (929.34-1075.01];
4-я группа: (1075.01-1220.68];
5-я группа: (1220.68-1366.35];
6-я группа: (1366.35-1512.02].
Построим группы:
Группы торговых
№ группы точек по объему
Число торговых точек Накопленные частоты
ежедневного дохода
1
638-783.67
7
7
2
783.67-929.34
11
18
3
929.34-1075.01
15
33
4
1075.01-1220.68
12
45
5
1220.68-1366.35
4
49
6
1366.35-1512.02
1
50
50
-
Итого
Построим гистограмму, полигон, кумуляту.
Проведем расчет выборочных характеристик.
Группы торговых точек Число
по объему ежедневного торговых
дохода
точек
Середина
интервала
638-783.67
7
710.84
4975.88 570611.72 7
783.67-929.34
11
856.5
9421.5
929.34-1075.01
15
1002.17
15032.55 508.09
33
1075.01-1220.68
12
1147.85
13774.2 275427
45
1220.68-1366.35
4
1293.51
5174.04 353216.26 49
1366.35-1512.02
1
1439.18
1439.18 196098.41 50
Итого
50
-
49817.35 1610999.73 -
Накопленные
частоты
215138.25 18
Среднее значение определим по формуле средней арифметической взвешенной:
= 996.35 д. ед.
Дисперсию определим по формуле:
= 32219.99 д. ед.
Среднее квадратическое отклонение определим по формуле:
= 179.5 д. ед.
Рассчитаем значение моды. Наибольшая частота: 15. Мода находится в интервале между
929.34 и 1075.01. Точное значение моды определим по формуле:
= 1012.58 д. ед.
Рассчитаем значение медианы. Середина ряда: 25. Медианным является интервал с
накопленной частой 33. Точное значение медианы определим по формуле:
= 997.32 д. ед.
Определим место нижней квартили: NQ1 = (50+1) /4 = 12.75.
Определим место верхней квартили: NQ3 = (50+1) /4*3 = 38.25.
Квартили определим по формулам:
=
783.67+145.67* ( (12.5-7) /11) = 856.51 д. ед.
=
1075.01+145.67* ( (37.5-33) /12) = 1129.64 д. ед.
Коэффициент вариации определим по формуле:
= 18.02%.
В исследуемой совокупности средний размер объема ежедневного дохода составил 996.35
д. ед. Самым распространенным значением объема ежедневного дохода является 1012.58
д. ед.50% торговых точек имеют объем ежедневного дохода более 997.32 д. ед., а 50% менее 997.32 д. ед.
Полученное значение среднего квадратического отклонения говорит о том, что в среднем
в исследуемой совокупности конкретные величины признака отклоняются от своего
среднего значения на 179.5д. ед.
25% торговых точек имеют доход менее 856.51 д. ед.; 25% торговых точек имеют доход
более 856.51 д. ед., а остальные торговые точки имеют доход в пределах от 856.51 д. ед. до
1129.64 д. ед.
Так как значение коэффициента вариации меньше 33%, то исследуемую совокупность
можно считать однородной.
В целом на основе полученных данных можно выдвинуть гипотезу о нормальном законе
распределения дохода.
Задача 2
Имеются ежемесячные уровни дохода фирмы (тыс. у. е.) в 2008 г (приложение 2).
1. Графически отобразить динамику дохода.
2. Рассчитать цепные и базисные:
абсолютные приросты (изменения) уровней;
темпы роста;
темпы прироста (снижения) уровней,
средние значения ряда, темпа роста и прироста.
3. Провести сглаживание методом скользящей средней с базой равной четырем.
4. Осуществить аналитическое выравнивание сглаженной зависимости по линейному
тренду.
5. Оценить адекватность и точность полученной линейной модели.
6. Осуществит точечный и интервальный прогноз дохода фирмы в январе 2009.
Решение:
Графически отобразим динамику дохода:
группировка кумулята точечный прогноз
Рассчитаем цепные и базисные показатели:
Показатели
январь февраль март апрель май
Абсолютный
уровень ряда, 25
тыс. у. е.
июнь июль август сентябрь октябрь ноябрь декаб
32
40
26
32
61
49
44
55
74
73
62
Абсолютный
прирост, тыс.
у. е.
7
8
-14
6
29
-12
-5
11
19
-1
-11
Коэффициент
роста
1.28
1.25 0.65
1.231 1.906 0.803 0.898 1.25
1.345
0.986
0.849
Темп роста,
%
128
125 65
123.08 190.63 80.33 89.8
134.55 98.65
84.93
Темп
прироста, %
28
25
23.077 90.625
25
19.672 10.204
34.545 -1.351 -15.0
Абсолютное
значение 1%
прироста,
тыс. у. е.
0.25
0.32 0.4
0.26
0.61
0.55
Цепные:
Базисные:
-35
0.32
0.49
125
0.44
0.74
0.73
Абсолютный
прирост, тыс.
у. е.
7
15
1
7
36
24
19
30
49
48
37
Коэффициент
роста
1.28
1.6
1.04
1.28
2.44
1.96
1.76
2.2
2.96
2.92
2.48
Темп роста,
%
128
160 104
128
244
196
176
220
296
292
248
Темп
прироста, %
28
60
28
144
96
76
120
196
192
148
Абсолютное
значение 1%
прироста,
тыс. у. е.
0.25
0.25 0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
0.25
4
Цепные и базисные показатели динамики были определены по следующим формулам:
Далее определим средние показатели ряда динамики. Средний уровень ряда определим по
формуле:
= 47.75 тыс. у. е.
Средний абсолютный прирост определим по формуле:
= 3.36 тыс. у. е.
Средний коэффициент роста определим по формуле:
= 1.0859
Средний темп роста определим по формуле:
= 108.59%
Средний темп прироста определим по формуле:
= 8.59%
Среднюю величину абсолютного значения 1% прироста определим по формуле:
= 0.39 тыс. у. е.
Анализ полученных результатов показывает, что средний размер дохода фирмы составил
47.75 тыс. у. е. при среднемесячном увеличении на 3.36 тыс. у. е. или на 8.59%. Значение
1% прироста возросло с 0.25 до 0.73 тыс. у. е.
Проведем сглаживание методом скользящей средней с базой равной четырем:
Месяц
Доход фирмы, тыс. у. е. Выровненные значения, тыс. у. е.
январь
25
-
февраль 32
30.75
март
40
32.5
апрель
26
39.75
май
32
42
июнь
61
46.5
июль
49
52.25
август
44
55.5
сентябрь 55
61.5
октябрь 74
66
ноябрь
73
-
декабрь 62
-
Осуществим аналитическое выравнивание сглаженной зависимости по линейному тренду.
Для этого построим вспомогательную таблицу:
Порядковый №
значения
Фактическое
значение уровня
ряда
Квадрат
Произведение порядкового
порядкового №
№ на фактическое значение
признака
1
30.75
30.75
1
2
32.5
65
4
3
39.75
119.25
9
4
42
168
16
5
46.5
232.5
25
6
52.25
313.5
36
7
55.5
388.5
49
8
61.5
492
64
9
66
594
81
Итого
426.75
2403.5
285
Система нормальных уравнений будет иметь вид:
Для определения параметров уравнения подставим в приведенную систему исходные
данные и получим:
426.75 = 9a0+45a1
2403.5 = 45a0+285a1
Выравняем коэффициенты при а0, разделив первое уравнение на 9, а второе на 45 и
получим:
47.42 = a0+5a1, 53.41 = a0+6.33a1
Вычтем из второго уравнения первое и определим значение а1: а1 = 4.5.
Подставим полученное значение а1 в одно из уравнений и определим значение а0: а0 =
24.92. Тогда уравнение будет иметь вид:
= 24.92+4.5*t.
Оценим адекватность и точность полученной линейной модели.
№ п/п
yi
А
1
30.75 29.42 1.7689
277.89
4.33
2
32.5
222.61
4.37
3
39.75 38.42 1.7689
58.83
3.35
4
42
42.92 0.8464
29.38
2.19
5
46.5
47.42 0.8464
0.85
1.98
6
52.25 51.92 0.1089
23.33
0.63
7
55.5
56.42 0.8464
65.29
1.66
8
61.5
60.92 0.3364
198.25
0.94
9
66
65.42 0.3364
345.22
0.88
Итого
426.75 426.78 8.8751
1221.65
20.33
-
2.26
33.92 2.0164
Среднее 47.42 -
-
Остаточная дисперсия: 8.8751/9 = 0.9861.
Общая дисперсия: 1221.65/9 = 135.74.
Систематическая дисперсия: 135.74-0.9861 = 134.7539.
На систематическую дисперсию, определяемую тенденцией развития, приходится
(134.7539/135.74) * 100 = 99.27% общей дисперсии, а остальные 0.73% вариации
объясняются сезонными особенностями того или иного месяца и другими особенностями
отдельных месяцев.
Следовательно, построенную модель адекватна, точность и адекватность модели
подтверждает и средняя ошибка аппроксимации = 2,26%, что существенно меньше 10%.
Осуществим точечный и интервальный прогноз дохода фирмы в январе 2009 на основе
полученной трендовой модели:
= 24.92+4.5*10 = 69.92 тыс. у. е.
Доверительный интервал прогноза определим по формуле:
где L - период упреждения (L = 1);
- точечный прогноз по модели на (n+L) - й момент времени, 69.92 тыс. у. е.;
n - количество наблюдений во временном ряду (9);
- стандартная ошибка оценки прогнозируемого показателя для числа параметров
модели, равного двум;
tα - табличное значение критерия Стьюдента для уровня значимости α и для числа
степеней свободы, равного n-2.
= 1.13.
5,59.
= 62.09 тыс. у. е.
= 77.75 тыс. у. е.
Таким образом, с вероятностью 95% можно утверждать, что в январе 2009 г. доход фирмы
составит от 62.09 тыс. у. е. до 77.75 тыс. у. е.
Приложения
Приложение 1
647 1010 875 1115 1124 1044 1015 985 1155 1229 1251 796 981 1293 1046 907 691 1053 770
933 899 1161 638 721 979 1144 886 1163 1512 816 875 819 1325 1085 973 1105 1203 681
1062 1049 887 867 1172 1052 783 1104 1130 839 935 992
Приложение 2
Месяц
январь
25
февраль 32
март
40
апрель
26
май
32
июнь
61
июль
49
август
44
сентябрь 55
октябрь 74
ноябрь
73
декабрь 62
Download