Отбор единиц в выборочную совокупность может быть

advertisement
212
Отбор единиц в выборочную совокупность может быть повторным или
бесповторным. При повторном отборе попавшая в выборку единица подвергается обследованию, а затем возвращается в генеральную совокупность и
наравне с другими единицами участвует в дальнейшей процедуре отбора. Тем
самым вероятность попадания каждой отдельной единицы в выборку остается
постоянной на всем протяжении отбора. При бесповторном отборе попавшая в
выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует. Поэтому вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора.
Выборочное наблюдение, как бы грамотно с методологической точки зрения оно ни было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Случайные ошибки выборки обусловлены
действием случайных факторов, не содержащих каких-либо элементов системного направления воздействия на рассчитываемые выборочные характеристики. Даже при строгом соблюдении всех принципов формирования выборочной
совокупности выборочные и генеральные характеристики будут несколько различаться. Поэтому получаемые случайные ошибки должны быть статистически
оценены и учтены при распространении результатов выборочно наблюдения на
всю генеральную совокупность. Оценка таких ошибок и является основной задачей, решаемой в теории выборочного наблюдения. Обратной задачей является определение такой минимально необходимой численности выборочной совокупности, при которой ошибка не превысит заданной величины.
Собственно-случайная выборка. Ее суть заключается в отборе единиц из
генеральной совокупности в целом, без разделения ее на группы, подгруппы
или серии отдельных единиц. При этом единицы отбираются в случайном порядке, не зависящем ни от последовательности расположения единиц в совокупности, ни от значений их признаков. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
После проведения отбора определяются границы генеральных характеристик. Для этого рассчитываются средняя, предельная, и относительная ошибки
выборки.
Средняя ошибка повторной собственно-случайной выборки определяется
следующим образом:
при повторном отборе:

2
n
,
при бесповторном отборе:

2 
n
1   ,
n  N
где  2 - дисперсия признака в генеральной совокупности; п — объем (число
единиц) выборочной совокупности; N – численность генеральной совокупности.
213
Величина ( 1 n / N ) всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора
обеспечивает меньшую ошибку выборки.
На практике величина дисперсии признака в генеральной совокупности
2
(  ), как правило, неизвестна, поэтому ее заменяют выборочной дисперсией
( S 2 ). Это возможно, поскольку доказано, что соотношение  2 и S 2 определяется равенством:
 2  S2
n
.
n 1
При большой численности выборочной совокупности сомножитель (
n
)
n 1
стремится к единице и им можно пренебречь.
Величина дисперсии доли в генеральной совокупности определяется по
формуле
2
 доли
 p(1  p) ,
где p – доля единиц, обладающих каким-либо значением признака в генеральной совокупности.
При расчете средней ошибки выборочной доли дисперсия доли в генеральной совокупности, как правило, тоже неизвестна, поэтому ее заменяют
дисперсией доли в выборочной совокупности:
2
S доли
 w(1  w) ,
где w – доля единиц, обладающих каким-либо значением признака в выборочной совокупности.
Формулы для расчета средней ошибки выборочной доли соответственно
для повторного и бесповторного отборов имеют вид:
w 
w(1  w)
, w 
n
w(1  w) 
n
1   .
n
 N
Предельная ошибка выборки (  ) представляет собой t-кратную среднюю
ошибку:
  t ,
где t - коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.
Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие им значения t.
P(t)
0,683
0,950
0,954
0,990
0,997
t
1,00
1,96
2,00
2,58
3,00
Проявление ошибки большей, чем утроенная средняя ошибка выборки,
имеет крайне малую вероятность (1 – 0,997 = 0,003) и считается практически
невозможным событием.
Зная величину выборочной средней ( ~x ) или доли (w), а также предельную
ошибку выборки (  ), можно определить доверительные интервалы, в которых
находятся значения генеральных параметров:
~
x   x  ~
x ,
214
w   P  w .
Пример. В результате выборочного обследования незанятого населения,
ищущего работу, осуществленного на основе собственно-случайной повторной
выборки, получен следующий ряд распределения (табл. 11.1).
Таблица 11.1. Результаты выборочного обследования незанятого населения
Возраст, лет до 25 25-35 35-45 45-55 55 и
более
Численность
лиц данного
возраста
15
37
71
45
22
С вероятностью 0,954 определите границы:
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.
Для определения средней ошибки выборки нам необходимо прежде всего
рассчитать выборочную среднюю величину и дисперсию изучаемого признака
(табл. 11.2):
Таблица 11.2. Расчет среднего возраста незанятого населения и дисперсии
xf
Числен- Середиx2 f
Возраст,
ность
на инлет
лиц
тервала
данного
( x )
возраста
(f)
До 25
15
20
300
6000
25-35
37
30
1110
33300
35-45
71
40
2840 113600
45-55
45
50
2250 112500
55 и более
22
60
1320
79200
Итого
190
7820 344600
7820
344600
~
x
 41,2 ,  2 
 41,2 2  116,24 .
190
190
Средняя ошибка выборки составит:

2
n

116,24
 0,8 года.
190
Определим с вероятностью 0,954 (t = 2) предельную ошибку выборки:
  2  0,8  1,6 года.
Установим границы генеральной средней:
41,2-1,6  x  41,2 + 1,6 или 39,6  x  42,8.
Таким образом, на основании проведенного выборочного исследования с
вероятностью 0,954 можно заключить, что средний возраст незанятого населения, ищущего работу, лежит в пределах от 40 до 43 лет.
215
Для ответа на вопрос, поставленный в пункте «б» данного примера, по выборочным данным определим долю лиц в возрасте до 25 лет и рассчитаем дисперсию доли:
w
15
 0,079 ;  2  w(1  w)  0,079  (1  0,079)  0,079  0,921  0,073 .
190
Рассчитаем среднюю ошибку выборки:
w 
0,073
 0,02 .
190
Предельная ошибка выборки с заданной вероятностью составит:
  2  0,02  0,04 .
Определим границы генеральной доли:
0,079 - 0,04  P  0,079 + 0,04 или 0,039  P  0,119.
Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц в
возрасте до 25 лет в общей численности незанятого населения находится в пределах от 3,9 до 11,9%.
При проектировании выборочного наблюдения решается задача нахождения необходимой численности выборки, обеспечивающей определенную точность расчета оценок генеральных параметров.
Обычно на практике расчет объема выборки производят по формуле для
повторно отбора:
nповт 
t 2 2
.
2
Если полученный объем выборки превышает 5% численности генеральной
совокупности, расчеты корректируют «на бесповторность»:
t 2 2 N
.
nбесповт  2 2
t   2 N
Если доля отбора не превышает 5%, к формуле бесповторного отбора
можно не переходить, так как это существенно не скажется на величине n.
Полученный на основе использования этих формул результат всегда
округляется в большую сторону до целого значения.
При решении задачи определения объема выборки величина допустимой
предельной ошибки и уровень вероятности, гарантирующей точность оценок
будущей выборки, задаются исследователем. Величина генеральной дисперсии,
как правило, неизвестна. Для ее оценки можно использовать:
1. выборочную дисперсию по данным прошлых или пробных обследований;
2. дисперсию, найденную из соотношения для среднего квадратического
отклонения:
1
3
  x;
3. дисперсию, определенную из соотношения для асимметричного распределения:
1
5
  ( xmax  xmin ) ;
216
4. дисперсию, вычисленную из соотношения для нормального распределения:
1
6
  ( xmax  xmin ) ,
где x - среднее значение признака в генеральной совокупности; xmax , x min - соответственно максимальное и минимальное значения признака в генеральной
совокупности.
В качестве оценки генеральной дисперсии доли используют максимально
возможную дисперсию альтернативного признака:
2
 доли
 0,5  0,5  0,25 .
Пример 11.1. Определите, сколько учащихся первых классов района необходимо отобрать в порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997 определить границы среднего роста первоклассников с
предельной ошибкой 2 см. Известно, что всего в первых классах школ района
обучается 1100 учеников, а дисперсия роста по результатам аналогичного обследования в другом районе составила 24.
Необходимый объем выборки при уровне вероятности 0,997 (t = 3) составит:
n
32  24  1100
 51,5  52.
32  24  2 2  1100
Таким образом, для получения данных о среднем росте первоклассников с
заданной точностью необходимо обследовать 52 школьника.
Рассмотрим еще один пример.
Пример11.2. Определить численность выборки по следующим данным.
Для определения средней цены говядины на рынках города предполагается
произвести выборочную регистрацию цен. Известно, что цены на говядину колеблются от 100 до 160 руб. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 5 руб. за 1 кг? На момент обследования на рынках города действует 3214 торговых точек.
Предположим, что распределение цен соответствует нормальному распределению. Тогда
1
6
1
6
  ( xmax  xmin )  (160  100)  10 руб.
Осуществим расчет объема выборки по формуле повторного отбора с учетом уровня вероятности 0,954 (t = 2):
n
t 2 2 2 2  10 2

 16 торговых точек.
2
52
Поскольку доля отбора не превышает 5% (16 / 3214 = 0,005, или 0,5%), к
формуле бесповторного отбора можно не переходить.
Таким образом, для того чтобы с вероятностью 0,954 гарантировать, что
ошибка при определении средней цены говядины не превысит 5 руб. за 1 кг,
необходимо обследовать 16 торговых точек на рынках города.
217
Иногда на практике задается не абсолютная величина предельной ошибки
выборки, а ее относительный уровень – отношение предельной ошибки выборки к среднему значению признака, выраженное в процентах. Эта величина
называется относительной ошибкой выборки и характеризует относительную
погрешность выборочного наблюдения:
 относит 

 100% .
x
Расчет объема выборки при заданном уровне относительной ошибки выборки осуществляется по формулам:
t 2v 2
nповтор 
2относит
где v – коэффициент вариации;
v
, nбесповт 

x
t 2v 2 N
,
t 2 v 2  2относит N
 100% .
Пример 11.3.. В городе зарегистрировано 30 тыс. безработных. Для определения средней продолжительности безработицы организуется выборочное
обследование. По данным прошлых лет известно, что коэффициент вариации
продолжительности безработицы составляет 40%. Какое число безработных
необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997
утверждать, что полученная предельная ошибка выборки не превышает 5%
средней продолжительности безработицы?
Доверительной вероятности 0,997 соответствует коэффициент доверия t =
3.
Расчет численности выборки осуществляется по формуле для бесповторного отбора:
nбесповт 
t 2v 2 N
32  0,4 2  30000

 565,15  566 человек.
t 2 v 2  2относит N 32  0,4 2  0,05 2  30000
Таким образом, для того чтобы с вероятностью 0,997 утверждать, что полученная ошибка выборки не превышает 5% средней продолжительности безработицы, необходимо охватить выборочным наблюдением 566 безработных.
Механическая выборка. Данная выборка заключается в отборе единиц из
общего списка единиц генеральной совокупности через равные интервалы в соответствии с установленным процентом отбора. При решении задач на определение средней ошибки механической выборки, а также необходимой ее численности, следует использовать приведенные выше формулы, применяемые при
собственно-случайном бесповторном отборе.
Типическая выборка. Эта выборка применяется в тех случаях, когда единицы генеральной совокупности объединены в несколько крупных типичных
групп. Отбор единиц в выборку про изводится внутри этих групп пропорционально их объему на основе использования собственно-случайной или механической выборки.
Средняя ошибка типической выборки определяется по формулам:
при повторном отборе:  

2
n
;
218
2
 
n
1   ,
n  N
при бесповторном отборе:  
2
где  - средняя из внутригрупповых дисперсий.
Пример11.4.. В целях изучения доходов населения по трем районам области сформирована 2%-ная выборка, пропорциональная численности населения
этих районов. Полученные результаты представлены в табл. 11.3.
Таблица 11.3. Результаты выборочного обследования доходов населения
Район Численность Обследовано, Доход в расчете на
населения,
чел.
1 человека
чел.
средняя, дисперсия
тыс.
руб.
I
120 000
2400
2,9
1,3
II
170 000
3400
2,5
1,1
III
90 000
1800
2,7
1,6
Необходимо определить границы среднедушевых доходов населения по
области в целом при уровне вероятности 0,997.
Рассчитаем среднюю из внутригрупповых дисперсий:

 n

n
2
i
2
i
i

1,3  2400  1,1  3400  1,6  1800
 1,28 .
2400  3400  1800
Определим среднюю и предельную ошибки выборки:
2

 
n
1,28
(1  0,02)  0,013 ;   3  0,013  0,039  0,04 .
1   
n  N
7600
Рассчитаем выборочную среднюю:
~
x
x n
n
i
i
i

2,9  2400  2,5  3400  2,7  1800
 2,67 тыс. руб.
2400  3400  1800
В результате проведенных расчетов с вероятностью 0,997 можно сделать
вывод, что среднедушевые доходы жителей данной области находятся в следующих границах (тыс. руб.):
2,67  0,04  x  2,67  0,04 .
При определении необходимого объема типической выборки учитывается
средняя из внутригрупповых дисперсий:
2
2
t 2
t 2 N
nповтор  2 , nбесповт 
2

t 2   2 N
Полученное значение общего объема выборки необходима распределить
по типическим группам пропорционально их численности, чтобы определить,
какое количество единиц следует отобрать из каждой группы:
ni  n
Ni
,
N
219
где N i - объем i-й группы; ni - объем выборки из i-й группы.
Серийная выборка. Эта выборка используется в тех случаях, когда единицы изучаемой совокупности объединены в небольшие равновеликие группы
или серии. Единицей отбора в этой случае является серия. Серии отбираются с
использованием собственно-случайной либо механической выборки, а внутри
отобранных серий обследуются все без исключения единицы.
В основе расчета средней ошибки серийной выборки лежит межгрупповая
дисперсия:
при повторном отборе:  
2
r
при бесповторном отборе:  
;
2 
r
1   ,
r  R
где r – число отобранных серий; R – общее число серий.
Межгрупповую дисперсию при равновеликих группах вычисляют следующим образом:

2
 (x

i
 x) 2
r
,
где xi - средняя i-й серии; x - общая средняя по всей выборочной совокупности.
Пример 11.5. В целях контроля качества комплектующих из партий изделий, упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%ная серийная выборка. По попавшим в выборку ящикам среднее отклонение
параметров изделия от нормы соответственно составило 9 мм, 11, 12, 8 и 14 мм.
С вероятностью 0,954 определите среднее отклонение параметров по всей партии в целом.
9  11  12  8  14
 10,8 мм.
Рассчитаем выборочную среднюю: ~x 
5
Определим величину межгрупповой дисперсии:
2 
(9  10,8) 2  (11  10,8) 2  ...  (14  10,8) 2
 4,56 .
5
С учетом установленной вероятности Р = 0,954 (t = 2) предельная ошибка
выборки составит:   2 
4,56 
5
1    1,8 мм.
5  50 
Произведенные расчеты позволяют заключить, что среднее отклонение параметров всех изделий от нормы находится в следующих границах:
(10,8 – 1,8) мм  x  (10,8 + 1,8) мм.
Для определения необходимого объема серийной выборки при заданной
предельной ошибке используются следующие формулы:
rповтор 
t 2 2
t 2 2 R
r

,
.
бесповт
2
t 2 2  2 R
11.3.Проверка гипотезы о существенности расхождения средних
К расчетам ошибок случайной выборки прибегают в тех случаях, когда
необходимо сравнить между собой средние величины данного признака по
220
двум совокупностям, т.е. определить, существенно ли расхождение между двумя выборочными средними или несущественно; следовательно, превосходит
или не превосходит максимальной величины случайного расхождения, которое
можно ожидать с определенной вероятностью. Другими словами, можно ли
считать, что генеральные средние в двух подгруппах одинаковы, и эти подгруппы можно объединить в одну группу и характеризовать последнюю общей
средней?
Для ответа на вопрос определяют среднюю (стандартную) случайную
ошибку разности двух выборочных средних (   ); для двух независимых выборок она определяется по формуле
 12
 

n1
 22
n2
 12   22 ,
где  12 и  22 - выборочные дисперсии соответственно в первой и во второй выборках; 1 и  2 - стандартная ошибка средней соответственно в первой и во
второй выборках.
 x
 
2
i
i 1

2
fi
i
 xi
fi
;
x1  x 2

 t ðàñ÷.
По таблице Лапласа определяют по полученному значению t соответствующую вероятность (см. приложение 3). Если вероятность значительна, то нулевая гипотеза, т.е предположение об отсутствии существенного различия, не
опровергается.
Получить ответ на выдвинутую нулевую гипотезу можно иначе. Зная величину ошибки разности выборочных двух средних, можно с заданной вероятностью указать предел возможных расхождений двух выборочных средних. Если t ðàñ÷. > t òàáë. при определенной заданной доверительной вероятности, то это
свидетельствует о том, что нулевая гипотеза не подтверждается.
Пример 11.6. Обработка детали № 427 производится в цехе на двух однотипных станках. При выборочном наблюдении (механический отбор единиц)
были зарегистрированы следующие затраты на обработку одной детали (табл.
11.4):
Необходимо определить на основе приведенных данных, существенно ли
расхождение в затратах времени на обработку одной детали для этих двух
станков, гарантируя результат с вероятностью 0,95.
Таблица 11.4. Результаты выборочного обследования затрат времени на
обработку детали № 427
Затраты времени на одну деталь,
Число деталей
мин.
станок №1
станок №2
1,5 – 2,5
7
2,5 – 3,5
10
12
3,5 – 4,5
15
17
4,5 – 5,5
8
11
Итого
40
40
221
Для ответа на поставленный вопрос определяется отношение
x1  x 2

 t ðàñ÷. ,   
 12
n1

 22
,
n2
2
i
 x

i
 xi
ni  1
f.
2
Таблица 11.5 Вспомогательная таблица для расчета средних и дисперсий
Затраты
Станок №1
времени на число детаx' f
x'
( x '  x1 ) 2 f
x '  x1
1 деталь
лей, f
1,5 – 2,5
2,5 – 3,5
3,5 – 4,5
4,5 – 5,5
Итого
7
10
15
8
40
Затраты
времени на число дета1 деталь
лей, f
1,5 – 2,5
2,5 – 3,5
12
3,5 – 4,5
17
4,5 – 5,5
11
Итого
40
x f

f
'
x1
2
3
4
5
14
30
60
40
144
-1,6
-0,6
0,4
1,4
17,92
3,6
2,4
15,68
39,6
Станок №2
x'
x' f
x'  x2
(x'  x 2 )2 f
3
4
5
36
68
55
159
0,98
0,02
1,02
11,52
0,007
5,2
16,73
144

 3,6 мин.;  12 
40
 x
i
 x1
n1  1

2
f

39,6
159
; x2 
 3,98 мин.;
40  1
40
3,6  3,98
1,015 0,429
16,73

 0,19 ; t ðàñ÷. 
 0,429 ;  
 2,0 .
40
40
40  1
0,19
При заданной доверительной вероятности Р = 0,95 t òàáë. =1,96. t ðàñ÷. > t òàáë. - это
 22 
свидетельствует о том, что нулевая гипотеза не подтверждается, т.е. расхождение между средними затратами времени на обработку одной детали на двух
станках существенно и не может быть объяснено случайностями выборки.
Контрольные вопросы
1. Что такое выборочное наблюдение, и в каких случаях к нему прибегают?
2.
3.
4.
5.
6.
Объясните понятия генеральной и выборочной совокупности.
Какие существуют способы отбора (виды выборки)?
Что такое повторная и бесповторная выборка?
Как определяется объем собственно-случайной бесповторной выборки?
В чем отличие средней и предельной ошибок выборки?
222
7. Решение каких вопросов зависит от объема выборки? Как влияет объем
выборки на ее ошибке?
Задачи и упражнения
1. В результате 5%-ного выборочного обследования торговых предприятий
региона, проведенного на основе собственно-случайной бесповторной выборки,
получены следующие данные:
Номер
ТовароНомер
ТовароНомер
ТовароНомер
Товароторгового оборот за торгового оборот за торгового оборот за торгового оборот за
предприя- месяц, предприя- месяц, предприя- месяц, предприя- месяц,
тия
млн. руб.
тия
млн. руб.
тия
млн. руб.
тия
млн. руб.
1
2,3
11
3,2
21
2,3
31
1,9
2
1,9
12
2,0
22
2,4
32
2,4
3
2,8
13
1,5
23
2,7
33
2,0
4
2,1
14
2,3
24
2,4
34
2,3
5
2,2
15
1,8
25
2,9
35
3,5
6
3,7
16
2,4
26
1,7
36
2,5
7
2,8
17
2,3
27
2,2
37
2,4
8
3,0
18
2,8
28
2,5
38
2,3
9
2,3
19
2,5
29
2,3
39
2,2
10
2,0
20
2,3
30
2,5
40
2,8
С вероятностью 0,954 определите по региону в целом:
а) границы среднего товарооборота в расчете на одно торговое предприятие;
б) границы суммарного товарооборота по всем торговым предприятиям.
2. В результате выборочного обследования покупателей супермаркета
(собственно-случайная повторная выборка) получено следующее распределение по размеру сделанных покупок:
Стоимость покупки, до 100 100 - 200 200 - 300 300 и более
руб.
Число покупателей
17
58
89
43
С вероятностью 0,997 определите:
а) границы среднего размера покупки; б) границы удельного веса покупок на
сумму до 100 руб.
3. Планируется 25%-ное собственно-случайное выборочное исследование
населения района. Определите, на сколько процентов ошибка такой выборки
при бесповторном отборе будет выше ошибки повторной выборки.
4. Выборочное 5%-ное обследование размеров домохозяйств района, проведенное на основе собственно-случайного повторного отбора, позволило получить следующие данные:
Размер домохозяйства, чел.
1
2
3
4
5
6
7
Число домохозяйств
35 94 167 53 12 4
1
223
С вероятностью 0,954 определите по району в целом:
а) границы среднего размера домохозяйства;
б) границы общей численности населения района.
5. Из партии готовой продукции с целью проверки ее соответствия технологическим требованиям произведена 10%-ная собственно-случайная бесповторная выборка, которая привела к следующим результатам:
Вес изделия, г
46 47 48 49 50 51 52
Число
шт.
изделий, 46
123 158 97
36
18 12
Можно ли принять всю партию при условии, что доля изделий с весом 51 г
и более с вероятностью 0,997 не должна превышать 8%?
6. На основе 3%-ного выборочного обследования (собственно-случайная
бесповторная выборка) получены следующие данные о расходах населения на
оплату жилищно-коммунальных услуг:
Расходы на оплату жи- до 100 100-200 200-300 300-400 400-500 500 и
лищно-коммунальных
более
услуг, руб.
Число домохозяйств
93
190
555
335
84
18
С какой вероятностью можно утверждать, что удельный вес домохозяйств,
расходующих на оплату жилищно-коммунальный услуг более 400 руб. в месяц,
в целом по данному региону не превышает 9,5%?
7. Для выборочного контроля знаний студентов в порядке собственнослучайной бесповторной выборки было отобрано и протестировано 156 чел.,
что составило 5% от общего контингента студентов вуза. В результате тестирования 5 студентов показали неудовлетворительные результаты. Можно ли с вероятностью 0,954 утверждать, что доля студентов с неудовлетворительными
знаниями в целом по вузу не превышает 7%?
8. Сколько покупателей супермаркета необходимо охватить в процессе
выборочного наблюдения, чтобы с вероятностью 0,997 определить границы
среднего размера покупки с предельной ошибкой 15 руб.? Для получения данных о вариации размера покупок воспользуйтесь данными задачи 2.
9. В результате выборочного обследования населения региона установлено, что с вероятностью 0,997 среднедушевые доходы находятся в интервале от
2380 до 2620 руб.в месяц. Определите границы среднедушевых доходов с вероятностью 0,954.
10. В результате выборочного контроля качества продукции установлено,
что при уровне вероятности 0,954 доля некондиционных изделий не превышает
6,4%. При этом доля некондиции в сборке составила 0,05. Можно ли с вероятностью 0,997 утверждать, что некондиционная продукция в тестируемой партии не превышает 8%?
224
11. Как изменится необходимый объем собственно-случайной повторной
выборки, если уровень вероятности, с которым требуется получить результат,
увеличить с 0,683 до 0,954; с 0,954 до 0,997?
12. Определите, сколько клиентов автосервиса, отобранных на основе алгоритмов собственно-случайной выборки, необходимо опросить для определения доли лиц, неудовлетворенных качеством обслуживания. При этом предельная ошибка не должна превышать 2,5% при уровне вероятности 0,683. Из аналогичных обследований известно, что дисперсия данного альтернативного признака (удовлетворенность качеством обслуживания) не превышает 0,21.
13. Определите, сколько телефонных звонков необходимо обследовать
оператору мобильной связи в порядке собственно-случайной выборки, чтобы с
вероятностью 0,954 установить долю разговоров продолжительностью свыше
10 мин. Допустимая величина предельной ошибки 3%.
14. Определите, сколько семей необходимо охватить собственнослучайной выборкой для определения доли семей, не имеющих детей, с вероятностью 0,954 и предельной ошибкой 2%. Известно, что в регионе проживают
600 тыс. семей, а дисперсия изучаемого признака по результатам ранее проведенных обследований не превышала 0,19.
15. Планируется обследование населения с целью определения средних
расходов на медицинские услуги и лекарственные средства. Определите необходимый объем собственно-случайной бесповторной выборки, чтобы получить
результаты с точностью ±10 руб. при уровне вероятности 0,954. Известно, что в
районе проживает 73 тыс. человек, а пробное обследование показало, что среднее квадратическое отклонение расходов населения на эти цели составляет 38
руб.
16. В результате опроса каждого пятого учащегося выпускных классов
школ района было выяснено, что среднее время, затрачиваемое ежедневно на
подготовку к занятиям, составляет 86 мин. при коэффициенте вариации 29,4%.
При этом выборочная совокупность составила 128 чел. С вероятностью 0,997
определите границы средних затрат времени на подготовку к занятиям в целом
по всем учащимся выпускных классов школ района.
17. Определите, каким должен быть интервал отбора при организации выборочного наблюдения на основе механической выборки, чтобы процент отбора составил 20%; 5%; 2,5%; 2%?
18. Пробное выборочное обследование каждого сорокового малого предприятия области привело к следующим результатам:
Численность штатных
до 5
6-10
11-15 16 и боработников, чел.
лее
Число предприятий
36
18
7
2
Определите, каким должен быть интервал отбора при механической выборке, чтобы получить данные о средней численности занятых на малых предприятиях с точностью ±1 чел. при уровне вероятности 0,997.
19. 10%-ная проверка качества произведенной продукции показала, что в I
цехе из обследованных 300 изделий 4% — бракованные, во II цехе из обследо-
225
ванных 380 изделий удельный вес брака - 3%. С вероятностью 0,997 определите
границы доли брака но всей произведенной предприятием продукции.
20. С целью изучения бюджетов домохозяйств, состоящих 1 чел., проведена 2%-ная бесповторная типическая выборка. По результатам проведенного обследования среднемесячные расходы мужчины составили 2300 руб. (обследовано 1510 чел.), среднемесячные расходы женщины — 1900 руб. (обследовано
1670 чел.). Общая дисперсия среднемесячных расходов по данной категории
домохозяйств оценивается 55000. С вероятностью 0,997 определите границы
среднемесячных расходов домохозяйств, состоящих из 1 чел., в целом по региону.
21. 2%-ное выборочное обследование торговых предприятий района с целью изучения цен на молоко привело к следующим результатам:
Цена, руб. за Число торговых предприятий в
1 литр
населенных пунктах
городских
сельских
до 20
9
29
20-22
16
34
22-24
37
8
24 и более
8
С вероятностью 0,997 определите границы средней цены 1 литра молока в
целом по данному району.
22. Выборочное обследование цен на вторичном рынке жилья позволило
получить следующие данные:
Тип жилого помещения Количество Средняя Среднее квадражилых по- цена 1 кв. тическое откломещений
м, тыс.
нение цены,
руб.
тыс., руб.
Комната в коммунальной квартире
25
12,2
0,8
1-комнатная квартира
34
14,5
0,6
2-комнатная квартира
46
13,1
0,5
3-комнатная квартира
62
11,6
0,3
Многокомнатная квар11
15,0
1,1
тира
Предполагая, что в ходе обследования применялась повторная выборка,
пропорциональная объему выделяемых типических групп, определите границы
средней цены 1 кв. м жилья в данном городе.
23. В целях изучения прибыли малых предприятий в торговле планируется
выборочное обследование, пропорциональное, объему групп. По итогам ранее
проведенных обследований известно, что дисперсия годовой прибыли малых
предприятий, специализирующихся на оптовой торговле, составляет 37 млн.
руб., на розничной торговле - 25 млн. руб. Определите, каким должен быть объем выборки из каждой типической группы для получения результатов с пре-
226
дельной ошибкой 0,7 млн. руб. при уровне вероятности 0,954, если учесть, что в
данном регионе зарегистрировано 450 малых предприятий оптовой торговли и
1380 малых предприятий розничной торговли.
I
24. Сбор томатов в каждой 8-й теплице агрофирмы позволил получить следующие предварительные данные об урожайности:
Номер тепли- 1 2 3 4 5 6 7 8 9 10
цы
Урожайность, 9,2 8,2 8,7 8,1 8,0 9,0 8,5 9,3 8,6 8,4
кг на 1 кв. м
С вероятностью 0,997 определите:
а) среднюю урожайность томатов по агрофирме в целом;
б) виды на урожай с учетом того, что площадь каждой теплицы составляет 200
кв. м.
25. Из предполагаемой к закупке товарной партии минеральной воды, упакованной в ящики (по 20 бутылок в каждом), в порядке проверки на соответствие требованиям стандарта собственно-случайным способом были отобраны
12 ящиков, что составило 2% от их общего количества. Проверка наполняемости бутылок дала следующие результаты:
Номер
ящика
1
2
3
4
5
6
Средний
заполненный
объем бутылки,
мл
485
490
510
500
495
505
Номер
ящика
7
8
9
10
11
12
Средний
заполненный
объем бутылки,
мл
515
480
495
500
505
520
Можно ли закупить всю партию при условии, что с вероятностью 0,954
средний объем минеральной воды в бутылке должен быть не менее 495 мл?
26. На предприятии в порядке случайной бесповторной выборки было
опрошено 100 рабочих из 1000 человек и получены следующие данные об их
доходе за прошедший год:
Годовой доход, тыс. руб.
Число рабочих
до 40
12
40-50
60
50-60
20
Определить среднегодовой размер дохода работников
предприятия, гарантируя результат с вероятностью 0,997.
60 и более
8
данного
227
27. Какова должна быть численность механической выборки для
определения доли служащих, прошедших повышение квалификации по
использованию вычислительной техники, чтобы с вероятностью 0,954 ошибка
репрезентативности не превышала 4%. Общая численность служащих
предприятий составляет 370 человек.
12.Ряды динамики
12.1.Виды рядов динамики
Основная цель статистического изучения динамики любых видов деятельности состоит в выявлении и измерении закономерностей их развития во времени. Это достигается посредством построения и анализа статистических рядов
динамики.
Рядами динамики называются статистические данные, отображающие
развитие изучаемого явления во времени. В каждом ряду динамики имеются
два основных элемента:
1. показатель времени, за который или по состоянию на который приводятся числовые значения ( t );
2. числовые значения того или иного показателя, называемые уровнями
ряда ( y ).
В зависимости от способа выражения уровней (в виде абсолютных, относительных и средних величин) ряды динамики подразделяются на ряды абсолютных, относительных и средних величин.
В качестве показаний времени в рядах динамики выступают либо определенные даты (моменты) времени, либо отдельные периоды (годы, кварталы, месяцы, сутки). В соответствии с этим, ряды динамики подразделяются на моментные и интервальные. Уровни моментных рядов динамики характеризуют
объекты изучения по состояния на определенный момент времени: численность
населения на конец года (или на дату переписи), численность работников предприятия на начало каждого месяца, товарные запасы на складе на начало дня и
т.д. Уровни интервальных рядов динамики характеризуют явления за определенный промежуток, интервал времени: товарооборот магазина за квартал,
прибыль предприятия за год, выпуск продукции за месяц и т.п.
Кроме того, ряды динамики могут быть с равноотстоящими (по времени)
уровнями и неравноотстоящими уровнями.
Если уровни интервального ряда представляют собой абсолютные величины, то их можно суммировать во времени, т.е. переходить от ряда динамики с
малыми временными интервалами к более крупным промежуткам времени.
Так, от ряда динамики с месячной выплавкой стали можно перейти к ряду динамики с годовой выплавкой стали, суммируя месячные уровни.
Пример. Имеются данные о сборе сахарной свеклы в Российской Федерации (млн. т.):
228
1992 1995 2000 2001 2002 2003 2004
25,5
19,1
14,1
14,6
15,7
19,4
21,8
Это интервальный ряд динамики абсолютных величин с равноотстоящими
уровнями во времени. Его уровни характеризуют суммарный итог сбора сахарной свеклы за четко определенный отрезок времени (за каждый год). Уровни
интервального ряда динамики могут быть суммированы. Таким образом, мы
получим суммарный объем производства сахарной свеклы из период с 1992 по
2004 гг.
Примером моментного ряда абсолютных величин с равноотстоящими
уровнями во времени можно назвать ряд динамики, показывающий численность населения РФ на 1 января каждого года (млн. чел.):
2001
2002
2003
2004
2005
146,3
145,6
145,0
144,2
143,5
Уровни этого ряда – обобщенные итоги учета численности населения по
состоянию на определенную дату (начало каждого года). Отдельные уровни
моментного ряда динамики содержат элементы повторного счета, так как
большая часть населения, учтенная, например, в 2002 г., проживает на территории России и в настоящее время, являясь единицами совокупности и в 2005 г.
Все это делает бессмысленным суммирование уровней моментных рядов динамики.
Примером интервального ряда динамики средних величин с неравноотстоящими уровнями во времени может служить ряд динамики среднегодовой
численности занятых в экономике России (млн. чел.):
1990
1993
1998
2000
75,3
70,9
63,8
64,3
Его уровни относятся к годовым интервалам времени, но суммирование их
самостоятельного значения не имеет.
Примером моментного ряда динамики относительных величин с равноотстоящими уровнями во времени может служить ряд динамики, характеризующий удельный вес студентов вузов России дневной формы обучения в общей
численности студентов на начало каждого учебного года:
Год
2000/01
2001/02
2002/03
Общая численность
студентов, %
100
100
100
из них на дневном
отделении
55
53
52
229
2003/04
2004/05
100
100
51
50
Суммирование уровней данного ряда не имеет смысла.
12.2.Показатели изменения уровней ряда динамики
Одним из важнейших направлений анализа рядов динамики является
изучение особенностей развития явления за отдельные периоды времени. Для
выявления специфике развития изучаемых явлений за отдельные периоды времени определяют абсолютные и относительные показатели изменения ряда динамики: абсолютные приросты, абсолютное значение одного процента прироста, темпа роста и прироста.
Для характеристика развития явления во времени применяются следующие
показатели:
а) абсолютный прирост (  )
б) темп роста ( Т Р )
в) темп прироста ( Т пр )
г) абсолютное значение 1% прироста (А)
Рассматривая данные показатели, необходимо правильно выбирать базу
сравнения, которая зависит от цели исследования. При сравнении каждого
уровня ряда с предыдущим получаются цепные показатели; при сравнении
каждого уровня с одним и тем же уровнем (базой) получают базисные показатели.
Для выражения абсолютной скорости роста (снижения) уровня ряда динамики исчисляют статистический показатель – абсолютный прирост (  ). Его
величина определяется как разность двух сравниваемых уровней. Она вычисляется по следующим формулам
цепной абсолютный прирост -  Ц  yi  yi 1 ;
базисный абсолютный прирост -  б  y i  y 0 ,
где y 0 - уровень ряда динамики, выбранный за базу для определения базисных
абсолютных приростов; yi 1 - уровень ряда динамики i-го года.
Пример. Требуется провести анализ динамики продажи мясных консервов
за 1997 – 2003 гг. по условным данным. Для удобства и наглядности исходные
и рассчитанные показатели изложены в табличной форме (табл. 11.1).
Абсолютное уменьшение продажи консервов за 2000 г. по сравнению с
1999 г. составило: 806 – 891 = -85 млн. усл. банок (табл. 11.1 графа 2), а по
сравнению с базисным 1999 г. продажа консервов в 2003 г. возросла на 760
млн. усл. банок (графа 3).
Интенсивность изменения уровней ряда динамики оценивается отношением текущего уровня к предыдущему или базисному, которое всегда представляет положительное число. Этот показатель принято называть темпом роста
( Т Р ).
230
Он выражается в процентах:
Тр 
y
yi
100 , или Т р  i  100 .
yi1
y0
Таблица 12.1. Динамика продажи мясных консервов в одном из регионов за
1999-2003 гг. и расчет аналитических показателей динамики
Год
А
1999
2000
2001
2002
2003
Итого
Абсолютные Темпы роста, %
Кон- приросты, млн.
сервы,
усл. банок
млн.
с прес
с предыс
усл.
ды1997
дущим 1997
банок дущим
г.
годом
г.
годом
1
2
3
4
5
891
100,
0
806
-85
-85
90,5
90,5
1595
+789
+704
197,9
179,
0
1637
-42
+746
102,63
183,
7
1651
+14
+760
100,85
185,
3
6580
+760
-
Темпы прироста,
%
с предыдущим
годом
с
1997
г.
Абсолютное значение 1%
прироста,
млн. усл.
банок
6
-
7
0,0
8
-
-9,5
97,9
-9,5
79,0
8,91
8,06
2,63
83,7
15,95
0,85
85,3
16,37
-
-
-
Так, для 2003 г. темп роста по сравнению с 1999 г. составил
 1651 

  100  185,3% (табл. 11.1 графа 5).
 891 
Темпы роста могут быть представлены в виде коэффициентов ( К р ). В этом
случае он показывает, во сколько раз данный уровень ряда больше уровня базисного года или какую его часть он составляет.
Для выражения изменения величины абсолютного прироста уровней ряда
динамики в относительных величинах определяется темп прироста ( Т пр ), который рассчитывается как отношение абсолютного прироста к предыдущему
или базисному уровню, т.е.
Т пр 
Ц
y i 1
 100 или Т пр 
б
y0
Существует связь между темпами роста и прироста:
Т пр = Т Р -100%.
В нашем примере (табл. 12.1 графы 6, 7) показывается, на сколько процентов продажа консервов в 2003 г. возросла по сравнению с 1999 г.:
 760 

  100  85,3% , или 185,3 – 100 = 85,3%.
 891 
231
Если разделить абсолютный прирост (цепной) на темп прироста (цепной)
за соответствующий период, получим показатель, называемый - абсолютное
значение 1% прироста:
A
Ц
Т пр
или A 
Ц
Ц
y i 1
 0,01y i 1 .
 100
Иными словами, абсолютное значение 1% прироста в данном периоде есть
сотая часть достигнутого уровня в предыдущем периоде. В связи с этим расчет
абсолютного значения 1% прироста базисным методом не имеет смысла, ибо
для каждого периода это будет одна и та же величина – сотая часть уровня базисного периода.
Для 2003 г. абсолютное значение 1% прироста (табл. 12.1 графа 8) равно:
0,01 · 1637 = 16,37, или
14
 16,37 млн. усл. банок.
0,855
Между цепными и базисными показателями изменения уровней ряда существует слудеющая взаимосвязь:
а) сумма цепных абсолютных приростов равна базисному приросту (см.
табл. 11.1, где в итоговой строке по графе 2 накопленный прирост за 2000-2003
гг. – 760 млн. усл. банок совпадает с базисным абсолютным приростом для 2003
г.)
б) произведение цепных коэффициентов роста равно базисному или равносильное этому деление рядом стоящих базисных коэффициентов роста друг
на друга равно цепным коэффициентам роста. Так, по данным табл. 12.1, имеем:
0,905 · 1,979 · 1,0263 · 1,0085 = 1,853 или 185,3% - базисный темп роста;
185,3/183,7 = 1,085 или 100,85% - цепной темп роста для 2003 г.
Взаимосвязь цепных и базисных темпов (коэффициентов) роста позволяет
при анализе, если необходимо, переходить от цепных показателей к базисным и
наоборот.
12.3.Средние по рядам динамики
Для обобщения данных по рядам динамики рассчитываются:
средний уровень ряда;
средний абсолютный прирост;
средний темп роста и прироста.
Для разных видов рядов динамики средний уровень рассчитывается неодинаково.
По интервальному динамическому ряду из абсолютных величин с равными
интервалами средний уровень определяется по средней арифметической простой из уровней ряда:
y
y
i
n
,
где yi - уровни ряда для i-го периода; n – число уровней в ряду динамики.
232
По данным табл. 12.1, средний за период объем производства консервов
составит:
y
6580
 1316 млн. усл. банок,
5
т.е. в среднем ежегодно по региону производилось данное количество мясных
консервов.
По интервальному временному ряду из относительных и средних величин
средний уровень определяется так же, как в статике, т.е. с учетом информации
по признакам, связанным с осредняемым. Так, средняя урожайность должна
определяться по средней арифметической взвешенной:
y
y x
x
i
i
,
i
где yi - урожайность по годам; xi - посевная площадь по годам.
Если интервальный ряд динамики имеет неравноотстоящие уровни, то
средний уровень ряда вычисляется по формуле
y
yt
t
i i
,
i
где t i - период, в течение которого уровень yi остается неизменным.
По моментному динамическому ряду в зависимости от исходной информации средний уровень ряда определяется тремя способами.
1. Если известны данные об изменении уровня ряда внутри временного
промежутка, то средний уровень определяется как средняя арифметическая
взвешенная:
y
yt
t
i i
,
i
где yi - уровень моментного динамического ряда; t i - период, в течение которого
уровень yi остается неизменным.
Пример. Имеются данные об остатках средств на расчетном счете предприятия. На 01.01 остаток средств составил 100 тыс. руб.; 10.01 поступило от
покупателей 250 тыс. руб.; 15.01 списано со счета на хозяйственные нужды 15
тыс. руб.; 18.01 снято со счета для выплаты заработной платы 180 тыс. руб.;
25.01 поступило от покупателей 420 тыс. руб. Других изменений до конца месяца не было. Определим средний остаток средств на расчетном счете в январе
(табл. 12.2).
Исходя из данных табл. 12.2, имеем: y  8765 / 31  282,7 тыс. руб.
Таблица 12.2. Расчет среднего остатка средств на расчетном счете
yi t i
Календарный пеОстаток средств,
Период действия
риод
тыс. руб. ( yi )
уровня, дней ( t i )
01.01-09.01
100
9
900
10.01-14.01
350
5
1750
15.01-17.01
335
3
1005
18.01-24.01
155
7
1085
233
25.01-31.01
Итого
575
-
7
31
4025
8765
2. Однако не всегда имеется информация об изменении уровня моментного
ряда внутри рассматриваемого временного промежутка. В этом случае средний
уровень моментного ряда динамики определяется приближенно как средняя
арифметическая взвешенная из парных смежных средних:
~
yt

y
t
i i
,
i
где ~y i - смежные парные средние, найденные как средняя арифметическая простая из двух рядом стоящих уровней, т.е.
1
~
yi   yi ;
2
t i - период действия средних ~y i .
Пример. Товарные запасы в магазине составили: на 01.01 – 60 тыс. руб.; на
01.04 – 50; на 01.11 – 62; на следующего года – 80 тыс. руб. Определим среднегодовой товарный запас в магазине (табл. 12.3).
Таблица 12.3. Расчет среднегодового товарного запаса
~y t
~y (тыс. руб.)
Дата учета
t i (мес.)
yi (тыс. руб.)
i i
i
01.01
60
67,5
3
202,5
01.04
75
250,0
62,5
4
01.08
50
168,0
3
56,0
01.11
62
142,0
2
71,0
01.01
80
Итого
12
762,5
Величина ~y i отображает средний уровень за определенный интервал времени. Так, с 01.01 по 01.04, т.е. за I квартал, средний товарный запас составил
67,5 тыс. руб. ((60 + 75)/2). Исходя из расчетов табл. 11.3, среднегодовой остаток товаров в магазине составлял;
y  762,5 / 12  63,5 тыс. руб.
3. Если интервалы между датами равны, то рассмотренная ранее средняя
арифметическая взвешенная преобразуется в тождественную ей среднюю хронологическую:
1
1
y1  y 2  ...  y n 1  y n
2
y 2
n 1
Данная формула используется, например, для расчета среднегодовой стоимости имущества при уплате налога на имущество.
Пример. На балансе предприятия числится имущество: на 01.01 – 800
тыс. руб., на 01.04 – 1000; на 01.07 – 1600; на 01.10 – 1100, на 01.01 следующего
года – 1400 тыс. руб. В отличие от предыдущего пример интервалы между да-
234
тами равны: они составляют квартал. Определим имущество в каждом квартале
отдельно:
800  1000
;
2
1000  1600
I I квартал ;
2
1600  1100
I I квартал ;
2
1100  1400
IV квартал .
2
I квартал -
Далее рассчитаем, какое имущество действовало в течение года в рамках
любого квартала. Для этого можно сложить квартальные средние и поделить их
сумму на 4:
800  1000 1000  1600 1600  1100 1100  1400



2
2
2
2
.
4
Нетрудно видеть, что данная формула преобразуется в среднюю хронологическую, а именно:
800
1400
 1000  1600  1100 
2
2  4800  1200 тыс. руб.
4
4
Кроме среднего уровня, при анализе и прогнозировании широко используются
средние показатели изменения уровней ряда, а именно средний абсолютный
прирост и средний темп роста.
Средний абсолютный прирост определяется как средняя арифметическая простая из цепных приростов:  

Ц
n 1
.
Так как   Ц   б , то средний абсолютный прирост можно определять
следующим образом:

yn  y0
,
n 1
где n - число уровней ряда динамики; y 0 - уровень ряда динамики, взятый за базу сравнения; y n - последний уровень ряда динамики;
Применительно к данным табл. 12.1 среднегодовой абсолютный прирост
продажи мясных консервов за 1999-2003 гг. равен:

760
1651  1637
 190 , или  
 190 млн. усл. банок.
4
4
Для обобщения характеристики интенсивности роста рассчитывается
средний темп (коэффициент) роста по средней геометрической простой:
Т р  m K1  K 2  ...  K m ,
где К 1 , К 2 ,…, К m - цепные коэффициенты роста; m – число цепных коэффициентов роста.
Применим эту формулу к данным табл. 12.1:
Т р  4 0,905  1,979  1,0263  1,0085  4 1,853  1,167 , или 116,7%.
235
Учитывая взаимосвязь цепных и базисных темпов роста, средний темп роста можно представить следующим образом:
Т р  n 1
yn
.
y0
Для нашего примера имеем:
Тр 4
1651 4
 1,853  1,167 , или 116,7%.
891
В средней геометрической корень степень определяется как разность хронологических дат (2003 – 1999 = 4).
12.4.Приведение рядов динамики в сопоставимый вид
Ряды динамики, изучающие изменение статистического показателя, могут охватывать значительный период времени, на протяжении которого могут
происходить события, нарушающие сопоставимость отдельных уровней ряда
динамики (изменение методологии учета, изменение цен и т.д.).
Для того, чтобы анализ ряда был объективен, необходимо учитывать события, приводящие к несопоставимости уровней ряда и использовать приемы обработки рядов для приведения их в сопоставимый вид.
Наиболее характерные случаи несопоставимости уровней ряда динамики:
1. Территориальные изменения объекта исследования, к которому относится изучаемый показатель (изменение границ городского района, пересмотр административного деления области и т.д.).
2. Разновеликие интервалы времени, к которым относится показатель.
Так, например, в феврале - 28 дней, в марте - 31 день, анализируя изменения
показателя по месяцам, необходимо учитывать разницу в количестве дней.
3. Изменение даты учета. Например, численность поголовья скота в разные
годы могла определяться по состоянию на 1 января или на 1 октября, что в
данном случае приводит к несопоставимости.
4. Изменение методологии учета или расчета показателя.
5. Изменение цен.
6. Изменение единиц измерения.
Пример. Имеются данные, характеризующие общий объем продукции
промышленности в одном из регионов (в фактически действовавших ценах):
Уровни продук1997 1998 1999
2000
2001
2002
2003
ции промышленности
В старых грани20,1
20,7
21,0
21,2
цах региона
В новых границах
региона
23,8
24,6
25,5
27,2
Для приведения ряда динамики к сопоставимому виду для 2000 г. определим
коэффициент соотношения уровней двух рядов:
23,8
 1,12 .
21,2
236
Умножая на этот коэффициент уровни первого ряда, получаем их сопоставимость с уровнями второго ряда, млн. руб.:
1997 г. – 20,1 · 1,12 = 22,5; 1998 г. – 20,7 · 1,12 = 23,2;
1999 г. – 21,0 · 1,12 = 23,5.
Получен сопоставимый ряд динамики общего объема продукции промышленности в одном из регионов (в новых границах, млн. руб.):
1997
1998
1999
2000
2001
2002
2003
22,5
23,2
23,5
23,8
24,6
25,5
27,2
Другой способ смыкания рядов динамики заключается в том, что уровни
года, в котором произошли изменения (в нашем примере уровни 2000 г.), как до
изменений, так и после изменений принимаются за 100%, а остальные – пересчитываются в процентах по отношению к этим уровням соответственно (в
нашем примере до изменений – по отношению к 21,2, а после изменений – по
отношению к 23,8). В результате получается сомкнутый ряд.
Применив этот способ для нашего примера, получим следующий ряд динамики, характеризующий общий объем продукции региона:
Показатель
1997
1998 1999 2000 2001 2002
2003
Общий объем продукции в новых границах региона, (в % к
2000 г.)
94,8
97,6
99,1
100,0 103,4
107,2
114,3
12.5.Сглаживание вариационных рядов методом скользящих средних
Аналитическое выравнивание уровней динамического ряда не дает хороших результатов при прогнозировании, если уровни ряда имеют резкие периодические колебания. В этих случаях простым путем определения тенденции
развития явления представляется сглаживание динамического ряда методом
скользящих средних. Предположим, что уровни динамического ряда образуют
график, представленный на рис. 12.1.
237
120
100
80
60
40
20
0
0
2
4
6
8
10
12
14
16
Рис. 12.1. Графическое изображение динамического ряда с периодическими колебаниями
К такому временному ряду непосредственное применение аналитического
выравнивания затруднено, ибо форму кривой не обосновать. Проблема выбора
типа кривой может быть решена, если сгладить ряд методом скользящих средних.
Чтобы заменить фактические уровни временного ряда скользящими средними, выбирается период сглаживания. Чаще рекомендуется нечетный период
скольжения: 3, 5, 7, 9. Соответственно рассчитываются 3-, 5-, 7- и 9-членная
скользящие средние.
Скользящие средние представляют собой средние уровни за определенные
периоды времени (3, 5, 7, 9) путем последовательного передвижения начала периода на единицу времени. Найденные по средней арифметической значения
скользящих средних условно относятся к середине периода, по которому
она исчислена. Рассмотрим применение скользящей средней по данным о
производстве продукции одного предприятия (табл. 12.4).
Таблица 12.4. Данные о производстве продукции
(тыс. ед.)
1990 1991 1992 г. 1993 1994 г. 1995 г. 1996 г. 1997 1998 1999
г.
г.
г.
г.
г.
г.
35
31
40
34
18
30
34
40
29
40
Поскольку период сглаживания теоретически не обосновать расчеты начинают с 3-членной скользящей средней. Первый сглаженный уровень получим для1991 г.: yˆ  (35  31  40) / 3  35,3 . Последовательно сдвигая на один год
начало периода скольжения, находим сглаженные уровни для других лет. Так,
для 1992 г. скользящая средняя составит: ŷ =(31+ 40 + 34)/3 = 35,0, для 1993 г.
ŷ = (40 + 34 + 18)/ 3 = 30,7 и т.д. Так как скользящая средняя относится к середине интервала, за который она рассчитана, то динамический ряд сглаженных
уровней сокращается на (n - 1) уровень при нечетном периоде скольжения и на
n уровней — при четном периоде скольжения. Поэтому в нашем примере ряд
238
сглаженных уровней стал короче на два члена для трехчленной средней и на
четыре - для пятичленной (табл. 12.5).
Как видно из табл. 11.5, трехчленная скользящая средняя демонстрирует
выровненный динамический ряд с разнонаправленной тенденцией движения
уровней: снижение до 1995 г. и далее рост их с некоторым нарушением в 1997
г. Чтобы исправить это нарушение закономерности, можно попытаться увеличить период скольжения до 5. Однако в нашем примере увеличение периода
скольжения не дало положительных результатов. Трехчленная скользящая
средняя дает более сглаженный ряд, чем пятичленная. Кроме того, для нее оказывается меньше сумма квадратов отклонений фактических данных ( y t ) от
сглаженных ( ŷ ): для трехчленной скользящей средней  ( yt  yˆ ) 2
=234,43, а для пятичленной -  ( yt  yˆ ) 2 = =365,4. Иными словами, трехчленная
скользящая средняя лучше представляет закономерность движения уровней динамического ряда.
Таблица 12.5. Сглаживание уровней ряда
Годы Фактический
Сглаженные уровни
уровень, y t
Простая скольВзвешенная
зящая средняя скользящая средняя
3535членная членная членная членная
1990
35
1991
41
35,3
34,3
1992
40
35,0
31,6
36,3
34,6
1993
34
30,7
30,6
31,5
31,1
1994
18
27,3
31,2
25.0
27,4
1995
30
27,3
31,2
28,0
28,9
1996
34
34,7
30,2
34,5
29,4
1997
40
34,3
34,6
35,8
35,1
1998
29
36,3
37,0
34,5
35,6
1999
40
37,0
37,8
2000
42
Поскольку укрупнение интервала сглаживания приводит к уменьшению
числа сглаженных уровней ряда, а длина динамического ряда в экономике часто ограничена (максимум 10—15 лет), то многочленные скользящие средние
практически не применяются (исключение составляет применение скользящих
средних при измерении сезонных колебаний).
Простые скользящие средние в ряде случаев позволяют выявить тенденцию лишь в общих чертах, ибо при сглаживании исчезают изгибы линии тен-
239
денции и некоторые уровни показывают вместо спада, имевшего место реально,
подъем или наоборот (см., например, табл. 12.5 -1997, 1998 гг.).
Более совершенным приемом считается взвешенная скользящая средняя.
Если при простой скользящей средней все уровни временного ряда считаются
равноценными, то при исчислении взвешенной скользящей средней каждому
уровню в пределах интервала сглаживания приписывается вес, зависящий от
расстояния данного уровня до середины интервала сглаживания.
Веса для уровней ряда при сглаживании могут быть взяты как коэффициенты бинома Ньютона:
Интервал сгла- Коэффициенты Сумма веживания (n)
(f)
сов
3
1 2 1
4
5
1 4 6 4 1
16
7
1 6 15 20 15 6
64
1
Взвешенная скользящая средняя определяется как средняя арифметическая
взвешенная:
n
yˆ t 
y
i 1
n
t
f
i 1
fi
,
i
где ŷ - скользящая средняя; y t - уровни динамического ряда, участвующие в
расчете за интервал n; f i веса. Если принять, что сумма весов равна единице, то
весом будет выступать
fi
f
.
i
Для рассматриваемого примера трехчленная взвешенная скользящая средняя за 1991 г. окажется равной:
yˆ 91  (35  1  31  2  40  1) : 4  34,25 ;
для 1992 г. соответственно получим:
yˆ 92  (31  1  40  2  34  1) : 4  36,25 .
При пятичленной взвешенной скользящей средней для 1992 и 1993 гг. получим:
yˆ 92  (35  1  31  4  40  6  34  4  18  1) : 16  34,5625 ;
yˆ 93  (31  1  40  4  34  6  18  4  30  1) : 16  31,0625 .
Аналогично рассчитываются и для других лет взвешенные скользящие
средние, результаты которых приведены в табл. 12.5.
Как видим, взвешенные скользящие средние несколько ближе подходят к
фактическим данным. Для них  ( yt  yˆ ) 2 меньше, чем для простых скользящих
средних: для трехчленной взвешенной скользящей средней  ( yt  yˆ ) 2 =136,81,
а для пятичленной -  ( yt  yˆ ) 2 =215,87.
240
При сглаживании ряда динамики по чётному числу уровней выполняется
дополнительная операция, называемая центрированием, т.е. определение средней из найденных средних, что необходимо для определения срединного периода. Например, если исчисляется скользящая с продолжительностью периода,
равной 2, то расчет производится следующим образом:
y1 
y y
y y
y1  y 2
; y 2  2 3 ; y 3  3 4 и т.д.
2
2
2
Тогда центрированные средние равны:
y11 
y y
y1  y 2
; y 21  2 3 и т.д.
2
2
Причем первая центрированная средняя будет отнесена ко второму периоду,
вторая к третьему и т.д.
12.6.Прогнозирование на основе стационарного ряда
Временной ряд называется стационарным, если в нем отсутствует тенденция развития. Это значит, что уровни динамического ряда варьируют вокруг
среднего уровня, отклонения от которого представляют собой случайную колеблемость. Модель уровня динамического ряда в этом случае имеет вид:
yt  y   ,
где y t — уровни динамического ряда; y — средний за период уровень динамического ряда;  - случайная составляющая, определяемая как случайная составляющая, определяемая как   yt  y .
Графически стационарный ряд можно представить следующим (рис.
12.2).
y
время
Рис. 12.2. Стационарный ряд
Такие ряды в экономике сравнительно редки. Чаще наблюдаются ряды с
тенденцией. Вместе с тем они могут иметь место при изучении динамических рядов из относительных и средних величин. Например, сумма подоходного налога в процентах к фонду оплаты труда на предприятиях России даже при
прогрессивной шкале налогообложения представляла собой во многих случаях подобный ряд. С введением в 2001 г. «плоской» шкалы обложения величина налогового бремени на фонд оплаты труда становится практически ве-
241
личиной постоянной, колеблющейся за счет прочих выплат, облагаемых по более высоким ставкам. Аналогичную картину можно наблюдать при исследованиях спроса на товар при отсутствии резких изменений на него и одинаковом сегменте рынка.
Если стационарный ряд разбить на две равные по времени части, то средние уровни по этим частям не должны существенно различаться, т. е. y1  y 2 .
Поскольку при практических расчетах полного равенства средних не бывает изза колеблемости уровней, с помощью t-критерия Стьюдента дается оценка, существенно ли различаются между собой средние и можно ли их различие связывать только с действием случайности. Если в двух сравниваемых частях динамически ряда дисперсии уровней различаются несущественно, то проверка
равенства средних уровней осуществляется по t-критерию Стьюдента по
формуле:
t
y1  y 2
1
1


n1 n2
,
где n1 = n2 - число уровней в каждой половине динамического ряда, σ - среднее
квадратическое отклонение разности средних, которое может быть определено как корень квадратный из средней арифметической взвешенной из групповых дисперсий, т. е.
 12 (n1  1)   22 (n2  1)

n1  n2  2
.
Так как (n1  1)  (n2  1) , данная формула упрощается:

1 2
( 1   22 ) .
2
В связи с тем что число уровней динамического ряда у исследователя
обычно ограничено, каждая половина ряда рассматривав как малая выборка,
и дисперсия по ней определяется по формуле:

2
1
(y

1
 y1 ) 2
n1  1
и
2
2
(y

2
 y 2 )2
n2  1
Сравнивая фактическое значение t-критерия с табличным (см. приложение 1) при уровне значимости 0,05 и числе степеней свободы (n - 2), различия между средними уровнями признаются несущественными, если t фактическое меньше табличного значения. В этом случае ряд можно считать стационарным.
Непосредственному применению формулы t-критерия Стьюдента для оценки существенности различий сравниваемых средних уровней предшествует статистическая проверка по F-критерию Фишера теста о равенстве дисперсий в
сравниваемых группах:
F
 12
, где  12   22 .
 22
242
Если фактическое значение F меньше табличного при числе степеней свободы (n1  1) и (n2  1) , то гипотеза о равенстве дисперсий подтверждается и приведенная формула для оценки существенности различий в сравниваемых средних правомерна.
Если же фактическое значение F-критерия Фишера окажется больше табличного, то дисперсии в сравниваемых частях динамического ряда не
равны. В этом случае для оценки существенности различий средних
tкритерий Стьюдента определяется по следующей формуле:
t
y1  y 2
 12
n1

 22
.
n2
Полученное фактическое значение t сравнивается с табличным при числе
степеней свободы (f-2), где
  2  2   ( 2 / n ) 2 ( 2 / n ) 2 
f   1  2  :  1 1  2 2  .
n2  1 
 n1 n2   n1  1
При практических расчетах, если фактическое значение t-критерия оказывается меньше единицы, то групповые средние считаются равными, т. е.
y1  y 2 .
Пример. Прибыль за год характеризуется данными, приведенными в табл.
12.6
Таблица 12.6. Годовая прибыль
y , тыс. руб.
1-е полугодие
63,5
2-е полугодие
64,5
2
0,92
0,86
Оценим существенность различий в дисперсиях: F =0,92 /0,86 = 1,07 при
табличном значении 5,05 (для α = 0,05 и при числе степеней свободы 5 и 5).
Дисперсии можно признать равными. Тогда оценим существенность расхождения в среднемесячных уровнях прибыли за каждое полугодие по t-критерию
Стьюдента:
t
64,5  63,5

1 1

6 6
,
1
(0,92  0,86)  0,9434 .
2
Произведя дальнейшее вычисления, находим, что t = 1,84. Это меньше
t табл = 2,23. Следовательно, с вероятностью 0,95 можно признать, что тенденции
в ряду динамики нет. Или, другими словами, ряд можно считать стационарным.
Прогноз по стационарному ряду основан на предположении неизменности
в будущем среднего уровня динамического ряда, т.е. y П  y , где y П — прогнозное значение. Так как средний уровень динамического ряда имеет погрешность как выборочная средняя и, кроме того, отдельные уровни ряда колеблются вокруг среднего значения, принято прогноз давать в интервале:
243
y П  y  t ,n 1 1 
1
,
n
где y — среднее значение по динамическому ряду;  - среднее квадратическое
отклонение по динамическому ряду; п — длина динамического ряда; t ,n1 - табличное значение t-критерия Стьюдента при значимости α и числе степеней свободы (п - 1).
Для нашего примера:
y
1
(63,5  64,5)  64,0 ,  2   2   2
2
где  2 - межгрупповая дисперсия;  2 - внутригрупповая дисперсия.
( y1  y) 2  ( y 2  y) 2
0,92  0,86
 0,25 ;  2 
 0,89 ;
2
2
 2  0,25  0,89  1,14 и   1,0677 ; t 0.05,n111  2,201.
2 
Тогда ошибка прогноза составит: 2,201  1,0677 1 
1
 2,446 .
12
Соответственно прогноз прибыли на январь следующего года окажется таким: 61,6  y П  66,4 .
Основной недостаток этого подхода: прогноз не учитывает период упреждения. Иными словами, на февраль ошибка прогноза остается прежней величиной, что вряд ли соответствует действительности. Данный метод может быть
использован лишь для краткосрочного прогноза.
12.7.Прогнозирование на основе средних показателей динамики
Скорость изменения уровней динамического ряда за определенный отрезок
времени характеризуется средним абсолютным приростом. Предполагая его
стабильным, прогноз можно дать в виде следующей экстраполяции:
y П  yб  L ,
где y П - прогнозируемый уровень; y б - уровень, принятый за базу для экстраполяции;  -средний абсолютный прирост уровня в единицу времени; L — период упреждения.
Применение среднего абсолютного прироста для экстраполяции, что
развитие явления происходит по арифметической прогрессии:
y n  y0  (n  1)
Отсюда и формула среднего абсолютного прироста принимает вид:

y n  y1
,
(n  1)
где ( y n  y0 ) - базисный абсолютный прирост.
Использование в экстраполяции среднего абсолютного прироста относится
в прогнозировании к классу «наивных» моделей, ибо чаще всего развитие явления следует по иному пути, чем арифметическая прогрессия. Вместе с тем в ряде случаев этот метод, может найти применение как предварительный прогноз,
если у исследователя нет динамического ряда: информация дана лишь на нача-
244
ло и конец периода предыстории. Примером могут служить данные одного баланса, где активы и пассивы предприятия заданы в виде сальдо на начало и на
конец отчетного периода.
При прогнозной оценке y П в качестве базового уровня y б чаще всего используется конечный уровень динамического ряда как наиболее близкий к прогнозируемому периоду. В отдельных случаях, когда отсутствуют резкие колебания в уровнях, это дает неплохие результаты. В противном случае за базовый
следует принимать более стабильный уровень, обосновывая при этом целесообразность использования его в расчете.
Пример. Объем сделок на ММВБ по инструменту USD UTS составил:
22.01.01 – 91,474 млн. ед. вал., а 25.01.01 – 124,674 млн. ед. вал. Прогноз объема
сделок на 26.01 составит:
y П  yб  L , y б = 124,674,
124,674  91,474 33,2

 11,067 млн. ед. вал. L = 1.
3
3
Соответственно y П =124,674 + 11,067 · 1 = 135,741 млн. ед. вал. Фактически

26.01.01 объем сделок составил 136,940 млн. ед. вал., т.е. ошибка прогноза равна 1,199 млн., или 0,88%.
Другим показателем динамики, который может быть использован в ориентировочном краткосрочном прогнозе, является средний коэффициент (темп)
роста. Прогнозное значение уровня, исходя из среднего коэффициента роста,
можно получить по формуле:
L
y П  yб  К р ,
где y б - уровень, взятый в качестве базового для экстраполяции; К р - средний
коэффициент роста; L – период упреждения.
Для нашего примера К р  n1
yn
124,674
3
 1,1087 . Соответственно прогноз
y0
91,474
на 26.01 окажется y П  124,674 1,10871 = 138,226 млн. ед. вал., т.е. ошибка прогноза несколько выше: 1,286 млн. ед. вал., или 0,94%.
Рассмотренный прием экстраполяции предполагает, что уровни динамического ряда изменяются в геометрической прогрессии, что не всегда соответствует реальности. Кроме того, формула расчета среднего коэффициента роста
по средней геометрической ориентирована на достижение при ее применении
конечного ( y n ) уровня динамического ряда. И если на конце временного интервала уровень резко изменился (рост сменился спадом) и оказался ниже начального ( y 0 ), то прогноз по средней геометрической распространится на будущую
тенденцию падения, которой на самом деле не было.
12.8.Аналитическое выравнивание и кривые роста
На практике для описания тенденции развития явления широко используются модели кривых роста, представляющие собой различные функции времени y  f (t ) . При таком подходе изменение исследуемого показателя связывается
245
лишь с течением времени и считается, что влияние других факторов несущественно или косвенно сказывается через фактор времени.
Правильно выбранная модель кривой роста должна соответствовать характеру изменения тенденции исследуемого явления. Кривая роста позволяет получить выровненные, или теоретические, значения уровней динамического ряда. Это те уровни, которые наблюдались бы в случае полного совпадения динамики явления с кривой.
Нахождение по имеющимся данным за определенный период времени некоторых недостающих значений признака внутри этого периода называется
интерполяцией. Прогнозирование на основе модели кривой роста базируется на
экстраполяции, т.е. на продлении в будущее тенденции, наблюдавшейся в прошлом. При этом предполагается, что во временном ряду присутствует тренд,
характер развития показателя обладает свойством инерционности, сложившаяся тенденция не будет претерпевать существенных изменений в течение периода упреждения.
В настоящее время в литературе описано несколько десятков кривых роста.
Поэтому вопрос о выборе кривой является основным при выравнивании ряда.
Для решения этой задачи необходимо ознакомиться с основными свойствами
используемых кривых роста.
Наиболее часто используются полиномы К-й степени:
yˆ t  a0  a1t  a2 t 2  ...  ak t k ,
где a i (i = 0, 1, … , k) – параметры многочлена, t – независимая переменная времени.
При k = 1 получаем линейный тренд, т.е. линейную функцию выравнивания: yˆ t  a0  a1t .
По содержанию линейный тренд означает, что уровни динамического ряда
изменяются с одинаковой скоростью. В этом можно убедиться, если в уравнение линейного тренда подставить порядковые значения t:
yˆ t  a0  a1t
t

a0
0
a0  a1
a1
1
a0  2a1
a1
2
a1
a0  3a1
3
a1
a0  4a1
4
Параметр a 0 означает начальный уровень тренда при t = 0. Параметр a1 характеризует средний абсолютный прирост в единицу времени t.
Так,
по уравнению тренда для индексов потребительских цен
y  99,9  1,9t , где t= 1, 2,..., 12 мес., видно, что ежемесячно цены возрастали в
среднем на 1,9 процентных пункта. В линейном тренде уровни динамического
ряда изменяются в арифметической прогрессии. Это значит, что при прогнозировании по линейному тренду предполагаются падающие темпы роста уровня временного ряда.
246
При К=2 получаем параболу второй степени: yˆ t  a0  a1t  a2 t 2 . Данная
функция рекомендуется для прогнозирования, если ряд характеризуется стабильным абсолютным ускорением, т. е. постоянными являются вторые разности (приросты абсолютных приростов). Убедимся в этом, подставив в уравнение параболы второй степени порядковые значения t:
t
yˆ t  a0  a1tyˆt a2at 02  a1t  a2 t 2


0
a0
-
-
1
2
3
4
5
a0  a1  a2
a1  a 2
-
a0  2a1  4a2
a1  3a 2
2a 2
a0  3a1  9a2
a1  5a 2
2a 2
a0  4a1  16a2
a1  7a 2
2a 2
a0  5a1  25a2
a1  9a 2
2a 2
Здесь a 0 - начальный уровень тренда при t = 0; a1 - средний абсолютный
прирост за рассматриваемый период времени, если t обозначить так, что  t  0 ;
a 2 - половина абсолютного ускорения динамического ряда.
Даже если тренд хорошо описывается параболой второй степени, то для
долгосрочного прогноза в экономике он, как правило, затруднителен (особенно
если а2 < 0).
Например, производство мяса в России за 1983-1995 гг. характеризовалось
уравнением параболы: yˆ  9,7133  0,159t  0,0817t 2 при t = 0 для 1989 г. Ошибка
аппроксимации (расхождений фактических данных y t от теоретических ŷ t ) составляла всего 3,3%. Однако исходя из этого уравнения тренда уже в 2000 г.
производство мяса представляет собой отрицательные величины ( ŷ t <0).
Соответственно тренд не может быть использован на дальнюю перспективу.
Парабола второй степени означает смену тенденции за рассматриваемый
период времени (рост сменяется падением или наоборот). Такое возможно, если
существенно изменились условия функционирования явления. Это, как правило, связано с новым этапом в развитии явления во времени. Предвидеть, что
этот этап продлится достать долго, весьма проблематично. Для краткосрочного
прогноза данная функция может иметь место.
Еще более проблематично использование в долгосрочном и несрочном
прогнозах параболы третьей степени: yˆ t  a0  a1t  a2 t 2  а3t 3 .
Формально этот вид тренда предполагает, что во временном ряду стабильны третьи разности (   ), т. е. приросты вторых приростов. Это означает, что по
ряду динамики тенденцию имеют абсолютные ускорения (вторые разности).
В этом случае ряд характеризуется тремя этапами развития (рост, спад и
опять рост), и при прогнозе на длительный период нет уверенности в правомерности и экстраполяции третьего периода. Кроме того, полиномы высоких
степеней требуют достаточно длинных динамических рядов, чтобы параметры
тренда были статистически надежными: на каждый параметр при t должно при-
247
ходиться не менее 6—7 временных единиц. Следовательно, парабола третьей
степени должна содержать ряд хотя бы в 20 лет, что предполагает достаточно
стабильную экономику.
Чаще отдают предпочтение функциям с меньшим числом параметров. Среди них широкое применение находит показательная кривая y  ab t . Эту функции рекомендуется использовать, если ряд динамики характеризуется стабильным темпом роста.
t
Коэффициент роста
y  ab t
1
2
3
4
5
b
b
b
b
ab
ab 2
ab 3
ab 4
ab 5
Следовательно, если за ряд лет динамика прибыли характеризуется уравнением вида: yˆ t  13,5  1,5t , где t = 1,2,..., то ежегодно прибыль возрастает в
среднем на 50% (коэффициент роста 1,5). Данное уравнение означает
геометрическую прогрессию уровней динамического ряда, что в экономике
возможно в сравнительно небольшой период времени (ограничены ресурсы,
меняются условия рынка). Поэтому данный вид тренда используется в основном в краткосрочных прогнозах.
Распространение в аналитическом выравнивании получили также гиперболы.
b
t
Равносторонняя гипербола имеет вид: y  a  .
Гиперболические кривые характеризуются наличием асимптоты, выше или
ниже которой признак не может принимать значения (верхняя или нижняя
асимптоты).
При наличии понижающейся тенденции уровней ряда гипербола для
прогноза предпочтительнее, чем, например, линейный тренд y  a  bt ,
ибо при увеличении значений t в уравнении линейного тренда возможно при
прогнозе на дальнюю перспективу получить у<0, а в гиперболе y = a + b/t величина у не может быть меньше параметра а.
Если b>0, то значения уровней динамического ряда снижаются во времени
и асимптотически приближаются к параметру а.
Если b<0, то уравнение тренда характеризует тенденцию к росту уровней
ряда с асимптотической границей, равной параметру а.
Например, численность мужчин старше трудоспособного возраста в СанктПетербурге за 1979-1995 гг. характеризовалась повышающейся тенденцией:
y  296,92  89,9 / t , из которой следует, что численность мужчин старше трудоспособного возраста за этот период не может превысить 296,9 тыс. человек.
Следует отметить, что этот максимум выдерживался для 1996 и 1997 гг., а в
248
1998 г. фактический уровень несколько превысил данную величину, составив
303,1 человек.
Оценивание параметров при подборе уравнений трендов
При использовании полиномов разных степеней оценка параметров производится по методу наименьших квадратов (МНК): строится система нормальных уравнений, число которых соответствует параметров полинома. Так, для
линейного тренда y  a  bt система нормальных уравнений следующая:
na  b t   y
,

2
a  t  b t   yt
в которой при машинной обработке t обычно обозначается 1, 2,..., п. При ручном способе счета t берется как отклонение от центра, т. е.  t  0 , что очень
удобно, ибо упрощается система нормальных уравнений. От того, как обозначен фактор времени t, зависит изменение значения параметра а.
Пример. Рассмотрим построение линейного тренда на следующем примере о просроченной задолженности по заработной плате за 9 месяцев 2000 г. по
Санкт-Петербургу (табл. 12.7).
9а  45b  3392,6

45а  285b  16565
а = 410,12; b = -6,63(3);
y = 410,12 – 6,63t при t = {1, 2, …, 9}.
Таблица 12.7. Расчет параметров линейного тренда
(млн. руб.)
Месяцы
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Итого
y
387,6
399,9
404,0
383,1
376,9
377,7
358,1
371,9
333,4
3392,6
t
1
2
3
4
5
6
7
8
9
45
t
2
1
4
9
16
25
36
49
64
81
285
yt
387,6
799,8
1212,0
1532,4
1884,5
2266,2
2506,7
2975,2
3000,6
16,565
* 2
*
(t )
-4
-3
-2
-1
0
1
2
3
4
0
16
9
4
1
0
1
4
9
16
60
t
*
yt
-1550,4
-1199,7
-808,0
-383,1
0
377,7
716,2
1115, 7
1333,6
-398
ŷ t
403,5
396,9
390,2
383,6
376,9
370,3
363,7
357,1
350,4
3392,6
Как видим, за 9 месяцев 2000 г. просроченная задолженность по заработной плате ежемесячно снижалась в среднем на 6,63 млн. руб., а расчетное значение просроченной задолженности за декабрь 2000 г. (т.е. при t = 0) составило 410,12 млн. руб. Соответственно точечный прогноз на октябрь составит: y П =
410,12 - 6,63 · 10 = 343,8 млн. руб. Фактически за октябрь просроченная задолженность составила 344,7 млн. Ошибка прогноза 0,3%.
249
Ту же величину прогноза получим, построив уравнение тренда с использованием обозначения дат с нулем в середине ( t * ). Так как  t *  0 , система нормальных уравнений примет вид:
na   y

* 2
*
b (t )   yt .
Откуда
y  y
a
n
yt
и b 
 (t )
*
* 2
.
В нашем примере имеем y = 3392,6 /9 = 376,9(5). Следовательно, а =
376,96, а параметр b = -398 / 60 = -6,63. Соответственно уравнение окажется
следующего вида:
y  376,96  6,63t * .
В данном уравнении изменилось лишь значение параметра а, который теперь фиксирует расчетное значение просроченной задолженности за май 2000
г., когда t * = 0. В предыдущем варианте уравнения на расчетное значение за май
составит: ŷ = 410,12 —6,63 · 5 = 376,6, ту же величину, что и параметр а во втором варианте уравнения тренда. Прогноз по уравнению y  376,96  6,63t * производим так же, подставив в него очередное по порядку значение t * = 5,
т. е. y П = 376,96-6,63 · 5 = 343,8.
В рассмотренном примере динамический ряд включал нечетное число
уровней (9). При четном числе уровней в ряду динамики центральными являются два уровня и за ноль для t * принимается середина между ними. Соответственно предыдущие временные даты принимают значения: -0,5; -1,5; -2,5 и т.
д., а последующие: 0,5; 1,5; 2,5 и т.д. Чтобы не работать с дробными значениями t * , их можно удвоить, т.е. использовать величины: -1, -3, -5 ... и 1, 3, 5, ...
Однако в этом случае параметр b будет характеризовать лишь половину
среднего абсолютного прироста и не совпадет с его величиной при обозначении
дат 1, 2, 3, ...
Предположим, что в рассмотренном примере были использованы при построении уравнения тренда также данные за октябрь (344,7). Тогда, обозначив
месяцы 1, 2..... 8, 9, 10, получим уравнение тренда: y = 409,94-6,58t, исходя из
которого делаем выводы по существу такие же, как и ранее: ежемесячно просроченная задолженность снижалась в среднем на 6,6 млн. руб., а расчетное
значение за декабрь 1999 г. составило 409,9 млн. руб., что достаточно близко
подходит к предыдущему расчету 410,1 млн. руб. Если же месяцы будут обозначены как -4,5; -3,5; -2,5; -1,5, - 0,5; 0,5; 1,5; 2,5; 3,5; 4,5, то уравнение
тренда будет иметь у = 373,73 - 6,58t. Как и ранее, изменилось только значение параметра а, который фиксирует среднее значение уровня за 10 месяцев.
Если же месяцы будут обозначены: -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, то уравнение
тренда будет иметь вид: y = 373,73-3,29t. Из него можно сделать вывод, что в
среднем за полмесяца задолженность снижалась на 3,29 млн. руб., т. е. за месяц
на 6,58 млн. руб., что и соответствует предыдущему уравнению тренда.
250
Как видим, от обозначения временных дат меняется интерпретация параметров уравнения тренда. Поэтому рядом с трендом необходимо указывать
обозначение фактора времени t. Изменение положения начала отсчета t в
уравнении параболы второй степени y  a  bt  ct 2 влияет не только на свободный член уравнения ( а ), но и на параметр b.
Пример. Затраты предприятия на рекламу составили по месяцам года (тыс.
руб.):
Месяц январь февраль март апрель май июнь июль август сентябрь
Затраты
2
9
4
7
8
16
62
16
77
Нетрудно увидеть, что по данному ряду фактически стабильными являются
приросты абсолютных приростов и тренд может быть выражен параболой
второй степени y  a  bt  ct 2 , расчет которой представлен в табл. 12.8.
Система нормальных уравнений для расчета параметров паpаболы составит:
na  b t  c t 2   y

2
3
a  t  b t  c  t   yt

2
3
4
2
a  t  b t  c t   yt
Таблица 12.8. Расчет параметров тренда: y  a  bt  ct 2
t
1
2
3
4
5
6
7
8
9
  45
y
2
9
24
47
78
116
162
216
277
931
t2
1
4
9
16
25
36
49
64
81
285
t3
t4
1
1
8
16
27
81
64
256
125
625
216 1296
343 2 401
512 4 096
729 6 561
2025 15333
yt
2
18
72
188
390
696
1134
1728
2493
6721
yt2
2
36
216
752
1950
4 176
7 938
13824
22437
51331


7
15
23
31
38
46
54
61
275
8
8
8
7
8
8
7
54
Исходя из итоговой строки табл. 12.8, для нашего примера данная система
предстанет в виде:
9a  45b  285c  931

45a  285b  2025c  6721
285a  2025b  15333c  51331.

Решая ее методом определителей, получим:  = 166 320,  a = 344 520,  b =
-695 448,  c = 642 240. Тогда параметры уравнения тренда окажутся равными:
a   a /   2,071 ; b   b /   4,181 ; c   c /   3,861 .
Соответственно уравнение тренда составит:
у = 2,071 - 4,181t + 3,861 t 2 ,
251
где а = 2,071 тыс. руб. - затраты на рекламу в декабре предыдущего когда t = 0;
с = 3,861 тыс. руб. - половина абсолютного ускорения по динамическому ряду,
т. е. средняя ежемесячная величина абсолютного ускорения составляет: 3,861 ·
2=7,72 тыс. руб., что соответствует данным последней графы табл. 12.8 (  
стабильны и среднее их значение равно 7,71 тыс. руб.). Параметр b в данном
случае экономической интерпретации не имеет.
Иной смысл приобретают параметры параболы второй степени при обозначении t с нулем в центре (табл. 12.9).
Система нормальных уравнений в этом случае упрощается, так как
t  t 3  0 :
na  c  t 2   y

2
b t   yt

2
4
2
a  t  c  t   yt .
Исходя из итоговой строки табл. 12.9, система нормальных уравнений составит:
9a  60c  931

60b  2066
60a  708c  7396.

Таблица 12.9. Упрошенный метод расчета параметров параболы второй
степени
t
y
yt
yt2
t2
t3
t4
2
-4
16
-8
256
32
1,7
9
-3
9
-27
81
81
9,2
24
-2
4
-48
16
96
24,3
47
-1
1
-47
1
47
47,1
78
0
0
0
0
0
77,7
116
1
1
116
1
116
116,1
162
2
4
324
16
648
162,0
216
3
9
648
81
1944 215,8
277
4
16
1108
256
4432 277,2
60
2066
708
7396
931
  931 0
Из этой системы сразу же определяется параметр b: b = 2066/60 = 34,43(3).
Его величина соответствует в данном случае (при  t  0 ) среднему абсолютному приросту уровней динамического ряда. Из табл. 12.8 следует, что

или, иначе:  
   275  34,375 ,
n
y n  y1 277  2

 34,375 .
n 1
8
8
Чтобы определить параметры а и с, решим систему
9a  60c  931

60a  708c  7396.
252
Откуда а = 77,701 и с = 3,861. Иными словами, уравнение тренда составит:
y = 77,701+34,433t + 3,861 t 2
Как видим, параметр с остался без перемен, а параметр а поменял свое значение. Его величина характеризует расчетное значение y при t = 0, т. е. при фактическом размере затрат в мае в 78 тыс. руб. расчетное значение исходя из параболы второй степени составило 77,7 тыс. руб. Не следует отождествлять величину параметра а со средним уровнем динамического рада, т. е. y . При параболе второй степени a  y в отличие от линейного тренда. Так, в рассматриваемом примере
y
 y  931  103,44 .
n
9
Величина параметра а при четном числе уровней динамического будет характеризовать срединное из двух центральных значение уровня динамического ряда при  t  0 .
Прогнозные значения определяются так же, как было показано для линейного тренда, т. е. путем подстановки следующего по порядку значения t. Так, на
октябрь затраты на рекламу составят:
y П  2,071  4,181  10  3,861  100  346,36 ,
или
y П  77,701  34,433  5  3,861  25  346,39 .
Аналогично определяются параметры и полиномов более высоких степеней.
Метод наименьших квадратов применим и для оценки параметров показательной функции y = ab' , так как эта функции путем логарифмирования приводятся к линейному виду:
lg y  lg a  t lg b .
Применяя метод наименьших квадратов, получим систему нормальных
уравнений:

n ln a  ln b t   ln y

2

ln a  t  ln b t   t ln y.
где t принимает значения 1, 2, … , n. Для этой функции также может быть применен упрощенный способ расчет, используя условие, что  t  0 , т.е. обозначая t также, как было показано в табл. 12.9.
Решая данную систему уравнений, находим параметры a и b.
В гиперболических функциях y  a 
b
параметры также оцениваются
t
с
помощью метода наименьших квадратов. Система нормальных уравнений составит:
1

na  b t   y


2
y
a 1  b  1  
,




t
t
t 
253
где t принимает значения 1, 2, ..., п. Обозначение t с нулем в центре для этой
функции неприменимо.
Контрольные вопросы
1. Что такое ряды динамики, и какова их роль в статистическом анализе?
2. Как решается вопрос о сопоставимости уровней динамического ряда?
3. Какие существуют виды рядов динамики?
4. Как исчисляется средний уровень для различных рядов?
5. Какие основные показатели рассчитываются для анализа динамических
рядов?
6. В чем суть аналитического выравнивания?
7. Как осуществляется прогнозирование по стационарному динамическому
ряду?
8. В чем принцип построения интервального прогноза?
Задачи и упражнения
1. Укажите, к какому виду относятся ряды, характеризующие размеры
(объемы) следующих социально-экономических явлений;
а) численность населения (по данным переписей населений);
б) протяженность автомобильных дорог с усовершенствованным покрытием
(по состоянию на конец каждого года);
в) объем реализованной продукции по кварталам года;
г) жилищный фонд (общая площадь на конец года);
д) удельный вес объема перевезенного железнодорожным транспортом груза в
общем объеме перевозок по годам;
е) средний размер дохода населения по годам;
ж) удельный вес городского и сельского населения региона;
з) среднемесячная (списочная) численность работников предприятия;
и) численность студентов (на конец учебного года);
к) объем инвестиций, вложенных в различные отрасли экономики;
л) количество дорожно-транспортных происшествий в регионе;
м) численность врачей на 1000 жителей района;
н) коэффициент текучести кадров на предприятии по месяцам;
о) число вкладов населения в учреждениях Сберегательного банка России;
п) удельный вес затрат на услуги связи в общем объеме затрат предприятий и
организаций, отдельных отраслей экономики;
р) удельный вес иностранных инвестиций в предприятия и организации транспорта и связи;
с) число приватизированных предприятий (объектов) транспорта.
2. Имеются следующие данные о росте производительности труда в отрасли (к 1994 г.):
Год
1995 1996 1997 1998 1999 2000
Коэффициент роста
1,29 1,37 1,48 1,58 1,64 1,77
Определить:
254
1) на сколько процентов возросла производительность труда в 2000 г. по сравнению с 1995 и 1999 гг.;
2) среднегодовой темп роста производительности труда за период 1995 - 2000
гг.
3. Производство основных товаров длительного пользования для населения
России характеризуется следующими данными (тыс. шт.):
Наименование товара 1995 г. 1996 г. 1997 г. 1998 г. 1999 г.
Телевизоры
1005
313
327
329
278
В том числе
цветного изображения 370
102
252
293
260
Холодильники и
морозильники
1789
1064 1186 1043 1168
Легковые автомобили 896
868
986
840
956
Фотоаппараты
296
217
143
60,1
81,2
Определите показатели динамики (цепные, базисные) производства каждого вида товара длительного пользования. Сопоставьте приведенные ряды динамики, используя среднегодовые показатели динамики. Сформулировать выводы.
4. Имеются следующие данные об удельных расходах условного топлива
на производство теплоэнергии (кг/Гкал) на ТЭЦ по годам:
Год
1992 1993 1994 1995 1996 1997 1998 1999 2000
Удельный расход 167,6 165,8 167,4 168,0 167,5 167,2 166,5 166,5 166,4
условного топлива,
кг/Гкал
Требуется:
1) произвести сглаживание ряда методом трехлетней скользящей средней;
2) произвести аналитическое выравнивание ряда по прямой;
3) методом экстраполяции определить уровни 2001 и 2002 гг.;
4) начертить график первичного и выровненного рядов.
5. Численность населения РФ на начало года характеризуется следующими
данными:
2001
146,3
2002
145,6
2003
145,0
2004
144,2
2005
143,5
Требуется, используя данные о численности населения и производстве товаров длительного пользования (задача 2):
а) построить ряды динамики выпуска каждого вида товаров на душу населения;
б) проанализировать динамику полученных показателей, исчислив коэффициенты опережения среднегодовых темпов прироста;
в) изобразить графически динамику выпуска каждого вида товаров на душу
населения.
255
6. Имеются следующие данные об активах коммерческого банка в одном из
регионов за 2004 г. на первое число каждого месяца (млн. руб.)
Январь Февраль Март Апрель Май Июнь Июль
189
190
205
226
208
195
190
Определите среднемесячные уровни активов коммерческого банка за первый, второй кварталы и за полугодие в целом.
7. Число вкладов населения в учреждениях Сберегательного банка России
по региону на начало года представлено в таблице:
Год
1997
1998
1999
2000
Число
вкладов, 141,0
203,7
210,9
234,2
млн.
Определить ежегодные абсолютные приросты, коэффициенты роста и темпы прироста числа вкладов с постоянной и переменной базой.
8. Имеются следующие данные по объединению о производстве промышленной продукции за 1998-2003 гг. в сопоставимых ценах (млн. руб.):
1998
1999
2000
2001
2002
2003
67,7
73,2
75,7
77,9
81,9
84,4
9. Для анализа ряда динамики определите:
а) средний уровень ряда динамики;
б) цепные и базисные темпы роста и прироста;
в) для каждого года абсолютное значение 1 % прироста. Результаты расчетов
изложите в табличной форме.
10. Известны темпы роста инвестиций по двум регионам (в % к 2001 г.):
Регион
2002
2003
2004
А
127
269
319
Б
123
208
273
Определить темпы роста инвестиций за каждый год по сравнению с предшествующим годом и среднегодовые темпы роста инвестиций для каждого региона. Сформулируйте вывод.
11. Имеются следующие данные о производстве молока в России за 1995 2000 гг. (млн. т):
1995
1996
1997
1998
1999
2000
39,2
35,8
34,1
33,3
32,3
32,3
Установите начальный, конечный и базисный уровни ряда динамики для
определения: а) среднего уровня ряда; б) цепных и базисных абсолютных приростов; в) цепных и базисных темпов роста.
Определите для каждого года абсолютное значение 1% прироста. Результаты расчетов изложите в табличной форме и сделайте выводы.
12. Имеются следующие данные о мощности электростанций региона (на
конец года, млн. кВт):
Год
Мощность
Цепные показатели динамики
256
1999
2000
2001
2002
2003
2004
электростанций абсолют- коэффици- темп абсолютное зна(на конец года), ный при- ент роста приросчение 1%
млн. кВт
рост, млн.
та, % прироста, млн.
кВт
кВт
21,8
1,2
2,2
0,22
1,038
1,075
1,95
Требуется исчислить отсутствующие в таблице сведения за 1999 - 2004 гг.,
а также определить, в каком периоде (в 1999 - 2001 гг. или в 2002 - 2004 гг.)
были более высокие абсолютный и относительный приросты мощности электростанций региона.
13. Ввод в действие жилых домов предприятиями всех форм собственности
в одном из регионов в 1996-2003 гг. характеризуется следующими данными
(млн. м2 общей площади):
1996 1997 1998
1999
2000 2001 2002 2003
17
18
19
20
21
20
22
23
Для анализа ряда динамики определите: цепные и базисные:
а) абсолютные приросты;
б) темпы роста;
в) темпы прироста;
г) среднегодовой темп прироста;
2) найдите для каждого года абсолютное значение 1% прироста;
3) в целом за весь период рассчитайте среднегодовой абсолютный прирост.
Результаты расчетов оформите в таблице и сделайте выводы.
14. Имеются следующие данные о приеме студентов в высшие учебные заведения России, тыс. чел.:
Цепные показатели динамики
Принято
студен- абсолютный темп
темп
абсолютное знаГод
тов,
прирост,
роста, прироста, чение 1% приротыс. чел. тыс. чел.
%
%
ста, тыс. чел.
1996
2791
146
1997
106,2
1998
9,5
1999
2000
475
35,98
Требуется: исчислить отсутствующие в таблице сведения о приеме студентов за 1996 - 2000 гг.; проанализировать динамику изучаемого явления, опираясь на рассчитанные показатели динамики.
15. В таблице представлены данные о пассажирообороте автобусного
транспорта региона.
257
Год
Цепные показатели динамики
абсолютный коэфтемп
абсолютное
Пассажирооборот, прирост,
фиприро- значение 1%
млрд. пасс.-км млрд. пасс.- циент
ста,
прироста,
км
роста
%
млрд. пасс.-км
360,2
14,5
1,037
1996
1997
1998
1999
2000
10,8
4,018
Определить недостающие уровни и цепные показатели динамики.
16. Производство электроэнергии в регионе в 1996-2003 гг. характеризуется следующими данными (млрд. кВт • ч):
1996 1997 1998 1999 2000 2001 2002 2003
915 976 1038 1111 1150 1202 1239 1294
Для анализа ряда динамики 1) определите показатели, характеризующие
динамику производства электроэнергии по годам к базисному 1996 г.: а) темпы
роста; б) темпы прироста; в) абсолютные приросты;
2) рассчитайте для каждого года абсолютное значение 1% прироста. Результаты
расчетов изложите в табличной форме и сделайте выводы.
17. По группе предприятий имеются следующие данные:
№ предприятия
Удельный вес в общем
Прирост объема произобъеме продукции в
водства продукции пропрошлом году, %
тив прошлого года, %
1
30,5
7,3
2
24,3
10,5
3
45,2
18,4
Определить удельные веса предприятий в общем объеме продукции в отчетном году.
18. Приведены следующие данные (табл. 6.42).
Год
2001 2002 2003 2004
Уровень ряда
15
22
Определить неизвестные уровни, предполагая их линейное изменение.
19. Среднее расстояние перевозки грузов в международном сообщении по
годам характеризуется следующими данными:
Год
1996 1997 1998 1999 2000
Среднее расстояние 512
255
223
210
185
перевозки, км
Произвести аналитическое выравнивание с последующей экстраполяцией
для 2001 г.
20. Удельный вес городского населения региона увеличился с 1 января
2000 г. по 1 января 2004 г. с 39,5 до 46,7%. Определить показатели динамики
258
численности городского и сельского населения региона, если общая численность населения данного региона за этот период уменьшилась на 2,3%.
21. Поступление денежных средств от реализации продукции, работ и
услуг за отчетный год по предприятию следующее:
Месяц
Фактически поступило
Месяц Фактически поступило на
на расчетный счет, млн. руб.
Расчетный счет, млн. руб.
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Декабрь
15,2
14,8
14,5
16,0
16,7
15,4
16,1
17,3
16,9
15,8
17,5
18,0
Требуется:
1) определить начальный, конечный и средний уровень ряда динамики;
2) построить ряд динамики с нарастающими итогами по кварталам года;
3) определить среднемесячный уровень поступления денежных средств за каждый квартал.
22. На 1 марта в списке предприятия «Звезда» числилось 33 человека; с 13
марта были приняты на работу 4 человека, а с 21 марта были уволены по собственному желанию 2 человека. С 23 марта на предприятие были приняты 3 человека.
На предприятии «Радуга» на 1 марта числилось 22 человека; с 15 марта
были приняты на работу 5 человек, а с 24 марта уволилось 4 человека.
Требуется:
1) определить, на каком предприятии и насколько среднесписочная численность в мартее была больше (в абсолютном выражении и в процентах);
2) изобразить динамику численности работников каждого предприятия с помощью линейной диаграммы.
23. Имеются следующие данные об объеме производства продукции пищевой промышленности (млн. руб.):
2000
2001
2002
2003
2004
526792,6 687370,6 824797,9 829766,3 1219023,6
Определить среднегодовой темп роста и темп прироста объема производства.
24. Погрузка вагонов по отделению дороги характеризуется следующими
данными за апрель отчетного года:
Числа
Погружено
Числа
Погружено
Числа
Погружено
месяца
вагонов
месяца
вагонов
месяца
вагонов
1
2
3
4
218
190
105
185
11
12
13
14
210
184
200
163
21
22
23
24
203
195
214
177
259
5
6
7
8
9
10
200
170
175
98
208
164
15
16
17
18
19
20
112
174
103
170
188
152
25
26
27
28
29
30
209
197
169
181
170
210
Требуется:
1) для погашения колебаний и выявления основной тенденции роста числа погруженных вагонов произвести сглаживание динамического ряда с помощью
трехчленной скользящей средней;
2) объяснить полученные результаты.
25. Стоимость основных средств на предприятии за отчетный год составила (млн. руб.):
на 1 января – 3,7;
на 1 апреля -4,2;
на 1 июля – 3,5;
на 1 октября – 4,1;
на 1 января (следующего года) – 4,4.
Определить среднегодовую стоимость основных средств предприятия и величину 1% прироста за год.
26. Остаток средств на расчетном счете предприятия составил на 1 ноября
2004 г. 116 тыс. руб.; 12 ноября поступило на расчетный счет 314 тыс. руб.; 20
ноября списано с расчетного счета 210 тыс. руб.; 26 ноября поступило на расчетный счет 422 тыс. руб. С 28 января до конца месяца остаток средств на расчетном счету не изменился. Определить среднесуточный остаток средств на
расчетном счете предприятия в ноябре.
27. Имеются следующие данные о ежесуточной добыче угля по шахте за
первую декаду:
День
1
2 3 4 5 6 7 8 9 10
Добыча угля, т 800 790 804 808 805 810 800 817 820 832
Произвести сглаживание ряда методом трехчленной скользящей средней.
Начертить график первичного и сглаженного рядов.
28. Производство цемента в регионе характеризуется следующими данными:
Год
Производство
цемента, млн. т
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
64
72
80
84
86
90
95
100 104 109
Требуется:
1) провести аналитическое выравнивание по прямой и использовать полученное уравнение для экстраполяции уровней 2001 и 2002 гг.;
260
2) построить график первичного и выровненного рядов.
29. Имеются следующие данные о динамике браков и разводов в N-м городе:
Показатель 1996 1997 1998 1999 2000 2001 2002
Браки
74,1 75,3 69,7 61,1 49,2 45,1 39,7
Разводы
15,0 11,8 10,5
7,6
7,3
6,7
6,6
Определите:
а) среднегодовые уровни браков и разводов;
б) цепные и базисные абсолютные приросты;
в) ценные и базисные темпы роста и прироста;
г) средний: абсолютный прирост, темп роста и прироста;
д) коэффициент опережения браков над разводами. Результаты расчетов изложите в таблице и сделайте выводы.
30. Приведите уровни следующего ряда динамики, характеризующие численность работников фирмы, к сопоставимо виду:
(млрд. руб.)
1995 1996 1997 1998 1999 2000 2001 2002 2003
На 1 января Сред- 420 429 427 431
негодовая численность рабочих
435 442 450 460 465 475
31. Объем выполненных строительно-монтажных работ по строительной
фирме до и после ее расширения характеризуете следующими данными (тыс.
м2):
Объем
строи- 1997 1998 1999 2000 2001 2002 2003
тельно-монтажных работ
До расширения
фирмы
255
260
264
268
После расширения фирмы
290
296
299
304
Установите причины несопоставимости уровней ряда динамики. Приведите уровни ряда к сопоставимому виду. Изобразите динамику объема выполненных работ линейной диаграммой.
32. Производство продуктов земледелия в России характеризуется следующими данными (млн. т):
Год Сахарная Овощи Картофель Льноволокно
свекла
1990
33,2
11,2
35,9
124
1991
24,3
10,4
34,3
102
1992
25,5
10,0
38,3
78
1993
25,5
9,8
37,7
58
261
1994
1995
1996
1997
1998
1999
2000
13,9
19,1
16,2
13,9
10,8
15,2
14,1
9,6
11,3
10,7
11,1
10,5
12,3
12,5
33,8
39,9
38,7
37,0
31,4
31,3
34,0
54
69
59
23
34
24
51
Для изучения общей тенденции производства продуктов земледелия произведите:
а) сглаживание уровней рядов динамики с помощью трехчленной скользящей
средней;
б) аналитическое выравнивание. Выразите общую тенденцию развития каждого
вида продуктов земледелия за 1990—2000 гг. соответствующими математическими уравнениями. Определите выровненные (теоретические) уровни рядов
динамики и нанесите на график с фактическими данными. Сделайте выводы по
результатам расчетов.
33. Известны следующие данные о производстве тканей в регионе (млн.
2
м ):
Год
Ткани
шелковые
хлопчатобумажные шерстяные
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
1,14
1,51
1,60
1,65
1,69
1,73
1,77
1,81
1,82
1,90
6,15
6,63
6,78
6,81
6,97
6,97
7,07
7,17
7,15
7,30
0,64
0,74
0,76
0,77
0,78
0,77
0,76
0 77
0 74
0,70
Для изучения общей тенденции производства тканей в регионе: а) рассчитайте средний абсолютный прирост и темп роста; б) произведите аналитическое
выравнивание каждого вида тканей по соответствующим математическим
уравнениям. Сделайте выводы по результатам работы.
34. По данным таблицы задачи 33 о производстве тканей в регионе за
1994—2003 гг. произведите экстраполяцию и ближайшие годы на основе: а)
среднего абсолютного прирост среднего темпа роста; б) аналитического выравнивания уровня ряда динамики. Сравните полученные результаты и выберите
наилучший прогноз.
262
13. Индексы
13.1. Индексный метод
Необходимость разработки индексного метода исторически обусловлена
потребностями общества в учете и анализе динамики цен. При этом невозможно использовать обобщающие суммарные или средние показатели, так как
на потребительском рынке реализуются совершенно различные товары - продукты питания, одежда, мебель, транспортные средства, недвижимость. Нельзя
рассчитать и среднюю цену только продуктов питания, по крайней мере, из-за
различных единиц измерения (килограммы, десятки, штуки, литры). Даже если
рассматривать только продукты питания, измеряемые в килограммах, то любому человеку понятно, что «средняя цена 1 кг еды» — очень абстрактная категория, объединяющая мясо, рыбу, масло, картофель и другие совершенно различ-
Download