23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ 23.1. Методологические рекомендации по проведению выборочных обследований 1. Общие положения Широкое распространение новых экономических отношений, уход от системы централизованного планирования и распределения, рост негосударственного сектора экономики привели к тому, что статистические органы республики стали испытывать значительные трудности при сборе необходимой информации. Традиционно применявшиеся методы сплошного статистического наблюдения в силу ряда причин существенно снизили свою эффективность. Это обусловило необходимость освоения и дальнейшего применения методов выборочных обследований. Концепция перехода от методов сплошного статистического учета к методам выборочных обследований, утвержденная постановлением коллегии Нацстакома Кыргызской Республики от 4 сентября 2000г. №33, предполагает широкое внедрение выборочных обследований в практику органов статистики Кыргызской Республики. Настоящие рекомендации подготовлены в соответствии с Программой развития статистики в Кыргызской Республике, утвержденной постановлением Правительства Кыргызской Республики от 11 декабря 2000г. №731, и определяют порядок и методологические основы организации и проведения выборочных обследований, проводимых статистическими органами республики. 1.1. Предмет выборочных обследований Предметом выборочных обследований являются различные статистические совокупности, исследование которых связано с количественной характеристикой и выявлением присущих им закономерностей. 1.2. Цели и задачи Основной целью является создание оперативной комплексной системы выборочных обследований, как основы получения достоверных, научно-обоснованных статистических данных. Основные задачи, которые предстоит решить для достижения поставленной цели, подразделяются на следующие: определение оптимальных подходов получения репрезентативных показателей по различным отраслям экономики, разработка для отраслевых отделов методологических материалов и рекомендаций по подготовке генеральной совокупности для отбора единиц обследования, разработка методологии и программного обеспечения распространения данных выборочных обследований на обследуемую генеральную совокупность. 814 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ 1.3. Нормативно-правовая база Закон Кыргызской Республики от 26 марта 2007 года №40 «О государственной статистике»; Программа статистических работ; Программа развития статистики Кыргызской Республики на 2001-2005 года, утвержденная постановлением Правительства Кыргызской Республики от 11 декабря 2000 года .№731. 1.4. Система классификации и кодирования При проведении выборочных обследований используются следующие классификаторы: Государственный классификатор Кыргызской Республики «Виды экономической деятельности» (ГКЭД); Государственный классификатор Система обозначений объектов административнотерриториальных и территориальных единиц Кыргызской (СОАТЕ); Государственный классификатор Кыргызской Республики органов управления (ГКОУ); Государственный классификатор Кыргызской Республики форм собственности (ГКФС); Государственный классификатор Кыргызской Республики организационно-правовых форм хозяйствующих субъектов (ГКОПФ); Классификатор типов предприятий (КТП). 1.5. Основные понятия Статистическое исследование представляет собой процесс изучения социальноэкономических объектов и явлений на основе статистических методов и систем статистических показателей. Статистическое наблюдение – стадия статистического исследования, представляющая собой организованный по единой программе сбор данных о социальноэкономических явлениях, процессах, их характеристик путем регистрации их существенных признаков с целью получения первичной статистической информации. Генеральная совокупность – это множество объектов или явлений, объединенных общими признаками и подвергающихся статистическому исследованию. Выборочная совокупность (выборка) – это часть генеральной совокупности, подвергающаяся статистическому наблюдению, по результатам которого определяются характеристики генеральной совокупности. Ошибки выборки – различия характеристик генеральной совокупности и значений, полученных при распространении характеристик выборки на генеральную совокупность. Простой случайный отбор – способ выбора элементов генеральной совокупности, подлежащих статистическому наблюдению, когда любые два элемента имеют равные шансы быть выбранными. Расслоенный (типизированный) случайный отбор – способ выбора элементов генеральной совокупности, подлежащих статистическому наблюдению, предусматривающий предварительное разделение генеральной совокупности на слои, внутри которых применяется простой случайный отбор. Смысл расслоения генеральной совокупности 815 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ состоит в получении нескольких внутренне однородных слоев, когда характеристики объектов внутри слоя мало изменяются. Это позволяет при минимальных дополнительных затратах уменьшить ошибки выборки. Кластерный (групповой) отбор – способ выбора элементов генеральной совокупности, подлежащих статистическому наблюдению, когда единицей отбора является группа (кластер) элементов генеральной совокупности. Примером кластерного отбора является обследование всех квартир дома, попавшего в выборку. Предпосылками его применения является отсутствие полного списка элементов генеральной совокупности, либо экономические соображения, требующие крупных единиц отбора. Многоступенчатый отбор – способ выбора элементов генеральной совокупности, подлежащих статистическому наблюдению, когда применяется комбинация кластерного и других методов отбора. Например, обследование не всех квартир попавшего в выборку дома, как при кластерном отборе, а отобрать далее часть квартир (двухступенчатый отбор). Под выборочным обследованием понимается комплекс мероприятий по организации и проведению статистического исследования, включающий: определение генеральной совокупности изучаемых объектов, его параметров и характеристик; создание основы выборки и выборочной совокупности; статистическое наблюдение объектов выборочной совокупности; обработка полученной информации; научно-обоснованное распространение характеристик выборки на генеральную совокупность; анализ полученных результатов. Основными подлежащими определению характеристиками генеральной совокупности обычно являются следующие: суммарное значение признака (например, общий объем производства вида продукции предприятиями отрасли); среднее значение признака (например, среднедушевое потребления некоторого продукта); доля объектов в генеральной совокупности, объединенных некоторым общим условием (например, процент безработных среди трудоспособного населения); отношение двух суммарных или средних значений признака (например, отношение прибыли к объему инвестиций, определение темпа роста в сравнении с предыдущим периодом). 2. Методические рекомендации по распространению характеристик выборки на генеральную совокупность 2.1. Формулы распространения Далее приводятся формулы распространения основных характеристик для различных способов отбора, использующие следующие обозначения: i - номер элемента выборки, yi - значение признака y для i-го элемента выборки, N - объем (количество элементов) генеральной совокупности, n - объем (количество элементов) выборки. 816 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Также приводятся формулы для расчета двух других важнейших характеристик: дисперсии, отражающей меру изменчивости измеряемой величины, и стандартной ошибки, характеризующей точность определения измеряемой величины. 2.1.1. Формулы распространения на генеральную совокупность при простом случайном отборе Характеристика Среднее значение Суммарное значение Доля Оценка суммы по отношению, Х - сумма прошлого периода, R=Y/X Формула y Y p Дисперсия оценки n 1 yi n i 1 N n s2 1 ( yi y) 2 n 1 i 1 n y i 1 s.e.( y ) s2 = p (1- p) s.e.(Y ) i i s.e.( y ) s.e.(Y ) i 1 n yi n i 1 y Y x Стандартная ошибка n X y i i 2 i s (1 n ) N n Ns n (1 n ) N s (1 n ) N n N (1 n ) N n 2 R yi xi R 2 xi2 Пример расчета 1 (данные условные): Обследуются крестьянские (фермерские) хозяйства поселка по производству молока. По данным сельскохозяйственного регистра в поселке в крестьянских (фермерских) хозяйствах содержатся 3000 коров. Методом случайного отбора для опроса в выборку попали пять хозяйств: № хозяйства Кол-во Кол-во коров в хозяйстве доящихся коров Надоено от всех доящихся коров, л/день 1 5 2 14 2 1 1 6 3 3 2 8 4 6 3 18 5 2 1 8 Для определения среднего количество молока, получаемого с 1 доящейся коровы в день, необходимо определить: общий по выборке объем надоенного молока ( 14+6+8+18+8 = 54 ), общее число доящихся коров попавших в выборку ( 2+1+2+3+1 = 9 ), разделить согласно формуле: y 54 / 9 6 литров Для оценки дисперсии среднего надоя определяется средний надой по каждому хозяйству (см. правый столбец). Далее согласно формуле рассчитывается оценка дисперсии среднего, причем если, в хозяйстве обследовалось несколько коров, то в формулу соответствующие разности включаются столько раз, сколько коров обследовалось. s 2 ((7 6) 2 (7 6) 2 (6 6) 2 (4 6) 2 (4 6) 2 (6 6) 2 * 3 (8 6) 2 ) /(9 1) 1,75 817 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Значение стандартной ошибки: s.e.( y ) 1.75 0,441 литров 9 Истинное значение среднего удоя находится в пределах от 6-1,96*0,441=5,136 до 6+1,96*0,441=6,864 литра с вероятностью 95 процентов (см. подробнее пункт 2.2). Относительная погрешность (при уровне доверия 95 процентов) составляет 1,96*0,441 / 6 = 0,864 / 6 = 14,4 процента. При оценке производства молока в крестьянских (фермерских) хозяйствах поселка учитывается коэффициент доящихся коров k = 9/17 = 0,5294. Суточное производство молока в поселке составит: Yˆ k * N * y =0,5294*3000*6=9529,4 литров в день Для оценки производства молока за определенный период необходимо суточное производство умножить на период, учитывая коэффициент дней. Погрешность определения суммарного производства молока (при уровне доверия 95 процентов) составляет 14,4 процента. 2.1.2. Определение доли Определение доли p (процентного содержания) можно трактовать как определение среднего значения. Каждый элемент генеральной совокупности можно характеризовать одним из двух значений, если элемент принадлежит рассматриваемому подмножеству генеральной совокупности (например, безработные в общем числе трудоспособного населения), тогда значение признака yi полагается равным 1, иначе – 0. При этом выражение для дисперсии оценки принимает особенно простой вид: p*(1-p). Пример расчета 2 (данные условные). В результате обследования 3600 человек доля безработных составила 10 процентов опрошенных (или p = 0.1). Дисперсия p равна 0,1*0,9 = 0,09, а корень из дисперсии равен 0,3. Стандартная ошибка вычисляется следующим образом: s.e.( p) 0.3 3600 0,005 . Таким образом, доля безработных в генеральной совокупности с вероятностью 67 процентов больше, чем 0,1-0,005 = 0,095 и меньше, чем 0,1+0,005 = 0,105. 2.2. Стандартная ошибка выборки, ее практический смысл Интуитивно ясно, что с увеличением размера выборки точность получаемых результатов возрастает. Также очевидно, что получаемые результаты имеют случайную основу и зависят от того, какие именно элементы попали в выборку - при различных выборках мы получим различные результаты. При решении практических задач, когда размер выборки достаточно велик (превосходит 30-40 случаев), получаемые значения параметра подчиняются строгой математической закономерности, известной как Центральная предельная теорема. Ее следствием является то, что: 818 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ для 68 процентов всех возможных выборок (данного размера) получаемые выборочным методом значения будут отличаться от (истинного) значения меньше, чем на величину стандартной ошибки; для 95 процентов всех возможных выборок получаемые выборочным методом значения будут отличаться от искомого меньше, чем на две величины стандартной ошибки; для 99,7 процента всех возможных выборок (то есть почти для всех) получаемые выборочным методом значения будут отличаться от искомого значения меньше, чем на три величины стандартной ошибки. Таким образом, результаты Примера 1 можно трактовать следующим образом. Средний удой доящихся коров в поселке отличается от полученного выборочным методом на 1,14 литра с вероятностью 95 процентов, то есть лежит в интервале от 4,86 до 7,14 литра. Средний удой доящихся коров в поселке отличается от полученного выборочным методом на 0,583 литров с вероятностью 67 процентов. Последний интервал y ± s.e.( y ) часто называют стандартным доверительным интервалом. 2.3. Формулы распространения на генеральную совокупность при расслоенном отборе Характеристика Формула y Среднее значение (доля) 1 N Стандартная ошибка L N h 1 h yh s.e.( y ) L Y Yh Суммарное значение 1 N2 L N h2 (1 h 1 nh s h2 ) N h nh s.e.(Y ) N s.e.( y ) h 1 Где L - число слоев, h - номер слоя, Nh - объем h-го слоя генеральной совокупности, nh - объем h-го слоя выборки, yh - среднее значение в слое по выборке, Yh - суммарное значение в слое по выборке, sh - оценка дисперсии h-го слоя: Sh 2 1 nh ( y hi y h ) 2 . n h 1 i 1 В отличие от простого случайного отбора при расслоенном отборе используется дополнительная информация о генеральной совокупности. При расслоении элементы генеральной совокупности группируются так, чтобы дисперсии внутри этих групп (слоев) были небольшими. В то же время предпочтительно, чтобы средние значения определяемого параметра в этих слоях различались друг от друга, насколько это возможно. При этом все элементы одного слоя должны иметь равную вероятность попасть в выборку. Пример расчета 3 (данные условные). При определении посевных площадей под зерновые культуры по району крестьянские (фермерские) хозяйства были разбиты на два слоя: малоземельные и крупноземельные хозяйства. В первом слое состоит N1 = 800 хозяйств, во втором N2 = 200 хозяйств. В выборку попало из первого слоя 40 хозяйств, которые засеяли зерновыми 80 га, и из второго слоя 40 хозяйств, которые засеяли зерновыми 600га. Определим посевные площади под зерновые культуры по району. 819 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Площадь под зерновые культуры по району рассчитывается следующим образом. В первом слое на одно хозяйство приходится в среднем 80:40=2 га отведенной под зерновые культуры пашни. Всего на 800 хозяйств первого слоя, соответственно, 800*2=1600 га, отведенных под зерновые. Во втором слое в среднем на одно хозяйство приходится 600:40=15 га отведенной под зерновые культуры пашни. На 200 хозяйств второго слоя приходится 200*15=3000 га. В целом по району под зерновые культуры отведено 1600 га + 3000 га = 4600 га. Для сравнения произведем те же расчеты без учета расслоения. Имеем N=1000 крестьянских (фермерских) хозяйств в районе. В выборку попало 80 хозяйств, в которых по данным обследования отведено под зерновые культуры 680 га. В среднем на каждое обследованное хозяйство под зерновые отведено 680:80=8,5 га. В целом по району под зерновые культуры отведено 1000*8,5=8500 га. Такое значительное смещение объясняется тем, что в выборке доля крупных хозяйств, специализирующихся на производстве зерновых значительно завышена. Приведенный пример наглядно доказывает, что применение расслоения приводит к более точным результатам, так как взвешивание средних показателей в слое производится на величину слоя. 2.4. Формулы распространения на генеральную совокупность при групповом (кластерном) отборе Характеристика Формула Стандартная ошибка s.e.( y) Среднее значение m Суммарное значение T ti M N (1 m m 1 ) (t i t ) 2 M m(m 1) i 1 s.e.(T ) N s.e.(t ) ∙ M /m i 1 Где M - число кластеров (групп) в генеральной совокупности, i - номер кластера, m - число обследуемых кластеров, ti - суммарное значение в кластере. Пример расчета 4 (данные условные). Предположим, определяется объем перевозок гужевым транспортом, оказывающим услуги населению по перевозкам на рынках г. Ош. Имеем 6 рынков, на которых пользуются услугами гужевого транспорта. В обследование попало 2 рынка. Сплошному обследованию подверглись все лица, оказывающие услуги по перевозкам гужевым транспортом на рынках, попавших в выборку. Рынок А. № п/п Всего Рынок Б. Перевезено в день, т/км № п/п Всего 2,64 Перевезено в день, т/км 6,65 1 0,14 1 0,10 2 0,15 2 0,27 3 0,67 3 0,12 4 1,26 4 0,99 5 0,42 5 1,50 6 1,80 7 1,74 8 0,43 820 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Оценим количество работающих на 6 рынках, используя данные выборочного обследования двух рынков. Y 6 (5 8) 39 человек 2 Аналогично оцениваем объем перевозок V 6 (2,64 6,65) 27,87 тонн-км 2 Таким образом, умножая на 30 дней, оценим месячный объем перевозок как 836,1 тонно-километров. 2.5. Оценки отношения Помимо методов расслоенного отбора, способов оптимизации размеров и эффективности выборки, рассматриваемых в пункте 2.6, существуют иные методы, позволяющие иногда очень сильно уменьшить величину стандартной ошибки. Наиболее простая из них - оценка отношения. Оценка отношения базируется на составлении пропорции. Например, если известны две величины Х и У за некоторый период, причем известно, что они ведут себя одинаково, то по известным данным У1 за некоторый другой период можно оценить неизвестное значение параметра Х1 (за другой период) из соотношения: X X1 . Y Y1 Обозначив R = X/Y, имеем оценку X1=R * Y1. Оценка отношения дает существенный эффект снижения ошибок выборки, если две характеристики ведут себя примерно сходным образом, например, общее количество отработанного времени и объем заработной платы. При определении темпов роста по отношению к данным предыдущего периода, когда изменчивость характеристик почти одинакова (коэффициент корреляции 0,5 и больше), использование оценки отношения приводит к снижению ошибки выборки в 3-10 раз по сравнению с методами простого случайного отбора. Формула расчета ошибки выборки для оценки отношения достаточно громоздка. Пример расчета 5 (данные условные). Предположим, все фирмы-импортеры автошин отчитались по итогам прошлого года. Для определения объемов импорта автошин за следующее полугодие проведено выборочное обследование 20 фирм. По отчетным данным, в республике имеется 100 фирм-импортеров, которые ввезли автошин в прошедшем году на сумму в 22 млн. долларов. Двадцать фирм, попавших в выборку, импортировали за 6 месяцев автошин на сумму в 2,5 млн. долларов, как показано ниже в таблице. 821 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ (млн.долларов) За год (yi) За 6 месяцев (xi) xi yi Фирма 1 0,448 0,265 0,119 Фирма 2 0,776 0,392 0,304 Фирма 20 0,395 0,190 0,075 4,50 2,50 0,6886 0,225 0,125 1,3169 0,3755 Итого В среднем на предприятие Сумма квадратов ( y 2 i ) Оценка отношения. По данным предприятиям, попавших в выборку объем импорта за прошедший год составил X = 4.5 млн. долларов, а 6 месяцев – Y = 2,5 млн. долларов, R = (2,5/4,5) = 5/9. Объем импорта всеми предприятиями за прошедший год составил Х1 = 22 млн.долларов. Тогда i yi Y1 X 1 = RX1 = 5/9 * 22 млн. долл. = 12,222 млн. долл. xi i Оценим точность полученного результата. Величина стандартной ошибки, учитывая y =1,3169, yi2 =0,3755, yi2 =0,6886, равна 2 i s.e.(Y ) N n (1 n ) N y 2 i 2 R y i x i R 2 x i2 5 0,8 1,308 ... 0,1667 млн. долл. Стандартный доверительный интервал для объема импорта шин равен среднему значению плюс (минус) величина стандартной ошибки: 12,056 – 12,389 млн. долларов. Простой случайный отбор. Имеем, N = 100, распространения) общий объем импорта автошин равен n = 20, тогда (см. формулы Y = (N/n) yi = (100/20) * 2,5 = 12,5 млн. долларов. Оценим точность полученного результата. Среднее значение объемов импорта на одно предприятие равно 0,125 млн. долларов. Дисперсия среднего значения равна s2 1 n ( yi 0,125) 2 =0,003318. 20 1 i 1 Величина стандартной ошибки Ns s.e.(Y ) (1 n ) = 1,152 млн. долларов. N n Стандартный доверительный интервал 11,348 - 13,652 млн. долларов. Ошибка оценки отношения, равная 0,1667 млн. долларов, меньше полученной в 6,91 раза. Основной причиной этого является высокая корреляция (равная, в данном случае, 0,923) между значениями импорта в рассматриваемые периоды. Заметим, что оценка отношения является смещенной, и ее применение рекомендуется только при достаточно крупных выборках, когда смещением можно пренебречь. Например, выборка из 100 человек сгруппирована по полу, местности проживания (город-село) и пяти возрастным группам, итого 20 групп. Средний размер группы всего 5 человек. В этом случае возможное накопление смещений может привести к большой ошибке выборки, и применение оценки отношения неправомерно. 822 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ 2.6. Определение размера выборки Один из основных вопросов, который приходится решать при организации выборочных обследований - это размер выборки. Слишком большая выборка влечет большие расходы, маленькая – неэффективна из-за невысокой точности результатов. Поэтому определение размера выборки является поиском компромисса между точностью и экономической эффективностью обследования. Определение размера выборки требует предварительного определения способа отбора и, соответственно, формулы стандартной ошибки. Опираясь на максимально допустимое значение ошибки выборки, необходимо из формулы стандартной ошибки оценить размер выборки. Пример расчета 6 (данные условные): Требуется определить долю p безработных лиц трудоспособного возраста. Из данных предыдущего обследования (экспертной оценки) известно, что p ≈ 0,1. Требуемая величина стандартной ошибки, предположим, 0,01. Размер генеральной совокупности (лиц трудоспособного возраста) примерно N = 1000000 человек Получим значение дисперсии s2(p) = p (1-p) = 0,09 или s = 0,3. Из формулы стандартной ошибки имеем, s.e.( y ) Подставляя значения, получаем: 0,01 s n (1 n ) . N 0,3 (1 n ). 1000000 n Проверено, что второй корень при n ≈ 1000 почти равен 1, и его можно из равенства исключить. Тогда имеем уравнение: n 0,3 0,01 30 . Отсюда n = 900. Аналогично определяется размер выборки для других видов отбора. 2.7. Распределение стратифицированной выборки по слоям При стратифицированной выборке возникает проблема распределения выборочной совокупности в слое. Для определения изменчивости показателей необходимо присутствие не менее двух наблюдений в слое. Однако, на практике размер выборки значительно больше двух наблюдений на слой. При распределении выборки по слоям учитываются два важных критерия: удобство. Выбирается способ, наиболее легкий для применения, что приводит к использованию пропорционально расслоенного выбора; точность. Выбирается способ, дающий наименьшую среднюю квадратическую ошибку, что приводит к использованию оптимального распределения. 2.7.1. Пропорционально расслоенный выбор Обычной практикой для пропорционально расслоенного выбора является отбор единиц из каждого слоя в равной пропорции. В этом случае, выборочная доля во всех слоях одинакова, а количество отобранных единиц различно и зависит от размера слоя. Оценки характеристик для пропорционально расслоенного выбора аналогичны оценкам простого случайного выбора. В данном случае, слои не принимаются во внимание, так как отношение Nh N постоянно для всех слоев и равно . Применение пропорционального отбора n nh 823 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ N - величина, обратная n вероятности, является постоянной для всех слоев, и данные выборки можно складывать до применения фактора взвешивания. Выборка, обладающая таким свойством, является самовзвешивающейся. отличается простой процедурой взвешивания, так как вес w Формулы, используемые при пропорциональном отборе Характеристика Формула Размер выборки в слое nh Nh *n N Среднее значение y 1 n yi n i 1 Суммарное значение Y N n Дисперсия оценки N n n N h * S h2 S ( y) N N * n i 1 2 N n n S 2 (Yˆ ) N h * S h2 n i 1 n yi i 1 Стандартная ошибка s.e.( y ) s.e.(Y ) s (1 n ) N n Ns (1 n ) N n Пример расчета 7 (данные условные): Предположим, что 36258 предприятий распределены по слоям по объему производства (см. таблицу ниже). Необходимо произвести выборку 1000 предприятий пропорционально количеству, N=36258, n=1000. Используя формулу пропорционального отбора nh n1 Слой Nh * n , имеем N 30964 4756 538 * 1000 854 , n2 * 1000 131 , n3 * 1000 15 . 36258 36258 36258 Объем производства Кол-во предприятий Итого Средний объем производства на слой Стандартное отклонение Объем выборки 36258 571,2 менее 1000 30964 203,8 300 854 2 1000-4999 4756 1779,6 1200 131 3 5000 и более 538 11029,7 9000 15 1 1000 Дисперсия рассчитывается по формуле: N n n N h * S h2 36258 1000 30964 * (300) 2 4756 * (1200) 2 538 * (9000) 2 N 36258 * 1000 * N * n i 1 36258 35258 53213400000 * 1427. 36258000 36258 S 2 ( y) 2.7.2. Оптимальное распределение Иногда требуется провести обследование с заданной стоимостью, и возникает ситуация, когда стоимость единиц в разных слоях резко отличается. Например, единицы выборки в сельских районах обычно более дорогостоящи, чем в городских. 824 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ В этом случае, пользуются более эффективным способом – оптимальным распределением, которое задается формулой: Nh * Sh nh l ch *n , Nh * Sh h 1 ch где ch - стоимость выборки одной единицы в слое h. В случае, когда затраты на производство выборки из различных слоев одинаковы, оптимальная формула распределения называется распределением Неймана. По распределению Неймана, количество элементов, подлежащих отбору в слое, зависит не только от общего количества элементов в слое, но и от стандартного отклонения измеряемой характеристики. Для использования оптимального распределения необходимо знать дисперсии генеральной совокупности. (Часто в качестве ее оценки принимаются результаты предыдущего обследования). Формулы, используемые при оптимальном распределении Характеристика Формула nh Размер выборки в слое N h * Sh h 1 y Среднее значение h Стандартная ошибка *n l N Дисперсия оценки * Sh 1 n yi n i 1 S 2 ( y) 1 1 ( n N N h 1 N h * S h2 N2 S 2 (Yˆ ) N * S ( y ) s (1 n ) N n s.e.( y ) * Sh )2 Суммарное значение Y N n n y i 1 i s.e.(Y ) Ns (1 n ) N n Пример расчета 8 (данные условные): Для определения объема выборки по слоям, рассмотрим предыдущий пример. Необходимо произвести выборку 1000 предприятий, N=36258, n=1000. Nh * Sn *n , Nh * Sh 9289200 5707200 4842000 *1000 468 , n2 *1000 288 , n3 *1000 244 . имеем n1 19838400 19838400 19838400 Определяем размер выборки для оптимального распределения nh Слой Объем производства Итого Кол-во предприятий Средний объем производства на слой 36258 571,2 менее 1000 30964 203,8 2 1000-4999 4756 3 5000 и более 538 1 825 Стандартное отклонение Nh*Sh Объем выборки 19838400 1000 300 9289200 468 1779,6 1200 5707200 288 11029,7 9000 4842000 244 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Дисперсия рассчитывается по формуле: 2 1 Nh * Sh 2 Nh * Sh 1 19838400 2 53213400000 S ( y) ( ) *( ) 259 . 2 n N 1000 36258 N 36258 2 2 Из примера видно, что оптимальное распределение дает значительно меньшую дисперсию, а значит, и стандартную ошибку, чем пропорциональное. Общие организационно-технические рекомендации 3. К преимуществам выборочных обследований относится возможность более детального обследования изучаемых объектов, тщательного контроля первичных данных, ввиду меньшего числа изучаемых объектов. Затраты на получение данных лишь от части объектов генеральной совокупности меньше, поэтому, с экономической точки зрения, выборочное обследование является экономически более эффективным, чем сплошное. При этом, возможно более оперативное получение информации. К недостаткам выборочных обследований относятся частичный охват исследуемой совокупности объектов, сложности, возникающие при распространении данных о части объектов на всю их совокупность. Организация проведения выборочных обследований подразделяется на три основные стадии – стадию предварительной подготовки, стадию сбора данных и первичной обработки информации и стадию завершающих работ. 3.1. Стадия предварительной подготовки включает в себя анализ запроса потребителей на то или иное обследование, анализ требований к качеству информации и срокам ее предоставления, собственно подготовительную организационную работу и составление предварительного отчета. 3.1.1. Требования потребителей к статистической информации, содержащиеся в запросе, обычно подразделяются следующим образом. Это: получение обоснований для определения и проведения политики властями, корректировки проводимой политики или оценки ее результатов; определение параметров ненаблюдаемой части экономики; мониторинг развития отдельных отраслей экономики или развития экономики в целом; ожидаемые результаты деятельности, прогнозы; условия иностранного партнера, выделяющего грант (кредит) и т.д. Возможно получение требований в виде технического задания. 3.1.2. Результатом анализа требований является: понимание требуемого образа статистической информации, параметров, вида представления информации и т.д.; определение генеральной совокупности объектов и используемых статистических регистров; выявление наиболее актуальных групп (слоев) совокупности исследуемых объектов, например, физические лица, осуществляющие индивидуальную трудовую деятельность; определение минимально необходимых финансовых и трудовых затрат; 826 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ выявление наличия или отсутствия противоречий между финансовыми ограничениями и требуемым статистическим результатом. 3.1.3. Стадия предварительных работ включает в себя также: определение ключевых показателей и параметров, интересующих потребителей; согласование количества, качества и форм представления информации (абсолютные – процентные объемы, соотношения параметров, временные периоды, зависимости и т.д.); определение соответствующего статистического регистра, минимально необходимого объема выборки объектов, ее структуры; разработка вопросников (анкет); составление и согласование бюджета обследования; сроки представления предварительных и окончательных результатов. На стадии предварительных работ необходимой представляется «обратная связь» с заказчиком. Понимание цели, которую преследует заказчик (потребитель) обследования, способствует быстрому и качественному проведению предварительной стадии работ. Поэтому для определения интересующих параметров, наиболее актуальных вопросов, требуемой точности результатов желательно выделение группы специалистов со стороны заказчика (потребителя). 3.1.4. Проведение работ предварительной стадии требует следующих организационных мероприятий: разработку сценария проведения обследования; определение необходимых организационных мероприятий и сроков их выполнения, составления графика проведения обследования; распределение ответственности между структурными подразделениями, участвующими в проведении обследования, в том числе между областными, городскими и районными статистическими службами, определение руководителя обследования; определение необходимого персонала, его численности, требованиям к квалификации, необходимость обучения (повышения квалификации); определения количества требуемого оборудования, программного обеспечения, принадлежностей, расходных материалов и т.д.; распределения бюджета обследования; проработку вопросов контроля и управления процессом сбора и обработки данных; определения групп пользователей, потенциальных потребителей статистической информации. 3.1.5. Стадия предварительной подготовки к проведению выборочного обследования очень важна и требует к себе особого внимания. Ввиду непродолжительности и важности этой стадии, для единовременных обследований в мировой практике считается общепринятым составление Предварительного Отчета, в котором отражается проведенная предварительная работа и достигнутые договоренности; формируются базисные положения, необходимые для реализации выборочного обследования, указываются ожидаемые результаты и форматы их выдачи, приводятся ключевые моменты принятой методики обследования, включается предварительный вариант анкеты (вопросника). 827 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Подготовка Отчета ведется при возможно более активном участии пользователей. Его составление, с одной стороны, означает достижение и фиксирование компромисса с Заказчиком обследования (потребителями статистической информации) во всех вышеперечисленных вопросах, с другой стороны, позволяет начать подготовку непосредственно к проведению обследования: размножению вопросников, составлению программ ввода и обработки первичных данных и т.д. 3.2. Стадия сбора информации и первичной обработки данных включает в себя следующие этапы: подготовительный – разработка системы кодирования анкет, тиражирование вопросников (анкет), отбор и обучение интервьюеров и супервайзеров (региональных руководителей), «полевых работ» – собственно сбора первичной информации, первичной обработки данных – ввода, логического контроля и «чистки» данных. Кодирование анкет производится для обеспечения конфиденциальности полученной статистической информации, а также для проведения логического контроля при первичной обработке информации. Особое внимание следует уделять обучению интервьюеров и супервайзеров. Качество опроса интервьюерами и контроль процесса опроса со стороны супервайзеров является основой для достижения высокого качества конечных результатов. Необходимым компонентом является создание программы ввода первичных данных. Для исключения возможности попадания ошибочных записей необходимо предусмотреть логический контроль (обычно при вводе данных) и визуальную «чистку» первичных данных. По возможности проводится пробное (пилотное) выборочное микро-наблюдение, основной целью которого является апробация вопросника, программного обеспечения ввода, логического контроля первичных данных, алгоритмов расчета, организации наблюдения. 3.3. Стадия завершающих работ включает в себя статистическую обработку данных «полевых работ», распространение полученных результатов на генеральную совокупность согласно соответствующим методикам или методическим указаниям, публикация полученных результатов. Общепринятым в мировой практике проведения выборочных обследований является создание Заключительного Отчета, в котором отражаются основные аспекты проведенной работы, приводятся полученные результаты. В этом случае, публикация полученных статистических данных возможна после согласования Заключительного Отчета. При проведении органами государственной статистики регулярного выборочного обследования вместо Заключительного Отчета разрабатывается комплекс документов, включающих в себя «Методические положения по проведению …», («Методика проведения …»), бланк анкеты (вопросника), «Методические указания по заполнению бланка…», при необходимости для программистов ГВЦ Нацстаткомитета разрабатывается «Постановка задачи по расчету…». 4. Пример проведения выборочного обследования В качестве примера применения изложенных выше методов рассмотрим выборочное обследование по определению объемов производства зерновых культур в Чуйской области. 4.1. Охват, генеральная совокупность Обследуются все крестьянские (фермерские) хозяйства области, имеющие пашню. В качестве генеральной совокупности используется регистр крестьянских (фермерских) 828 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ хозяйств. На момент обследования на территории Чуйской области зарегистрировано 22435 крестьянских (фермерских) хозяйств, имеющих пашню, которые распределены по районам следующим образом: Район Количество хозяйств Всего Размер пашни, га 22435 Аламудунский район 162721 768 8189,4 Ысык-Атинский район 2352 21117,3 Жайылский район 1847 24954,4 Кеминский район 5922 19007,9 Московский район 2346 20438,8 Панфиловский район 1432 18602,5 Сокулукский район 2029 28124,9 Чуйский район 5739 22285,8 Минимальное значение величины пашни в зарегистрированных хозяйствах 0,1 га, максимальное 3234 га. Очевидно, что такая разница в размерах пашни требует группировки хозяйств. Проведем расслоение хозяйств по величине пашни следующим образом: Слой Пределы 1 от 0,1 до 5 га 2 от 5,0 до 20 га 3 от 20,0 до 40 га 4 от 40,0 га и выше Теперь распределение крестьянских (фермерских) хозяйств выглядит следующим образом: Район Слой 1 Всего 2 Всего 3 4 14118 6824 1077 416 22435 Аламудунский район 371 307 58 32 768 Ысык-Атинский район 963 1141 207 41 2352 Жайылский район 843 742 183 79 1847 Кеминский район 5068 819 26 9 5922 Московский район 1146 955 189 56 2346 318 904 147 63 1432 574 1091 251 113 2029 4835 865 16 23 5739 Панфиловский район Сокулукский район Чуйский район 4.2. Выборка, расслоение выборки Необходимо произвести выборку хозяйств. Первоначальный объем выборки задан и составляет 350 хозяйств. Для распределения заданного объема выборки по слоям и по районам используем статистику генеральной совокупности. Для каждого слоя по районам рассчитаем средний размер пашни 829 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Yh 1 Nh n Yhi и дисперсию S h 2 i 1 n 1 (Yh Yh ) 2 . N h 1 i 1 i Для этих целей можно использовать различные приложения MS Office, например Excel, а также другие пакеты прикладных программ (SPSS, Статистик и т.д.), поддерживающие работу со статистическими функциями. Далее в таблице приведена статистика средних размеров пашни, дисперсия, стандартное отклонение, рассчитанное с использованием SPSS. Район Слой Количество хозяйств N h Средний размер пашни, Дисперсия Sh 2 Стандартное отклонение S h Произведение N h * Sh nh га Аламудун-ский район ЫсыкАтинский район Жайылский район Кеминский район Московский район Панфилов-ский район Сокулукский район Чуйский район N h * Sh *n ( N h * Sh ) 1 371 2,5 1,53 1,24 458,86 2 2 307 9,5 14,53 3,81 1170,27 5 3 58 26,5 28,79 5,37 311,19 1 4 32 87,9 4632,08 68,06 2177,90 8 1 963 2,9 1,30 1,14 1095,95 4 2 1141 9,3 13,92 3,73 4257,21 17 3 207 25,0 29,33 5,42 1121,09 4 4 41 61,2 540,43 23,25 953,13 4 1 843 3,0 0,46 0,68 571,20 2 2 742 10,2 14,40 3,79 2815,78 11 3 183 26,2 29,89 5,47 1000,51 4 4 79 127,5 131241,94 362,27 28619,59 111 1 5068 2,4 1,32 1,15 5832,44 23 2 819 6,9 5,66 2,38 1948,07 8 3 26 23,7 15,39 3,92 101,99 0 4 9 64,5 1209,86 34,78 313,05 1 1 1146 2,4 1,37 1,17 1340,77 5 2 955 9,5 10,04 3,17 3026,16 12 3 189 24,5 29,86 5,46 1032,74 4 4 56 70,9 1297,99 36,03 2017,55 8 1 318 3,5 0,99 0,99 316,26 1 2 904 9,5 13,16 3,63 3279,26 13 3 147 26,7 30,63 5,53 813,50 3 4 63 79,3 2949,79 54,31 3421,65 13 1 574 2,9 1,45 1,20 690,52 3 2 1091 9,5 9,93 3,15 3437,32 13 3 251 25,1 31,68 5,63 1412,65 5 4 113 86,5 3795,71 61,61 6961,86 27 1 4835 2,7 1,26 1,12 5416,57 21 2 865 7,1 6,26 2,50 2164,20 8 3 16 25,6 24,45 4,94 79,12 0 23 114,5 8036,40 89,65 4 Сумма Объем выборки по слоям 22435 830 2061,86 8 90220,24 350 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Заметим, что основной принцип расслоения состоит в том, чтобы произведение Nh * Sh по различным слоям было примерно одинаково, а среднее значения параметра внутри слоев (в данном случае, размер пашни) различались максимально возможно. 4.3. Распределение выборки по слоям Для распределения заданного объема выборки n=350 по слоям и районам используем формулу оптимального распределения Неймана: nh N h * Sh *n ( N h * Sh ) Таким образом, используя показатели генеральной совокупности (см. таблицу выше) получено распределение выборки. Однако, это не означает, что распределение выборки должно быть именно таким. Внимательно проанализировав этот показатель, убеждаемся, что объем выборки в слое увеличивается в зависимости от величины показателя Nh * Sh . Например, в Жайылском районе в 4-ом слое в выборку попадает число хозяйств, превышающее количество хозяйств в генеральной совокупности. Это объясняется большой величиной стандартного отклонения в этом слое, которое превышает средний размер пашни в слое. Таким образом, после первичного распределения объема выборки произведем корректировку, т.е. в случае превышения выборки генеральной совокупности, меняем размер выборки на величину, не превышающую генеральную совокупность. Также следует помнить, что объем выборки по региону должен быть достаточным, т.е. не меньше 25-30 в случае нормального распределения наблюдаемой величины. Объем выборки в слое не может быть 1, так как из одного наблюдения невозможно получить статистику изучаемой величины. Размер выборки после внесения корректур может измениться, и в нашем случае он стал следующим: Выборочная совокупность Всего Слой 1 Чуйская область Аламудунский район Ысык-Атинский район 2 3 4 500 66 94 74 266 40 5 8 7 20 50 5 17 7 21 Жайылский район 100 5 11 5 79 Кеминский район 45 23 8 5 9 Московский район 62 7 12 15 28 Панфиловский район 55 5 13 5 32 Сокулукский район 90 5 13 15 57 Чуйский район 58 11 12 15 20 Имея размер генеральной совокупности и объем выборки, осуществляем отбор хозяйств для проведения обследования, используя систематический метод отбора. Рассмотрим подробнее отбор хозяйств Аламудунского района слоя 1. В генеральной совокупности имеем 371 хозяйство, в выборочной – 5 хозяйств. Вычисляется шаг отбора: Задается случайное число, находящееся в пределах от 1 до 74. Первое отобранное N h 371 74,2. nh 5 831 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ хозяйство – это хозяйство по списку, равное случайному числу. Второе отобранное хозяйство – это хозяйство по списку, равное случайному числу + шаг отбора. Третье отобранное хозяйство – это хозяйство по списку, равное случайному числу + 2*(шаг отбора) и так далее. Таким образом, отбираем все 5 хозяйств этого слоя. В таблице приведен механизм отбора 5 хозяйств из 371, в случае, когда случайное число равно 45. Аналогично происходит отбор хозяйств в остальных слоях. Кол-во выборок Рассчитанное число Номер записи, попавшей в выборку 1 45 45 2 45+74,2=119,2 119 3 45+2*74,2=193,4 193 4 45+3*72,4=267,6 267 5 45+4*72,4=341,8 341 4.4. Распространение результатов, коэффициенты взвешивания. Проведя опрос хозяйств, и сформировав итоги по выборке, необходимо распространить полученные результаты на всю генеральную совокупность. Для этого рассчитаем коэффициенты распространения данных опрошенных хозяйств (коэффициенты взвешивания). Для этого необходимо получить суммарные площади пашни по районам и слоям отдельно по генеральной и по выборочной совокупностям. Затем для каждого слоя и каждого района необходимо рассчитать вес по формуле: Y w yh . h h Район Слой Пашня, га Генеральная совокупность Yh Yhi Выборка y h y Вес w h hi Yh yh i i Аламудунский 1 район 2 3 4 Ысык-Атинский район Панфиловский район Сокулукский район 926,5 4,3 215,4651 2913 91,2 31,9408 1535,6 232,2 6,6133 2814,3 1485,4 1,8946 1 2811,1 15,4 182,5390 2 10618,6 171,5 61,9160 3 5177,4 358,9 14,4257 4 2510,2 802,5 3,1280 1 1110,3 12,7 87,4252 2 8567,3 177,8 48,1850 3 3928,8 248,1 15,8356 4 4996,1 1996,1 2,5029 1 1644,6 19,3 85,2124 2 10392,4 141,7 73,3409 3 6308,4 359,8 17,5331 832 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ (продолжение) Район Слой Пашня, га Генеральная совокупность Выборка y h y Вес w Yh h yh hi i Yh Yhi i Чуйский район 4 9779,5 4318,8 2,2644 1 13060,8 76,7 170,2842 2 6182 176 35,1250 3 409,5 69 5,9348 4 2633,5 1127 2,3367 Рассчитаем валовой сбор зерна по культурам. Для этого взвешиваем итоги выборочного обследования по наблюдаемым показателям по каждому слою. Получаем промежуточную таблицу, в которой представлены наблюдаемые переменные по слоям. Сумма этих показателей по слоям дает результаты по районам и по области в целом. Итоговая таблица формируется в целом по области (или по районам) в зависимости от цели обследования. Промежуточная таблица Район Слой Итоги по выборке, ц Пшеница Аламудунский район ЫсыкАтинский район Жайылский район Кеминский район Московский район 1 33,0 Ячмень Вес Кукуруза на зерно 24,0 Экстраполяция, ц Пшеница 215,4651 7110,3 Ячмень 5171,2 Кукуруза на зерно 0,0 2 521,0 31,9408 16641,2 0,0 0,0 3 2055,0 509,0 275,0 6,6133 13590,3 3366,2 1818,6 4 8725,0 2474,0 7083,0 1,8946 16530,7 4687,3 13419,7 Итого 11334,0 3007,0 7358,0 53872,5 13224,7 15238,4 1 52,0 28,6 100,0 182,5390 9492,0 5220,6 18253,9 2 681,0 816,0 1241,9 61,9160 42164,8 50523,5 76893,5 3 2724,0 400,0 1426,0 14,4257 39295,7 5770,3 20571,1 4 5894,1 1474,0 3179,0 3,1280 Итого 9351,1 2718,6 5946,9 18436,6 4610,6 9943,8 109389,2 66125,0 125662,4 1 79,2 220,8246 17489,3 0,0 0,0 2 2522,0 170,7 1027,5 19,1287 48242,5 3265,3 19654,7 3 4056,0 1028,0 1770,0 10,4661 42450,5 10759,2 18525,0 3,7212 4 6502,0 8363,0 1750,0 Итого 13159,2 9561,7 4547,5 1 345,3 58,6 592,0 2 50,0 7,0 250,0 3 496,0 4 2461,0 Итого 3352,3 1 188,7 2 1416,1 24195,4 31120,6 6512,1 132377,7 45145,0 44691,9 138,5982 47857,9 8121,9 82050,1 121,1581 6057,9 848,1 30289,5 13,6911 6790,8 0,0 0,0 2,1576 65,6 842,0 5309,9 0,0 0,0 66016,6 8970,0 112339,6 100,0 132,8738 25073,3 0,0 13287,4 170,0 500,0 42,4164 60065,9 7210,8 21208,2 3 2968,0 576,0 14,7945 43910,1 0,0 8521,6 4 13162,7 152,0 3000,0 4,0164 52866,4 610,5 12049,1 Итого 17735,5 322,0 4176,0 181915,6 7821,3 55066,3 833 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ (продолжение) Район Слой Итоги по выборке, ц Пшеница Панфиловский район Сокулукский район Чуйский район Чуйская область 5. Ячмень Вес Кукуруза на зерно 1 Экстраполяция, ц Пшеница Ячмень Кукуруза на зерно 87,4252 0,0 0,0 0,0 2 819,9 485,6 342,0 48,1850 39506,9 23398,7 16479,3 3 1564,1 110,0 490,0 15,8356 24768,4 1741,9 7759,4 4 5522,0 1303,0 996,0 2,5029 13821,2 3261,3 2492,9 Итого 7906,0 1898,6 1828,0 78096,5 28401,9 26731,6 1 54,0 2 1588,0 351,0 130,0 85,2124 4601,5 0,0 11077,6 130,0 73,3409 116465,3 25742,6 9534,3 3 4816,0 1586,0 850,0 17,5331 84439,3 27807,5 14903,1 4 24249,8 13770,6 9602,0 2,2644 54911,3 31182,2 21742,8 Итого 30707,8 15707,6 10712,0 260417,3 84732,3 57257,8 1 457,5 218,9 685,7 170,2842 77905,0 37275,2 116763,9 2 1256,5 289,4 740,6 35,1250 44134,6 10165,2 26013,6 3 207,0 0,0 5,9348 1228,5 0,0 0,0 4 357,0 2,3367 834,2 0,0 0,0 Итого 2278,0 47440,4 142777,5 1 2 508,3 1426,3 124102,3 1209,7 330,1 1607,7 189529,4 55788,8 241432,9 8854,5 2289,7 4232,0 373279,0 121154,1 200073,1 3 18886,1 3633,0 5387,0 256473,5 49445,0 72098,9 4 66873,6 27536,6 25610,0 186905,7 75472,6 66160,6 Итого 95823,9 33789,4 36836,7 1006187,7 301860,5 579765,5 Приложение Приложение 5.1.: Примерный макет Предварительного (Заключительного) отчетов Выборочное обследование (малых предприятий пищевой промышленности г.Бишкека ) по итогам 9 месяцев 2000г. /Заключительный отчет/ 1. Предыстория вопроса. (кратко, необязательно) 2. Цели и задачи. Обследование организовано во всех районах г. Бишкека по выборочному методу. Область изучения и распространения данных обследования определяется целями: получение данных о производстве продуктов питания, необходимых для анализа развития пищевой промышленности; обеспечение данными для составления счета производства в системе национальных счетов. 3. План выборки Охват. Обследованию подлежат все малые предприятия г. Бишкека, занимающиеся производством пищевых продуктов. Основой информационной базы для построения выборки малых предприятий является актуализированный Единый государственный регистр статистических единиц, содержащий экономические показатели. 834 23. ВЫБОРОЧНЫЙ МЕТОД НАБЛЮДЕНИЯ Общее число предприятий, составляющих генеральную совокупность – … Единицей отбора является малое предприятие. Объем выборки. Наблюдение охватывает …, что составляет … процентов от... Составление выборки. Для формирования выборочной совокупности применяется метод простого (двухступенчатого расслоенного) случайного отбора. Репрезентативность. Выборка обеспечивает получение репрезентативных данных обследования в пределах заданной точности результатов. Выборочная совокупность. Данные по количественному составу выборки в разрезе регионов, слоев. 4. Структура и содержание обследования Обследование проводится на утвержденном (согласованном с …) бланке обследования, разработанном … (общие сведения о структуре проведения обследования, разработанных методических указаниях, инструкциях, анкете). Этапы проведения обследования На 1-ом этапе производится отбор и подготовка списков малых предприятий, рассылка списков вместе с бланками анкет, инструкцией по заполнению анкет, программами ввода и логического контроля первичных данных. На 2-ом этапе производится своевременное обеспечение районных статистических служб необходимым количеством бланков наблюдения и списками, проводится сбор данных, осуществляется ввод данных в компьютерную базу и ее пересылка по электронной почте в Нацстаткомитет до 2 числа месяца, следующего за отчетным. На 3-ом этапе производится сбор первичных данных из областных статистических управлений, слияние и обработка базы данных, распространение результатов обследования и формирование выходных таблиц. 5. Обработка данных Распространение на генеральную совокупность. Распространение на генеральную совокупность малых предприятий данных наблюдения производится согласно следующему алгоритму… Для каждого раздела, вида продукции определяется: среднее по выборке значение определяемой характеристики; общее по выборке количество предприятий генеральной совокупности, занимающихся производством (потреблением и т.д.) данного продукта. Оценка ошибки выборки. Приводятся данные по стандартным ошибкам выборки в разрезе основных групп, регионов. 6. Результаты обследования Приводятся результаты распространения данных на генеральную совокупность в разрезе основных групп, регионов, взаимосвязи характеристик и т.д. Рекомендуется широкое применение графиков, диаграмм, других наглядных способов представления информации. 7. Выводы (Анализ полученных результатов) 8. Заключение Приложения (Анкета-вопросник, методические разработки). 835