ЛЕКЦИЯ 9 «ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ» 9.1 Теоретические сведения Статистическая методология исследования массовых явлений различает два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное. Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц. Совокупность отобранных для обследования единиц в статистике принято называть выборочной, а совокупность единиц, из которых производится отбор – генеральной. Основные характеристики параметров генеральной и выборочной совокупности обозначаются определенными символами (таблица 22). Таблица 22 – Общепринятые условные обозначения параметров генеральной и выборочной совокупностей № Характеристики Объем совокупности (численность единиц) Численность единиц, обладающих 2 обследуемым признаком Доля единиц, обладающих 3 обследуемым признаком 1 4 Средний размер признака 5 Дисперсия количественного признака 6 Дисперсия доли Генеральная совокупность Выборочная совокупность N n M m M N xi x N 2 (x i x) 2 x N 2 p pq m n xi ~ x n x) 2 (x i ~ 2 ~x n 2w w (1 w ) P W Достоверность рассчитанных по выборочным данным характеристик в значительной степени определяется репрезентативностью выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности. По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единиц, а комбинированный отбор предполагает сочетание группового и индивидуального отбора. Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие виды выборки: собственно-случайная; механическая; типическая; серийная; комбинированная. Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Собственно-случайный отбор может быть как повторным, так и бесповторным. После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Эти два вида ошибок связаны следующим соотношением (9.1): Δ tμ , (9.1) где Δ – предельная ошибка выборки; μ – средняя ошибка выборки; t – коэффициент доверия, определяемый в зависимости от уровня вероятности p. В таблице 23 приведены некоторые значения t. Таблица 23 – Значения t Вероятность, pi Значение, t 0,683 1,0 0,866 1,5 0,954 2,0 0,988 2,5 0,997 3,0 0,999 3,5 При случайном повторном отборе средняя ошибка определяется по формуле (9.2): μ σ n , (9.2) а при бесповторном по формуле (9.3): σ2 n μ 1 , n N (9.3) где σ2 – выборочная (или генеральная) дисперсии; σ – выборочное или генеральное среднее квадратическое отклонение; n – объём выборочной совокупности; N – объём генеральной совокупности. Расчёт средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, соотношение для выборочной средней (9.4): ~ x Δ ~x x ~ x Δ ~x , (9.4) где x и ~ x – предельная и выборочная средняя соответственно; Δ ~x – предельная ошибка выборочной средней. Наряду с определением ошибок выборки и пределов для генеральной средней эти же показатели могут быть определены для доли признака. В этом случае особенности расчёта связаны с определением дисперсии доли (таблица 22). Тогда, при собственно-случайном повторном отборе для определения предельной ошибки выборки используется следующая формула (9.5): Δw t w(1- w) n (9.5) Соответственно, при бесповторном отборе (9.6): Δw t w(1- w) n 1 n N (9.6) Пределы доли признака в генеральной совокупности р выглядят следующим образом (9.7): w Δw p w Δw (9.7)