СТАТИСТИЧЕСКИЕ ОЦЕНКИ ЧАСТОТ ВСТРЕЧАЕМОСТИ

advertisement
СТАТИСТИЧЕСКИЕ ОЦЕНКИ ЧАСТОТ ВСТРЕЧАЕМОСТИ
НЕЧИСЛОВЫХ ПРИЗНАКОВ ПО СЛУЧАЙНЫМ ВЫБОРКАМ
ИЗ НЕОДНОРОДНЫХ СОВОКУПНОСТЕЙ
В.С. Мхитарян, Е.В. Черепанов
Одним из основных источников данных о социально-экономическом
положении страны являются результаты выборочных обследований
населения и домохозяйств. Сегодня на основе выборочных обследований
проводят маркетинговые исследования, изучают качество проектируемой и
производимой техники, поступивших в продажу товаров, эффективность
ценообразования и новых форм торговли, потребительский спрос и степень
удовлетворения населения по различным видам товаров и услуг.
В основе эконометрических методов анализа выборочных данных
(Айвазян, Мхитарян, 1998), как правило, лежат асимптотические свойства
выборочных статистик. Но их использование требует наличия выборочного
ансамбля наблюдений, случайно отобранных из однородной совокупности. В
реальности любой социум (генеральная совокупность) является заведомо
неоднородным множеством, структурированным по различным номинальным
шкалам.
В эмпирических социально-экономических исследованиях проблему
неоднородности изучаемой социально-экономической совокупности можно
решить на основе одного из двух подходов:
 создав неслучайную выборку, репрезентативную (в некоторой степени)
изучаемой совокупности по многомерной структуре (реально, хотя бы по
нескольким основным номинальным шкалам);
 математически корректно учесть (при компьютерной обработке
эмпирических результатов выборочного обследования) различия между
структурами генеральной совокупности и выборочного ансамбля.
Разработаны четыре типа неслучайных выборок, но в экономических
приложениях, несомненно, доминирует применение квотных выборочных
ансамблей. На практике формирование квотной выборки проводится с
учетом 3-4 номинальных шкал, а неучтенные априорные классификации
создают существенную неоднородность выборочного ансамбля.
Более перспективным является путь математически корректного учета
различий между многомерными структурами неоднородной совокупности и
случайной выборки ее элементов на этапе компьютерных расчетов. Этот
подход пока не нашел заметного развития, хотя, требуя значительного
объема компьютерных расчетов, и решает указанную задачу (Мхитарян,
Черепанов, 2007).
Пусть задана генеральная совокупность из N человек. По заданной анкете
проведен случайный опрос n респондентов. Каждый вариант ответа на все
вопросы анкеты трактуется как дихотомический признак. При опросе
используются s классификаций, априорные данные по которым имеются в
Росстате. Пусть i-я классификация имеет ri категорий, причем частоты
встречаемости  ij представителей всех категорий есть в Росстате.
Пусть в случайной выборке оказалось nij представителей j-й категории i-й
априорной классификации, из которых nijk лиц обладают исследуемым k-м
признаком. При N >> n случайное формирование выборки подчинено
полиномиальному распределению. Вспомогательную оценку ~ k частоты
ij
встречаемости k–го изучаемого признака среди лиц j-й категории
классификации (i 1, s) запишем в виде
( j 1, ri )
i-й
(1)
 ijk  nijk / nij .
Определим оценку вида
ˆ(ki)  rji ij ijk
.
(2)
Дисперсии оценок (1) имеют вид
(3)
D ijk   ijk ( 1 ijk )/ nij
А дисперсии оценок (2) приблизительно равны:
Dˆ(ki)  rji ij 2 D ijk .
(4)
Таким образом, для оценки частоты встречаемости k-го исследуемого
признака нами получена вторичная статистика (2). Итоговую оценку  k
частоты встречаемости k-го признака для всей совокупности, как принято в
теории неравноточных измерений (Новицкий, Зограф, 1985), запишем в виде
линейной комбинации
(5)
ˆ k   s ˆ k .

i
i (i)
Значения параметров  найдем из критерия:

Dˆ k  min( ),
при условии
is i  1.
(6)
Итоговая оценка в рамках модели (5) имеет вид
ˆ k  [  sj (ˆ(kj) Dˆ(kj) )  sj (Dˆ(kj ) ) 1 ] /  sj (Dˆ(kj) ) 1,
(7)
а ее дисперсия имеет вид
1
Dˆ k  [  sj (Dˆ(kj ) ) 1 ] .
(8)
Выражения (7) и (8) являются точными, а не приближенными. При этом,
будучи средним гармоническим дисперсий вспомогательных оценок,
дисперсия (8) оценки (7) заведомо меньше их минимального значения.
Заметим, что в более общем виде в выражении (4) следует учитывать и
ковариации вспомогательных оценок. Но практика показывает (Черепанов,
2013), что значения ковариаций по модулю на 1-2 порядка меньше дисперсий
(3).
Это объяснимо тем, что оценивание по разным (и практически связанным
между собой) номинальным шкалам дает слабо коррелируемые оценки (2).
Предложенный подход позволяет оценить частоты встречаемости
нечисловых признаков не только по совокупности в целом, но по всем
категориям задействованных априорных классификаций (Мхитарян,
Черепанов, 2007, Черепанов, 2013).
Например, можно показать (Черепанов, 2013), что выражение вида
ˆijk  1  [(1  ˆk )(nij  nijk )] / [ij (n  nk )] ,
(9)
где ˆ k — уже полученная оценка частоты встречаемости k –го признака по
совокупности в целом, является состоятельной и асимптотически
несмещенной оценкой частоты встречаемости k–го признака среди лиц j–й
категории i–й классификации. Ее дисперсия приближенно выражается в виде
2
(10)
Dˆijk  Dˆ k  [1  ˆijk ] / [1  ˆ k ]  .
Изложенная методика в исследованиях 1992-2011 гг. обеспечивала, при
объемах выборки 1500- 2000 наблюдений, погрешности оценок ˆ k порядка
1.0 – 1.5 %, а погрешности оценок ˆijk составляли, как правило, 2.0 – 4.5 %. Их
величины обусловлены, в первую очередь, значениями соответствующих
априорных частот  ij .
Литература
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы
эконометрики. М.: изд. «Юнити», 1998. – 1022 с.
Мхитарян В.С., Черепанов Е.В. Выборочный метод на случайных выборках
в
социологических
и
социально-экономических
исследованиях:
статистическое оценивание. // Информатика, социология, экономика,
менеджмент. Межвузовский сборник научных трудов, вып. 5, ч.2. М.:
Академия менеджмента инноваций, 2007, с. 154-165.
Новицкий П.Ф., Зограф И.А. Оценка погрешностей результатов измерений.
Ленинград: изд. «Энергатомиздат», 1985. – 187 с.
Черепанов Е.В.
Математическое моделирование неоднородных
совокупностей экономических данных. М.: Московский государственный
университет экономики, статистики и информатики «МЭСИ», 2013.
Download