ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ ПАРАМЕТРОВ

advertisement
ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ ПАРАМЕТРОВ
ОДНОТИПНЫХ ЭЛЕМЕНТОВ
Кобзев В.Г.
Харьковский национальный университет радиоэлектроники
61166, Харьков, пр. Ленина, каф. ИУС, тел. (057) 702-14-51,
E-mail: vgkobzev@rambler.ru; факс (057) 702-11-13
The likelihood boarders between order statistics distributions are introduced. These
boarders are not depended from observed casual value’s distribution kind and equal to there
quantiles.
Введение
Параметры однотипных элементов различной природы образуют совокупности
экспериментальных данных конечного объема, которые часто рассматривают как
выборки значений некоторых случайных величин. В зависимости от своего объема такие
выборки наблюдений могут использоваться различными известными методами оценки
интегральной или дифференциальной функций распределения, а также параметров этого
распределения. Эти методы в различной степени опираются на априорные знания о
характере случайных величин (дискретность/непрерывность, сосредоточенность) и их
распределений (симметричность, форма, вид, количество основных параметров). В
известных статистических методах выборочные значения при больших объемах выборок
подвергаются группировке, при малых и средних могут учитываться индивидуально.
Наборы экспериментальных данных по своей физической природе или в результате
этапа их начальной обработки оказываются упорядоченными по величине. Распределение
значений упорядоченных выборочных совокупностей описывается порядковыми
статистиками [1], свойства которых используются при изучении экстремальных значений
[2], в методах непараметрической, робастной и других направлениях статистики.
Большая часть этих свойств справедлива для асимптотического случая.
Целью данной работы является исследование свойств распределений порядковых
статистик непрерывных случайных величин для конечных объемов анализируемых
данных и выработка рекомендаций для их использования при обработке наборов
параметров однотипных элементов фиксированной длины.
Основной материал
Пусть имеется выборка x1 , x 2 ,..., xi ,..., x n , состоящая из n значений одномерной
непрерывной случайной величины Х , подчиненной неизвестному закону распределения
F (x) . После упорядочения по возрастанию значений исходная выборка имеет вид
вариационного ряда x (1)  x ( 2 )  ...  x ( i )  ...  x ( n ) , каждый член которого является
порядковой статистикой со своим законом распределения  i , n ( x) . Его вид определяется
совокупностью из трех составляющих: порядкового номера i , объема выборки n и
функции F (x ) . Закону  i , n ( x) должен подчиняться i -тый член каждого нового
вариационного ряда из n значений, полученных при неизменных условиях наблюдений
случайной величины Х .
В различных целях могут использоваться закономерности поведения членов вариационного
ряда для конкретных значений порядковых номеров. Так, значения с порядковыми номерами 1 и
n определяют особенности экстремальных порядковых статистик, значения i , равные
или близкие к n 2 , несут информацию о медиане исходного распределения F (x ) .
1. Установим наиболее правдоподобную границу между значениями членов
вариационного ряда с произвольными порядковыми номерами i и j , ( 1  i  j  n ).
Такая граница xiправд
, исходя из общего определения функции правдоподобия, является
,j
234
абсциссой точки пересечения кривых плотностей распределения  i , n ( x) и  j , n ( x) ,
представляющих
соответственно.
собой
первые
производные
функций
 i ,n ( x)
и
 j , n ( x) ,
Приравняв функции плотностей распределения  i , n ( x) и  j , n ( x) ,
получаем выражение для Fi ,правд
( x) .
j
Отметим, это значение не зависит от вида исходного распределения F (x ) ,
положительно и не превышает единицы ни при каких комбинациях трех величин ( i, j , n
), что представляет собой новый непараметрический факт статистики. Поэтому, данное
значение может рассматриваться как квантиль исходного распределения F (x ) уровня
Fi ,правд
( x) .
j
2. Для соседних членов вариационного ряда с номерами i и i  1 , где 1  i  n  1,
полученное выражение имеет следующий вид:
Таким образом,
Fi ,правд
i 1 ( x)  i n .
наиболее правдоподобная граница между значениями двух любых соседних порядковых
статистик с номерами i и i  1 для непрерывной исходной функции распределения
произвольного вида является его квантилем уровня i n . Данный факт отличается от
асимптотического (для неограниченно возрастающего n ) результата [1], где
рекомендуется данный квантиль принимать в качестве оценки математического
ожидания i -той порядковой статистики. При больших значениях объема выборки n
смещение данной оценки будет незначительным, в случаях малых и умеренных значений
n смещение будет весьма ощутимым.
3. Наиболее правдоподобные границы значений всех порядковых статистик (а это,
как показано, квантили исходного распределения указанных уровней) могут послужить
основой для построения эталона случайной выборки. Общее количество таких границ
K общ в выборке объемом n составляет n  (n  1) 2 , что при даже небольших значениях
n представляет достаточно большую величину, использование которой в практических
целях вряд ли оправдано. Для сокращения количества учитываемых границ можно
ограничиться лишь теми, которые соответствуют интересуемым уровням квантилей
исходного распределения F (x ) .
4. Разность между значениями любых последовательных границ соседних
порядковых статистик при возрастании значения i от 1 до n  1 постоянна и составляет
величину 1 n . Это дает возможность ввести n  1 внутренних границ и разбить весь
диапазон изменения одномерной непрерывной случайной величины Х , подчиненной
неизвестному закону распределения F (x ) , на конечное количество n непересекающихся
интервалов, вероятность попадания значения случайной величины Х в которые
одинакова и равна 1 n .
Расположение значений всех порядковых статистик одновременно в пределах их
наиболее правдоподобных границ для предполагаемого общего распределения может
рассматриваться как некоторый теоретический эталон случайной выборки и являться
признаком однородности экспериментальных данных. Вероятность такого расположения
нетрудно рассчитать. Она имеет тем меньшее значение, чем больше объем выборки,
причем, данная зависимость нелинейна.
5. В силу случайной природы значения членов вариационного ряда даже без
F (x) могут выходить за пределы
нарушения исходного распределения
вышеустановленных правдоподобных границ в пределах каждой пары. Вероятности
нарушения установленных наиболее правдоподобных границ значениями порядковых
правд
статистик получаются путем вычисления значений функций  i , n ( x  x( Fi , j )) и
235
 j ,n ( x  x( Fi ,правд
)) для каждой пары i и j ,
j
1  i  j  n . Так как в выражения
 i , n ( x) и  j , n ( x) входят лишь биномиальные коэффициенты и значения функции F (x )
в точках x( Fi ,правд
) , то искомые вероятности не зависят от F (x) , а определяются только
j
значениями трех величин ( i, j , n ).
Выводы
1. Установленная связь уровня квантиля непрерывного распределения с наиболее
правдоподобными границами значений двух порядковых статистик является еще одним
их свойством, справедливым для любого конечного объема выборки и произвольного
закона распределения вероятностей непрерывной исходной случайной величины.
2. Наиболее правдоподобные границы значений двух соседних порядковых
статистик в выборках конечного объема для произвольного закона распределения
вероятностей непрерывной исходной случайной величины совпадают с квантилями этого
распределения уровня i n , где i - порядковый номер младшей из двух соседних
величин.
3. Расположение значений всех членов вариационного ряда одновременно в
пределах их наиболее правдоподобных границ для предполагаемого общего
распределения может являться признаком их однородности и рассматриваться как
некоторый теоретический эталон случайной выборки.
Список литературы:
1.Г.Дэйвид. Порядковые статистики. – М.: Наука, 1979. - 336с.
2. Галамбош Я. Асимптотическая теория экстремальных порядковых статистик. - М.:
Наука, 1984. – 304с.
236
Download