А.Н.Тырсин Мера совместной нелинейной корреляционной

реклама
ОБОЗРЕНИЕ
Т о м 20
ПРИКЛАДНОЙ И ПРОМЫШЛЕННОЙ
МАТЕМАТИКИ
Выпуск 5
2013
А. Н. Т ы р с и н (Екатеринбург, НИЦ «НиР БСМ» УрО РАН). Мера совместной нелинейной корреляционной связи многомерных случайных величин.
Одной из актуальных проблем многомерного статистического анализа является
оценивание тесноты совместной корреляционной взаимосвязи системы случайных величин X = (X1 , X2 , . . . , Xm ) , если она является нелинейной. Для оценки совместной
корреляционной зависимости, как линейной, так и нелинейной, в [1] предложен коэффициент
(1)
de (X) = 1 − exp [−2I(X)/m],
e
где I(X) = H(X) − H(X) .
Здесь H(Xi ) — дифференциальная энтропия непрерывной случайной величины
e = Pm H(Xi ) — совместные дифференциальные
Xi , i = 1, 2, . . . , m ; H(X) , H(X)
i=1
e (ее компоненты X
ei являются
энтропии многомерных случайных величин X и X
взаимно независимыми и имеют те же распределения, что и Xi ).
Основным недостатком формулы (1) является необходимость вычисления оценок
дифференциальных энтропий, т.к. требуется оценивать по ограниченным выборкам
одномерные и многомерные плотности распределений непрерывных случайных величин. Результатом является низкая точность оценивания коэффициента de (X) .
Справедлива теорема [2].
e =
Теорема. Пусть имеем две системы непрерывных случайных величин X
e
e
e
(X1 , X2 , . . . , Xm ) и X = (X1 , X2 , . . . , Xm ), каждые соответствующие компоненты
ei , Xi , i = 1, 2, . . . , m, определены на всей числовой оси, имеют конечкоторых X
ные дисперсии и описываются однотипными законами распределения, с некоторыми
ei , i = 1, 2, . . . , m, являются взаимно
параметры положения и масштаба, причем X
e
независимыми. Тогда разность совместных энтропий систем случайных величин X
и X равна
m
X
2
e − H(X) = − 1
H(X)
ln (1 − RX
),
(2)
k /X1 X2 Xk−1
2
k=2
2
— коэффициенты детерминации соответствующих регрессионгде RX
k /X1 X2 Xk−1
ных зависимостей, k = 2, 3, . . . , m .
Подставив (2) в (1), после преобразований получим
"m
#1/m
Y
2
de (X) = 1 −
(1 − RXk /X1 X2 Xk−1 )
.
(3)
k=2
Вычисление коэффициента de (X) по формуле (3) по сравнению с (1) обладает
несколькими существенными преимуществами.
Во-первых, здесь не требуется оценивать энтропии H(X) , H(Xi ) , i =
1, 2, . . . , m . Это значительно повышает точность оценивания коэффициента de (X) ,
c Редакция журнала «ОПиПМ», 2013 г.
2
XIV Всероссийский симпозиум по прикладной и промышленной математике
и практически реализуемо на достаточно малых выборках, поскольку здесь требуется
2
соответствующих релишь оценивать коэффициенты детерминации RX
k /X1 X2 Xk−1
грессионных зависимостей.
Во-вторых, здесь имеется возможность построения стандартных статистических
гипотез для оценки значимости коэффициента (3).
Работа выполнена в рамках проекта 12-М-127-2049 фундаментальных исследований УрО РАН.
СПИСОК ЛИТЕРАТУРЫ
1. Pena D., Van der Linde A. Dimensionless measures of variability and dependence for
multivariate continuous distributions. — Commun. Statist. Theory Methods, 2007, v. 36,
iss. 10, p. 1845–1854.
2. Тырсин А. Н., Ворфоломеева О. В. Исследование динамики многомерных стохастических систем на основе энтропийного моделирования. — Информатика и ее применения, 2013, т. 7, в. 4, с. 3–10.
Скачать