ОБОЗРЕНИЕ Т о м 20 ПРИКЛАДНОЙ И ПРОМЫШЛЕННОЙ МАТЕМАТИКИ Выпуск 5 2013 А. Н. Т ы р с и н (Екатеринбург, НИЦ «НиР БСМ» УрО РАН). Мера совместной нелинейной корреляционной связи многомерных случайных величин. Одной из актуальных проблем многомерного статистического анализа является оценивание тесноты совместной корреляционной взаимосвязи системы случайных величин X = (X1 , X2 , . . . , Xm ) , если она является нелинейной. Для оценки совместной корреляционной зависимости, как линейной, так и нелинейной, в [1] предложен коэффициент (1) de (X) = 1 − exp [−2I(X)/m], e где I(X) = H(X) − H(X) . Здесь H(Xi ) — дифференциальная энтропия непрерывной случайной величины e = Pm H(Xi ) — совместные дифференциальные Xi , i = 1, 2, . . . , m ; H(X) , H(X) i=1 e (ее компоненты X ei являются энтропии многомерных случайных величин X и X взаимно независимыми и имеют те же распределения, что и Xi ). Основным недостатком формулы (1) является необходимость вычисления оценок дифференциальных энтропий, т.к. требуется оценивать по ограниченным выборкам одномерные и многомерные плотности распределений непрерывных случайных величин. Результатом является низкая точность оценивания коэффициента de (X) . Справедлива теорема [2]. e = Теорема. Пусть имеем две системы непрерывных случайных величин X e e e (X1 , X2 , . . . , Xm ) и X = (X1 , X2 , . . . , Xm ), каждые соответствующие компоненты ei , Xi , i = 1, 2, . . . , m, определены на всей числовой оси, имеют конечкоторых X ные дисперсии и описываются однотипными законами распределения, с некоторыми ei , i = 1, 2, . . . , m, являются взаимно параметры положения и масштаба, причем X e независимыми. Тогда разность совместных энтропий систем случайных величин X и X равна m X 2 e − H(X) = − 1 H(X) ln (1 − RX ), (2) k /X1 X2 Xk−1 2 k=2 2 — коэффициенты детерминации соответствующих регрессионгде RX k /X1 X2 Xk−1 ных зависимостей, k = 2, 3, . . . , m . Подставив (2) в (1), после преобразований получим "m #1/m Y 2 de (X) = 1 − (1 − RXk /X1 X2 Xk−1 ) . (3) k=2 Вычисление коэффициента de (X) по формуле (3) по сравнению с (1) обладает несколькими существенными преимуществами. Во-первых, здесь не требуется оценивать энтропии H(X) , H(Xi ) , i = 1, 2, . . . , m . Это значительно повышает точность оценивания коэффициента de (X) , c Редакция журнала «ОПиПМ», 2013 г. 2 XIV Всероссийский симпозиум по прикладной и промышленной математике и практически реализуемо на достаточно малых выборках, поскольку здесь требуется 2 соответствующих релишь оценивать коэффициенты детерминации RX k /X1 X2 Xk−1 грессионных зависимостей. Во-вторых, здесь имеется возможность построения стандартных статистических гипотез для оценки значимости коэффициента (3). Работа выполнена в рамках проекта 12-М-127-2049 фундаментальных исследований УрО РАН. СПИСОК ЛИТЕРАТУРЫ 1. Pena D., Van der Linde A. Dimensionless measures of variability and dependence for multivariate continuous distributions. — Commun. Statist. Theory Methods, 2007, v. 36, iss. 10, p. 1845–1854. 2. Тырсин А. Н., Ворфоломеева О. В. Исследование динамики многомерных стохастических систем на основе энтропийного моделирования. — Информатика и ее применения, 2013, т. 7, в. 4, с. 3–10.