3.6. Комплексный коэффициент парной корреляции

advertisement
3.6. Комплексный коэффициент парной корреляции
Поскольку при альтернативном подходе к эконометрии комплексных
переменных используются новые понятия, такие как комплексная дисперсия
и комплексный корреляционный момент, следует ожидать отличия и во всех
других разделах комплекснозначной эконометрии от разделов, которые
можно получить при стандартном подходе, изложенном в параграфах 3.1, 3.2
и 3.3.
В полной мере это касается и корреляционного анализа, если его
разрабатывать применительно к комплексным переменным.
В параграфе 3.3 было показано – как можно вывести формулу для
вычисления коэффициента парной корреляции. Для этого использовалась
известная в математической статистике формула:
 XY
 XY .
rXY 
(3.6.1)
Подставим в неѐ из параграфа 3.4 значения комплексного
корреляционного момента и комплексных дисперсий. Для упрощения формы
записи примем, что все исходные переменные центрированы относительно
их средних арифметических. С учѐтом этого получим:
 ( y  iy )(x  ix )
 ( x  ix )  ( y  iy )
rXY 
rt
it
rt
it
2
rt
it
rt
.
(3.6.2)
2
it
Раскрывая скобки числителя и группируя действительную и мнимую
части, получим для него:
( y
x  yit xit )  i ( xrt yit  yrt xit ) .
(3.6.3)
rt rt
Теперь в знаменателе возведѐм во вторую степень выражения,
находящиеся под знаком сумм и сгруппируем действительную и мнимую
части:
 (x
rt
 ixit )
2
(y
rt
 iyit ) 2 
 (x
2
rt
 xit2  i 2 xrt xit ) ( yrt2  yit2  i 2 yrt yit ) . (3.6.4)
Подставляя и числитель, и знаменатель в исходную формулу (3.6.2),
получим для комплексного коэффициента парной корреляции формулу,
которую можно использовать при отсутствии возможности работы с
комплексными числами:
rXY 
(y x
 (x  x
rt rt
2
rt
2
it
 yit xit )  i  ( xrt yit  yrt xit )
 i 2 xrt xit ) ( yrt2  yit2  i 2 yrt yit )
.
(3.6.5)
Отличие полученной формулы от той, которая следует из стандартной
постановки задачи (3.3.8) легко обнаружить, если привести эту формулу
здесь:
rXY 
(y
y  xrt xit )  i ( ( xrt yit  yrt xit ))
rt it
t
t
 ( xrt  xit ) ( yrt  yit 2 )
2
t
2
2
.
(3.6.6)
t
Таким образом, получено две разные формулы для расчѐта значений
коэффициента парной корреляции и необходимо определиться – какой из них
следует отдать предпочтение.
Для этого необходимо вернуться к истокам корреляционного анализа.
Формула (3.6.1), удобная для вывода коэффициента парной корреляции вовсе
не является первичной, о чѐм свидетельствует, например, работа
Е.Е.Слуцкого «Теория корреляции», опубликованная ещѐ в 1912 году1. Сам
коэффициент парной корреляции и его смысл определяются через
коэффициенты регрессии. Рассмотрим этот вывод и тогда можем получить
необходимый вывод.
Прежде всего, определим линейную взаимосвязь между двумя
комплексными переменными Y и X. Очевидно, что эта взаимосвязь опишется
равенством:
Y  Y0  aX
,
(3.6.7)
где Y0 и a – некоторые коэффициенты. Но что это за коэффициенты? Если
считать, что они – вещественные числа, то равенство (3.6.7) даѐт две
элементарные линейные зависимости – вещественных частей друг от друга и
мнимых частей друг от друга. Влияние, скажем, мнимой части комплексной
переменной X на действительную часть комплексной переменной Y эта
зависимость не отражает. Поэтому имеет смысл рассматривать модель с
комплексными коэффициентами.
По своему смыслу свободный член Y0 модели (3.6.7) представляет
собой константу, комплексное число, которому равна комплексная
переменная Y в том случае, если комплексная переменная X принимает
нулевое значение.
В корреляционном анализе для получения удобной при вычислениях
формулы коэффициента парной корреляции, избавляются от свободного
коэффициента посредством центрирования исходных переменных
относительно их средних арифметических. Логика этого подхода такова.
Коэффициенты регрессии Y на Х и Х на Y находятся с помощью МНК,
который для модели
1
Слуцкий Е.Е. Экономические и статистические произведения: Избранное. – М.: Эксмо, 2010 – с. 642-792.
Yt  a0  a1 X t
(3.6.8)
предлагает решить систему нормальных уравнений:
 Yt  na0  a1  X t
 t
t

2
 Yt X t  a0  X t  a1  X t
t
t
 t
,
(3.6.9)
а для модели
X t  b0  b1Yt
(3.6.10)
предлагает решить другую систему нормальных уравнений:
 X t  nb0  b1  Yt
 t
t

2
 Yt X t  a0  Yt  a1  Yt
t
t
 t
.
(3.6.11)
Для того чтобы найти коэффициенты регрессии a1 и b1, центрируют
исходные переменные относительно их средних арифметических:
X t  X ; Yt  Y
.
С учѐтом того, что сумма отклонений любой переменной от еѐ средней
арифметической равна нулю, равенство для первых уравнений систем
нормальных уравнений будут выполняться только в том случае, когда их
свободные члены (a0 и b0 соответственно) равны нулю. Тогда первая система
нормальных уравнений для центрированных переменных превратится в одно
уравнение:
 (Y  Y )( X
t
t
 X )  a1  ( X t  X ) 2
t
t
,
точно также как и второе:
 (Y  Y )( X
t
t
t
 X )  b1  (Yt  Y ) 2
t
.
Откуда легко вычисляются значения коэффициентов регрессии a1 и b1
через центрированные переменные. Среднее геометрическое коэффициентов
регрессий a1 и b1:
r   a1b1
(3.6.12)
и будет представлять собой коэффициент парной корреляции:
r
 (Y  Y )( X
t
t
 X)
t
 ( X t  X )2  (Yt  Y )2
t
.
(3.6.13)
t
Понятно, что значение коэффициента, по модулю равное единице,
достигается только в том случае, когда a1=1/b1, то есть когда между
переменными существует функциональная линейная зависимость.
Используем этот подход в случае вывода формулы для расчѐта
коэффициента парной корреляции комплексных переменных, для чего с
помощью центрирования избавимся от свободного члена так, как это сделано
в предыдущем параграфе в (3.5.26). Используя форму записи, удобную для
работы с комплексными переменными (3.5.27), применительно к
комплексному коэффициенту регрессии X на Y, обозначенному в (3.6.7) как
a, получим:
a
(y
 (x
rt
 iyit )(xrt  ixit )
rt
 ixit )( xrt  ixit )
.
(3.6.14)
Теперь рассмотрим регрессию,
комплексную регрессию Y на X:
обратную
X  X 0  bY ,
данной,
то
есть
–
(3.6.15)
где X0 и b – комплексные коэффициенты уравнения регрессии.
Комплексный коэффициент пропорциональности b также может быть
найден с помощью комплексного МНК:
b
(y
(y
rt
 iyit )(xrt  ixit )
rt
 iyit )( yrt  iyit )
.
(3.6.16)
Поскольку коэффициент парной корреляции представляет собой
среднее геометрическое коэффициентов регрессии (3.6.12), найдѐм среднее
геометрическое коэффициентов регрессии (3.6.14) и (3.6.16):
rXY   a1b1 
 ( y  iy )(x  ix )
 ( x  ix )  ( y  iy
rt
it
rt
it
2
rt
it
rt
2
it )
.
(3.6.17)
Как видно, получилась та же самая формула, что и (3.6.2), которая
выведена через комплексный корреляционный момент и комплексную
дисперсию. Она может быть преобразована и к виду (3.6.5) если у
экономиста нет возможности работать с комплексными числами, и он
вынужден оперировать только с действительными числами.
Теперь вернѐмся к стандартной постановке проблемы, принятой в
математической статистике, которая предполагает, что дисперсия,
корреляционный момент и т.п. статистические характеристики комплексных
переменных должны быть вещественными числами.
Вновь представим коэффициент парной корреляции как среднее
геометрическое двух комплексных коэффициентов регрессии, только в
формулы для вывода коэффициента будем подставлять те значения
комплексных коэффициентов регрессии, которые получаются при
минимизации дисперсии, если рассматривать еѐ как вещественную
характеристику процесса (3.1.2). Такой подход позволил в параграфе 3.2
получить систему уравнений, решая которые можно вычислить комплексные
коэффициенты, минимизирующие значения этой дисперсии. Поскольку мы
используем центрированные переменные, избавившись тем самым от
свободного члена, то можно напрямую воспользоваться уже полученной для
этого формулой (3.2.11).
Коэффициент комплексной регрессии X на Y будет вычисляться так:
a
(y
 (x
rt
 iyit )(xrt  ixit )
rt
 ixit )( xrt  ixit )

 ( y  iy )(x
 (x  x
rt
it
2
rt
rt
2
it
 ixit )
)
.
(3.6.18)
Если рассматривать обратную зависимость, то есть – комплексную
регрессию Y на X, то комплексный коэффициент такой регрессии будет
найден аналогично:
b
 (x
(y
rt
 ixit )( yrt  iyit )
rt  iyit )( yrt  iyit )

 ( x  ix )(y
(y  y
rt
it
2
rt
rt
2
it
 iyit )
)
.
(3.6.19)
Подставим теперь в формулы (3.6.18) и (3.6.19) в формулу их средней
геометрической. Получим:
 (x
r
rt
 ixit )( yrt  iyit ) ( yrt  iyit )(xrt  ixit )
 (x
rt
t
2
 xit 2 ) ( yrt  yit 2 )
2
.
(3.6.20)
t
Первый сомножитель числителя может быть приведѐн к такому виду:
( x
rt
 ixit )( yrt  iyit )  i( xit  ixrt )( yrt  iyit ) .
(3.6.21)
Второй сомножитель числителя коэффициента (3.6.20) также может
быть преобразован следующим образом:
( x
 ixit )( yrt  iyit )  i( xrt  ixit )( yit  iyrt ) .
rt
(3.6.22)
Теперь можно убедиться в том, что эти два сомножителя подкоренного
выражения числителя (3.6.20) равны друг другу, поэтому этот числитель
следует записать в таком виде:
i( xrt  ixit )( yit  iyrt ) ,
(3.6.23)
если работать непосредственно с комплексными переменными, а если
работать с действительными переменными, рассматривая и вычисляя
отдельно действительную и мнимую части комплексных переменных задачи,
то удобнее числитель представить так:
i( xrt  ixit )( yit  iyrt )  ( xrt yrt  xit yit )  i( xrt yit  xit yrt ) .
(3.6.24)
Тогда коэффициент парной корреляции (3.6.20) может быть записан
так:
i  ( xrt  ixit )( yit  iyrt )
r
(y
2
rt
 yit2 ) ( xrt2  xit2 )
.
(3.6.25)
Теперь сгруппируем в числителе действительную и мнимую части
коэффициента:
r
 (x
rt
yrt  xit yit )  i  ( xit yrt  xrt yit )
 ( yrt2  yit2 ) ( xrt2  xit2 )
.
(3.6.26)
Получили коэффициент, отличный от тех, которые были выведены в
данном параграфе. Но поскольку этот коэффициент выводился, исходя из
посылок стандартного подхода, то следует ожидать его полную идентичность
с тем коэффициентом (3.3.8), который был выведен в параграфе 3.3.
Приведѐм здесь полученную в указанном параграфе формулу:
rXY 
(y
it
yrt  xit xrt )  i ( ( xrt yit  yrt xit ))
t
t
 (x
rt
t
2
 xit ) ( yrt  yit )
2
2
t
2
.
(3.6.27)
Легко обнаружить существенное отличие в коэффициентах – первые
слагаемые числителей принципиально не равны друг другу, а мнимые
составляющие отличаются знаком. Если в ходе вывода этих двух
коэффициентов не допущена математическая ошибка (многочисленные
проверки еѐ не выявили, но…), то мы убеждаемся в том, что один и тот же
подход, который предполагает что все статистические меры колеблемости
комплексных переменных должны быть вещественными, не является
сбалансированным и его применение в целях эконометрии комплексных
переменных невозможно.
Поэтому будем использовать в эконометрии комплексных переменных
комплексную дисперсию (3.4.3), комплексный корреляционный момент
(3.4.6), комплексный МНК (3.5.10) и комплексный коэффициент корреляции
(3.6.17), то есть те расчѐтные методы и коэффициенты, которые изложены в
параграфах 3.5 и 3.6.
Download