Метод оценки вероятности принятия ошибочных

advertisement
Метод оценки вероятности принятия ошибочных решений при
дискриминационном анализе транспортных узлов
Пасевич Веслав Р.
к.ф.-м.н. Технологический университет Польши,
г. Щецин,
Январь 05.2010
tmp@nwpi.ru
Аннотация
Применение дискриминационных моделей при организации процедур
управления в транспортных узлах достаточно часто приводят к ошибочным
решениям. Поэтому нахождение вероятности таких ошибок чрезвычайно важно,
особенно в условиях напряженного движения и маневров транспортных единиц
на ограниченном пространстве акваторий, терминалов. В работе приводится
метод нахождение вероятности таких ошибок и их оценки.
Ключевые слова: транспорт, модель, вероятность, ошибка, система
Method of the estimation to probability of the taking the wrong decisions
under analysis diskrimination of the transport elements
Pasewicz Weslav R.
Abstract
Using diskriminants models in transport nodes, it is sufficiently often bring
about wrong decisions. So finding to probability such mistakes exceedingly it is
important, to term of the tense motion and manoeuvre of the transport units
particularly. The method finding happens In work to probability such mistake and
their estimations.
Keywords: transport, model, probability, mistake (error), system
Применение дискриминационной модели в управлении транспортными
узлами (ТУ) в некоторых случаях может дать ошибочное решение. Это вытекает
из самого характера моделей данного типа. Такие ошибки опасны тем, что могут
привести к неадекватным решениям по управлению грузовыми операциями на
акваториях, терминалах, станциях, грузовых площадках и т.д. По характеру
функционирования они сами по себе являются объектами повышенной
техногенной и экологической опасности. Если в этих условиях к указанным
ошибкам добавить ошибки модели управления такого рода объектами, то
процесс принятия решений может оказаться не адекватным уже на первых
шагах анализа и прогнозирования состояния объекта (ТУ) и вызвать нарушение
в переработки груза. Указанное приведёт, в свою очередь к накоплению товара,
нарушению работы ТУ, вызовет скопление подвижного состава всех видов
транспорта, наличных в данном ТУ. Поэтому нахождение и оценка вероятности
таких ошибочных решений чрезвычайно важна, особенно в условиях
напряженного движения и маневров транспортных единиц на ограниченных
пространствах ТУ.
Процесс
поддержки
управления
принятия
ТУ
рассматривается
решений
как
взаимосвязанных
переработки, хранения и погрузки товара для
единая
процедура
подсистем
выгрузки,
минимизации стоимости
обработки груза в данном транспортном узле. Иными словами, управление в ТУ
реализует
схему подготовки и принятия
многомерных систем. Отсюда и
решения по управлению для
постановка задачи оценки принятия
ошибочных решений в ТУ.
Для двух многомерных систем  i : X ~ N  i ,  i  дискриминационную
функцию можно записать в виде :
T   X   2  2  X   2    X  1  1  X  1 
'
1
'
1
(1)
где  i является вектором средних и  i дополнительно определенная
матрица дисперсий для i=1,2. Эта функция известна как квадратичная
дискриминационная функция (КДФ), представляющая функцию двух форм ,
когда
   , по выражению (1) редуцируется в
1
2
1
V  X '  1 ( 1   2 )  ( 1   2 )' 1 ( 1   2 ) ,
2
(2)
что известно как линейная дискриминационная функция (ЛДФ) . Пусть
P(i | j )
означает вероятность классифицирования наблюдаемого вектора в
 1 (i, j  1,2, i  j) . Тогда расчет этих вероятностей требует данных распределения
для КДФ и распределения для ЛДФ. Определение вероятности ошибочных
классификаций было описано несколькими авторами [1,2]. В случае ЛДФ
 
  
V ~ N  ,  , когда X ~ N 1 ,   и V ~ N   ,  , когда X ~ 1 ,   ,
2 
 2 
где   1   2  1 1   2  известно расстояние Махалановича между
двумя многомерными нормальными распределениями. В этом случае, известны
точные выражения для ошибочных классифицируемых систем [3].
P(1 | 2)  1  F (t1 ) , где t1 
P(2 | 1)  1  F (t 2 ) , где t 2 
K

2

K
(3)

2

(4)
где F - дистрибуанта функции нормального распределения, K  ln
q 2 C12
, q1
q1C 21
- априорная вероятность того, что наблюдения  i верны, и Cij - затраты. В
случае КДФ распределение случайной переменной T неизвестно. Поэтому,
точные выражения для классификаций не определены. Рассмотрим определение
ошибочных классификаций в случае одномерной нормальной системы.
Для одномерной системы  1 : X ~ N 1 ,  12  и  2 : X ~ N  2 ,  22  , а также для
данного наблюдения x квадратичная дискриминационная функция имеет вид
t
 X   2 2  X   1  2
 22

 12
.
(5)
Оптимальным правилом решения, минимизирующим риск по Байесу [2,4]
будет: классифицируй наблюдение x в систему  1 , если
2
q C 
2
t  K  ln 12  ln  2 12  , в противоположном случае в  2 .
1
 q1C 21 
Подставляя случайную переменную X вместо наблюдения в правой части
равенства (3) получаем следующее соотношение
T
 X   2  2  X   1 2
 22

 12
.
(6)
Произведя преобразования в (6) и принимая r 

1 12   2 22

X
 12   22 
 12   22
T
1
 22 



2


 12   22


r


 22



1   2 2 , получим
 12   22

  2   2 22
 X  1 12
 1   22


2



2



 .(7)



Если X ~ N 1 ,  12  , тогда
     
  2   2 22 
1 
 X  1 12
 ~ N  1 2 1 2 2 ,1 .
2
1 
1   2 
 1   2

(8)
Если X ~ N  2 ,  22  , тогда
     
  2   2 12 
1 
 X  1 22
 ~ N  2 2 1 2 2 ,1 .
2
2 
1   2 
 1   2

(9)
Распределение T является линейной функцией смещенного распределения
 2 с одной степенью свободны и параметром смещения, который зависит от
распределения случайной переменной X.
Если X ~ N 1 ,  12  , то
  1 
 12 1   2 2

2
1
  22

2
.
(10)
Если X ~ N  2 ,  22  , тогда
  2 
 22 1   2 2

2
1
  22

2
.
(11)
Отсюда



P(1 | 2)  Pr T  K | X ~ N  2 ,  22 

 2
2
 1   2
 1  Pr 
 12



  2   2 22
 X  1 12
 1   22


1




  2   2 22
 X  1 12
 1   22

 1  Pr 
2


2






  S1  ,





2






  K  r 





(12)
где S1  K  r  12 ( 12   22 ) 1 .
(13)
Рассматривая функцию плотности смещенного распределения
2,
вероятность (3) определится из следующего выражения
 
x e  2

S1
 2 
P(1 | 2)  1   
dx .
1
1
0
1  2 1
k 0 k  2 
2  k   e k !
2

k
1
2

x
2
k
(14)
Подобным образом
 
x e  1

S2
 2 
P(2 | 1)  1   
dx ,
1
1
0
1  2 1
k 0 k  2 
2  k  e k !
2

(15)
где S 2  K  r  22 ( 12   22 ) 1 .
(16)
k
1
2

k
x
2
Принимая алгоритмы, описанные в работах [3,4], можем вычислить
интегралы в равенствах (15) и (16) для любой группы параметров. Эти
результаты представлены в работе [3].
Более общим случаем поставленной задачи является определение и
оценка
вероятностей ошибочных классификаций в случае многомерных
нормальных систем.
Для двух многомерных систем  1 : X ~ N 1 , 1  и  2 : X ~ N  2 ,  2 , где 1 и
2
являются
диагональными

D( i )   i21 ,,  ip2

матрицами
с
диагональными
элементами
и векторами средних  i   i21 ,,  ip2  , (i=1,2), квадратичная
'
дискриминационная функция для наблюдаемого вектора имеет вид
t  x   2  2 x   2   x  1  1 x  1  .
'
1
'
1
(17)
Оптимальное правило решения, минимизирующее риск по Байесу
следующее: классифицируй наблюдение x в систему  1 , при t  K , где
1
2
q C 
K  ln
  2 12  ,
 2  q1C 21 
в противном случае - в  2 .
(18)
Подставляя многомерную случайную переменную X вместо наблюдения x
в равенство (17) и принимая
p
r
j 1

 2 j 
2
1j
 12j   22 j
,
(19)
получаем
 X  
j
2j
T   

2j
j 1 

p
p
 12j   22 j
j 1
 22 j

p
 12j   22 j
j 1
 12j

2
  X j  1 j
 
  
1j
 




2





1 j  12j   2 j  22 j
X j 
 12j   22 j


1j






 r .




1 j  22 j   2 j  12j
X j 
 12j   22 j


2j






r



(20)
Если X ~ N 1 , 1  и X ~ N 1 j ,  12j  , а также
Xj 
1 j 12j   2 j 22 j
 12j   22 j
1j
  1 j 1 j   2 j  
~ N
,1 , j  1,, p .
  2  2

1
j
2
j


(21)
Если X ~ N  2 ,  2  и X ~ N  2 j , 22 j , а также
Xj 
1 j 22 j   2 j 12j
  2 j 1 j   2 j  
 12j   22 j
~ N
,1 , j  1,  , p .
  2  2

2j
1j
2j


(22)
Поскольку матрицы 1 и  2 диагональные, то X 1 , , X p независимы. Поэтому квадраты выражений (20) являются случайными переменными со
смещенными распределениями  2 , с одной степенью свободны и параметром
смещения вида
 1 j 1 j   2 j 2
 2 j 1 j   2 j 2
j  1,  , p .
1 j 
и 2 j 
 12j   22 j
 12j   22 j
(23)
Отсюда случайная переменная T является линейной комбинацией
независимых случайных переменных со смещенным распределением  2 .
Патнайк [1] считал, что распределение линейной комбинации случайных
переменных со смещенным распределением  2 может быть аппроксимированно
многомерным центральным распределением  (n2 ) с n- степенями свободны. Если
принять W  T  r , то параметры «n» и «c» могут быть оценены путем сравнения
первых двух моментов W и c (n2 ) , где «r», определяемое из (19) является
постоянным.
Пусть
p
W   j ( X j   j ) 2 ,
(24)
j 1
где  j и  j есть известные постоянные (функции параметров двух
многомерных нормальных распределений). Тогда X 1 , , X p будут одномерными
случайными переменными с нормальными распределениями. Поэтому, для
каждой «j», X j   j является смещенным распределением  2 с одной степенью
свободы и параметром смещения  j2 . Заметим, что зависимость M w (t ) ,
определяющая моменты относительно W, имеет вид


M w (t )  E (e tW )   E exp t j X j   j 
p
j 1
 exp  t j  1  2t j 
p
j 1
1
2
j
2
 1  2t 
p

j
1
2

.
(25)
j 1
В то же время функция K w (t ) , создающая полуинварианты, будет
натуральным логарифмом функций M w (t ) и потому
E (W )  K1 (W ) 
p
d
K W (t ) |t 0    j (1   j2 ) .
dt
j 1
(26)
Дисперсию для W рассчитываем как вторую производную функции K w (t ) ,
в точке t=0, т.е.
Var (W )  K 2 (W ) 
p
d2
K
(
t
)
|

2
 2j (1   j2 ) .

W
t 0
dt 2
j 1
Более того, Ec (2n)   nc и Var(c (2n) )  2nc 2 .
(27)
2
Сравнивая E(W) и E(c (n)
) , а также Var (W ) и Var (c (n2 ) ) , и вычисляя систему
выражений относительно «n» и «c», получаем
  1  2 
p
c
2
j
j 1
2
j
(28)
  1   
p
j 1
2
j
j
и
  1  2 
p
n
2
j
j 1
2
j
  1   
p
j 1
2
j
2
.
(29)
2
j
Аппроксимируя распределение W, определенное примером (23) через
c (n2 ) , вероятности ошибочных классификаций можно выразить следующим
образом:
P(1 | 2)  PrV12  K | X ~ N  2 ,  2   PrW  K  r | X ~ N  2 ,  2  


 Pr c (2n )  K  r  Pr   (2n )  ( K  r ) 
c 

P(1 | 2)  1  Pr   (2n )  ( K  r )  , если c>0.
c 

, если c<0
(30)
 12j   22 j
Подставляя  j 
и  j   22 j (1 j   2 j )( 12j   22 j ) 1 в равенства (28) и
 12j
(29), получаем «n» и «c». Подобным образом, когда X ~ N 1 , 1  , тогда может
быть
P(2 | 1)  PrV12  K | X ~ N 1 , 1   PrW  K  r | X ~ N 1 , 1  


 Pr c (2n )  K  r  Pr   (2n )  ( K  r ) 
c 

P(2 | 1)  1  Pr   (2n )  ( K  r )  , если c>0.
c 

, если c<0
(31)
 12j   22 j
Подставляя  j 
и  j   12j (1 j   2 j )( 12j   22 j ) 1 в равенства (28) и
 22 j
(29), получаем «n» и «c».
Предложенный метод был успешно применён и внедрён в практику
организации процессов управления в транспортной фирме BAFTRANS, что
снизило ежедневные издержки обработки груза в ТУ на 12 %.
Литература
1. Anderson T.W. “An Introduction to Multivariate Statistical Analysis”. Wilay, New
York, 1958.
2. Kubicki J., Miklinska J., Urban-Popiolek I. “Transport Miedzynarodowy
Multimodalne Systemy Transportowe”. Gdynia. 2000.
3. Арефьев И.Б., Пасевич В. Управляемая модель транспортного узла на базе
распределения Гаусса. СПб: ГУВК, 2001, 37-40.
4. Маслов Е.П. Применение теории статистических решений к задачам
оценки параметров объекта. М: Ж: Автоматика и телемеханика №10, 1963 с.
1338-1350.
Пасевич Веслав, к.физ.мат.н., ст. преподаватель Западно-Поморского
технологического университета (Польша), докторант каф. Теории и методов
прогнозирования СЗТУ.
Тел.(+812) 312-07-92, E-mail: tmp@nwpi.ru
Download