УДК 62-50 Решение одной задачи теории оптимального

advertisement
УДК 62-50
Решение одной задачи теории оптимального управления с подвижным
левым концом и закреплённым правым концом
Лутманов Сергей Викторович (научный руководитель)
Вилданов Владислав Рафисович
Созонов Николай Сергеевич
Попова Екатерина Сергеевна
Куксенок Любовь Владимировна
Адрес: ПГНИУ, ул. Букирева, 15.
E-mail: young1990@ya.ru
В статье на базе формулы Коши для решения системы линейных дифференциальных уравнений выводятся необходимые условия оптимальности в задаче оптимального управления с подвижным левым концом. Их применение иллюстрируется на примере конкретной управляемой линейной динамической системе второго порядка.
Введение.
В линейных задачах теории оптимального управление использование формулы Коши для решения системы дифференциальных уравнений позволяет свести
вывод условий трансверсальности для оптимальной траектории, к задаче математического программирования специального вида, применив для ее решения необходимые условия Кароша—Джона [1]. В работе получены указанные условия
трансверсальности и на их основе решен конкретный пример задачи теории оптимального управления с подвижным левым концом.
1. Постановка задачи.
Рассмотрим следующую задачу теории оптимального управления
Задача 1. Найти допустимую программную стратегию U 0   t0 , T  , доставляющую минимум функционалу
I U       x T   ,   C1  R1 
при ограничениях
x  A  t  x  B t  u  C t  , x  Rn , u  P  Rr ,
0  t0  , 1  T  , x0  S0  Rn , S1  Rn ,
где A t  , B t  , t0 , T   матрицы размера n  n , n  r соответственно, непрерывные по переменной t .
Относительно множества S 0 предположим, что оно имеет вид

S0  x  R n i  x   0, i  1,

,m ,
где i : R n  R1 , i  1, , m -заданные непрерывно дифференцируемые по совокупности аргументов функции. Будем также считать, что для него выполнено следующее условие регулярности: для всех x  S0 набор векторов
i  x 
x

, i  I 0  x   i  1,

, m i  x   0
является линейно независимым.
2. Вывод необходимых условий оптимальности.
Пусть пара  x00 ,U 0    , x00  S0 , U 0     t0 , T  доставляет решение задачи 1. Тогда в соответствие с принципом максимума Л. С. Понтрягина [2] должно выполняться
B  t U 0  t  ,  0  t   max B  t  u,  0  t 
uP
(1)
для почти всех t  t0 , T  , где
 0 T   
 0
 x T   , x0   x , t0 , x00 ,U 0   .
x
(2)
Условия (1) и (2) не позволяют однозначно определить программную стратегию управления, претендующую на решение задачи 1, поскольку они содержат n
неизвестных параметров, образующих вектор начальных условий x00  S0 . Для их
определения выведем так называемые условия трансверсальности на левом конце
траектории.
Оптимальное начальное положение фазового вектора x00 удовлетворяет равенству
T
T


  x 0 T      X T , t0  x00   X T , B  U 0   d   X T , C   d  


t0
t0


T
T


0
 min   X T , t0  x0   X T , B  U   d   X T , C   d  .
x0 S0


t0
t0


 0 
 
 
По теореме Кароша – Джона существует вектор  1   0 , для которого спра 
  m 
ведливы соотношения
T
T


0
0
  X T , t0  x0   X T , B  U   d   X T , C   d 


t0
t0


0
x0
m
i  x00 
i 1
x0
  i
 0;
ii  x00   0, i  0, i  1,
0 0,1 .
(3)
,m ;
(4)
(5)
Заметим, что в силу регулярности множества S 0 , в условии (5) можно сразу
записать 0  1 . Действительно, пусть 0  0 . Тогда из условий (3) и (4) следует,
что
i  x00 
m

i 1

0
x0
i
 
i
i  x00 
iI 0 x00
x0
0,
(6)
причем среди чисел i , i  I 0  x  есть числа, отличные от нуля. Равенство (6)
противоречит линейной независимости набора векторов
i  x00 
x
, i  I 0  x00  . Остает-
ся признать, что 0  1 .
Вычисляем
T
T

 
 X T , t0  x0   X T , B  U 0   d   X T , C   d 

x0 
t0
t0

 X Tp T , t0 

x0  x00
 0
 x T     0 t0  .
x
Теперь условие (3) можно переписать в виде
m
  t0    i
0
i  x00 
i 1
x
.
Таким образом, доказана следующая теорема.
Теорема 1. Пусть пара  x00 ,U 0    , x00  S0 , U 0     t0 , T  доставляет решение
задачи 1. Тогда необходимо
B  t U 0  t  ,  0  t   max B  t  u,  0  t 
uP
при почти всех t  t0 , T  . В случае, когда для множества S 0 выполнены условия регулярности, существует набор чисел 1  0, , m  0 таких, что
m
  t0    i
0
i 1
i  x00 
x
, ii  x00   0, i  1,
,m .
3. Модельный пример
Рассмотрим линейный управляемый динамический объект
 0 1 1 0
 x  
u, t  [0,  ] ,
x1  

1
0
0
1

 

x 
u 
x   1   R 2 , u   1   P  {u  R 2 u12  u 22  1} ,
 u2 
 x2 
S 0  {x  R 2 |  16  x12  2 x 2  0,2 4  ( x1  1) 2  x 2  0} .
Таким образом функции 1 ,  2 определяются в следующем виде:
1 ( x1 , x 2 )   16  x12  2 x 2 ,  2 ( x1 , x 2 )  2 4  ( x1  1) 2  x 2 ,
I [u()]  4 x12 ( )  2 x22 ( )  min .
Множество S 0 показано на рис. 1.
Рис. 1
Из условия (1) программное управление определяется следующим образом
1


  12   22
u 0 (t , )  
2

  2  2
1
2




,



а объединенная система дифференциальных уравнений имеет вид
x1  x 2 
 1  
1
 12   22
, x 2   x2 
2
 12   22
,
(7)
H
H
  2 ,  2  
  1 .
x1
x 2
Выпишем граничные условия. На правом конце траектории:
 1 ( )  


 8 x1 ( ) ,  2 ( )  
x1 t 
x 2
 12 x 2 ( ) .
(8)
t 
В соответствии с теоремой 1 выпишем граничные условия на левом конце
траектории:
 1 (0)  1


1

1 x1
2 2 ( x1  1)
 2 2 

,
 2 (0)  1 1   2 2  21   2 ,
x1
x1
x2
x2
16  x12
4  ( x1  1) 2




1  16  x12  2 x 2  0 ,  2  2 4  ( x1  1) 2  x 2  0 , 1 ,  2  0 .
Общее решение системы дифференциальных уравнений (7) имеет вид

c1t
x1 (t )   c3 

c12  c 22



c2 t
 cos t   c 
4


c12  c 22



 sin t ,



c2 t
x 2 (t )   c 4 

c12  c 22



c1t
 cos t   c 
3


c12  c 22



 sin t ,


 1 (t )  c1 cos t  c2 sin t ,  2 (t )  c2 cos t  c1 sin t .
Выпишем граничные условия с учетом равенств (9).
(9)
На левом конце




1  16  x12  2 x 2  0 ,  2  2 4  ( x1  1) 2  x 2  0 ,
 1 (0) 
1 x1
16  x
2
1

2 2 ( x1  1)
 с1 ,  2 (0)  21   2  с2 ,
4  ( x1  1) 2
(10)
с3  х10 , с4  х20 , 1 ,  2  0 .
На правом конце
 1 ( )  8 x1 ( )  с1  
8с1
с12  с22
 2 ( )  12 x2 ( )  с2  
 8с3 ,
12с2
с12  с22
(11)
 12с4 .
В результате получилась система из восьми уравнений относительно
восьми c1 , c2 , c3 , c4 , 1 , 2 , x10 , x20 неизвестных. Последовательно рассмотрим четыре случая: 1) 1  0, 2  0 , 2) 1  0, 2  0 , 1) 1  0, 2  0 , 1) 1  0, 2  0 .
Случай 1. Из первых двух равенств в (10) вытекает, что
c1  c2  0   0  t   0, t  0,   .
В этом случае условия принципа максимума не позволяют определить структуру оптимального управления.
Случай 2. Граничные условия принимают вид
, с1 
с 2  2 1
1 х10
16  х102
,
(12)
2
 16  х10
 2 х20  0,
х10  с3 , х 20  с 4 ,  с1  
8с1
с12  с22
Решением системы (12), (13) будут числа
 8с3 ,  с 2  
12с 2
с12  с 22
 12с 4 .
(13)
х10  0, х20  2, с1  0, с2  61,6991, с3  0, с4  2, 1  30,8496 .
(14)
Проверим, входит ли точка (0;2) в S 0 :
 2 ( х10 , х20 )  1.4641 ,
следовательно точка принадлежит области S 0 .
Подставляя (14) в (7), определяем программную стратегию и траекторию объекта.
Значение функционала равно
I [U 0 ()]  158,616 .
Случай 3. Граничные условия принимают вид
x10  c3 , x20  c4 , c2   2 ,
 с1  
8с1
с12  с 22
2 2 ( x10  1)
4  ( x10  1)
2
 8с3 ,  с 2  
 с1 ,
12с 2
с12  с 22
 12с 4 .
 2 4  ( x10  1) 2  х20  0 .
(15)
(16)
Решением системы (15), (16) будут числа
х10  1,1525, х20  3,9884, с1  13,0198, с2  85,126, с3  1,1525, с4  3,9884,  2  85,216 .
Проверим, входит ли точка (1.1525,3.9884) в S 0 :
1 ( х10 , х20 )  4.1463 ,
следовательно точка не принадлежит области S 0 .
Случай 4. Граничные условия принимают вид
x10  c3 , x20  c4 , c2   2  21 ,
 с1  
1 x10
16  x
2
10

2 2 ( x10  1)
4  ( x10  1)
2
8с1
с12  с 22
 8с3 ,  с 2  
12с 2
с12  с 22
 12с 4 .
(17)
 с1 ,  2 4  ( x10  1) 2  х20  0 ,  16  x102  2 х20  0 . (18)
Эта система имеет два решения.
Первое решение
х10  2,8753, х20  1,3904, с1  39,6144, с2  44,9743, с3  2,8753, с4  1,3904,
1  20,8099, 2  3,3544 .
Значение функционала равно
I [U 0 ()]  182,36 .
Второе решение
х10  0,74196, х20  1,9653, с1  10,0262, с2  60,7799, с3  0,742, с4  1,9653,
1  29,7685, 2  1,243 .
Подставляя это решение в (7), определяем программную стратегию и траекторию объекта.
Значение функционала равно
I [U 0 ()]  57,5885
Таким образом, задача оптимального управления имеет оптимальное решение, полученное в последнем случае, так как при этом значение функционала
наименьшее. На рис. 2 представлена оптимальная траектория динамического объекта.
Рис. 2
Заключение
Условия принципа максимума и условия трансверсальности позволили однозначно определить программное управление и траекторию движения динамической системы. В силу того, что для данной задачи выполнены предположения теоремы существования оптимального решения, полученная пара является искомой.
Библиографический список
1. Васильев Ф. П. Численные методы решения экстремальных задач
/Ф. П. Васильев. М.: Наука, 1988. 549 с.
2. Понтрягин Л.С., Математическая теория оптимальных процессов
/Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. М.: Наука,
1976. 392 с.
One optimal control problem with variable initial point and fixed endpoint
Lutmanov Sergey Viktorovich (advisior)
Vildanov Vladislav Rafisovich
Kuksеnok Lubov Vladimirovna
Popova Ekaterina Sergeevna
Sozonov Nikolay Sergeevich
In this article Cauchy’s differential formula was used to found necessary conditions of optimal control problem with variable initial point. They are used in example of
linear dynamic control system of second order.
Download