Document 610075

advertisement
1
ЛЕКЦИЯ 1
Теория оптимального управления возникла в начале 50-х годов в связи
с появлением новых задач, поставленных практикой. Необходимость решения актуальных проблем теории автоматического регулирования, динамики
полета, потребовала разработки эффективных методов решения экстремальных задач нового типа. Такие задачи стали называться неклассическими вариационными задачами или задачами оптимального управления.
Естественно, что среди непрерывных систем в первую очередь были
изучены линейные системы, описываемые обыкновенными дифференциальными уравнениями:
x  Ax  bu
(0)
Для системы (0) качественная теория оптимального управления во
многих своих разделах к настоящему времени достигла очень высокого
уровня. Среди результатов этой теории выделяются принцип максимума Л.
С. Понтрягина [9], динамическое программирование Р. Беллмана, метод моментов Н. Н. Красовского [8].
Уравнения (0) являются математическими моделями многих процессов
в различных сферах человеческой деятельности. В них переменные x(t ) ,
t  T , представляют значения полного набора внутренних характеристик
изучаемого процесса в момент времени t . Переменные u (t ) , t  T , называются переменными управления, A - n  n -матрица, характеризующая динамические свойства объекта, b - n -вектор параметров входного устройства.
Согласно теории дифференциальных уравнений, поведение объекта
x(t ) , t  T , будет однозначным, если задать его начальное состояние
x(0)  x0
и управляющее воздействие u (t ) , t  T , из класса кусочно-постоянных
функций.
В целом система (0) представляет собой дифференциальный закон поведения процесса управления. Получение и использование законов поведения в дифференциальной форме широко распространено в современных
научных исследованиях, так как она компактно и адекватно выражает фундаментальные свойства многих явлений.
Большие усилия были приложены к созданию эффективных методов
решения задач оптимального управления. Однако до сих пор даже для линейных задач не предложено алгоритмов надёжно строящих оптимальное
управление.
Линейная задача оптимального управления с фазовыми ограничениями
формулируется в виде:
cxt1   max,
2
x  Ax  bu ,
  t   Dx t     t ,
x0  x0 , Hx t1   g ,
f   u t   f  , t  T  0, t1  ,
где x  R n ; u  R r ; c, A, B, H , D - постоянные векторы и матрицы соответствующих размеров.
В теории оптимального управления наряду с качественной теорией, которая анализирует вопросы существования решения, необходимые и достаточные условия оптимальности, корректность постановки задачи, структуру
решения и т. п., большое внимание уделяется конструктивным вопросам,
связанным с фактическим (аналитическим или численным) построением решения задач оптимального управления.
Несмотря на большие успехи, достигнутые в теории оптимального
управления, многие ее проблемы остаются нерешенными до настоящего времени. Это, прежде всего, относится к задачам с фазовыми ограничениями.
Поэтому создание эффективных методов решения задач с фазовыми ограничениями остается одним из приоритетных направлений современной теории
оптимального управления. Одним из способов повышения эффективности
численных методов является учет специфики решаемой задачи.
ПОСТАНОВКА ЗАДАЧИ
На фиксированном промежутке времени T  0, t   рассмотрим задачу
оптимального управления с фазовыми ограничениями
J u   cxt    max,
x  Ax  bu ,
 
x0  x0 , Hx t   g ,
  t   d xt     t ,
(1)
ut   1, t T .
Здесь x  xt  – n -вектор состояния системы в момент времени t ; u  u t  –
значение скалярного управления в момент времени t ; A – постоянная n  n матрица, H – постоянная m  n -матрица, rankH  m  n ; c, b, d – заданные
векторы соответствующих размеров;   t ,  t , t T , – достаточно гладкие
функции.
Фазовые   t   d xt     t , t T и терминальные Hxt    g ограничения назовем основными ограничениями, ограничения ut   1, t  T , –
прямыми ограничениями задачи (1).
Введем обозначения: u   u t , t  T , x   xt , t  T  , которые будем использовать в дальнейшем.
Будем считать, что d  b  0 и   0  d x0    0 .
3
Определение 1. Управление u и соответствующая траектория x системы (1) называются допустимыми, если они удовлетворяют всем ограничениям задачи (1).
Определение 2. Оптимальными будем называть допустимые управление u 0  и траекторию x 0  , на которых критерий качества J u   cxt   задачи (1) достигает максимального значения.
Определение 3. Допустимое управление u   , для которого выполняется неравенство J u 0   J u     , будем называть  -оптимальным (субоптимальным) управлением.
Будем считать, что основные ограничения задачи (1) удовлетворяют
условию Слейтера, то есть существует такое управление u  , что вдоль него
и соответствующей ему траектории x  системы (1) выполняются соотношения:
 x t     t   0;    max d  x t     t   0;

   min
d
tT
tT
u t   1, t  T ; Hx t    g   g .
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ
ОГРАНИЧЕНИЯМИ КАК ЗАДАЧА ЛП
Если в задаче (1) с помощью формулы Коши
t
xt   F t ,0 x0   F t , b u   d ,
0
исключить xt  , t  T , , то получим задачу линейного программирования в
функциональном пространстве управлений:
 
t*
 
c  F t ,0 x 0   c ' F t * ,  b u   d  max ,
*
0
 
t*
 
H F t * ,0 x0   H F t * , b u   d  g , x0  x0
(2)
0
t
 *  d  F  t ,0  x0   d  F t ,  b u   d   * ,
ut   1 , t  T .
0
В задаче (2) имеется бесконечное число переменных u t  , t  T , бесконечное
число основных ограничений неравенств и m основных ограничений ра-
4
венств. С точностью до интегралов и сумм задача (2) совпадает с дискретной
задачей оптимального управления:
 ct ut   max ,
tT
 ht ut   g  H1 x0 , x0  x0
(3)
tT
 *  d1 x0   d t u t    *  d1 x0 ,
t T
u t   1,
t  T  0,1,...,t   1
С точностью до обозначений задача (3) совпадает с интервальной задачей
ЛП, записанной в координатной форме
c  z  max , b*  A z  b * , d *  z  d * ,
где
z  u   , u    u t , t  T ,
 * 
 * 
 
b*     , b *     ,
 
g
 g 
 
A 
A   1 ,
H 
(4)
 1
1
d*     , d *   , c   ct  .
 
 
 1
 1 
Где
  




t  1,2, t ,   0,1, t
c   ct   c F t * , b,   0,1, t *  1  cAt
A1  d t   [d  F t , b, ]  d At  1b,
  

*



 1 ,
b,  0,1, t *  1 ,
*
H  ht   H F t * , b,   0,1, t *  1  HAt
 *   *  d1 x0   *  d At x0 ,
 1
*
 1
*


b,  0,1, t *  1 ,
 *   *  d1 x0   *  d At x0 ,
g  g  Hx0  g  HAt x0 ,
Полученная задача (4) имеет большие размеры, но при малом количестве разбиений ее можно решить методами линейного программирования.
Download