Есенков Александр Сергеевич

реклама
На правах рукописи
Есенков Александр Сергеевич
МОДЕЛИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ВРАЩАЮЩИМИСЯ
ТВЕРДЫМИ ТЕЛАМИ С ЖИДКИМ НАПОЛНЕНИЕМ
Специальность 05.13.18. - Математическое моделирование, численные методы и
комплексы программ
Автореферат диссертации на соискание ученой степени кандидата физикоматематических наук
Москва – 2006
Работа выполнена на кафедре интеллектуальных систем
Московского физико-технического института
(государственного университета)
Научный руководитель:
доктор физико-математических наук, профессор
Цурков Владимир Иванович
Официальные оппоненты:
доктор физико-математических наук, профессор
Дикусар Василий Васильевич
кандидат физико-математических наук, ст. науч. сотр
Пестерев Александр Витальевич
Ведущая организация:
Институт проблем управления им. В.А. Трапезникова РАН
Защита состоится
« 1 » декабря 2006 г. в 11 час. 20
мин. на заседании
диссертационного совета К 212.156.02 при Московском физико-техническом
институте по адресу: 141700, Московская обл., г. Долгопрудный, Институтский
пер. 9, МФТИ, аудитория 903 КПМ.
С диссертацией можно ознакомиться в библиотеке МФТИ.
Автореферат разослан « 27 » октября 2006 г.
Ученый секретарь диссертационного совета
кандидат физико-математических наук
Федько О.С.
2
Общая характеристика работы
Возможность управления вращающимися твердыми телами с жидким
наполнением еще в недавнем прошлом была практически не реализуема. С
развитием современной вычислительной техники, у исследователей появились
возможности моделирования такого рода систем и разработки эффективных
численных методов решения задач.
Одними
из
важных
задач
в
этой
связи
являются
построение
математической модели, выбор вида и характера управляющего воздействия,
изучение поведения системы, получение зависимостей и выражений для
параметров системы от управляющего воздействия.
В данной работе найдена аналитическая зависимость угловой скорости
возмущенного движения от момента внешних сил для вращающегося твердого
тела с полостью, целиком заполненной как идеальной, так и вязкой жидкостью.
Внешнее воздействие рассматривается как управляющий момент. Таким
образом, появляется возможность анализа различных постановок задач
оптимального управления. Для таких задач применяется аппарат оптимального
управления и удается либо получить аналитические решения, либо предложить
эффективный
численный
метод
и
продемонстрировать
результаты
соответствующими вычислениями.
Актуальность темы
Задачи стабилизации и управления движением ротора с полостью,
содержащей жидкость, являются привлекательными как с теоретической точки
зрения, так и в силу многочисленных технических приложений. Они возникают
и в теории движения самолетов, и кораблей, и спутников, где запас жидкого
топлива, имеющийся на борту, оказывает существенное влияние на движение
этих аппаратов.
Рассматриваемые вопросы находят свое применение при изучении
динамики космических аппаратов с запасами топлива. Они равномерно
3
закручиваются на орбите вокруг некоторой оси для стабилизации, равномерного
нагрева солнечными лучами, создания искусственной силы тяжести и других
целей.
Эти задачи актуальны также при проектировании быстровращающихся
роторов, гироскопов, имеющих внутри себя полости, заполненные жидкостью.
Не безынтересным является возможное использование в баллистике и
космонавтике, где получили свое применение снаряды, торпеды, ракеты с
жидким наполнением, для которых, в свою очередь, встают задачи наведения,
попадания и стабилизации.
С теоретической точки зрения данные задачи интересны прежде всего
тем, что они относятся к сложным задачам механики, и всякий раз требуют для
своего решения новые подходы и методы. Исследователи всячески пытаются
приблизить соответствующую математическую модель к реальности, порой
сталкиваясь с непреодолимыми вычислительными трудностями при решении
точных уравнений, прибегая к различным предположениям и упрощениям,
рассматривая только конкретные режимы или частные случаи.
В данной работе продемонстрирована методика для задач оптимального
управления в применении к вращающимся телам, наполненным жидкостью.
Цель и задачи исследования
Первой
основной
целью
данной
работы
является
разработка
математической модели для изучения динамики вращающихся твердых тел с
жидким наполнением, совершающих возмущенное относительно равномерного
вращения движение под действием моментов внешних сил. При этом
предполагается полное заполнение полости, без свободной поверхности,
идеальной или вязкой несжимаемой жидкостью. Компоненты момента внешних
сил, действующих на систему, перпендикулярные оси стационарного вращения,
предполагается рассматривать как управляющие воздействия.
4
На пути к поставленной цели основной задачей исследования на первом
этапе было получение зависимости характеристик поведения системы от
момента внешних сил. Следующей задачей было выяснение устойчивости
невозмущенного,
стационарного
движения
рассматриваемой
системы
и
получение зависимостей и ограничений на параметры системы для обеспечения
ее устойчивости.
Второй основной целью исследования была постановка задач управления
и применение различных методов и подходов теории оптимального управления
для рассматриваемых динамических систем, где в качестве неизвестной
функции управления выступал момент внешних сил.
В
ходе
исследований
удалось
применить
аппарат
оптимального
управления, основанный на принципе максимума, и теорию динамического
программирования
Беллмана.
Для
этого
потребовалось
осуществить
преобразование исходных соотношений и, в частности, получить сведение к
эквивалентным системам дифференциальных уравнений. В другом случае
удалось использовать найденную зависимость напрямую.
Научная новизна
С
одной
стороны,
существует
множество
работ,
посвященных
исследованию поведения твердых тел с жидким наполнением, однако,
практически отсутствуют результаты и публикации, о постановке задач
оптимального управления для таких систем. В данной работе делается попытка
заполнить эту нишу. Дается постановка задач оптимального управления с
различными функционалами и представлен математический аппарат для их
эффективного решения.
Рассматриваются известные в теории управления модели: построения
множеств
достижимости,
управления
в
условиях
неопределенности,
распределение ресурсов в иерархической системе и другие, где в качестве
5
связей фигурируют найденные соотношения, описывающие динамику тел с
жидким наполнением.
Методы исследования
В ходе исследования применяются следующие математические методы.
Рассматривается задача Коши для лианеризованного уравнения Навье-Стокса
для возмущенного относительно равномерного вращения движения тела с
полостью, содержащей жидкость. Методом Галеркина отделяется временная
составляющая решения от пространственных координат. Для случая вязкого
заполнения учет вязкости производится методом пограничного слоя, а
выражения для обобщенных диссипативных сил получаем, следуя процедуре
Л.Д. Ландау. Для разрешения системы интегро-дифференциальных уравнений
используется прямое и обратное преобразование Лапласа.
В задаче исследования устойчивости применяется критерий А.М.
Ляпунова устойчивости линейных систем для характеристического уравнения
невозмущенного движения. Методом возмущений получены поправки для
случая вязкого заполнения.
При исследовании моделей задач оптимального управления широко
используется принцип максимума Л.Д. Понтрягина и используется метод
динамического программирования Р. Беллмана. Применены необходимые
условия оптимальности А.Б. Куржанского для задач управления в условиях
неопределенности.
Для
иерархических
систем
большой
размерности
используются аналитические методы понижения размерности и метод
декомпозиции
на
основе
агрегирования
переменных.
Для
построения
численных решений задач оптимального управления с интегральными
ограничениями используется регуляризованный метод проекции градиента с
выбором шага согласно процедуре Армийо. Задача отыскания проекции точки
на множество решается с использованием двойственного метода. Для
некоторых постановок численно реализован метод Беллмана. В программной
6
реализации численных экспериментов используется ряд алгоритмов, которые
реализованы на языке С++, текст наиболее важных из них вынесен в
приложения
и
является
значимой
частью
диссертации.
Вычисления
проводились в среде программирования MS Visual Studio, построение графиков
многомерных функций в ряде задач осуществлялось с помощью среды Mathcad.
Практическая ценность
Полученные в работе теоретические результаты могут послужить
отправной точкой дальнейших исследований по данной проблематике,
расширив тем самым область применения описанных подходов. Например,
можно рассмотреть задачи управления для тел с частичным заполнением
полости, когда у жидкости есть свободная поверхность, исследовать упругие
стенки полости, рассмотреть производимый вдув или отсос жидкости, изучить
задачи с учетом нагрева или охлаждения стенок полости.
Использованные методы теории оптимального управления могут быть
применены в различных областях техники для задач, перевода системы в
требуемое состояние, для реального управления вращающимися роторами с
жидким наполнением. Программно реализованные алгоритмы и разработанный
комплекс программ может быть использован как основа для программного
обеспечения таких систем.
Апробация
Результаты,
докладывались,
представленные
обсуждались
и
в
работе,
получили
методы
одобрение
и
алгоритмы
специалистов
на
следующих конференциях и семинарах:
1.
XLVI
научная
конференция
МФТИ
«Современные
проблемы
фундаментальных и прикладных наук» (28-29 ноября 2003 г., Москва Долгопрудный).
7
2.
Российский симпозиум с международным участием «Управление
упругими колебаниями». (31 января – 2 февраля 2006 г. ПереславльЗалесский).
3.
Научные семинары отдела сложных систем ВЦ РАН (2002-2006 г.г.).
4.
Научные семинары кафедр «Интеллектуальных систем», «Управления и
вычислительных систем» МФТИ (ГУ) (2002-2006 г.г.).
Публикации основных результатов
Основные результаты диссертации опубликованы в 5 работах.
Структура и объем диссертации
Диссертация состоит из введения, трех глав, заключения, списка
использованных источников и трех приложений. Общий объем диссертации 123
страницы, в том числе основное содержание работы изложено на 112 страницах.
Список использованных источников включает 89 наименований.
Содержание диссертации
Во введении обосновывается тема диссертации, ее актуальность,
сформулированы
цели
и
задачи
исследования,
изложены
полученные
результаты и их практическая ценность.
В первое главе представлен обзор существующих работ, который
позволяет
проследить
основную
канву
развития
исследований
задач,
описывающих поведение вращающихся тел с жидким наполнением. Указаны
ключевые результаты и описаны основополагающие подходы и методики.
Рассматривается возмущенное относительно стационарного вращения
движение твердого тела с полостью Q , целиком заполненной как идеальной,
так и вязкой несжимаемой жидкостью плотности  , в поле массовых сил с
потенциалом U . Уравнения Навье-Стокса, описывающее движение жидкости,
записываются во вращающейся системе координат, жестко связанной с твердым
8
телом Oxyz , а уравнение моментов – относительно центра инерции всей
системы.
В предположении, что невозмущенное движение тела с жидкостью
относительно центра инерции представляет собой равномерное вращение всей
системы как твердого тела относительно оси, параллельной Oz с постоянной
угловой скоростью, исходные уравнения лианеризуются. Полученная таким
образом задача разбивается на две, которые можно решать независимо, это
гидродинамическая задача, которая сводится к решению уравнения на
собственные числа и зависит только от геометрии полости и не зависит от
движения тела. Вторая, динамическая часть задачи, сводится к решению задачи
Коши для системы обыкновенных линейных дифференциальных уравнений для
случая
идеальной
жидкости,
и
к
системе
интегро-дифференциальных
уравнений, для случая вязкой жидкости. При этом поправки, обусловленные
вязкостью, учитываются методом пограничного слоя. Далее предполагается, что
ось вращения системы в невозмущенном движении является одновременно и
осью массовой и геометрической симметрии тела и полости, что упрощает
исходные уравнения. В цилиндрической системе координат скалярное
уравнение движения вокруг оси Oz отделяется от остальных, а уравнения
движения относительно осей Ox и Oy идентичны. Решения полученных систем
проводится
в
пространстве
Лапласа.
Далее
исследуется
устойчивость
невозмущенного движения рассматриваемой динамической системы. Выписаны
условия устойчивости для случая идеальной жидкости и методом возмущений
получены выражения для случая вязкой жидкости.
Окончательным итогом первой главы является полученная явная
зависимость угловой скорости возмущенного движения от момента внешних
сил для случая заполнения идеальной, или вязкой жидкостью, полученная
сначала в пространстве Лапласа, и для которой, с использование функции
свертки, применено обратное преобразование Лапласа. Таким образом, имеем
9
t

  t    M ( ) Xe
0
1
p   t  
 Ye
2
p   t  
 d ,
(1.1)
   x  i y , M  M x  iM y , а значения констант p1 и p 2 , X и Y определяются
исходя из геометрии твердого тела, конкретного вида полости, вязкости
жидкости.
Во второй главе показано, что соотношение (1.1) эквивалентно системе
линейных дифференциальных уравнений вида
 x  t   Ax  t   BM  t  ,

 x  0   x0 ;
(2.1)
Показано как (1.1) можно свети к системе шестого порядка для случая
идеальной жидкости и к системе десятого порядка для случая вязкой жидкости
с разреженными матрицами и универсальное сведение к системе четвертого
порядка. После этого ставятся различные задачи оптимального управления, и
устанавливается возможность широкого применения методологии принципа
максимума для их решения.
С использованием принципа максимума Понтрягина показано, как можно
получить
аналитические
решения
задачи
безусловной
минимизации
терминального функционала
T
J  M     x T   10     y T    02      M x2  t   M y2  t   dt  min ,
2
2
0
или в векторном виде
J  M   Zx T ; M   b
T
2
En
   M t 
2
Em
dt  min ,
(2.2)
0
где M  t    M x  t  , M y  t  
T
- неизвестная функция управления,  - заданное
действительное положительное число, Z  zi , j
10
nn
- матрица n  n , причем
отличны от нуля только z1,1  z2,2  1 , b   10 , 02 ,0, ,0  - столбец, i0 , при i  1, 2
T
- заданные действительные числа.
Для задачи оптимального управления вида
T
J  M    x T      M x  t   M y  t   dt  max
0
0  M x  t   1, 0  M y  t   1, t  0, T 
получено решение с разрывным оптимальным управлением, со следующими
условиями для точек переключения
X cos    T  tM x
 
  Y cos    T  t    ,
 
  Y sin   T  t    ,
1
X sin    T  tM y
1
2
Mx
2
My
причем эти условия могут не иметь решений, например, если   X  Y , что
будет соответствовать решению M x*  M *y  0 (плата  «слишком завышена»).
Они могут иметь счетное число решений, соответствующее количеству
пересечений периодических функций в левых частях с прямой y   .
Для решения задачи оптимального управления
J  M     x T   10     y T   02   min
2
M i t 
L  0;T 
2
2
(2.3)
 Ri2 , i  x, y
где Rx , Ry , 10 , 02 - произвольные наперед заданные действительные числа,
M t    M x t  , M y t 
T
-
неизвестная
функция
управления,
предложен
регуляризованный метод проекции градиента. Он позволяет построить сильно
сходящуюся к M  (оптимальное управление) последовательность M N U область допустимых значений управления, N  1, 2,... . Для регуляризованной
задачи вида
TN (M )  J (M )   N I (M )  inf, M  U , N  1, 2,...,  N  0,  N  0, N  
рассмотрена следующая итерационная схема
11
M k 1  M k   k pk , k  0,1,... , M 0 U .
где pk   ,
pk  1 - вектор направления спуска, удовлетворяющий условию
T   M k  , pk  0 и шаг спуска  k , который выбирается из условия минимума
T ( M k   k pk ) 
min T ( M k   k pk ) .
M k  k pk U
Процедура нахождения  k реализована с помощью, так называемого,
алгоритма Армийо. Вектора направления спуска
pk 
wk  M k
,
wk  M k
где wk выбирается как
wk  PU  M k  T   M k   ,
PU - оператор проектирования на множество U . Для нахождения элементов wk
применяется двойственный метод.
Рис.1
На рис.1 на правом графике – пространство управлений M  t  , отрезок
T , t0 
равен 0,1 , на левом – пространство траекторий, терминальная точка
12
которых помечена порядковым номером компоненты. Терминальная точка
y   10 , 02 ,0,0,0,0 
отмечена на левом графике и имеет координаты
y  1,1,0,0,0,0  . На рис.1 представлено полученное численно решение задачи
(2.3). Первая и вторая компоненты траектории сошлись в точке y .
Картина качественно изменялась при увеличении T . На ней появлялись
характерные осцилляции. На рис.2 приведено численное решение задачи для
T  5.
Рис.2
Далее ставятся и анализируются задачи оптимального управления для
вращающихся твердых тел с жидким наполнением в случае, когда начальное
положение системы точно не известно, а задано лишь множество возможных
состояний. Решена задача о переводе системы в положение минимально
близкое к наперед заданной точке. Начальное состояние системы неизвестно
заранее, и подчиняется условию
x0  X 0 ,
где X 0 - заданное выпуклое компактное множество в
n
– множество
возможных начальных состояний системы. Тогда в каждый момент времени
известно множество X  t; M  , t   0, T  – ансамбль траекторий, объединяющее
все траектории, полученные при одном и том же управлении, при
13
всевозможных x0 . Выбирая всевозможные допустимые M  t  можно управлять
положением ансамбля. Пусть R  известная матрица k  n , назовем ее матрицей
наблюдения, z  t; M , x0   Rx  t; M , x 0  . Пусть   z  - выпуклая, всюду конечная
функция заданная на
k
, а   Z   max   z  | z  Z  .
Мы хотим привести ансамбль траекторий как можно ближе к заданному
состоянию в момент времени T . Задача формулируется следующим образом:
среди допустимых управлений M  t   U  M : M  t   1 найти оптимальное
M 0  t  , удовлетворяющее условию минимума




0 RX T ; M 0   min   RX T ; M   ,
M  t U
(2.4)
где   z  - функция расстояния вида   z   z  y , где y - терминальная точка,
в которую мы стремимся перевести нашу систему.
Согласно
условиям
оптимальности
в
условиях
неопределенности
начальных данных и коэффициентов, оптимальное управление M 0  t  задачи
(2.4) удовлетворяет условию минимума


s  t; q0  B  t  M 0  t   min s  t; q 0  B t  M t 
M U
(2.5)
на решении s  t; q 0  , q 0  RT l 0 сопряженной системы, порожденном элементом
l 0 , который максимизирует функцию F  l 
T
F  l        s  t ; q  B  t  | U  dt  f **  l  ,
(2.6)
0
где
f  l    *  l     s  0; q  | X 0  ,
( f*
-
сопряженная
функция
f *  y   sup  x, y  f  x  | x  E , а   x | E  - является опорной функцией к
множеству E ,   x | E   sup  x, y , y  E ).
Применительно к рассматриваемой в работе динамической системе
матрица наблюдения будет состоять только из двух ненулевых элементов
14
R1,1  R2,2  1 .
x  X
0
В
работе
рассматривалось
X0
следующего
вида
 xi  ai , i  1, 2; ai  0, i  3..n - параллелепипед, где a1,2 заданные заранее
числа. Задача свелась к максимизации такой функции
T
F  l        s  t ; q  B  t  | U  dt   y , l     l |  1  0   si  0; q  ai .
(2.7)
i 1,2
0
Из определения индикаторной функции следует, что максимум (2.7) будет
достигаться на множестве l  1. Предлагаются варианты численно найденных
значений
l 0 , при различных значениях параметров исходной системы
управления, а так же параметров a1 и a2 , задающих неопределенность в
начальном состоянии системы. После чего получаем найденные значения
оптимального управления
1,  X  Y  s1  t ; q 0   Xs3  t ; q 0   Ys4  t ; q 0   0,

M 
0
0
0
1,  X  Y  s1  t ; q   Xs3  t ; q   Ys4  t ; q   0;
0
x
1,  X  Y  s2  t ; q 0   Xs5  t ; q 0   Ys6  t ; q 0   0,

M 
0
0
0
1,  X  Y  s2  t ; q   Xs5  t ; q   Ys6  t ; q   0.
0
y
Здесь значения si берутся из решений сопряженной системы для идеальной или
вязкой жидкости.
Рассмотрена иерархическая задача распределения ресурсов вида
T
1
j 2  c j x 2j  t    j M 2j  t  dt  min
0
(2.8)
сначала для одномерной системы
x j  t   a j x j  t   bj M j t  , x j  0  0,
j  0,
,J
(2.9)
со следующим условием на общий ресурс
J
 M  t   W  t  , t  0, T 
j
j
15
(2.10)
где c j ,  j , a j , b j , J - заданные постоянные величины, W  t  - заданная функция
времени, J
достаточно велико. После применения принципа максимума
Понтрягина получено выражение для оптимального управления
  t  b j 1  J  k  t  bk
 J 1 
M t   j
 
 W  t     ,
j
 j  k 1  k
 k 1  k 
1
*
j
(2.11)
где  j - решения сопряженной системы. Далее рассмотрена следующая система

 x j t   a j x j t   b j M j t  ,


 j  t   c j x j  t   a j j  t  ;
 x j  t   0,

 j T   0;
(2.12)
где M  t  определяется из (2.11). После введения агрегированных величин
j
  t  bk
 J 1
P t    k
, Q   
k
k 1
 k 1  k 
J
1
(2.13)
систему (2.12) переписываем в виде

b 2j
bj
 x j  t   a j x j  t    j  t    P  t   W  t   Q,
j
j


 j  t   c j x j  t   a j j  t  ;
(2.14)
причем P T   0 . Подстановка решений (2.14) в (2.13) приводит нас к
уравнению на P  t 
T
P  t    P   K  t , d  f 9  t  ,
0
которое представляет собой уравнение Фредгольма второго рода, с разрывным
при   t ядром (в силу определения функции K  t ,  ), которое может быть
решено численно известными методами. После
нахождения
P t 
его
достаточно подставить в решения сопряженной системы, что в свою очередь
полностью определяет выражения для оптимального управления. Таким
образом, решение задачи оптимального управления размерности
J
с
интегральным функционалом сводится к решению уравнения Фредгольма
16
второго рода с разрывным ядром. Полученный результат обобщен на случай
многомерной системы, где подсистемы описываются как вращающиеся тела с
жидким наполнением.
В третьей главе найдены множества достижимости для рассматриваемой
динамической системы: вращающееся твердое тело с жидким наполнением,
приведены примеры построенных множеств достижимости. Для нахождения
множества достижимости ставится следующая задача
J   c , z T    max , T  t0 , c  1 ,
(3.1)
T - фиксированный момент времени окончания процесса, c - заданный вектор.
Решая задачу для всевозможных векторов c , для каждого значения ci получаем
точку zi* T  на границе множества достижимости и опорную гиперплоскость в
этой точке. Определив точки zi* T  и опорные гиперплоскости, можно получить
как внешнюю, так и внутреннюю аппроксимацию множества достижимости.
При ограничениях на управление вида
ai  M i  t   bi , i  1, 2
где ai , bi - заданные числа, и начальным условием z  t0   0 , получено значение
оптимального управления для задачи (3.1)
bi ,

M t   
ai ,

*
i
 c K T , t   0,
j 1,2
j
j ,i
 c K T , t   0;
j 1,2
j
j ,i
и соответствующие ему оптимальные траектории
T
z T   z0i    M *j  t  K i , j T , t dt .
*
i
0 j 1,2
Для ограничений в виде круга M  r выражение для оптимального управления
примет вид
17
M t   r
*
i
 c K T , t 
j 1,2
j
j ,i
 c K T , t 
j 1,2
j
.
j ,i
Следующая задача оптимального управления решается методом Беллмана
T

 T
J  M   g  x  t0    K   M   d     F M  t  dt  min ,


t0
0



где


F M t   M t 
2
E
,
m

g x T;M
 
x T   y 0

2
En
(3.2)
i, j  1,2 ,
и
в
рассматриваемых ранее примерах функционалов t0  0 , x  t0   0 . В дальнейшем
вид функций F и g для описания метода не имеет значения и может быть
более общий. Функция Беллмана имеет вид
T
T
 


f  x , t   f  x1 , x2 , , xn , t   min  g  x   K   M   d     F M   d  .
M  t U

t
t

 


Для нее справедливо следующее рекуррентное соотношение




f  x , ti   min  F M  ti   f x  K  ti  M ti  , ti    .

M  t U 
Граничное условие при ti  T
f  x, T   g  x, T  .
Для решения исходной задачи (3.2) требуется отыскать f  0,0  - значение
функции Беллмана в начальный момент времени с начальным условием
x  t0   x  0   0 .
Процедура численного решения (3.2) реализована так. В каждой точке
сетки по фазовой переменной для каждого ti рассчитаем функцию Беллмана,
начиная счет с граничного условия f  x, T   g  x, T  . Помимо значения функции
Беллмана будем хранить еще и значения «оптимального» управления в каждой
точке. При расчете компонент оптимального управления для
i
шага
осуществляем контроль принадлежности полученной точки x  K  ti  M  ti   для
18
i  1 шага множеству достижимости, и полученное значение рассчитанной точки
интерполируется ближайшим значением сетки.
В результате полного расчета имеем набор таблиц значений оптимального
управления для каждой точки фазового пространства и значения функции
Беллмана для каждого ti . Используя начальное условию x  t0   x  0   0 ,
обратным пересчетом по набору таблиц восстановим оптимальную траекторию
в каждый момент времени, после чего получим оптимальное значение
функционала исходной задачи. Значения функции Беллмана достаточно
сохранять только для предыдущего шага по времени. Решения получаются в
виде импульсной кривой с постоянными значениями на отрезке от t до t   .
Приведем ниже найденные так решения некоторых задач оптимального
управления. На рис.3 и рис.4 приведено решение задачи для вязкой жидкости
для случая, когда коэффициент  мал, что соответствует малой «плате» за
управление в исходном функционале. Ограничения на управление Rl  1 ,
терминальная точка 10  02  1 .
Управления
Траектории
1,5
1,5
Ряд1
1
Ряд2
-0,5
t
1
0,
8
0
-1
-1,5
0,
6
0
0,
4
0,
8
0,
6
0,
4
0,
2
Ряд2
Ряд1
0,5
0,
2
0
-0,5
X1, X2
1
0,5
0
M1, M2
1
t
Рис.3
Рис.4
На рис.5 и рис.6 изображено решение задачи оптимального управления
системой с вязкой жидкостью. Коэффициент  порядка 10. Ограничения на
управление Rl  1 , терминальная точка 10  1, 02  1 .
19
Управления
Траектории
1
0
0,
15
Ряд2
0,
9
0,
6
0,
75
-0,5
0,
3
0,
45
-0,5
0,
9
Ряд2
0
Ряд1
0
0,
6
0,
75
Ряд1
0,
3
0,
45
X1, X2
0,5
0,5
0
0,
15
M1, M2
1
-1
t
t
Рис.5
Рис.6
и рис.8 изображено решение задачи когда коэффициент 
На рис.7
достаточно мал, изменены параметры полости, увеличена вязкость в 2 раза.
Ограничения на управление Rl  1 , терминальная точка 10  1, 02  1 .
Траектории
1,5
1,5
1
0,5
0,5
-1
0,
9
Ряд2
-0,5
0
0,
15
0,
9
0,
6
0,
75
0,
3
0,
45
Ряд2
-0,5
-1
Ряд1
0
0,
6
0,
75
Ряд1
0
0,
3
0,
45
X1, X2
1
0
0,
15
M1, M2
Управления
-1,5
-1,5
t
t
Рис.7
Рис.8
И, наконец, аналогичная задача для идеальной жидкости рис.9, рис.10.
Траектории
Управления
t
6
8
0,
0,
t
Рис.9
Рис.10
20
1
4
Ряд2
0,
8
0,
-1
Ряд1
2
6
0,
0
4
0,
1
2
Ряд2
0,
-0,5
X1, X2
Ряд1
0
0
M1, M2
0,5
1,5
1
0,5
0
-0,5
-1
-1,5
0,
1
В заключении формулируются основные результаты работы.
В три приложения вынесены соответственно программно реализованные
следующие
алгоритмы:
регуляризованный
метод
проекции
градиента,
построения множества достижимости, метод Беллмана.
Основные результаты работы
1. Предложена математическая модель для вращающегося твердого тела с
жидким наполнением и найдена аналитическая зависимость угловой
скорости возмущенного относительно стационарного вращения движения
твердого тела с осесимметричной полостью, полностью заполненной
идеальной или вязкой несжимаемой жидкостью, от внешнего момента.
2. Найдены эквивалентные системы дифференциальных уравнений для случаев
идеальной и вязкой жидкости, которые позволяют применить аппарат
Гамильтона-Понтрягина
для
постановки,
анализа
аналитического
и
численного решения широкого класса задач оптимального управления
твердыми телами с жидким наполнением.
3. Рассматриваются различные модели задач оптимального управления: с
переключениями управлений, в условиях неопределенности, иерархические
задачи распределения ресурсов, задача с интегральными ограничениями на
управление и демонстрируются аналитические и численные методы их
решений.
4. Для задач с терминальными функционалами применен метод Беллмана,
который
использует
полученную
зависимость
угловой
скорости
возмущенного движения от внешнего момента напрямую, не прибегая к
сведению к системам дифференциальных уравнений. Таким же образом
получены аналитические выражения для внешней аппроксимации множества
достижимости системы, а также приведены примеры построения множеств
достижимости.
21
5. Набор предложенных в диссертации алгоритмов представлен в виде
комплекса программ для численного решения рассматриваемых задач.
Публикации по теме диссертации
1. Есенков
А.С.,
Ишмухаметов
А.З.,
Карюкина
Ю.Г.
Двойственный
регуляризованный метод в выпуклых конечномерных задачах оптимизации.
//Вопросы моделирования и анализа в задачах принятия решений. – М.: ВЦ
РАН, 2004, с.109-122.
2. Есенков А.С., Ишмухаметов А.З. Регуляризованный метод проекции
градиента с конечношаговыми внутренними алгоритмами для задач
оптимального управления //Современные проблемы фундаментальных и
прикладных наук. Часть VII. Прикладная математика и экономика: Труды
XLVI научной конференции. /Моск. физ. – техн. ин-т. – М. – Долгопрудный,
2003. – с. 88.
3. Башлыков А.М., Гридина Е.Д., Есенков А.С. Понижение размерности в
иерархической задаче распределения ресурсов. //Динамика неоднородных
систем. Выпуск 9(3). Труды ИСА РАН. / – М.: КомКнига, 2005.
4. Гурченков А.А., Есенков А.С., Цурков В.И. Управление движением ротора с
полостью, содержащей идеальную жидкость ч.1. //Известия РАН. Теория и
системы управления. 2006. №1, с. 141-148.
5. Гурченков А.А., Есенков А.С., Цурков В.И. Управление движением ротора с
полостью, содержащей идеальную жидкость ч.2. // Известия РАН. Теория и
системы управления. 2006. №3, с 82-89.
В
работах
в
соавторстве
Есенковым
А.С.
численно
реализованы
регуляризованные оптимизационные методы для широкого класса задач,
решена
задача
понижения
размерности
для
иерархической
задачи
распределения ресурсов с интегральным функционалом, для вращающихся тел
с
полостью,
полностью наполненной
22
идеальной
жидкостью,
получена
зависимость угловой скорости возмущенного движения от момента внешних
сил, предложено сведение к системе дифференциальных уравнений, решен ряд
задач оптимального управления аналитически и численно.
23
Скачать