1. Общая постановка задачи

advertisement
1. Общая постановка задачи математического
программирования.
Задача формулируется таким образом: среди элементов
, образующих множество X, найти такой элемент,
который доставляет минимальное значение заданной
функции
. Для корректной постановки задачи
требуется задать допустимое множество X (с помощью
ограничений), целевую функцию
, а также критерий
поиска (минимум/максимум). Тогда решить задачу
означает либо найти такое
, при котором
. В случае, если множество X является
множеством всех возможных значений, то это задача
безусловной оптимизации, в обратном случае –
условной.
Порядок поиска решений:
1. Поиск всех точек стационарности
2. Выбор тех, что принадлежат области допустимых
решений
3. Проверка граничных точек.
Сложность решения зависит от размерности. Например,
может потребоваться проверить условие на границе,
заданной линией, т.е. в бесконечном количестве точек.
Задача на условный экстремум включает ограничения:
- это ограничение типа равенство.
Этап поиска условий экстремума – обычно
аналитический, а вычисления оптимальных решений –
инженерный.
2. Метод неопределенных множителей Лагранжа при
поиске максимальных значений функций.
Требуется найти экстремум функции
,
которая зависит от n переменных и эти переменные
связаны m соотношениями
, причем
m<n, иначе решение было бы тривиальным. Для
решения методом неопределенных множителей
Лагранжа составим функцию
.
Составим систему из n+m уравнений, приравняв нулю
частные производные функции Лагранжа по и . Если
полученная система имеет решения относительно своих
параметров, то точка x может быть решением исходной
задачи, то есть условным экстремумов.
На
картинке
изображены линии уровня
при условии
. Данное уравнение задает кривую S.
Пример. Найти экстремум функции
при
ограничении
.
Составляем
функцию
Лагранжа
, откуда
Правда, можно было решить проще: выразить из
ограничений одну переменную через другую,
подставить в функцию и найти экстремум функции
одной переменной: например
.
3. Линейный функционал.
Функционалом называют отображение, аргументов
которого является функция вещественной переменной,
а результатом – вещественное число. Функционал
обозначим
. Функционал является линейным,
если он удовлетворяет принципу суперпозиции:
.
Другое определение: функционалами называются
величины, значение которых определяются выбором
одной или нескольких функций. Пример: длина дуги
пространственной кривой, соединяющей заданные
точки.
Исторические предпосылки введения функционалов:
1. Геодезические линии. Найти линию минимальной
длины между двумя точками при некотором условии.
2. Изометрическая задача. Найти замкнутую линию
заданной длины, ограничивающей максимальную
площадь. Условие на постоянство длины кривой
называется изопараметрическим.
3. Задача о брахистохроне. На плоскости, требуется
попасть из одной точки в другую без начальной
скорости и только за счет силы тяжести за минимальное
время.
Функционал
непрерывен, если малому
изменению
соответствует малое изменение
функционала. Функции можно считать близкими, если
мал модуль их разности при любом x из области
определений. Но так как часто функционал зависит еще
от производных, желательно считать близкими
функции, также близкие по своим производным (1-й
порядок близости).
4. Понятие вариации функционала.
Вариация
функционала
позволяет
определить
экстремум функционала. Вариация функционала
обозначается как
и выглядит как приращение
к
«точке» (то есть функции, так как у нас исходная часть –
не функция, а функционал)
. Такое приращение
называется вариацией аргумента и оно должно
принадлежать тому же выбранному линейному
нормированному пространству. Необходимое условие
экстремума заключается в равенстве нулю вариации
функционала. Проще говоря – как бы мы не толкали
наши функцию, она в любом случае будет иметь один и
тот же знак, то есть будет сидеть в экстремуме.
5. Вычисление вариации функционала.
Для вычисления вариации функционала запишем:
функционал
в
сформулировать
где
–
линейный
функционал
относительно второго аргумента,
– бесконечно
малая величина высокого порядка. Учитывая свойство
линейности функционала L, можно записать
При переходе
при
получаем
виде,
для
которого
можно
задачу
Эйлера:
.
Дифференциальное
уравнение Эйлера в данном случае является линейным,
имеющим второй порядок:
. Решая его и
подставляя граничные значения
,
можно получить оптимальную траекторию движения, а
затем уже и выразить оптимальное управление.
9. Понятие близости кривых.
См. 3.
.
6. Постановка задачи Эйлера.
Нужно найти функцию, которая соответствует критерию
оптимальности.
10. Уравнение Эйлера-Пуассона.
Рассматривается
функционал
вида
, т.е. зависящий от старших
производных.. На функцию
наложены граничные
условия:
и
такие же для . Используя рассуждения из билета 6,
можно прийти к выводу:
Рассматривается функционал вида
.
Требуется провести через две заданные точки с
координатами
и
такую кривую
,
которая
доставила
бы
экстремум
заданному
функционалу. Вычислим вариацию рассматриваемого
функционала:
11. Пример использования уравнения Эйлера-Пуассона
в теории оптимального управления.
Пусть имеется динамическая система, описываемая
уравнением
. Требуется перевести систему из
состояния
в состояние
за время
так, чтобы
функционал
принимал
бы
минимальное значение. Уравнение Эйлера-Пуассона
примет вид
где
– вариация с границами
.
Проинтегрировав по частям второе слагаемое, получим:
Тогда получим условие экстремума:
Основная лемма вариационного исчисления позволяет
записать
условие
экстремума
в
виде
дифференциального уравнение для искомой кривой:
. Кстати, может быть не очевидно, но
. А уравнение это – уравнение Эйлера.
7. Уравнение Эйлера.
В предыдущем уравнении все расписано норм так.
8. Пример использования уравнения Эйлера для поиска
оптимального управления.
Пусть имеется динамический объект, описываемый
дифференциальным
уравнением
.
Требуется перевести за время T объект из состояния в
состояние
так, чтобы функционал
имел минимальное значение. Решаем: представим
, общее решение которого выглядит
как
. Эти коэффициенты
находятся с использованием заданных значений
функции и ее производных при нулевом и конечном
времени, а затем из этого выражается оптимальное
управление.
12. Вариационные задачи с подвижными границами.
Пример в теории управления.
Рассмотрим задачу об экстремуме функционала
15. Пример использования множителей Лагранжа для
поиска управлений.
Пусть имеется динамический объект, описываемый
дифференциальным
уравнением
.
Требуется перевести его из состояния
в состояние
за время
так, чтобы функционал
имел минимальное значение. Образуем с помощью
множителей
Лагранжа
новый
функционал:
. Тогда система
уравнений Эйлера имеет вид:
Функция
– дважды дифференцируемая. На
допустимые функции нет ограничений в виде граничных
условий.
Подсчет
вариации
дает
. Приравняв ее к нулю,
чтобы найти экстремаль, получим выражение 1:
.
По
основной
лемме
вариационного исчисления получаем выражение 2:
. В то же время, если посчитать
выражение 1 по частям:
Исключая и получим дифференциальное уравнение
для функции вида
. Отсюда находим x и
определяем оптимальное управление.
16. Понятие переменных состояния.
Наиболее полным описанием системы является форма
Коши.
, и граничными условиями.
Величины
называются переменными состояния. В
частном случае, если система линейна:
Если линейная система стационарна, матрицы A и B не
зависят от времени.
Интеграл в правой части равен 0 из выражения 2. Значит
Так как вариации в точках a и b могут меняться
произвольно, можно записать:
Получили уравнение Эйлера с естественными краевыми
условиями.
13. Вариационные задачи на условный экстремум.
Имеется функционал вида
17. Постановка задачи оптимального управления.
Объект задается в форме Коши: система уравнений
граничные
условия
,
и функционал, который требуется
минимизировать
при
соблюдении ограничения на входное воздействие
.
Задача
оптимального
управления
заключается в нахождении функции состояния
и
управления
для времени
, которые
минимизируют функционал.
Такие задачи решаются с помощью принципа
максимума
Понтрягина,
а
также
методом
динамического программирования.
Каждая из функций проходит через две заданные для
нее точки, на функции наложены ограничения вида
,
кроме
того
имеются ограничения на концах отрезка. Требуется
найти экстремум функционала.
Воспользоваться системой уравнений Эйлера не
получится – она справедлива для независимых
переменных
. Для решения вводим множители
Лагранжа в функционал, образуется новый функционал:
18. Линеаризация дифференциальных уравнений и ее
использование при получении принципа максимума.
Пусть дифференциальное уравнение задано в виде
. Известно, что для
решением
будет
. Изменим несильно входное воздействие:
.
Проведем линеаризацию в окрестности :
- малое приращение.
Находится экстремум этого функционала, оставляются
функции
, при которых достигается экстремум
функционала.
Условный
экстремум
исходного
функционала
вычисляется
с
использованием
выделенных функций
.
Так как
14. Множители Лагранжа в вариационном исчислении.
см. 13
- решение, то
, откуда
линейное
дифференциальное уравнение
I-го порядка
с
переменными коэффициентами, которые можно найти,
посчитав производные выше.
19. Принцип максимума.
Это не вывод, просто поиск пути.
Задача задана – см. 17
Введем дополнительную переменную
тогда из
21. Определение моментов переключения.
а) Разветвленная схема,
- процентные
составляющие управляющего воздействия
:
следует что
u (t )
Изменив немного входное воздействие
, получим
приращение функционала
(его линейную
часть).
Введем
вспомогательные
вектора
и
Тогда
приращение функционала можно записать как
скалярное
произведение:
.
Предлагается далее изменить вектор таким образом,
чтобы скалярное произведение было постоянным на
интервале
. Пусть новый
.
Условие постоянства:
. Производная
произведения:
Линеаризация j'ой компоненты вектора
.
Это система уравнений в форме Коши.
По принципу максимума Понтрягина:
откуда
По теореме об n интервалах:
Таким образом, функция
составляющих
вектора :
зависит
от
всех
Решением каждого из уравнений будет:
:
содержит константу интегрирования
Подставляя результаты в получаем:
Подстановка равенства в предыдущее, за скобки можно
вынести
откуда
называемые сопряженными уравнениями.
Введем некую функцию
. Для того,
чтобы управление было оптимальным, эта функция
должна достигать наибольшего значения в любой
момент времени по аргументу
.
20. Теорема о числе переключений.
(теорема об n интервалах)
Если объект управления описывается линейным
дифференциальным уравнением n порядка, корни его
характеристического
уравнения
вещественные
неположительные (могут быть кратными), то для
оптимального управления необходимо и достаточно,
чтобы на n интервалах управляющее воздействие было
равно максимальному
, а знаки чередовались (n-1)
раз. Теорема значительно облегчает нахождение
оптимального
управления.
т.к.
исключает
необходимость определения функций и их анализа.
Эта функция имеет
действительных корней.
Таким образом, для оптимального управления
необходимо n интервалов максимального значения
управления, при этом знаки на интервалах должны
меняться
раз.
Если в рассматриваемой структуре содержится k
звеньев с одинаковым динамическим свойством (т.е.
имеет одинаковые постоянные времени T), то
количество интервалов будет равно
.
Количество одинаковых звеньев уменьшает количество
интервалов управления.
б) Параллельная схема,
(уравнение 1)
Пусть начальное состояние
; конечное
состояние находится в гиперплоскости, определяемой
уравнением 1. Таким образом, задача является задачей
с подвижным правым концом.
Как в вопросе а) получается решение:
Постоянные интегрирования выбираются из условия
трансверсальности: вектор
параллелен
.
Последний имеет одно и то же значение:
В момент окончания управления
составляющие
вектора
должны быть равны составляющим
вектора
, т.е.
для всех
Отсюда находим:
Подставляя результаты в
, получаем:
Данная функция знака не меняет, т.к. значения
экспонент возрастают при росте t, а коэффициенты при
них положительны. Значит, попасть на гиперплоскость
можно с помощью одного интервала управления при
.
22. Принцип оптимальности.
Пусть движение системы
разностным уравнением:
описывается
конечно-
(уравнение 1)
где - временной интервал,
координаты в дискретный
начальный момент времени
0
x1
U0
Обозначим
,
момент
– значение
времени. В
.
...
1
Обозначим
- функция
состояния системы в выбранный момент времени как
функция величины
.
Другими словами, имеем таблицу значений
для
различных аргументов
и соответствующие этим
аргументам оптимальным значениям управления.
Перейдем к предыдущему интервалу. Аналогично:
и
.
На основании формулы конечно-разностных уравнений:
Минимизируем
выбором упр. воздействия
для каждого фиксированного
.
И так далее. На каждом шаге минимизации
определяется оптимальное значение, зависящее от
координаты. Процесс расчета продолжается, пока не
придет к начальному интервалу. На нем используется
начальное условие и определяется начальное значение
управляющего значения, а за ним и весь ряд
управляющих значений.
С увеличением порядка системы быстро возрастает
объем вычислений.
23.
Дискретная
программирования.
форма
динамического
24. Учет ограничений
программирования.
в
динамического
x2
U1
, запишем (уравнение 1) в виде:
Функционал, минимизацию которого нужно обеспечить
при оптимальном управлении, выражается суммой:
Оптимальный процесс будет определен, если будут
найдены значения управляющих воздействий во все
дискретные моменты времени (постоянно на
интервале), минимизирующие сумму функционала. При
этом необходимо прохождение траектории через
начальную точку.
Критерий оптимальности является сложной функцией
большого числа переменных . Метод динамического
программирования позволяет свести поставленную
задачу к более простой: к последовательному
вычислению некоторый функций только одной
переменной.
При этом будем руководствоваться принципом:
 любой отрезок оптимальной кривой тоже
оптимален;
 будущее поведение процесса не зависит от его
предыстории.
Значит, для любой траектории каждый ее участок,
связывающий любую точку этой траектории с конечной,
является оптимальным (хотя это не относится к любому
участку траектории вообще). Участи процесса будем
рассматривать в последовательности, обратной из
номеру.
Рассмотрим отрезок, соответствующий времени
. Управление должно быть оптимальным,
значит
. Выбираем
такое,
что оно минимизирует функционал:
.
методе
25. Постановка задачи линейного программирования.
Задача допускает строгое алгоритмическое решение и
определяется таким образом: в многомерном
пространстве определяется область допустимых
решений с помощью линейных ограничений типа
равенств и неравенств:
где
–
известные
числа
Допустимое решение – это вектор , удовлетворяющий
заданными выше ограничениями. Предполагается, что
все составляющие вектора
неотрицательны.
Требуется найти такое допустимое решение, при
котором линейная форма
с известными
численные коэффициентами
принимает наибольшее
(или наименьшее) значение.
26. Определение моментов переключения.
Для определения экстремальных точек сперва
определим выпуклое множество. Множество M будет
выпуклым, если две любые точки A,B, принадлежащих
множеству M, определяют отрезок прямой, целиком
принадлежащий множеству M.
Если наше выпуклое множество является кругом, то
экстремальными точкам являются все точки на его
окружности. В случае, если наше выпуклое множество –
многоугольник, то экстремальными точками являются
все углы. Таким образом, чтобы точка была
экстремальной, требуется, чтобы она лежала на отрезке,
стягивающемся
в
точку,
математически:
.
Теорема: Точка x является экстремальной тогда и только
тогда, когда перестановка столбцом матрицы А
может быть представлена в блочном виде
(где N – произвольная матрица) так, что
, где
– невырожденная квадратная
матрица порядка m, и
система
. Например, имеется
уравнений
.
системы
Для
передвижения от нее к другим точкам, пока такое
движение будет возможно. Исчезновение этой
возможности означает, что точка – оптимальна
(минимальна/максимальна). Для начала путем теоремы
об экстремальных точках (см. 26) находим одну из
точек. Например, требуется найти наименьшее
значение линейной формы
при
ограничениях
. Найдем
экстремальные точки, выбрав свободные переменные
равными 0.
Выберем первую точку, значение линейной формы в
ней будет
. Можно ли найти точку со
значением линейной формы меньше? Перепишем
ограничения в виде
Переменные, имеющие значения в исходной
экстремальной точки, называются базисными, а
нулевые переменные – свободными. Решая систему
относительно базисных переменных, получим:
этой
. Сперва положим
,
тогда
. Фактически это решение в случае
,
Подставляя в линейную форму:
.
Теперь попробуем уменьшить значение линейной
формы, увеличивая значение величины, входящей в
уравнение с отрицательным знаком, то есть
.
Увеличивая значение, до тех пор, пока одна из базисных
переменных не станет равной нулю (потому что они
должны быть неотрицательны), получим другую
экстремальную точку, в нашем случае
. В этой точке
значение линейной формы будет
, а в ее
уравнении
все коэффициенты входят с
положительными коэффициентами, поэтому уменьшать
и дальше форму мы не можем. Таким образом,
решение закончено.
Замечание: если бы на окончательном шаге одна из
переменных входила с нулевым коэффициентом, это бы
означало, что существует множество точек, в которых
значение линейной формы минимально.
Так как в решении присутствуют отрицательные
значения, то оно не является экстремальным (и вообще,
не принадлежит множеству значений данной системы
уравнений). После перестановки в уравнении
переменных местами можно получить экстремальные
решения. Сам займись. Кстати, число экстремальных
точек не превышает величины
, то есть
возможного количество перестановок столбцом
матрицы A. А еще у всякого непустого множества есть
хотя бы одна экстремальная точка. И, кстати, линейная
форма достигает наименьшего/наибольшего значения
именно в экстремальной точке.
27. Симплексный метод.
Можно определить оптимальное решение перебором
всех экстремальных точек, подставляя в них решение,
но это может быть громоздко для большого количества
точек. Поэтому есть более удобный способ –
симплексный метод. Его суть заключается в нахождении
хотя бы одной экстремальной точки, а затем
.
28. Геометрическая интерпретация симплексного
метода.
Каждое из линейных неравенств на переменные
ограничивает полупространство в соответствующем
линейном пространстве. В результате все неравенства
ограничивают некоторый многогранник (возможно,
бесконечный), называемый также полиэдральным
комплексом.
Уравнение
W(x)=c,
где
W(x)
максимизируемый (или минимизируемый) линейный
функционал,
порождает
гиперплоскость
L(c).
Зависимость от c порождает семейство параллельных
гиперплоскостей.
Тогда
экстремальная
задача
приобретает следующую формулировку — требуется
найти такое наибольшее c, что гиперплоскость L(c)
пересекает многогранник хотя бы в одной точке.
Пересечение
оптимальной
гиперплоскости
и
многогранника будет содержать хотя бы одну вершину,
причём, их будет более одной, если пересечение
содержит ребро или k-мерную грань. Поэтому
максимум функционала можно искать в вершинах
многогранника. Принцип симплекс-метода состоит в
том, что выбирается одна из вершин многогранника,
после чего начинается движение по его рёбрам от
вершины к вершине в сторону увеличения значения
функционала. Когда переход по ребру из текущей
вершины в другую вершину с более высоким значением
функционала невозможен, считается, что оптимальное
значение c найдено.
Последовательность вычислений симплекс-методом
можно разделить на две основные фазы:
нахождение
исходной
вершины
множества
допустимых решений,
последовательный переход от одной вершины к
другой, ведущий к оптимизации значения целевой
функции.
29. Учет ограничений типа неравенств в линейном
программировании.
В постановке задачи линейного программирования
присутствуют ограничения в виде неравенств, которые
можно перевести в ограничения типа равенств,
используя дополнительные переменные. Каждому
ограничению соответствует одна дополнительная
переменная.
Например,
задано
ограничение
.
Введем
вспомогательную
переменную
, тогда неравенство
будет
выглядеть
как
. Теперь у задачи
больше ограничений, но в целом все осталось постарому.
Download