Линейные дифференциальные игры преследования Презентация студентки гр. 413 Абрамовой А.А. Московский Государственный университет им. М.В. Ломоносова Кафедра Оптимального Управления Введение Рассматриваемая модель: Пример: процесс преследования одного управляемого объекта другим управляемым объектом. один самолёт преследует другой. Цель первого самолёта догнать второй, цель второго – уйти от преследования. v Убегающий Управляя своим самолётом, они используют информацию u Преследователь I. Знание о технических возможностях самолётов II. Сведения о поведении обоих самолётов Замечание относительно II: можно предпологать известным поведение противника с некоторым опережением и строить соответствующую мат.модель, а потом показать, что это применимо к реальной задаче. Процесс преследования Обозначения: x = (x1, x2) – фазовый вектор преследователя. y = (y1, y2) – фазовый вектор убегающего, где x1, y1 – геометрическое положение соотв. объектов; x2, y2 – их скорости. Уравнения управляемых объектов: Эти уравнения соотв. информации I. (возможностям объектов) где управление u принадлежит множеству P, управление v – множеству Q. Окончание игры: x1 = y1 Процесс преследования заканчивается, когда объекты геометрически совпадают. Переход к дифференциальной игре Дифференциальная игра возникает в результате упрощения обозначений процесса преследования. Обозначения: z = (x, y) – фазовый вектор, образующий пространство R игры как прямую сумму фазовых простанств соответствующий объектов Уравнение управляемых объектов: где u – управление преследования, v – управление убегания. Окончание игры: z M Переход в терминальное простанство M. R Замечание В случае дифференциальной игры и в случае процесса преследования мы можем рассматривать две противоположные задачи. 1. Наша цель: завершение игры (приведение z на M). В распоряжении: u(t) и сведения о z(s) и v(s) на t - θ ≤ s ≤ t 2. Наша цель: предотвращение конца игры. В распоряжении: v(t) и сведения о z(s) и u(s) на t - θ ≤ s ≤ t В дальнейшем нас будет интересовать первая задача (игра преследования). Линейная дифференциальная игра Фазовое пространство R линейной игры будем считать евклидовым векторным пространством размерности n. Уравнение игры: u - преследователь. v - убегающий. где z из R; C – линейное отображение пространства R в себя; u, v принадлежат выпуклым компактам P, Q из R соответственно; u(t), v(t) – измеримые функции t; M – выпуклое замкнутое подмножество R. Мы будем рассматривать дифференциальную игру преследования. Решение дифференциальной игры преследования Естественно, что мы, отождествляя себя с преследователем, стремимся завершить игру за конечное время. z Точка начала Как лучше выбрать ?.. M R Для этого нам бы хотелось уметь эффективно находить точки ( которых можно завершить преследование за конечное время. ), из Это, как оказалось, можно сделать, используя альтернированный интеграл Понтрягина. Далее мы приступим к изучению этого нового для нас объекта. Выпуклые множества и их геометрическая разность Для изучения альтернинованного интеграла Понтрягина нам понадобятся некоторые знания о выпуклых множествах и их геометрической разности. 1. Пусть A, B – замк., вып. подмножества пространства R. Введём мн-во E: Линейная комбинация множеств Свойства: где α и β – фикс. действительные числа 1) E - выпукло. 2) Если A(B) компактно, то E – замкнуто. 3) Если A и B компактны, то E - компактно. 2. Пусть A – замк., вып. Подмножество пространства R. Введём его опорную ф-цию: Вектор u – произвольный из R. По аналогии с пунктом 1: где α и β – неотр. числа. ..кроме того, справедливо следующее: <=> 3. Пусть A, B – замк., вып. подмножества пространства R, пусть B – комп. Введём: Геометрическая разность. т.е. совокупность точек z из R: Обратим внимание на некоторые вытекающие отсюда соотношения: I II (Для док-ва исп. п.2) Пусть X – замк., вып. мн-во, Y – комп. вып. мн-во. Положим: 4. Пусть A – замк., вып. мн-во, а U, V – комп., вып. мн-ва. Тогда справедливо: Это включение следует из определения геом. разности и предыдущего пункта. 5. Обозначим шар радиуса r с центром в начале координат в R через Введём расстояние между двумя комп., вып. подмн-вами X, Y пространства R так: Это расстояние обозначают как h(X, Y) и называют хаусдорфовым. Через обозначим совокупность всех непустых комп. вып. подмножеств R. Метрическое пространство. 6. Очевидна такая связь геом. разности и шара: если r > s. 7. Пусть X(t) – непрерывная функция действительного числового параметра t со значениями в метрическом пространстве Ω(R). Определим интеграл: Он определяется как обычный риманов интеграл. Расстояние между интегральной суммой и Y(p, q) берётся как расстояние хаусдорфа. Предполагается, что p ≤ q. Свойства: 1) Y(p, q) из Ω(R) – непрерывная функция пределов интегрирования p и q. 2) Если r такое, что p ≤ r ≤ q, то справедливо: 8, 9. Заметим, что вып. мн-во Y(p, q) совпадает с мн-вом всех точек y вида: где x(t) X(t) – измеримая функция переменного t в R. Кроме того, имеет место соотношение: Оценка геометрической разности Продолжаем вспомогательные исследования для введения альтернированного интеграла Понтрягина. 1. Пусть A – комп., вып. подмножество пространства R. Положим: Понятно, что для непустоты при некотором r нужно совпадение размерности A с R. Обозначим: α = α(A) – максимальное значение r, при котором δ = δ(A) – диаметр множества A. Введём Оценим хаусдорфово расстояние между и : непусто (r ≤ α); 2. Пусть A, B – комп., вып. подмн-ва R. Пусть их разность D имеет размерность R. Тогда существуют положительные числа γ и l, зависящие только от k(D), α(D) и δ(A), что при r ≤ γ два произвольных комп., вып. подмн-ва A', B' пр-ва R обладают св-вом: Если то для разности Справедливо соотношение: 3. Пусть A, A' и B, B' – комп., вып. подмножества пространства R. Тогда Теперь мы готовы перейти к изучению альтернированного интеграла Понтрягина. Альтернированный интеграл 1. Пусть A – замк., вып. подмножество пространства R и пусть - две последовательности комп., вып. подмножеств пространства R. Положим Альтернированная сумма последовательностей U и V с начальным значением A Заметим, что если Тогда имеет место включение 2. Пусть A – компактно и существует такое положительное число β, что верно: Тогда альтернированная сумма является непр. функцией переменных в пр-ве Ω(R), когда выполнено данное неравество. 3. Пусть A – замк., вып. подмн-во пр-ва R. Пусть U(τ), V(τ) – комп., вып. мн-ва в пр-ва R, непрерывно зависящие от параметра τ на отрезке p ≤ τ ≤ q. Пусть - некоторое подразделение отрезка pq, т.е. последов-ть: Положим Теперь, исходя из A и U, V, так же как в пункте 1 составим последовательность мн-в: Введём обозначение: Далее рассмотрим случаи когда A компактно и когда A не компактно. Тем самым подчеркнув зависимость от A, P, r Пусть A – компактно. Тогда считаем, что функции U(τ), V(τ) удовлетворяют требованию: Существует непр. на отрезке функция β(r), положительная при всех значениях r > p, что для любого подразд. P отрезка pq имеет место нер-во: Т. о., не исключается возможность, что α(A) = 0, и множество функцией чисел Пусть A – не компактно. является непрерывной Тогда положим: Кроме того, потребуем, чтобы существовало настолько большое число μ, что верно: При этом предположении является непр. ф-цией 4. Пусть - такая посл -ть неогр. измельчающихся подразделений отрезка pq, что имеет место включение: Значит, эта посл - ть есть убывающая посл - ть замк., вып. мн-в в пространстве R. Её пересечение не зависит от последовательности подразделений отрезка pq при выполнении условия из предыдущего пункта: 5. Считаем, что выполнено условие. Тогда множество называется альтернированным интегралом АИ функций U(τ), V(τ) на отрезке pq с нач. множеством A: Кроме того, 6. Пусть x – произвольная точка отрезка pq, т.е. p ≤ x ≤ q. Введём интеграл: Правая часть определена, т.к. условие, при котором вводится АИ, выполнено и на px. Тогда можно ввести и Заметим, что если x ≥ p + ε, где ε – положительное число, и A – компактно, то λ: т.е. при компактном A ф-ция W(x) имеет равном.огр. рост на каждом отрезке p + ε ≤ x ≤ q. имеет равном. огр. рост на отрезке p + ε ≤ x ≤ q. шары с центром в нуле. Допустим имеет место для каждого i. и и Допустим и шары с центром в нуле. при p < t ≤ q. Спасибо за просмотр!