Сер. 10. 2011. Вып. 2 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА ПРОЦЕССЫ УПРАВЛЕНИЯ УДК 517.977+519.71 М. А. Александров, Н. В. Смирнов АСИМПТОТИЧЕСКИ УСТОЙЧИВЫЙ ГИБРИДНЫЙ ИДЕНТИФИКАТОР В ЗАДАЧЕ МНОГОПРОГРАММНОЙ СТАБИЛИЗАЦИИ 1. Введение. Постановка задачи. Стабилизация программных движений управляемых динамических систем является по сути центральной в современной математической теории управления. Наиболее распространенный подход при ее решении состоит в построении управлений вида обратной связи [1, 2]. Задача многопрограммной стабилизации была впервые сформулирована В. И. Зубовым в работах [3, 4]. В них предложено представление правых частей систем дифференциальных уравнений, имеющих наперед заданное конечное семейство решений, а также рассмотрена задача синтеза управлений, которые реализуют заданную совокупность программных движений и обеспечивают их асимптотическую устойчивость по Ляпунову. Допустим, что движение объекта управления описывается линейной системой ẋ = Px + Qu + f (t), (1) где x ∈ Rn – вектор фазового состояния; u ∈ Rr – вектор управлений; P и Q – постоянные, вещественные матрицы соответствующих размерностей; f (t) – вещественная, непрерывная вектор-функция, заданная при t ∈ [0, +∞). Задача 1 [4] (многопрограммная стабилизация). Требуется построить управление u = u(x, t), (2) которое реализует заданные программные движения xj = xj (t) при программных управлениях uj = uj (t), j = 1, N . Кроме того, необходимо, чтобы программные движения xj (t) при управлении (2) были асимптотически устойчивы по Ляпунову. Александров Михаил Александрович – аспирант кафедры моделирования экономических систем факультета прикладной математики–процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук, проф. Н. В. Смирнов. Количество опубликованных работ: 2. Научное направление: математическая теория управления. E-mail: [email protected]. Смирнов Николай Васильевич – доктор физико-математических наук, профессор кафедры моделирования экономических систем факультета прикладной математики–процессов управления СанктПетербургского государственного университета. Количество опубликованных работ: 81. Научные направления: теория устойчивости, математическая теория управления, управление макроэкономическими системами. E-mail: nvs [email protected]. c М. А. Александров, Н. В. Смирнов, 2011 81 Конструктивное решение задачи 1 предлагает Теорема 1 [4]. Пусть выполнены следующие условия: 1) система ẋ = Px + Qu при u = Cx может иметь сколь угодно большой запас устойчивости, получающийся путем выбора постоянной матрицы C; 2) программные движения xj (t) различимы при t t0 0, иначе говоря, inf t0 xi − xj > 0, i = j. Тогда существует управление (2), реализующее программные движения xj (t), при этом каждое из них будет асимптотически устойчиво по Ляпунову. В общем случае число N не связано с размерностью системы (1) и размерностью пространства управлений. Управление (2) имеет следующее представление: u(x, t) = N N (xj − xi )(x − xj ) uj + C(x − xj ) − 2uj pj (x, t), (xj − xi )2 j=1 (3) i=1,i=j где pj (x, t) = N 9 i=1,i=j (x − xi )2 , (xj − xi )2 j = 1, N. (4) Функция (3) – это интерполяционный полином Эрмита, в котором узловые точки – программные движения xj (t), а значения – программные управления uj (t). По построению управление (3), (4) обладает такими очевидными свойствами: pj (xj , t) ≡ 1; pj (xi , t) ≡ 0, i = j; u(xj (t), t) = uj (t), j = 1, N . Выражения вида (xj − xi )(x − xj ), (xj − xi )2 представляют собой скалярные произведения соответствующих векторов. В формулах (3), (4) и далее по тексту, где это не мешает пониманию сути, не будем указывать аргумент t у векторных функций xi , xj , uj , . . . . Кроме того, зависимость функций pj (x, t) от времени является неявной, лишь через xi (t), xj (t), поэтому имеет смысл обозначение pj (x) в левой части (4). Система (1), замкнутая управлением (3), (4), представляет собой многопрограммный автомат, способный реализовать произвольное программное движение xj (t) из заданного семейства и обеспечить его асимптотическую устойчивость. В [5] задача 1 была рассмотрена для билинейных систем, а в [6, 7] – для линейных и билинейных систем в случае неполной обратной связи. В них предложены алгоритмы построения непрерывных идентификаторов полного порядка и Люенбергера [8], позволяющих, в конечном − xj . итоге, заменить векторы отклонений x − xj в (3) на их оценки x Практическая реализация управления (3), (4) в конкретной прикладной задаче требует непрерывного получения информации о векторах отклонений yj (t) = x(t) − xj (t) для всех программных движений xj (t). Эта проблема отпадает, если построить дискретный регулятор вместо непрерывного. Отметим, что при решении задачи 1 векторы отклонения от программных режимов x − xj считались доступными для измерения. Изменим постановку задачи. Предположим, что задано уравнение измерительного прибора zj (t) = Ryj (t), j = 1, N, (5) где zj (t) ∈ Rm – вектор измерений; R – постоянная, вещественная (m × n)-матрица. Уравнение (5) называют уравнением выхода [9], а вектор zj (t) – выходом системы. Зная j (t) вектора yj (t), чтобы она обладала выход zj (t), требуется построить такую оценку y свойством [9] j (t) → 0, t → +∞. yj (t) − y (6) 82 Если такая оценка существует, то ее можно было бы использовать для синтеза управления, аналогичного управлению (3), (4). В этом и состоит задача многопрограммной стабилизации линейной системы (1) в случае неполной обратной связи. Определение 1. Многопрограммным управлением с неполной обратной связью будем называть управление вида (3), (4), в котором вектор фазового состояния x(t), (t), понедоступный для прямого измерения, заменяется соответствующей оценкой x строенной с применением асимптотического идентификатора. Многопрограммное управление с неполной обратной связью построим в виде [6] u( x, t) = N N (xj − xi )( x − xj ) x − xj ) − 2uj x), uj + C( pj ( (xj − xi )2 j=1 (7) i=1,i=j x) = pj ( N 9 i=1,i=j ( x − xi )2 , (xj − xi )2 j = 1, N. (8) Замкнем систему (1) управлением (7), (8) и рассмотрим некоторое ее программное движение xk (t) из данного семейства. Здесь и в дальнейшем индексом k будем обозначать некоторое конкретное движение семейства, относительно которого ведутk (t) = x (t) − xk (t), построим систему ся рассуждения. Полагая yk (t) = x(t) − xk (t), y в отклонениях yk + Hk ( yk ). ẏk = Pyk + QC (9) Здесь N Hk ( yk ) = Q C yk − 2uk i=1,i=k (xk − xi ) yk (xk − xi )2 N + Quk hk ( yk ) + Q N 2 i=1,i=k (xk − xi ) yk + h ( y ) + k k (xk − xi )2 yk + xk − xj ) − uj + C( j=1,j=k − 2uj N (xj − xi )( yk + xk − xj ) yk + xk ), pj ( (xj − xi )2 (10) i=1,i=j k не меньше hk ( yk ) – скалярная функция, порядок которой по компонентам вектора y двух. По построению нелинейную систему (9) можно рассматривать как систему, замкнуyk . В этом случае ее можно записать в форме тую управлением вида vk = C ẏk = Pyk + Qvk + Hk ( yk , vk ). (11) Идентификатор состояния для системы (11) предлагается строить в таком виде: ˙ k = P y yk + Qvk + L(zk − R yk ) + Hk ( yk , vk ), (12) где L – (n × m)-матрица параметров идентификатора, подлежащая определению. Слагаемое L(zk − R yk ) в правой части (12) учитывает качество оценки состояния. Поk ), то в идеальной ситуации при y k ≡ yk yk = R(yk − y скольку с учетом (5) zk − R система (12) с точностью до обозначений совпадает с исходной системой (11). Перед формулировкой задачи введем еще несколько понятий. 83 Определение 2. Управление vk будем называть допустимым дискретным управлением, если оно имеет вид кусочно-постоянной векторной функции yk (sh), vk = C t ∈ [sh, (s + 1)h[ , s = 0, 1, . . . , (13) k (0) = y k0 – вектор начальных данных для идентификатогде h – шаг дискретности; y ра (12). Определение 3. Идентификатор (12), замкнутый дискретным управлением (13), будем называть гибридным идентификатором полного порядка. Идентификатор полного порядка позволяет оценить весь вектор yk в отличие от идентификатора Люенбергера [8, 9]. Определение 4. Гибридным многопрограммным управлением будем называть управление вида (3), (4), в котором только первые слагаемые uj (t), отвечающие за реализацию программных движений xj (t), являются известными непрерывными и ограниченными функциями времени, а все остальные слагаемые и сомножители, отвечающие за стабилизацию программных движений, вычисляются в дискретные моменты времени t = sh, s = 0, 1, . . . . Задача 2 (многопрограммная стабилизация при неполной обратной связи с применением гибридного идентификатора). Выяснить, при каких коэффициентах усиления в виде матриц C, L и при каком выборе шага h существуют гибридный идентификатор полного порядка и допустимое дискретное управление (13), обеспечивающие асимптотическую устойчивость нулевому решению системы (11). Решение этой задачи позволит указать алгоритм построения гибридного многопрограммного управления с неполной обратной связью, что и является конечной целью данной работы. В заключение п. 1 отметим, что задача синтеза гибридного идентификатора с целью обеспечения технической устойчивости многопрограммного регулятора рассматривалась в [10]. 2. Синтез многопрограммного регулятора на основе асимптотически устойчивого гибридного идентификатора состояния системы. Перейдем к решению поставленной задачи. Прежде всего построим непрерывное стабилизирующее управление в системе (11), (12). Для этого рассмотрим (11), (12) как одну систему, учитывая уравнение измерителя (5) и вид допустимого непрерывного управления yk : vk = C % yk + Hk ( yk , C yk ), ẏk = Pyk + QC (14) ˙ = P k ) + Hk ( y yk + QC yk + LR(yk − y yk , C yk ). k В системе (14) сделаем неособую замену переменных: % yk (t) = yk (t), k (t). yk (t) = yk (t) − y (15) Переменная yk (t) отражает качество оценки состояния и может быть использована для анализа ее асимптотики (6). В новых переменных система (14) примет вид ẏk P + QC −QC yk Hk (yk − yk , C(yk − yk )) = + . (16) yk O P − LR O ẏk Система (16) состоит из двух подсистем. Первая представляет собой систему (11), yk , выраженным через новые переменные (15), а втозамкнутую управлением vk = C рая, по yk , описывает качество оценки отклонения yk по измерениям (5). В результате 84 задача сводится к выбору матриц C и L таким образом, чтобы нулевое решение системы (16) было асимптотически устойчиво по Ляпунову. Перейдем к формулировке основного результата. Теорема 2. Пусть выполнены условия теоремы 1 и существуют матрицы C и L, при которых система линейного приближения в (16) асимптотически устойчива по Ляпунову. Тогда существует гибридное многопрограммное управление, построенное с применением гибридного идентификатора (12), (13), которое реализует заданные программные движения xj (t), j = 1, N , и обеспечивает их асимптотическую устойчивость. Д о к а з а т е л ь с т в о. Условия теоремы означают, что существуют непрерывное yk для системы (14) и построенное на его основе стабилизирующее управление vk = C непрерывное многопрограммное управление с неполной обратной связью (7), (8), где k – выход идентификатора (12). =y k + xk , а y x Рассмотрим теперь дискретное управление (13) с той же матрицей C и соответствующее гибридное многопрограммное управление u( x(sh), t) = N j=1 uj (t) + C( x(sh) − xj (sh)) − $ N (xj (sh) − xi (sh))( x(sh) − xj (sh)) − 2uj (t) x(sh)), pj ( (xj (sh) − xi (sh))2 (17) i=1,i=j где pj ( x(sh)) = N 9 i=1,i=j ( x(sh) − xi (sh))2 . (xj (sh) − xi (sh))2 (18) Построим оценки отклонений решений замкнутой системы (1), (17), (18) от программных движений xj (t). Повторяя для нее вывод системы в отклонениях (11), получим ẏk = Pyk + QC yk (sh) + Hk ( yk (sh), C yk (sh)). (19) Соответствующий гибридный идентификатор имеет вид ˙ k = P y yk + QC yk (sh) + L(zk − R yk ) + Hk ( yk (sh), C yk (sh)). (20) Объединим (19), (20) в одну систему, учитывая уравнение измерителя (5), и выполним замену переменных (15): ẏk ẏk = P O O P − LR Введем обозначения yk k = y , yk yk yk QC −QC yk (sh) + yk (sh) O O Hk yk (sh) − yk (sh), C(yk (sh) − yk (sh)) + . (21) O + = P P O , O P − LR = Q QC −QC . O O 85 Тогда система (21) примет вид yk + Q yk (sh) + Gk ( ˙ k = P y yk (sh)), (22) где Gk ( yk (sh)) – обозначение вектора нелинейности в (21). yk (sh)) состоит нелинейных слаВектор Gk ( из двух блоков, построенных на основе гаемых в (21). Функция Hk yk (sh) − yk (sh), C(yk (sh) − yk (sh)) имеет вид полинома (см. (10)), максимальная степень которого конечна и зависит только от параметра N , а порядок по компонентам векторов yk (sh), yk (sh) не меньше второго. Следовательно, k (sh) справедлива оценка при достаточно малых по норме отклонениях y Gk ( yk (sh)) a yk (sh)b , (23) где b 2; a – положительная константа, зависящая от норм матриц Q, C и функций uj , xj . k (t) − y k (sh) при t ∈ [sh, (s + 1)h] в системе (22). Применяя Оценим норму разности y формулу Коши, запишем k (t) − y k (sh) = y e P(t−sh) −E+ t−sh e P(t−sh−τ ) 0 $ k (sh) + dτ Q y + 0 t−sh eP(t−sh−τ ) dτ Gk ( yk (sh)). Используя (23) и очевидные вспомогательные оценки t−sh eP(t−sh−τ ) dτ hePh , eP(t−sh) − E ePh − 1, 0 справедливые при t ∈ [sh, (s + 1)h], получим k (sh) m(h, y k (sh)) yk (t) − y yk (sh), (24) + ahePh k (sh)) = ePh − 1 + hePh Q m(h, y yk (sh)b−1 . k (sh)) > 0 Для любого допустимого дискретного управления (13) функция m(h, y k (sh)) → 0 при h → 0 и yk (sh) ω, s = 0, 1 . . . , при h > 0 и обладает свойством m(h, y где ω – некоторая положительная постоянная. k (sh) m(h, y k (sh)) k (t)+ y k (t), то при достаточно Поскольку yk (t)− y yk (sh)− y k (sh)) < 1, имеет место окончательная оценка малом h, когда m(h, y k (sh) yk (t) − y k (sh)) m(h, y yk (t). k (sh)) 1 − m(h, y (25) Запишем систему (22) в эквивалентной форме + Q) yk + Q( yk (sh) − y ˙ k = (P k ) + Gk ( y yk (sh)). Рассмотрим систему 86 + Q) yk , ˙ k = (P y (26) (27) которая совпадает с системой линейного приближения в (16). По условию теоремы существуют матрицы C и L, при которых (27) асимптотически устойчива. Тогда суkT V ществует квадратичная форма v( yk ) = y yk такая, что dv( yk )/dt|(27) = − yk 2 . Матрицу V квадратичной формы v( yk ) можно найти, решая матричное уравнение Ляпунова. Продифференцируем теперь v( yk ), в силу системы (26): dv( yk ) 2 yk (sh) − y k ) + grad v( yk + grad v( yk ), Q( yk ), Gk ( yk (sh)) . (28) = − dt (26) Для оценки сверху модуля второго слагаемого в (28) используем (25) и неравенство Коши–Буняковского yk (sh) − y grad v( k ) A1 yk ), Q( k (sh)) m(h, y yk (t)2 , k (sh)) 1 − m(h, y (29) где A1 = 2VQ. Построим аналогичную оценку для третьего слагаемого в (28), применяя неравенство Коши–Буняковского и (23): grad v( yk ), Gk ( yk (sh)) A2 yk yk (sh)b , A2 = 2aV. Поскольку yk (sh)− yk + yk yk (sh) yk (sh) = b b−1 1+ k (sh)) m(h, y k (sh)) 1 − m(h, y yk (sh)b−1 , yk то окончательно получим grad v( yk (sh)) A2 1 + yk ), Gk ( k (sh)) m(h, y k (sh)) 1 − m(h, y yk 2 . yk (sh)b−1 (30) Объединяя оценки (29), (30), найдем dv( yk ) 2 yk − dt (26) 1 − A1 k (sh)) m(h, y − k (sh)) 1 − m(h, y $ k (sh)) m(h, y − A2 1 + yk (sh)b−1 . (31) k (sh)) 1 − m(h, y Для доказательства асимптотической устойчивости нулевого решения системы (26) приведем несколько вспомогательных оценок. k (sh)), существуют положительные числа В силу основного свойства функции m(h, y Δ и h0 такие, что при h ∈ (0, h0 ), yk (sh) < Δ выполнено k (sh)) m(h, y 1 , 2 k (sh)) k (sh)) m(h, y 1 m(h, y A1 + A2 1 + yk (sh)b−1 . k (sh)) k (sh)) 1 − m(h, y 1 − m(h, y 2 (32) (33) 87 Пусть для некоторого s0 0 и δ < Δ выполнено yk (s0 h) < δ, тогда, в силу (24), (32), справедлива оценка 1 k (s0 h) δ + δ < 2δ. yk ((s0 + 1)h) yk (s0 h) + yk ((s0 + 1)h) − y 2 Будем считать, что 2δ < Δ. В этом случае имеем 1 k ((s0 + 1)h) 2δ + 2δ < 4δ. yk ((s0 + 2)h) yk ((s0 + 1)h) + yk ((s0 + 2)h) − y 2 Пусть теперь 2 δ < Δ, тогда аналогичные рассуждения позволяют получить оценку yk ((s0 + )h) 2 δ. (34) Далее, в силу оценки (31) и неравенства (33), имеем dv( yk (t)) 1 2 − yk (t) . dt 2 (35) Вместе с тем положительно-определенная квадратичная форма удовлетворяет неравенствам yk 2 v( yk ) a2 yk 2 , (36) a1 где a1 > 0, a2 > 0. Из (35), (36) следует 1 dv( yk (t)) − v( yk (t)). dt 2a2 (37) Оценки (34), (37) позволяют сделать вывод о том, что на решениях системы (26), удовлетворяющих условию yk (s0 h) < δ, выполнены неравенства 1 v( yk (s0 + )h) v( yk (s0 h))e− 2a2 h . (38) Далее, в силу (35), (36) и (38), имеем : yk ((s0 + )h) a2 − h yk (s0 h)e 4a2 . a1 Пусть число l выбрано так, чтобы было справедливо соотношение : h a2 − 4a e 2 < 1. a1 Тогда имеют место оценки yk ((s0 + )h) < δ. Получаем, что решения системы (26), начинающиеся в области y < δ, при возрастании времени остаются в области y < Δ. Значит, для таких решений при всех t ∈ [t0 , +∞) выполняются неравенства (35) и (37). Cледовательно, нулевое решение системы (26) асимптотически устойчиво. Теорема доказана. 3. Заключение. В работе предложен метод построения гибридного многопрограммного управления с неполной обратной связью. Реализация данного класса управлений возможна при наличии соответствующего идентификатора. С этой целью доказана теорема о достаточных условиях существования асимптотически устойчивого 88 гибридного идентификатора. Доказательство теоремы конструктивно. Оно основано на втором методе Ляпунова и содержит алгоритм построения указанного идентификатора. Таким образом, изложен конструктивный метод синтеза многопрограммных гибридных управлений для класса линейных систем, обеспечивающий заранее прогнозируемую точность и асимптотическую устойчивость по Ляпунову программных движений из наперед заданного семейства. Литература 1. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 496 с. 2. Зубов В. И. Математические методы исследования систем автоматического регулирования. Изд. 2-е, перераб. и доп. Л.: Машиностроение, 1974. 336 с. 3. Зубов В. И. Интерполяция систем дифференциальных уравнений // Докл. АН СССР. 1991. Т. 318, № 1. С. 28–31. 4. Зубов В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. 1991. Т. 318, № 2. С. 274–277. 5. Смирнов Н. В., Смирнова Т. Е. Синтез многопрограммных управлений в билинейных системах // Прикл. математика и механика. 2000. Т. 64, № 6. С. 929–932. 6. Смирнов Н. В. Многопрограммная стабилизация линейных и билинейных систем в случае неполной обратной связи // Изв. РАН. Теория и системы управления. 2001. № 3. С. 40–44. 7. Smirnov N. V. Synthesis of multiprogrammed stable controls using the Luenberger observer // Proc. of 11th IFAC Workshop: Control Appl. Optim. 2000. Vol. 1. P. 327–330. 8. Luenberger D. G. Observers for multivariable systems // IEEE Trans. Automat. Control. 1966. Vol. AC–11, N 2. P. 190–197. 9. Андреев Ю. Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с. 10. Смирнов Н. В. Синтез гибридного идентификатора полного порядка в задаче многопрограммной стабилизации // Автоматика и телемеханика. 2006. № 7. С. 41–52. Статья рекомендована к печати проф. А. П. Жабко. Статья принята к печати 16 декабря 2010 г.