Нейросетевая система адаптивного управления нелинейным

advertisement
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
В.А. УЛЬШИН, Д.А. ЮРКОВ
Восточноукраинский национальный университет им. В. Даля, Луганск,
Украина
rusdma@rambler.ru
НЕЙРОСЕТЕВАЯ СИСТЕМА
АДАПТИВНОГО УПРАВЛЕНИЯ
НЕЛИНЕЙНЫМ НЕСТАЦИОНАРНЫМ ОБЪЕКТОМ
Рассмотрен метод организации алгоритмов и структур данных, используемых в рамках адаптивной системы управления. Показана возможность практической реализации рассмотренного метода для управления
статическим нелинейным нестационарным объектом в режиме реального
времени при наличии помех.
Ключевые слова: адаптивная система управления, нейронная сеть
Введение
Потребности человека использовать в своей деятельности объекты с
неточной или неизвестной математической моделью в изменяющихся
условиях взаимодействия управляемой системы с внешней средой и при
изменении характеристик самого объекта приводят к необходимости разработки новых методов управления подобными системами, а также к поиску путей и возможностей упрощения практической реализации теоретических результатов.
Недостоверность, неточность или же отсутствие знаний об управляемом объекте требует использования различных методов, позволяющих на
основании анализа наблюдаемой динамики системы определять необходимый закон управления.
При практическом использовании в некоторых случаях желательно
использовать алгоритмы, работающие в реальном масштабе времени, что
часто требует соответственной организации вычислительных процессов и
специфических методов представления данных.
В соответствии с этим, в данной работе рассматривается метод организации алгоритмов и структур данных, обеспечивающий возможность обучения системы непосредственно в процессе управления, что позволяет
сочетать в рамках единого процесса решение задач идентификации и
управления.
УДК 004.032.26(06) Нейронные сети
115
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
Постановка задачи
Рассмотрим статический объект, состояние которого описывается скалярной величиной S (x) , зависящей от управляющих параметров, обозначаемых вектором x . Цель управления – обеспечить изменение S по требуемому закону: S  u (t ) . При этом будем полагать, что другой информации об управляемом объекте нет и его математическая модель неизвестна.
Классический подход к решению данной задачи подразумевает получение модели управляемого объекта, её исследование и последующее использование полученных результатов для управления. Получение модели
объекта, пригодной для использования во всех режимах функционирования – трудоёмкий процесс и не всегда возможен с практической точки
зрения.
В случае, когда применение классических методов проблематично, целесообразно поэтапное накопление знаний об объекте управления и
окружающей среде с целью их дальнейшего использования для решения
задач управления, что осуществимо в классе адаптивных систем.
Однако синтез адаптивных систем зачастую сопряжён с проблемами
технической реализации требуемых алгоритмов регулирования и адаптации. В связи с этим представляется актуальной разработка новых методов
реализации алгоритмов адаптивного управления и соответствующего
представления данных. В связи с этим определим целью данной работы
разработку алгоритмов и структур данных, позволяющих реализовать систему адаптивного управления для нелинейного нестационарного объекта
с изначально неизвестной математической моделью, работающую в реальном масштабе времени.
Также рассмотрим возможность и особенности практической реализации системы управления статическим нелинейным объектом с неизвестной математической моделью. В частности, рассмотрим один из возможных вариантов реализации алгоритма поиска новых знаний, необходимого
для функционирования системы адаптивного управления, а также результаты его использования для некоторых примеров.
Алгоритм адаптации и управления
Как указывалось ранее, состояние объекта характеризуется скалярной
величиной S (x) . Задача управления сводится к поиску таких значений
управляющих параметров, которые обеспечивают требуемое значение
УДК 004.032.26(06) Нейронные сети
116
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
S (x) . Рассмотрим задачу, в которой наблюдаемый выход объекта  t в
дискретный момент времени t зависит от управляющих параметров x t в
соответствии с выражением:
(1)
t  S (xt )  t , t  1, 2,..., T ,
где S (x t ) – гладкая поверхность;  t – одна из реализаций процесса белого шума с нулевым средним и дисперсией 2 .
Предположим, что ошибки в наблюдениях нет ( t  0 ) и оценкой состояния может служить наблюдаемый выход , что при сделанном предположении эквивалентно S (x) . Допустим, что в некоторый момент времени t1 значения управляющих параметров x1 . Предположим, что значение функции S (x1 ) не соответствует требуемому. Следовательно, необходимо управляющее воздействие (изменение управляющих параметров)
для перевода системы в некоторое состояние S (x 2 ) , которое обеспечивает лучшее значение S (x) (по какому-либо критерию). Лучшее значение
можно найти на основании локальной аппроксимации функции S (x) в
ограниченной области G, которой принадлежит x1 . Переведя систему в
состояние S (x 2 ) , можно продолжить поиск лучшего значения функции
S (x) , но, уже относительно новых значений x . Очевидно, что продолжать такую последовательность операций можно до достижения цели. В
случае наличия помех в результатах наблюдений ( t  0 для любого t ) в
качестве оценки состояния системы допустимо использование приближённого значения * , полученного в результате вычисления аппроксимирующей функции * F (x) в ограниченной области G. Реализовать
приемлемое для практического использования отображение F можно,
используя любой метод. Например, использовать искусственную нейронную сеть на основе радиально-базисных функций [1] (RBF-сеть) или же
использовать другие известные методы аппроксимации функций [2].
Реализация системы, работающей в реальном масштабе времени, требует быстрых алгоритмов аппроксимации, а настройка коэффициентов
нейронной сети для каждой ограниченной области – процесс достаточно
трудоёмкий с вычислительной точки зрения и зависит от количества составляющих сеть искусственных нейронов. Учитывая, что аппроксимация
выполняется в локальной области G, можно использовать нейронные сети
с меньшим количеством нейронов или же использовать RBF-сети с изУДК 004.032.26(06) Нейронные сети
117
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
вестными центрами радиально-базисных функций, расположенными
внутри ограниченной области G. В таком случае задача поиска коэффициентов нейронной сети сводится к решению систем линейных уравнений,
для чего разработаны многочисленные, хорошо апробированные методы.
Поскольку реализация аппроксимации функции многих переменных может быть осуществлена многими способами, в дальнейшем часть системы
управления, выполняющую эту операцию, будем называть аппроксиматором без указания конкретного метода его реализации.
Очевидно, что данный метод применим, если в границах области G
всегда можно найти такие значения управляющих параметров x , в котором рассогласование  между управляющим воздействием u(t ) и текущим значением F (x) находится в допустимом с точки зрения практического использования интервале:    . В случае, если данное условие не
выполняется, необходимо изменение значений управляющих параметров,
что эквивалентно некоторому действию. Основная проблема в данном
случае – прогноз результата предполагаемого действия, его оценка. Кроме
того, аппроксимация в новой области требует новых экспериментальных
данных, что приводит к необходимости дополнительных действий системы с целью их накопления и не всегда допустимо.
В связи с этим авторами данной работы предлагается следующий метод, позволяющий существенно снизить количество поисковых операций
при работе системы управления и улучшить качество работы системы.
Основная идея метода заключается в обмене данными между соседними
областями, который реализован следующим образом.
Допустим, что текущая область G соответствует гиперкубу в многомерном пространстве со стороной r j для j -го измерения. Добавление
нового результата эксперимента в обучающую выборку приводит к
настройке аппроксиматора, отвечающего за
вычисление F (x) в области G . Для улучшения качества аппроксимации в соседних
областях целесообразно добавить этот же
результат эксперимента и в обучающие
выборки для соответствующих соседним
областям аппроксиматорам. На рис. 1. приведена иллюстрация описанного алгоритма
для области, обозначенной A. Темные области соответствуют областям, для которых
Рис. 1. Иллюстрация
имеются реальные экспериментальные данк описанию алгоритма
УДК 004.032.26(06) Нейронные сети
118
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
ные, светлым областям соответствуют гиперкубы, в которых измерений
не проводилось, но возможен прогноз на основании данных из соседних
областей.
Очевидно, что если при настройке аппроксиматора для области A будут использованы данные, полученные в результате измерений, выполненных в соседних с ней областях, то качество аппроксимации может
быть существенно выше. Также можно не ограничиваться только соседними областями, а использовать данные из областей, находящихся не далее чем на заранее заданное расстояние. В случае, если размеры гиперкуба заданы по каждому измерению и постоянны, то каждой области можно
сопоставить набор целых чисел, однозначно идентифицирующий любой
гиперкуб. Такое представление приводит к возможности реализации
быстрого алгоритма поиска всех областей, находящихся на заданном расстоянии от текущей.
Таким образом, возможно решение описанной ранее задачи – в случае
недопустимой величины рассогласования  между требуемым и прогнозируемым значениями оценки состояния системы в границах текущей
области выбрать наилучшее решение из соседних областей. В случае, если
в окрестностях лучшего решения нет, то целесообразно использовать разбиение пространства параметров на области большего размера, т.е. с другим масштабом. В другом масштабе прогноз может осуществляться с
меньшей точностью, что приводит к менее точному определению закона
управления, но позволяет решить проблему выхода системы из локальных
экстремумов. Очевидно, что максимально возможный размер локальной
области ограничен только практическими соображениями и требованиями
эксплуатации системы. С практической точки зрения представляется целесообразным организовать несколько подсистем, работающих по описанному принципу, но на разных масштабах.
Практическая реализация
Для оценки эффективности используемого алгоритма рассмотрим решение различных задач управления. Общая структурная схема используемой системы приведена на рис. 2.
На рис. 2 приняты следующие обозначения: u – задающее воздействие; x u – управляющее воздействие, сформированное управляющей
подсистемой; x r – реальное значение управляющих параметров, обеспе-
УДК 004.032.26(06) Нейронные сети
119
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
чиваемое исполнительным устройством;  – наблюдаемый выход системы;  – случайная величина (неизмеряемое возмущение).
УДК 004.032.26(06) Нейронные сети
120
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
Рис. 2. Структурная схема рассматриваемой системы
Сначала для моделирования работы системы используем нелинейный
стационарный объект со следующей математической моделью:
S (x)  1   p x  μ  ,
(2)
где μ – координаты точки, в которой S (μ)  1 ; p  0,002 . Если принять
размерность вектора x равной двум, а значения  считать подчиняющимися нормальному закону распределения с нулевым математическим
ожиданием и дисперсией 2  0, 25 ,
то одна из возможных реализаций
наблюдаемого выхода системы будет
выглядеть так, как показано на рис. 3.
Для указанных условий эксплуатации результаты работы описанного
алгоритма для решения задач стабилизации и слежения приведены соответственно на рис. 4 и 5.
Рис. 3. Пример возможной реализаДля моделирования работы систеции наблюдаемого выхода системы
мы в задаче слежения использовалось
задающее воздействие u(t )  0,5  0,4 sin(0,1t ) . Результаты моделирования
работы описанной системы подтверждают эффективность используемых
алгоритмов и позволяют надеяться на успех при управлении реальными,
физическими объектами.
Теперь рассмотрим более сложный случай – управление нелинейным
нестационарным объектом, с изменяющимися во времени характеристиками. В качестве модели такого объекта примем следующую зависимость:
3
S (x)  1   p x  μ  ,
(3)
где h(t )  a0  a1 sin(t ) ; p  0,002 ; a0  1,75 ; a1  1,25 ;   0, 05 . Для
наглядности на рис. 6 показан характер изменения нелинейности объекта
для разных значений h .
h (t )
УДК 004.032.26(06) Нейронные сети
121
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
Рис. 4. Пример обучения системы для решения задачи
стабилизации в условиях помех
Рис. 5. Пример обучения системы для решения задачи слежения
в условиях помех
а)
б)
Рис 6. Изменение характера нелинейности объекта управления
а) h  0,5 ; б) h  3
УДК 004.032.26(06) Нейронные сети
122
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
Особенностью управления нестационарными объектами является изменение закона их функционирования во времени. Данное обстоятельство
определяет необходимость модификации описанного ранее метода следующим образом. Для этого сделаем допущение о квазистационарности
объекта, т.е. параметры рассматриваемого объекта изменяются существенно медленнее остальных динамических процессов, протекающих в
системе. Таким образом, будем считать, что на протяжении некоторого
времени  изменение его параметров не оказывает существенного влияния на качество управления, основанного на текущей математической
модели.
Однако описанный ранее метод подразумевает аппроксимацию функции многих переменных на основе всех имеющихся данных, часть которых может быть не актуальна для текущего временного интервала, что
требует реализации эффекта «забывания» данных, полученных ранее чем
t  . Внедрение в управляющую систему блока, реализующего данный
эффект, позволило реализовать систему управления описанным ранее нестационарным нелинейным объектом в условиях случайных возмущений.
В качестве примера обучения и использования системы управления,
построенной по описанному принципу можно привести результаты моделирования, показанные на рис. 7. Для задачи слежения использовалось
задающее воздействие u(t )  0,3  0,2 sin(0,1t ) и не измеряемое возмущение  с нулевым математическим ожиданием и дисперсией 2  0,0025.
h(t )
S (x, t )
Рис. 7. Пример работы адаптивной системы для управления
нестационарным объектом в условиях помех
УДК 004.032.26(06) Нейронные сети
123
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
Подсистема, реализующая эффект «забывания» данных, позволяет не
только реализовать возможность управления нестационарными объектами. При эксплуатации системы возможно использование ограниченного
количества гиперкубов, в рамках которых реализуемы состояния объекта,
соответствующие требуемому задающему воздействию u (t ). Однако, в
рамках поискового процесса возможно накопление избыточных знаний,
которые могут никогда не пригодиться для реальной работы. С целью
экономии вычислительных ресурсов такие знания целесообразно удалять
как устаревшие, что приводит к ограничению количества локальных областей, используемых для моделирования и управления.
Заключение
Результаты моделирования, изложенные в работе, показывают, что
предложенный метод реализации алгоритма адаптивного управления позволяет достаточно эффективно совмещать решение задачи идентификации и задачи управления объектом с неизвестной математической моделью в рамках единого процесса в реальном масштабе времени. Тем не
менее, использование описанной системы для управления реальными
объектами требует дальнейших исследований. В частности, представляет
интерес эффективность предложенного алгоритма для управления системами большой размерности, а также вопросы настройки параметров аппроксиматора в реальном масштабе времени и его качества. Также представляется интересным исследование возможностей описываемого алгоритма для управления динамическими системами.
Список литературы
1. Хайкин С. Нейронные сети: полный курс, 2-е изд., испр. / Пер. с
англ.–М.: ООО «И. Д. Вильямс», 2006. 1104 с.
2. Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы.
М.: Наука, Гл. ред. физ.-мат. лит., 1987. 600 с.
УДК 004.032.26(06) Нейронные сети
124
Related documents
Download