tsarkova

Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX Математическая модель искусственной нейронной сети для управления робототехническим комплексом в экстремальных условиях Е.Г. Царькова Федеральное казенное учреждение «Научно-исследовательский институт Федеральной службы исполнения наказаний», НИЦ-1, Москва Аннотация: В работе рассматривается математическая модель искусственной нейронной сети с запаздыванием в аргументах функций состояния и управления, предназначенной для управления робототехническим комплексом при проведении аварийно-спасательных операций в экстремальных условиях. Процесс обучения рассматриваемой искусственной нейронной сети описан задачей оптимального управления с запаздыванием. С использованием принципа максимума Понтрягина и метода быстрого автоматического дифференцирования разработан метод решения полученной задачи оптимального управления. Приведены результаты работы программного средства, при создании которого использован алгоритм построения приближенного оптимального управления рассматриваемой задачи. Ключевые слова: аварийно-спасательные работы, искусственная нейронная сеть, нейроуправление, робототехника, принцип максимума, безопасность. Сегодня успехи в развитии отечественной робототехники обеспечивают возможность использования робототехнических комплексов (РК) в проведении аварийно-спасательных работ и в пожаротушении. Разработка и внедрение в практическую деятельность спасательных служб автоматизированных комплексов, позволяющих снизить риск гибели людей при проведении спасательных мероприятий в экстремальных условиях является перспективным направлением современных научных исследований. Актуальность разработки таких систем, в том числе, продиктована растущим уровнем террористических угроз, реализация которых на крупных производственных, химически и радиационно опасных объектах может приводить к техногенных авариям и катастрофам с непредсказуемыми последствиями. В связи с этим целесообразна разработка моделей и алгоритмов управления робототехническими системами, предназначенными для использования спасательными службами при ликвидации чрезвычайных © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX ситуаций на важных объектах. К таким объектам могут быть отнесен ряд производственных и иных объектов уголовно-исполнительной системы Российской Федерации, характеризующихся большим скоплением людей и существованием высокого уровня криминогенных угроз. Для разработки применение роботизированных искусственных рассматривается роботизированным нейронных построение комплексов сетей (ИНС). нейросетевой спасательным эффективно В модели комплексом, работе управления предназначенным для проведения аварийно-спасательных работ в экстремальных условиях. За последние десятилетия искусственные нейронные сети активно внедряются в различные сферы деятельности человека [1, 2, 3, 4]. В области робототехники ИНС активно применяются при создании различных мобильных роботов и систем автопилотирования наземными и летательными аппаратами. Подобные технические комплексы находят широкие перспективы применения в разработке систем поддержки принятия решений при работе в экстремальных условиях [5]. При этом наиболее перспективными для применения в сложных технических системах являются динамические нейронные сети, обладающие способностью, в отличие от статических ИНС, адаптировать свою структуру и параметры к входным данным за счет повторяющегося процесса. Данное свойство ИНС обеспечивают преимущество их применения в сравнении со статическими моделями. Кроме того, в моделировании процессов, протекающих в сложных управляемых технических системах, необходим учет запаздываний. Запаздывания возникают при передаче сигналов от управляющих устройств к исполнительным механизмам. Данный факт приводит к необходимости рассмотрения ИНС с нетривиальной архитектурой. Согласно предлагаемому подходу для обучения таких нейронных сетей требуется осуществить поиск решения задачи оптимального управления (ЗОУ) с запаздыванием. Наиболее © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX полно на данный момент исследованы задачи с запаздываниями в функции состояния [6]. В исследовании рассматриваются запаздывания не только в функции состояния, но и в функции управления, используемой при построении нейросетевой модели управления робототехническим комплексом с обратной связью, что обеспечивает уточнение модели, а также служит разработке численного алгоритма построения оптимального управления системой. Указанные выше факторы обуславливают новизну, актуальность и практическую значимость исследования. Рассмотрим математическую модель ИНС, использующуюся для объезда препятствий при управлении передвижением РК, имеющего дифференциальный привод колес. Автоматическое расстояние до препятствия обеспечивает возможность установления соответствующей скорости и направления дальнейшего движения РК, при этом скорости левого и правого привода для передвижения комплекса в необходимом направлении зависит от входных параметров – расположения препятствий и коэффициента ускорения. Для описания соответствующей ИНС, содержащей N нейронов, используется нелинейная система дифференциальных уравнений (ДУ) второго порядка с запаздыванием [4]: N xi (t )   1  i xi 2 (t )   vi 2 xi (t )  ui (t )   wij (t )  x j (t  h j )  xi (t )  , i  1,..N , t  [0, T ] . (1) i 1 С учетом обозначений: xi (t )  yi (t ) , z j (t )  yi (t  h j ), i, j  1,..N , t [0, T ] , уравнение (1) перепишется в виде системы ДУ первого порядка следующего вида: xi (t )  yi (t ) , j  1, N , t [0, T ] , (2) N   yi (t )  vi 2 xi (t )   1  i xi 2 (t )   ui (t )   wij (t )  y j (t  h j )  y i (t )  .   j 1 Учитываются условия на состояния нейронов и величину внешних воздействий на управляемую систему на начальном отрезке времени: © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX (3) xi (0)  ai , xi (t )  i (t ), i  1, N , t  [ max{h j }, 0] , ui (t )   i (t ), i  1, N , t  [ max{h j }, 0] , где i (t ), i (t ) – заданные функции. Вводятся следующие ограничения на управляющие воздействия: (4) ui (t )  Bi , wij (t )  Cij . В введенных соотношениях xi (t ) определяет амплитуду колебаний i-го нейрона в момент времени t; y i (t ) выражает скорость изменения амплитуды колебаний i-го нейрона; N – общее число нейронов; T – заданное время протекания процесса;   0,  – коэффициенты, которые характеризуют общее воздействие на i-ый нейрон всего ансамбля нейронов. Так,  оказывает влияние на величину силы затухания колебания i-го нейрона; vi определяет собственную частоту колебания i-го нейрона. Вводятся весовые коэффициенты ансамбля нейронов wij (t ) , i, j  1, N , которые подбираются в зависимости от цели построения ИНС. В рассматриваемой задаче весовые коэффициенты играют роль функций управления. В рассмотрение введены функции управления ui (t ), i  1, N , характеризующие величину внешнего воздействия на ансамбль нейронов. В рассматриваемой модели учитываются запаздывания, возникающие при передаче сигнала от одного нейрона к другому. Целью управления введенной в рассмотрение ИНС является ее обучение. Для достижения данной цели необходимо построить процесс, при котором в конечный момент времени характеристики нейронов будут совпадать с заданными терминальными условиями, а также осуществить построение оптимального управления u (t ) ансамблем нейронов, обеспечивающего минимизацию целевого функционала. Рассматриваемая задача оптимального управления формализуется следующим образом. Требуется минимизировать функционал: © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX (5) T I (u )  M  f 0  t , x(t ), u (t ), w(t )  dt  M 3Ф( x(T ))  inf 0 при заданных ограничениях (2) – (4). Здесь константы M , M 3 играют роль весовых коэффициентов. Необходимо осуществить построение оптимального процесса, минимизирующего функционал (5) при заданных ограничениях N N N i 1 i , j 1 i 1 (2) – (4). Пусть f0  t , x(t ), u (t ), w(t )   M1  ui 2 (t )  M 2  wi 2 (t ), Ф( x(T ))    xi (T )  Ai  . 2 Целевой функционал принимает следующий вид: N N N   2 I (u )    M 1  ui 2 (t )  M 2  wi 2 (t )  dt  M 3   xi (T )  Ai   inf . i 1 i , j 1 i 1  0 T (6) Цель управления динамикой нейронной сети состоит в минимизации рассматриваемого функционала. В рассматриваемом функционале слагаемые при коэффициенте M 1 отвечают за величину энергии источника внешних управляющих воздействий, слагаемые при весовом коэффициенте M 2 выражают внутреннюю энергию сети, слагаемые с коэффициентом M 3 отвечают за конечное состояние системы. Для построения численного решения задачи обучения нейронной сети применим принцип максимума Понтрягина [7, 8]. Функция Понтрягина в рассматриваемой задаче имеет вид: N N N i 1 i , j 1 i 1 H  0 , x, y, z, p(t ), q(t ), u, w   0 M 1  ui 2 (t )  0 M 2  wi 2 (t )   pi (t )yi  N N  2     qi (t )    vi  xi   1  i xi 2   ui   wij  z j  y i   .   i 1 j 1  Здесь z j (t )  yi (t  h j ), i, j  1,..N , t [0, T ] , введенные функции p(t), q(t) являются сопряженными вектор-функциями. Построим сопряженную систему уравнений. Используем принцип максимума для задачи с запаздыванием в аргументе. В соответствии с особенностями задачи сопряженные вектор-функции будут удовлетворять © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX системе ДУ с опережающим аргументом. При этом условие максимума примет вид: N N   N 0  M 1  ui 2 (t )  M 2  wij 2 (t )    pi (t ) yi  i , j 1  i , j 1  i 1 N N      qi (t )  vi 2 xi   1  i xi 2   ui   wij  z j  y i      i 1 j 1  N N N N     pi (t ) y i   qi (t ) vi 2 x i   1   i xi 2   max uU  0 M 1  ui 2 (t )   qi (t )ui   i i , j 1 i 1 i 1     max wW Для построения  N N  2  0 M 2  wij (t )   i i 1  приближенного   q (t )w  z N j 1 i ij численного j   yi  .   решения используем дискретную аппроксимацию рассматриваемой задачи. Разбиваем интервал [0,T] равномерно на q слоев. Аппроксимируем интеграл по правилу левых прямоугольников, систему ДУ аппроксимируем по схеме Эйлера. В результате получаем следующую дискретную задачу оптимального управления: N N  2 2 I  u , w    M 1   u i   M 2   wij   t  M 2Ф( x q )  inf , i 1 i , j 1   (7) xi l 1  xi l  tyi l , i  1, N , l  1, q , (8)   N   2 2 l  yi l 1  yi l  t    vi l  xi l   1  i  xi l   ui l   wij l y j j  yi l  , j 1    xi 0  ai , yi l  i l , l [ max{v j },0] , ui l  Bi .  (9) (10) В соотношениях (7) - (10) индекс i  1, N означает номер координаты вектора, индекс l  1, q определяет номер нейронного слоя. Для решения дискретной задачи оптимального управления (ДЗОУ) используем метод быстрого автоматического дифференцирования (БАД) [9]. Для реализации реализующего метод градиентного спуска вычислительного алгоритма, построенного с учетом полученных соотношений и метода БАД, автором © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX разработано программное средство в среде IDE Lazarus. Схема алгоритма приведена на рис. 3. Рисунок 1 – Схема вычислительного алгоритма При заданных значениях штрафных коэффициентов M 1 , M 2 , M 3 и параметров задачи программой выполнено 13946 итераций. Полученные результаты приведены на рис. 1 – 3. Рис. 1. - Графики Рис. 2. – Графики Рис. 3. – Графики функций состояния управляющих значений весовых воздействий коэффициентов На рис. 1 приведены графики трех нейронов, участвующих в построении модели ( x0 (t ), x1 (t ), x2 (t ) ). Графики, представленные на рис. 2, отражают изменение функций управления u0 (t ), u1 (t ), u2 (t ) . На рис. 3 приведены графики © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX управлений wij (t ), i  0, 2, j  0, 2. Критерием останова в работе алгоритма служит достижение допустимой величины ошибки обучения ei  0, 08 либо выполнение максимально допустимого количества выполненных итераций Itmax  15000 . Ключевой особенностью разработанного алгоритма является возможность его применения для моделирования ИНС, динамика которых описывается системой ДУ с запаздываниями. Обозначим через X p , Yp координаты РТК, через VBR ,VBL линейные скорости, соответствующие левому и правому приводу, полученные с использованием обученной ИНС. Пусть далее L, обозначают ширину у угол поворота, выполняемого РТК, [ X 0 , Yo ] - координаты начального положения РТК. Тогда координаты РТК в каждый момент времени заданного временного интервала могут быть вычислены с учетом системы дифференциальных уравнений:  V  VBL  X p (t )   BR  sin   X 0 , 2    V  VBL Yp (t )   BR 2  (11)   cos   Y0 , t  [0, T ] .  Рассмотренная математическая модель ИНС может быть использована для решения прикладных задач робототехники, направленных на разработку технических средств для проведения аварийно-спасательных работ в экстремальных условиях. В силу гибкости, устойчивости и возможности адаптации к внешним условиям, ИНС позволяют решать задачи оптимизации управляемых систем в широком диапазоне параметров [10]. Литература © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX 1. Бахтинова Ч.О., Чунаева М.Э. Автоматизация системы контроля качества при организации строительства особо опасных и технически сложных объектов в России // Инженерный вестник Дона, 2022, № 3. URL: ivdon.ru/ru/magazine/archive/n3y2022/7511. 2. Душкин А.В., Цветков В.В. Вопросы моделирования состояний инженерно-технических средств охраны и надзора // Вестник Воронежского института ФСИН России, 2014, №3, с. 28-31. 3. Сумин В.И., Чураков Д.Ю., Царькова Е.Г. Разработка моделей и алгоритмов информационных структур и процессов объектов особой важности // Промышленные АСУ и контроллеры, 2019, № 4. С. 30-39. 4. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ. 2013. №5, с. 140-149. 5. Омельченко государственного В.В. Информационное управления обеспечение национальными системы ресурсами: риск- ориентированный подход // Правовая информатика, 2019, № 1. С. 4-17. 6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Technical Diagnostics of Equipment Using Data Mining Technologies // Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. Pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30. 7. Игнатьева О.В. Архитектурные приемы при разработке программного обеспечения, зависимого от интерфейса пользователя // Инженерный вестник Дона, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478. 8. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972. 55 с. © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX 9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. An improved method for predicting the evolution of the characteristic parameters of an information system // Journal of Physics: Conference Series, Vol. 973, № 1, 2018. P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf. 10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059. References 1. Bahtinova CH.O., CHunaeva M.E. Inzhenernyj vestnik Dona, 2022, №3. URL: ivdon.ru/ru/magazine/archive/n3y2022/7511. 2. Dushkin A.V., Cvetkov V.V. Vestnik Voronezhskogo instituta FSIN Rossii, 2014, №3, pp.28-31. 3. Sumin V.I., CHurakov D.YU., Car'kova E.G. Promyshlennye ASU i kontrollery, 2019, № 4. pp. 30-39. 4. Kayashev A. I., Rahman P. A., SHaripov M. I. Vestnik UGATU, 2013, №5, pp. 140-149. 5. Omel'chenko V.V. Pravovaya informatika, 2019, № 1. pp. 4-17. URL: ivdon.ru/uploads/article/pdf/IVD_86_Akolzin.pdf_2394.pdf. 6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30. 7. Ignat'eva O.V. Inzhenernyj vestnik Dona, 2022, №2. © Электронный научный журнал «Инженерный вестник Дона», 2007–2015 Инженерный вестник Дона, №1 (2015) ivdon.ru/ru/magazine/archive/n1y2015/XXXX URL: ivdon.ru/ru/magazine/archive/n2y2022/7478. 8. Ventcel' E.S. Issledovanie operacij [Operations research]. M.: Sovetskoe radio, 1972. 55 p. 9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. Journal of Physics: Conference Series. 2018, P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf. 10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059. © Электронный научный журнал «Инженерный вестник Дона», 2007–2015

tsarkova

Похожие документы

Разделы

Поддержка

tsarkova

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib