Нейросетевой подход к задачам идентификации источников

реклама
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
Д.А. ТАРХОВ, А.Г. РОМАНОВА
Санкт-Петербургский государственный политехнический университет
[email protected]
НЕЙРОСЕТЕВОЙ ПОДХОД К ЗАДАЧАМ
ИДЕНТИФИКАЦИИ ИСТОЧНИКОВ ЗАГРЯЗНЕНИЯ
ОКРУЖАЮЩЕЙ СРЕДЫ
В статье рассмотрены проблемы, возникающие на пути создания
иерархических интеллектуальных систем мониторинга и прогнозирования
состояния окружающей среды, которые предлагается создавать с
помощью нейросетевого моделирования. Данные системы позволят
минимизировать вредные воздействия техносферы на население и
природу, спрогнозировать возникновение чрезвычайных ситуаций и
принять меры по их предотвращению, смягчению последствий и их
ликвидации.
Ключевые слова: нейросетевое моделирование, мониторинг,
прогнозирование, окружающая среда, иерархические интеллектуальные
системы
***
Быстрый рост загрязнённости окружающей среды ставит острую
проблему сохранения экологических систем и здоровья человека. Важной
задачей науки в настоящее время является прогноз изменения экосистем
под влиянием естественных и антропогенных факторов. Назрела
необходимость создания иерархической системы экологического
мониторинга от локального уровня, отслеживающего загрязнения
атмосферы промышленными выбросами в масштабе предприятия
(района) до глобального – масштаба всей планеты. Такая система, в
частности, позволит фиксировать количество выбросов от предприятий и
идентифицировать наиболее загрязняющие из них, а также оценить
реальный вклад отдельных источников в загрязнение воздуха.
Отметим некоторые проблемы в применении классических подходов к
созданию соответствующих моделей. Локальный уровень поставленной
задачи
предполагает,
что
будет
рассматриваться
несколько
промышленных предприятий, выбрасывающих в атмосферу заданное
количество вредных аэрозолей в выбранном районе. Пусть в заданном
регионе G с полной границей S расположены n промышленных объектов,
УДК 004.032.26(08) Нейронные сети
149
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
ежесекундно выбрасывающих Qi аэрозолей, i  1, 2,..., n , состав которых
будем считать одинаковым. В области G выделим m экологических зон
Gk, k  1, 2, , m , для которых заданы предельно допустимые
концентрации выпавшего за интервал времени 0, Ò аэрозоля.
В результате традиционная математическая постановка задачи [1-3]
примет
вид
уравнения
диффузии
для
интенсивности
( x, y, z, t ) аэрозольной субстанции от n индустриальных объектов:
n

 
(1)
 div(u)    v     Qi i
t
z z
i 1


с граничными условиями:   f s на  ,
  на 0 ,
 0 на  H .
z
z
Здесь u – скорость воздушного потока;  – оператор Лапласа по
переменным ( x, y) ; для цилиндрической области G с полной границей
S    0  H , где боковая поверхность цилиндра  – граница
рассматриваемого региона, 0 – подстилающая поверхность,  H –
верхняя граница рассматриваемой области;  – коэффициент,
описывающий скорость распадения (поглощения) аэрозоля,  и v –
коэффициенты
горизонтальный
и
вертикальный
диффузии;
i ( x, y, z; xi , yi , zi ) – дельтаобразная функция, которая локализована в
малой окрестности i -ого предприятия (при вычислениях заменяется,
например, быстроубывающим гауссианом).
На решениях  задачи (1) строится функционал
T
Yk   dt  Pc dG ,
0
(2)
Gk
который характеризует санитарную дозу аэрозоля, выпавшего в области
экологической зоны Gk.
Особенность реальной постановки задачи, формализуемой уравнением
(1) и соответствующими граничными условиями, состоит в том, что
входящие в неё параметры не являются константами и известны с
некоторой погрешностью. Для многоуровневой системы такие параметры
(скорость воздушного потока, концентрация загрязнений на границе
региона f s и т.д.) часто определяются решением задачи на другом уровне
иерархии. Вычисления при большом числе наборов параметров требуют
нерационально больших затрат вычислительных ресурсов.
Кроме того, в реальных ситуациях трудно определить саму границу
150
УДК 004.032.26(08) Нейронные сети
НЕЙРОИНФОРМАТИКА-2013. Часть 3
ISBN 978-5-7262-1782-6
региона S и условия на ней. Обычно, вместо них, наряду с
дифференциальными уравнениями, бывает задана дополнительная
информация, например, в виде приближенно известных данных
наблюдений (измерений  с помощью датчиков, размещённых в
некотором наборе точек области G ). Предлагаемый нами подход [4,5]
позволяет объединить разнородную информацию о системе в
нейросетевой модели.
Данный подход может быть эффективно применён для решения
обратных задач и задач, поставленных некорректно или данных в
неклассической постановке. Подобные задачи возникают, например, в
случаях, когда определяющие моделируемую систему характеристики
известны не точно, необходимо исследовать поведение решения в
зависимости от некоторого параметра или идентифицировать значение
параметра по данным измерений. К таким задачам, в частности, относятся
задачи определения Qi по данным наблюдений.
Для решения подобных задач общий подход, изложенный в [4,5],
нуждается в следующей модификации.
Пусть в постановку задачи
p
(3)
A(u, r)  g (r), u  u (x, r), x (r)  R , B(u, r)
 f (r )
(r)
(здесь оператор A определяет уравнение, оператор B задает начальнокраевые условия) входят параметры r  (r1 ,..., rk ) , меняющиеся на
некоторых интервалах: ri  (ri  ; ri  ), i  1,..., k .
Ищем приближённое решение задачи (3) в виде выхода искусственной
нейронной сети заданной архитектуры
N
u(x, r)   ci hi (x, r, ai ) ,
(4)
i 1
веса которой – линейно входящие параметры ci и нелинейно входящие
параметры a i – определяются в процессе поэтапного обучения сети на
основе минимизации функционала ошибки вида
M
M
J (u )   A(u (x j , r j ))  g (x j , r j )    B(u (xj , rj ))  f (xj , rj ) .
j 1
2
2
(5)
j 1
УДК 004.032.26(08) Нейронные сети
151
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
Здесь {x j , rj }Mj1 – периодически перегенерируемые пробные точки в
k
области (rj )   (ri  ; ri  ) , {xj , rj }Mj 1 – пробные точки на её границе
i 1
(rj ) ;   0  штрафной параметр.
Предлагается строить иерархическую интеллектуальную систему
мониторинга и прогнозирования состояния окружающей среды на основе
постоянно подстраиваемых под новые данные нейросетевых моделей и
пересылки таких моделей от одного уровня иерархии к другому.
Иерархическая система мониторинга реализуется на нескольких
уровнях, каждому из которых соответствует свой набор математических
моделей, описывающих распространение загрязнений и другие важные
для рассматриваемых задач величины, например скорость ветра,
температуру воздуха и т.д. Данные модели обычно имеют вид или
уравнений в частных производных с граничными и начальными
условиями, или таблиц (баз данных) с результатами наблюдений
(измерения интересующих параметров).
В реальной ситуации, обычно имеется информация обеих типов,
причём часть её, например все или часть граничных и начальных условий
могут быть неизвестны. Как говорилось выше, на основе всей этой
информации можно построить параметризованную нейросетевую модель.
При классическом подходе для того, чтобы учесть воздействие от
соседних областей, а также от внешних условий, нужно пересылать
большой массив информации. При изменении каких-либо внешних
параметров, придется формировать другой информационный массив, и
так до бесконечности. Мы предлагаем пересылать от информационной
системы, соответствующей одной области в информационную систему,
соответствующую другой области или другому уровню иерархии вместо
большого массива чисел упомянутую выше готовую параметризованную
нейросетевую модель, в которой уже заложены зависимости от
возможного изменения внешних условий.
В качестве примера приведём нейросетевое решение задачи с
обращением времени. В данной задаче начальное распределение
концентрации вредного вещества в воздухе рабочей зоны в начальный
момент времени восстанавливается по его конечному распределению.
При этом конечная концентрация может отличаться от начальной на
несколько порядков. Как это обычно делается при построении и
исследовании математических моделей, переходим в уравнении и краевых
условиях к безразмерным величинам, рассматривая в качестве искомой
152
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
функции и её аргументов отношения соответствующих величин к
характерным для задачи константам.
Прямая
задача.
Ищется
функция
u( x, t ), x  [0;1], t  [0; T ] ,
ut  uxx ,( x; t )  (0;1)  (0; T ) ,
u( x;0)  ( x), x  (0;1), u (0; t )  0, t  [0; T ], u(1; t )  0, t  [0; T ].
Обратная задача. Ищется функция
u( x, t ), x  [0;1], t  [0; T ] ,
удовлетворяющая
условиям
ut  u xx ,
удовлетворяющая
условиям:
u( x; T )  f ( x), x  (0;1), u (0; t )  0, t  [0;T ], u(1; t )  0, t  [0; T ].
Функция φ( x)  u( x,0) в этой постановке задачи неизвестна и
подлежит нахождению.
Будем искать решение обратной задачи в виде нейросетевого
приближения
ne
u ( x, t )   ci e  ai ( x  xi )
2
bi ( x  xi )( t ti )  di ( t ti )2
.
(6)
i 1
Здесь веса (параметры) нейросети вводятся следующим образом
wi  (ci , ai , bi , di , xi , ti ), i  1,..., ne .
Подбор весов осуществлялся через минимизацию функционала
ошибки, который в данной задаче имел вид: J1 (w)  b J b (w)  d J d (w) , где
w  (w1 ,.., wne ) – вектор весов сети;
J1 (w)   ut ( j ,  j )  uxx ( j ,  j ) – слагаемое, отвечающее дифференN
2
j 1
циальному уравнению;
Nb
J b (w )   u 2 (0,  j )  u 2 (1,  j ) – слагаемое, отвечающее граничным
j 1
условиям;
Nd
J d (w )   u ( x j , T )  f ( x j )
2
– слагаемое, отвечающее значениям
j 1
температуры в конечный момент времени; b , d  0 – «штрафные»
множители.
УДК 004.032.26(08) Нейронные сети
153
ISBN 978-5-7262-1782-6
Здесь в слагаемых
перегенерируемые
 0,   , 1,  
j
j
Nb
j 1
НЕЙРОИНФОРМАТИКА-2013. Часть 3
J1 (w) и J b (w) используются периодически
пробные
точки
  ,  
j
j
N
–
j 1
в
области
,
– на частях границы.
Устойчивого приближения и без привлечения дополнительной
информации о решении в такой постановке получить не удаётся.
Приведём результаты двух способов привлечения подобной информации.
Первый способ состоит в замене нескольких слагаемых в J d (w )
слагаемыми, соответствующими начальному условию. Вычислительный
эксперимент показал, что достаточно использовать одно значение, т.е.
предполагается, что мы знаем начальное условие в одной точке.
Приведём некоторые результаты вычислений для случая N = 200, Nb =
=50, Nd = 50. Нейроны добавляются по одному с отбраковкой. Для
обучения сети (минимизации функционала) наиболее эффективным
оказалась комбинация метода облака и метода RProp [4,5].
Отбраковывается нейрон, приводящий к увеличению функционала
ошибки на тестовом множестве (множестве точек, полученных после
упомянутой выше перегенерации).
В первом эксперименте число попыток добавить нейрон 10, число
нейронов 11 (отбраковки нет).
и
и–f
1.0
0.8
0.08
0.06
0.6
0.04
0.4
0.02
0.2
0.2
0.2
0.4
0.6
0.8
1.0
x
Рис. 1. Восстановление начальных
условий
154
0.4
0.6
0.8
1.0
х
Рис. 2. Ошибка восстановления
начальных условий
УДК 004.032.26(08) Нейронные сети
u ( x, 0)  f ( x )
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
Рис. 3. Ошибка восстановления
решения
Во втором эксперименте число попыток добавить нейрон 20, число
нейронов 21 (отбраковки нет).
Рис. 4. Восстановление
начальных условий
Рис. 5. Ошибка восстановления
начальных условий u ( x, 0)  f ( x )
Рис. 6. Ошибка восстановления
решения
В третьем эксперименте число попыток добавить нейрон 50, число
нейронов 48 (отбраковано 3 нейрона).
УДК 004.032.26(08) Нейронные сети
155
ISBN 978-5-7262-1782-6
Рис. 7. Восстановление начальных
условий
НЕЙРОИНФОРМАТИКА-2013. Часть 3
Рис. 8. Ошибка восстановления
начальных условий u ( x, 0)  f ( x )
Рис. 9. Ошибка
восстановления
решения
Рис. 1-3 показывают, что уже сеть из 11 нейронов даёт приближённое
решение задачи с точностью, достаточной для большинства инженерных
приложений (обычно в подобных задачах точность модели в виде краевой
задачи не выше). Такую сеть можно использовать в качестве
аналитического приближённого решения. Если подобная точность
недостаточна, её можно легко повысить, что показывают рис. 4-9. В
приведенных численных экспериментах и далее использовался
эволюционный алгоритм настройки структуры растущей сети на основе
добавления нейронов по одному с дальнейшей отбраковкой этого
нейрона. Такой алгоритм позволяет добиться почти линейной
зависимости времени обучения сети от числа нейронов, что важно для
задач, в которых требуется получить высокую точность.
Второй способ состоит в использовании вместо известной точки,
соответствующей начальному времени, одной или нескольких случайных
156
УДК 004.032.26(08) Нейронные сети
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
точек внутри области. Данная постановка задачи формализует ситуацию,
когда проводятся измерения в промежуточные моменты времени.
Ниже использовались 5 таких точек, число попыток добавить нейрон
1559, число нейронов 51.
Рис. 10. Восстановление начальных
условий
Рис. 8. Ошибка восстановления
начальных условий u ( x, 0)  f ( x )
Рис. 12. Ошибка
восстановления решения
Результаты, опубликованные в работах [4-7] показывают, что
предложенный метод построения устойчивых нейросетевых моделей
весьма эффективен для задач с неточно заданными параметрами, с
обновляемой разнородной информацией об объекте или процессе, для
плохо поставленных или некорректных задач.
Именно такие задачи встречаются при мониторинге, анализе и
прогнозе атмосферных загрязнений, обеспечении экологической
безопасности и сбережения здоровья людей. Мы убеждены, что
нейросетевые технологии станут основой для построения иерархических
информационно-аналитических систем мониторинга и прогнозирования
состояния окружающей среды.
Список литературы
УДК 004.032.26(08) Нейронные сети
157
ISBN 978-5-7262-1782-6
НЕЙРОИНФОРМАТИКА-2013. Часть 3
1. Марчук Г.И. Математическое моделирование в проблеме
окружающей среды. М.: Наука, 1982.
2. Дымников В.П. (ред.) Современные проблемы вычислительной
математики и математического моделирования. М.: Наука, 2005.
3. Белов П.Н. Антропогенное загрязнение природной среды и оценка
его уровня методом математического моделирования// Вестн. Моск. ун-та.
Сер. 5, География. 1990. № 5. С.16–24.
4. Тархов Д.А. Нейронные сети: модели и алгоритмы. М.:
Радиотехника, 2005.
5. Васильев А.Н., Тархов Д.А. Нейросетевое моделирование.
Принципы. Алгоритмы. Приложения. СПб.: Изд-во СПбГПУ, 2009.
6. Васильев А.Н., Тархов Д.А. Нейросетевое решение задачи о
пористом катализаторе// Научно-технические ведомости СПбГПУ.
Физико-математические науки, 2008. №6 (67). С.110-113.
7. Васильев А.Н., Тархов Д.А. Параметрические нейросетевые модели
для уравнения теплопроводности. Классическая и неклассическая задачи.
Материалы IX Международной конференции по неравновесным
процессам в соплах и струях (NPNJ'2012), 25-31 мая 2012 г., Алушта. М.:
Изд-во МАИ-ПРИНТ, 2012.
158
УДК 004.032.26(08) Нейронные сети
Скачать