Технология нейросетевого моделирования коррозионных

advertisement
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
С.А. ГОРБАТКОВ, Г.А. БЕСХЛЕБНОВА
Уфимский филиал всероссийского заочного финансово-экономического института
mailto: gorbatkov.ufa@vzfei.ru
ТЕХНОЛОГИЯ НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ
КОРРОЗИОННЫХ ПРОЦЕССОВ МАГИСТРАЛЬНЫХ
ТРУБОПРОВОДОВ
Аннотация
Предложена технология нейросетевого моделирования процессов
коррозии участков магистральных нефтепроводов. Полученные
результаты позволяют с достаточной точностью прогнозировать глубину
коррозионных дефектов в зависимости от глубины залегания трубы,
характеристик грунта, марки стали и других факторов.
Постановка задачи
Вследствие старения трубопроводов и ускорения процессов коррозии
металла труб надежная эксплуатация нефтяных трубопроводов весьма
проблематична. Огромный объем предстоящих ремонтных работ не
позволяет провести быструю замену всех труб, имеющих коррозионные
повреждения. Актуальность настоящего исследования связана с тем, что
критическое положение трубопроводной системы России, сложившееся за
последнее время, ставит задачу в кратчайшие сроки на основе имеющихся
баз данных по измерению глубины коррозии определить остаточный
ресурс трубопроводов. Кроме того, требуется найти научно-техническое
решение по выбору оптимальных технологий ремонтных работ в
различных природно-климатических условиях. В настоящем сообщении
разрабатывается методология построения нейросетевой модели (НСМ)
коррозиционных процессов магистральных трубопроводов, а именно
разработаны алгоритмы предобработки и пост-обработки данных,
окончательная модель формируется на основе метода «комитета
нейроэкспертов». Такая методология
необходима, так как из-за
сложности задачи непосредственное применение стандартных пакетов
нейропрограмм не обеспечивает приемлемую надежность оценки
коррозиционных процессов. Рассмотрим математическую постановку
задачи.
Имеется
многомерная
статистическая
выборка
экспериментальных
наблюдений
нескольких
переменных,
характеризующих коррозионное повреждение поверхности трубы (рис. 1).
УДК 004.032.26(06) Нейронные сети
155
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
Рис. 1. Схема катодной защиты трубопровода от коррозии: 1 – изоляция; 2 –
стенка трубы; 3 – коррозионное разрушение; 4 – катодная станция; 5 –
распределенные аноды; δ – глубина дефекта коррозии, H – толщина стенки трубы
Требуется выявить зависимость глубины коррозии от следующих
факторов: глубины залегания трубы до верхней образующей; диаметра
трубы; марки стали; типа грунта на уровне трубы; длительности
эксплуатации; удельного электрического сопротивления грунта; разности
потенциалов распределенной по трубе катодной защиты, расчетной
скорости образования дефекта. В качестве зависимой переменной Y
разрабатываемой модели
используется относительная
глубина
коррозионного дефекта, определяемая по формуле: Y   / H , где δ –
глубина дефекта коррозии, H – толщина стенки трубы. Задавая
конкретные значения независимых переменных, можно оценить величину
коррозионного разрушения δ, что и является конечной целью построения
нейросетевой модели.
Отметим специфические особенности исследуемой задачи. 1) Большая
размерность вектора независимых переменных. Вычислительные
эксперименты показывают, что применение методов регрессионного
анализа для построения нелинейной динамической модели в таких
условиях малоперспективно. 2) Среди компонент вектора входных
переменных имеются качественные переменные: тип грунта на уровне
трубы (9 градаций: глины, супеси и т.п.) и марка стали, из которой
изготовлена труба (более 20 градаций). Учет качественных переменных
производился с помощью кластеризации экспериментальных данных для
фиксированного участка трассы нефтепровода. 3) В выборке
экспериментальных данных мало временных отсчетов, и к тому же они
расположены в области эксперимента неравномерно. 4) Требуется
УДК 004.032.26(06) Нейронные сети
156
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
высокая (около 2 %) точность прогноза при зашумленности данных.
Измерение глубины и площади коррозионного дефекта производилось
двумя способами: с помощью прибора Ultroscan и методами
дополнительного дефектоскопического контроля (ДДК). Иногда
результаты измерений глубины и площади коррозионного разрушения в
одной и той же точке участка поверхности трубы этими двумя методами
отличаются в два раза; в среднем значения глубины дефекта, полученные
двумя способами, отличаются на 14 %.
Методика построения НСМ
При разработке методики построения НСМ применялась
программа NeuroSolutions – 4.32. Для построения НСМ был сформирован
кластер по двум качественным переменным (тип грунта-супеси, марка
стали 17Г1С). Нейронная сеть представляла собой многослойный
персептрон. Нейросеть содержала 6 входных нейронов, один выходной,
число скрытых слоев варьировалось от 1 до 3, активационная функция
нейронов скрытого слоя – гиперболический тангенс либо сигмоидная
функция, нейрон выходного слоя имел линейную активационную
функцию. Оптимальное число нейронов в скрытом слое подбиралось
варьированием параметров обучения с использованием критерия
минимума среднеквадратической ошибки. Параметры обучения
подбирались по умолчанию в соответствии с настройками программы
NeuroSolutions – 4.32. Для обучения нейросети выделено 225 примеров,
которые были распределены в случайном порядке. В тестирующую
выборку и выборку перекрестного подтверждения было помещено по 38
примеров.
На этапе управления настройкой нейросети было задано число
прогонов при настройке – 1000, обновление весов осуществлялось после
прохождения обучающей выборки через сеть.
Была разработана
специальная итерационная процедура [1] повышения однородности
данных в сформированном кластере, что позволяет существенно повысить
точность модели. Такая итерационная процедура состояла в следующем.
На первом этапе с использованием программы NeuroSolutions – 4.32
строилась нейросетевая субмодель. Для каждой точки сформированного
кластера производились выявление и отбраковка «аномальных» точек, т.е.
осуществляется сглаживание данных. «Аномальные» точки выявлялись
по критерию точности. Для каждой точки (Xi1, Xi2, …, Xip, Yi)
сформированного кластера вычислялась относительная ошибка  i
УДК 004.032.26(06) Нейронные сети
157
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
расчетного значения выходной переменой Y:
 i( s ) 
( yi  yˆ i )
 100%, i  1,2,..., n;
yi
(1)
s – номер итерации. Точка считается «аномальной», если выполнено
(s)
неравенство i  ( s ) , где (s) – экспертно задаваемое число на
каждом s – ом шаге итерационного процесса.
«Аномальные» точки исключались из дальнейшего обучения и
тестирования, в результате чего выборка кластера становится более
однородной. На редуцированной выборке строилась новая нейросетевая
субмодель, для которой процедура выявления и устранения «аномальных»
точек повторялась. Итерационная процедура сглаживания данных в
кластере останавливается при выполнении одного из следующих условий:
Рис. 2. Изменение нормированной среднеквадратической ошибки SN на
обучающей выборке в зависимости от номера итерации s: –––– линия SN(s),
- - - - - - S N 0 – линия приемлемого уровня по условиям качества модели ошибки
типа NMSE
УДК 004.032.26(06) Нейронные сети
158
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
1. Начинает проявляться эффект дефицита наблюдений в
сформированном кластере, и соответственно начинает расти ошибка  i
по (1).
2. Достигается минимум величины SN по (2), выбранной в качестве
числовой меры точности модели, или ее приемлемый уровень .
Нейросетевая модель, полученная на последнем этапе итерационного
процесса, и есть искомая НСМ. В качестве числовой меры точности
модели выбрана нормированная среднеквадратическая ошибка SN,
определяемая по формуле
 n
  ( y i  yˆ i ) 2

S N   i 1
(n  1)






 /( y max  y min ),



(2)
где
y i , ŷ i – наблюдаемое и расчетное значения величины Y;
( ymax  ymin ) – размах наблюдения величины Y; n – число точек в
сформированном кластере, i – номер точки в кластере. Из рис. 2 ясно, что
минимум величины SN при выполнении итерационной процедуры не
достигается. Причиной этого является отсутствие дефицита точек в
кластере при выбрасывании «аномальных» точек, который мог бы
увеличить параметр SN. Итерационный процесс прерван на шестой
итерации, поскольку получен приемлемый уровень величины SN,
составляющий 0,0017.
Для проверки адекватности НСМ был разработан метод
модифицированного обобщенного – перекрестного подтверждения.
Предлагается строить не одну, а несколько независимых (параллельных)
НСМ (порядка 10), отличающихся друг от друга: 1) архитектурой
нейросети; 2) видами активационных функций, причем используется одно
и то же обучающее и тестовое множество для всего семейства моделей.
Для каждой нейросетевой модели строится однопараметрическое


семейство
динамических кривых вида y (t , x j , x k , W ) , где y –
расчетное значение глубины коррозионного дефекта, независимая
переменная x j варьируется как параметр семейства (пучка) кривых;
x k , k  j , (k  1,2,..., n  1) – зафиксированные входные факторы; t –
длительность эксплуатации участка трубопровода, W – параметр
УДК 004.032.26(06) Нейронные сети
159
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
нейросетевой модели (матрица «синаптических весов»). Анализ
динамических кривых (рис. 3) выявил следующее:
1. Все «пучки» динамических кривых yˆ ( x j , t ) , xj = var, хорошо
согласуется с физическими представлениями в данной предметной
области. По оси времени на этих кривых можно выделить условно три
характерных участка: 1) начальный; 2) линейного роста глубины
коррозии; 3) насыщения.
Рис. 3. Обобщенное – перекрестное подтверждение нейросетевого моделирования.
Y – относительная глубина коррозионного дефекта, t – длительность эксплуатации
участка трубопровода, измеряемая в месяцах
2. Одинаковый качественный характер динамических «пучков»
кривых при вариации параметра пучка Xj говорит о том, что эти кривые
отражают скрытую электрохимическую закономерность, т.е. временной
тренд процесса. Плавный характер пучков динамических кривых в виде
непрерывных функций; имеющих первые и вторые производные, а также
плотное расположение кривых в «пучках», создают хорошие предпосылки
для аналитической аппроксимации этих прямых средствами Excel. Пусть
УДК 004.032.26(06) Нейронные сети
160
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
для части m  Q НСМ в процедуре обобщенного – перекрестного
подтверждения достигнуто условие равномерности погрешностей расчета
с требуемой точностью по чебышевскому критерию:
  max max
q
i
y i  yˆ iq
100 %   ; i  1, Ntest ; q  1, m ,  iq   ;
yi
i  1, Ntest ; q  1, (Q  m) ,
(3)
где i – номер точки тестовой выборки; q – номер НСМ в рассматриваемой
процедуре;  — экспертно зависимая точность; y i – фактически
наблюдаемое значение величины y (глубины коррозии); ŷ iq – расчетное
значение величины y по нейросетевой модели с номером q; N test – число
элементов тестового множества, Q – общее количество независимых
нейросетевых моделей в процедуре обобщенного – перекрестного
подтверждения. Данный критерий имеет смысл ограничения на максимум
относительной погрешности, найденной по всем точкам тестового
множества для всех построенных нейросетевых моделей.
Условие адекватности нейросетевой модели с заданной доверительной
вероятностью P* предлагается оценивать по формуле:
P  m / Q  P *,
,(4)
где P – заданный уровень доверительной вероятности; m – число
независимых НСМ, для которых выполнено условие близости результатов
по чебышевскому критерию равномерного приближения. Проведем
анализ кривых, представленных на рисунке 3, на предмет оценки их
адекватности. Для значений времени от 190 до 250 месяцев имеется
разделение «пучка» кривых на две части. Значительное расхождение
кривых на этом участке оси времени t (меньше 200) объясняется малым
числом экспериментальных наблюдений в этой зоне. Очевидно, что
вероятность обобщенного – перекрестного подтверждения будет
различной для разных временных срезов t  t k . Значение вероятности P
по (4) для tk = 216 равняется 66 %; для tk = 392 равняется 80 %. Значение
указанной вероятности P увеличивается с возрастанием t, что особенно
актуально для решения задачи прогнозирования, ибо важна достаточная
точность модели в конце временного ряда для хорошего прогноза. В
нашем случае точка tk = 392 расположена в предпрогнозной области.
Точка прогноза tk = 408 месяцев. Максимальное отклонение величины Y
*
УДК 004.032.26(06) Нейронные сети
161
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
по различным моделям в точке прогноза 0,11. Доверительная вероятность
прогноза составляет 90 %. Видно, что согласно идее модифицированного
метода обобщенно-перекрестного подтверждения независимые нейросети
хорошо «подтвердили» друг друга в смысле примерно совпадающих
аппроксимирующих функций в пучке.
Итоговая НСМ
Относительная глубина дефекта, y
Вследствие случайности в выборе начальных значений синаптических
весов предсказания нейросетей, обученных на одной и той же выборке,
будут, вообще говоря, разниться (отражая условия неопределенности
задачи). Этот недостаток можно превратить в достоинство, организовав
«комитет нейроэкспертов», состоящий из различных нейросетей [2].
Можно показать, что средние значения расчетов комитета нейросетевых
экспертов должны давать лучшие предсказания, чем любой отдельный
эксперт (нейросеть) из множества обобщенно перекрестного
подтверждения. В качестве прогнозной модели предлагается использовать
нейросетевую
модель,
полученную
в
результате
простого
арифметического среднего нейросетей из семейства обобщенного –
перекрестного нейросетевого подтверждения (рис. 4).
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
100
200
300
400
500
Длительность эксплуатации, t (месяцы)
Рис. 4. Прогнозная нейросетевая модель глубины коррозии
УДК 004.032.26(06) Нейронные сети
162
ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 2
Таким образом, с помощью предложенного алгоритма нейросетевого
моделирования возможно получение прогнозных оценок глубины
коррозии и составление в дальнейшем на их основе плана вывода в
ремонт участков трубопроводов.
Список литературы
1. Бублик Н.Д., Голичев И.И., Горбатков С.А., Смирнов А.В. Теоретические основы
разработки технологии налогового контроля и управления. – Уфа: РИО БашГУ, 2004. –
336 с.
2. Ежов А.А., Шумский А.А. Нейрокомпьютинг и его применения в экономике и бизнесе
(серия «Учебники экономико-аналитического института МИФИ» под ред. проф. В.В.
Харитонова). – М.: МИФИ, 1998. – 224 с.
УДК 004.032.26(06) Нейронные сети
163
Download