Нейросетевая модель выявления и распознавания

advertisement
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
А.М. ВУЛЬФИН, В.М. ГИНИЯТУЛЛИН, А.И. ФРИД
Уфимский государственный авиационный технический университет
Уфимский государственный нефтяной технический университет
vulfin.alexey@gmail.com
НЕЙРОСЕТЕВАЯ МОДЕЛЬ ВЫЯВЛЕНИЯ
И РАСПОЗНАВАНИЯ ТЕХНОЛОГИЧЕСКИХ СИТУАЦИЙ
В РАМКАХ МЕТОДОЛОГИИ DATA MINING
В работе рассматривается задача выявления и распознавания технологических событий и состояний объекта приема-сдачи нефти на основе
анализа временных рядов, характеризующих протекающие на объекте
процессы. Поэтапно решаются задачи предобработки исходных данных,
сегментации ряда, кластеризации и классификации имеющихся данных и
построения нейросетевого комитета для диагностики состояния объекта в
рамках методологии Data Mining.
Введение
Низкое качество (недостоверность) накапливаемых данных реального
времени (РВ), вводимых вручную или автоматически собираемых на промыслах, не позволяет непосредственно использовать их для контроля состояния и прогнозирования хода технологических процессов. Для решения этих задач необходимо использовать модели объектов технологического комплекса нефтегазодобычи (ТКН) и специализированные модели
данных, характеризующих их состояние. Объекты приема-сдачи нефти
(ПСН) обеспечивают выполнение операций приема-сдачи подготовленной
нефти. Качество контроля состояния технологического комплекса ПСН
непосредственно сказывается на качестве выполнения операций приема и
сдачи нефти [1-4].
Целью работы является разработка модели распознавания ситуаций,
возникающих на объектах ПСН, на основе анализа временных рядов, характеризующих технологический процесс, и ее реализация в нейросетевом базисе в рамках методологии Data Mining.
Описание предметной области
Основным аналитическим средством контроля и диагностики состояния инженерной сети является сведение балансов многокомпонентных
УДК 004.032.26(06) Нейронные сети
132
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
потоков по отдельным узлам и участкам сети на основе анализа выборок
параметров состояния путем проверки условия баланса.
Для применения современных методов диагностики [2, 3] к реальной
инженерной сети требуется адаптировать эти методы к реальным условиям:
 отфильтровать и верифицировать исходные данные;
 набрать статистику изменений параметров в отдельных узлах сети;
 зафиксировать прецеденты нарушений баланса потоков в этих узлах;
 разработать диагностические правила для распознавания различных ситуаций нарушения баланса в узлах инженерной сети [3, 4].
Особенности временных рядов,
описывающих технологические процессы
Нестационарные процессы и, соответственно, нестационарные временные ряды, описывающие их, наблюдаются, например, при переменных
условиях работы аппаратуры, когда параметры среды резко меняются,
или в случаях длительного времени работы аппаратуры, когда характеристики системы меняются, и один и тот же вход вызывает различные реакции системы. Для упрощения анализа нестационарные физические процессы произвольно полагаются стационарными на всем интервале анализа
или на отдельных участках течения такого процесса. Для анализа таких
процессов приходится разрабатывать специальные методы, применимые
только к некоторым типам таких процессов [5].
Концепция нейросетевой модели выявления и распознавания
технологических ситуаций в рамках методологии Data Mining
При исследовании временных рядов, описывающих технологические
объекты, с целью автоматизации процесса выявления событий и состояний
таких объектов, сигнал искажается влиянием самых разнообразных шумов.
К таким сигналам возможно применение технологии Data Mining [6]. Исследование сигналов методом Data Minig проводится в несколько этапов.
Использование методов выделения особенностей сигналов на основании применения методов сегментации и последующая унификация сегментов являются ключевым этапом. После получения подготовленного
материала необходимо его систематизировать с выделением классов, которые соответствуют основным группам событий.
УДК 004.032.26(06) Нейронные сети
133
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Поскольку для сегментов не существует априори заданных классов, то
к ним требуется применить методику кластеризации. Сопоставление событий кластерам сегментов происходит в хронологическом порядке, основываясь на гипотезе, что в один момент времени происходит одно событие [7].
Заключительным этапом является построение и обучение нейронной
сети, способной в реальном времени обрабатывать данные технологического временного ряда и классифицировать события и состояния узла
ПСН, и последующее тестирование и оценка работоспособности такой
модели.
Предобработка исходных данных. Цель предобработки – подавить
посторонние шумы:
 устранение основного тренда и переход к несмещенному представлению ряда;
 нормализация исходных данных;
 проведение кратномасштабного вейвлет-анализа.
Так как вейвлет-коэффициенты чувствительны к шуму, необходимо
выполнить усечение вейвлет-коэффициентов, используя для этого,
например, методы SureShrink или VisuShrink [8].
Выделения особенностей сигналов на основании применения методов сегментации. Исходя из описанной концепции Data Mining, определенную сложность представляет этап сегментации исходного сигнала.
Согласно работе [9], задача сегментации сводится к построению детектора, который по данной реализации сигнала f(t) устанавливает истинность
одной из вероятностных гипотез.
Для решения задачи сегментации и оценки качества такого разбиения
временного ряда на участки использовались следующие подходы:
 адаптивная авторегрессионная (АР) модель [9];
 методы оценки регулярности сигнала на основе многоуровневых
контуров [10-14].
При возникновении «быстрых» изменений в сигнале происходит излишняя сегментация по методу адаптации АР-модели. Алгоритм, основанный на применении оценки показателя регулярности сигнала с помощью
вейвлет-анализа, адекватно реагирует на «быстрые» изменения, но не распознает более долговременных изменений. Совместное применение рассмотренных методов позволяет создавать эффективные системы сегментации временного ряда, описывающего технологические процессы на узле
ПСН. В работе [13] приведены качественные показатели работы рассматриваемых методов для сегментации временных рядов различной природы.
УДК 004.032.26(06) Нейронные сети
134
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Классификация событий и кластеризация сегментов. Следующим
этапом обработки временного ряда является этап унификации разнородных по длине сегментов и последующая их кластеризация. Длина сегментов усредняется по критериям значимости границы. Таким образом, полученные наборы сегментов, описывающих те или иные технологические
события, необходимо подвергнуть процедуре кластеризации.
Существует внушительное количество алгоритмов кластеризации, с
присущими им достоинствами и недостатками [6, 15]. В данной работе
используются три метода кластеризации для сравнения эффективности по
критериям производительности и характеристикам полученных кластеров:
 самоорганизующиеся карты Кохонена [16, 17];
 алгоритмы Fuzzy c-means и Гюстафсона-Кесселя [6];
 алгоритмы таксономии в λ-пространстве [15].
Классификация событий технологической легенды. По имеющейся
легенде, описывающей совокупность технологических событий, происходящих на узле ПСН, можно выделить следующие группы:
 сервисные события, связанные с регламентированным воздействием на систему регистрации (пропуски данных);
 внешние события на линиях узлов-доноров;
 внутренние события на узле ПСН.
Нейросетевой классификатор событий временного ряда. Заключительным этапом создания системы выявления и распознавания технологических ситуаций является создание и обучение комитета нейронных сетей, способного обрабатывать данные технологического временного ряда
и классифицировать события и состояния узла ПСН.
Архитектура нейросетевого комитета. Комитет нейронных сетей,
каждая из которых представляет собой многослойный персептрон (МП),
обучается на множестве доступных данных с целью классификации технологических событий, выявляемых путем анализа временного ряда, по
заданным классам.
Каждый МП содержит K нейронов во входном слое и M в скрытом.
Функции активации нейронов скрытого слоя – гиперболический тангенс.
Выход сети образует L (по количеству выделенных классов событий)
нейронов с линейной функцией активации [19]. Выходы сети нормируются в диапазоне [-1;1], окончательная гипотеза формируется голосованием
трех комитетов [18].
Формирование множества примеров для обучения. Генеральная совокупность обучающих примеров представляет собой множество пар {xi,
УДК 004.032.26(06) Нейронные сети
135
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
yi}, где хi – вектор, принадлежащий i-му помеченному кластеру этапа сегментации, а yi – бинарный вектор, определяющий принадлежность к типу
события, соответствующего i-му кластеру.
В традиционном варианте весь набор доступных данных разбивается
на две выборки – обучающую и тестовую. Обучающая выборка используется для определения параметров классифицирующей системы, тестовые
примеры служат для оценки точности полученной классификации. В качестве меры ошибки использовалось стандартное значение SSE (Sum of
Squares Error). Для каждого МП, согласно алгоритму BOOST1 [18], осуществляется разбиение генеральной выборки на обучающее подмножество по описанной схеме.
Оценка работоспособности нейросетевой системы выявления и
идентификации технологических событий. Ниже представлена обобщенная схема работы системы выявления и идентификации событий
(рис. 1).
Рис. 1. Обобщенная схема работы системы выявления и
идентификации событий
Реальная задача. Для анализа были использованы данные об изменении параметров узла учета нефти СИКН (система измерения и контроля
качества нефти) [1] за период продолжительностью в 9 дней. На узле
СИКН каждые 5 секунд замеряется давление на выходе узла и расход
нефти по 5 измерительным линиям. На рис. 2 дано графическое представление исходных данных – зависимости давления и суммарного расхода –
от времени за один из дней. Кроме того, выведены значения признаков
состояния насосных агрегатов семи узлов-доноров.
Для дальнейшего анализа использован временной ряд, описывающий
давление на выходе узла. Общая длина ряда составляет 155520 отсчетов.
УДК 004.032.26(06) Нейронные сети
136
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
На этапе предобработки исходный временной ряд был очищен от шумов и подвергнут сегментации по методам АР и оценки регулярности
сигнала на основе многоуровневых контуров. В результате выделено 358
сегментов переменной длины.
Рис. 2. Параметров узла учета нефти СИКН за суточный период
Сравнение методов кластеризации применительно к задаче выявления технологических событий. Для осуществления этапа кластеризации длина сегментов была усреднена по критерию значимости границы.
Результаты кластеризации с помощью описанных методов приведены в
табл. 1.
Для алгоритма λ-KRAB-2 исходное количество сегментов усечено до
50% с целью обеспечения приемлемого времени работы алгоритма в текущей реализации.
Таблица 1
Результаты кластеризации
Метод
кластеризации
Число
кластеров
Коэффициент множественной
детерминации R2
УДК 004.032.26(06) Нейронные сети
137
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Fuzzy c-means
19
0.65
Гюстафсона18
0.72
Кесселя
SOM Кохонена
15
0.79
λ-KRAB-2*
10
0.82
Как видно из таблицы, количества выделенных кластеров и коэффициенты множественной детерминации для разных методов достаточно близки. Оперирование картами Кохонена потребовало привлечения ряда априорных и эмпирических фактов, как-то: экспертная оценка количества
классов событий, эмпирическая оценка длительности события.
Построение и обучение нейросетевого классификатора событий.
На предыдущем этапе было выделено 15 кластеров по 21 сегменту в каждом (остальные были отброшены по критерию значимости). Унифицированная длина такого сегмента составляет 1024 отсчета. Для построения
нейросетевой модели узла ПСН и выявления технологических ситуаций
необходимо выделить факторы в описании сегментов, наилучшим образом характеризующие искомое технологическое явление. При этом необходимо уменьшить число таких факторов (без существенного ухудшения
точности моделирования), так как это приводит к снижению чувствительности модели к шуму. С этой целью выполнены следующие шаги:
 выбран предельный масштаб истории ряда;
 для унифицированного сегмента длиною 1024 проведен кратномасштабный вейвлет-анализ, осуществлено дискретное вейвлетпреобразование на масштабах, кратных степени двойки;
 выделены 64 наиболее значимые компоненты вектора вейвлеткоэффициентов.
Архитектура нейронных сетей, входящих в состав комитета, приведена
в табл. 2.
Таблица 2
Архитектура нейронных сетей
Количество
нейронов
Функция
активации
Входной слой
64
Скрытый слой
15
гиперболический
тангенс
УДК 004.032.26(06) Нейронные сети
Выходной слой
15
линейная
138
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Чтобы обосновать применение комитета нейронных сетей, на сформированной выборке обучающих примеров был обучен одиночный МП с
аналогичными параметрами.
Результаты обучения представлены в табл. 3.
УДК 004.032.26(06) Нейронные сети
139
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
Таблица 3
Результаты обучения сетей
Комитет
Одиночный
МП
SSE на тестовом
множестве,
% успешной
классификации,
R2
0.2129
78.7
0.75
0.2615
73.9
0.71
SSE на контрольном
множестве,
% успешной
классификации,
R2
0.3812
61.9
0.59
0.4214
57.9
0.51
Как видно из таблицы, даже простейшая структура комитета нейронных сетей дает определенное преимущество перед отдельным МП.
Выводы и направления дальнейших исследований
В ходе выполнения работы построена нейросетевая модель выявления
технологических событий в рамках методологии Data Mining, позволяющая осуществлять анализ технологических временных рядов с целью диагностики состояния узла ПСН.
В работе описано применение комплекса методов Data Mining,
нейросетевых и нечетких технологий кластеризации и классификации,
методов сегментации и вейвлет-анализа, совместное применение которых
позволяет добиться распознавания более чем 75% известных ситуаций на
объекте ПСН и более 60% ситуаций за контрольный период, содержащий
смесь известных и незнакомых системе событий.
Совместное применение хорошо зарекомендовавших себя практических методов анализа данных из различных предметных областей (нефтепереработка, сейсмология, эконометрика и т.п.), объединенных в рамках
выбранной методологии Data Mining, позволяет преодолеть ограничения
использования отдельных методов [5, 10].
Тестирование разработанной системы на примере решения реальной
задачи распознавания ситуаций на узле ПСН [3] показало эффективность
УДК 004.032.26(06) Нейронные сети
140
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
данного подхода применительно к задачам АТП по сравнению, например,
с [1, 19], так как разработанная система позволяет:
 расширить количество классов выявляемых событий;
 преодолеть ограничение принятия гипотезы (условной) стационарности процесса;
 получить количественное описание и характеристики технологических событий.
Направления дальнейших исследований:
 проанализировать необходимость применения эффективных систем
фильтрации сигнала на этапе предобработки и выбрать тип фильтра;
 использовать более совершенные алгоритмы, в частности, для построения комитетов НС (AdaBoost и т.п. [18]);
 исследовать эффективность комитета НС гомогенной и гетерогенной архитектуры;
 перейти к нечеткой системе сигнализации на выходе комплекса.
Список литературы
1. Гиниятуллин В.М., Сибагатуллин Н. М., Зозуля Ю.И. Разработка
программного модуля диагностики состояния инженерной сети нефтегазодобычи. // Автоматизация телемеханизация и связь в нефтяной промышленности – 2003. – №11. – С. 31-35.
2. Зозуля Ю.И. Интеллектуальные нейросистемы. М.: Радиотехника –
2003. 144 с.
3. Зозуля Ю.И., Назипов Д.Ф., Ахметзянов Р.Р. Нейросетевые технологии в решении задач анализа и диагностики состояния инженерных сетей // Автоматизация, телемеханизация и связь в нефтяной промышленности. – 2007. – №4. – С. 25-30.
4. Зозуля Ю.И. Анализ баланса потоков жидкости в узлах инженерной
сети на основе ее нейросетевой модели. // VI Всероссийская конференция
«Нейрокомпьютеры и их применение»: сб. докл. М., 2000. С. 53 – 55.
5. Бендат Д., Пирсол .А. Измерение и анализ случайных процессов /
Пер. с англ. Г.В. Матушевского, В.Е. Привальского; Под ред. И.Н. Коваленко. – М.: Мир, 1971. – С. 311-357.
6. Барсегян А.А., Куприянов М.С., Степаненко В.В. Методы и модели
анализа данных: OLAP и Data Mining. СПб.: БХВ-Петербург, 2004. 336 с
7. Тристанов А.Б., Геппенер В.В., Фирстов П.П. Применение методов
сегментации к обработке геофизических данных. Санкт-Петербургский
государственный электротехнический университет, г. Санкт-Петербург,
УДК 004.032.26(06) Нейронные сети
141
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 1
2007. http://www.emsd.iks.ru/konf060117lib/pdf/25_geppener_tristanov.pdf
8. Donoho D.L., Johnstone I.M., Kerkyacharian G., Picard D. Wavelet
shrinkage: asymptopia? (with discussion) //J. R. Statist. Soc. – 1995. – Ser. B,
57, N 2. – P. 301 – 369.
9. Любушин А.А. (мл.) Геофизический мониторинг: шумы, сигналы,
предвестники // Проблемы геофизики XX века. М.: Наука, 2003. С. 70-94.
10. Бассвиль М., Вилски А., Банвенист А. и др. Обнаружение изменений свойств сигналов и динамических систем. М.: Мир, 1989. 278 с.
11. Тристанов А.Б., Руленко О.П., Фирстов П.П. Некоторые особенности сейсмического шума в скважине НИС-1 в июле-августе 2003 года //
Материалы конференции, посвященной дню вулканолога. ПетропавловскКамчатский, 2004. С. 82-89.
12. Mallat S., Hwang W.L. Singularity detection and processing with wavelets //IEEE Trans. Info Theory, 1992, v. 38, №2, p. 617 – 642.
13. Востров Г.Н., Полякова М.В., Любченко В.В. Фрактальновейвлетные методы анализа существенно нестационарных временных
рядов. Научно-теоретический журнал «Искусственный интеллект» N2 –
2000.
http://www.iai.dn.ua/public/JournalAI_2000_2/1/4252_Vostrov_Polyakova_Lyubchenko.pdf
14. Воробьев В.И., Грибунов В.Г. Теория и практика вейвлетпреобразования. ВУС, 1999. С. 15-104.
15. Загоруйко, Н. Г. Прикладные методы анализа данных и знаний. –
Новосибирск: ИМ СО РАН, 1999. — 270 с.
16. Хайкин С. Нейронные сети, полный курс. 2е издание, испр. - М:
Вильямс. 2008. - 1103 с.
17. Дебок Г., Кохонен Т. Анализ финансовых данных с помощью самоорганизующихся карт / Пер. с англ. – М.: Издательский Дом «АЛЬПИНА», 2001. – 317 с.
18. Терехов С.А. Гениальные комитеты умных машин. Научная сессия
МИФИ-2007. IX Всероссийская научно-техническая конференция «Нейроинформатика-2007»: Лекции по нейроинформатике. Часть 2. – М.:
МИФИ, 2007. – С. 11-42
19. Буренин В.А, Гиниятуллин В.М, Зозуля Ю.И., Вульфин А.М.,
Жильцов А.А. Аппроксимация моделей технологического комплекса приема-сдачи нефти в
нейросетевом базисе.
Итоговый отчет.
http://www.skevalt.rbfree.ru/public/NefteAuto/report.pdf
УДК 004.032.26(06) Нейронные сети
142
Download