Применение алгоритмов кластеризации и классификации для

advertisement
УДК 004.896(06) Интеллектуальные системы и технологии
Н.А. ЖУКОВА, А.Б. ТРИСТАНОВ1
Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"
1
Камчатский государственный университет имени Витуса Беринга
ИСПОЛЬЗОВАНИЕ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ
И КЛАССИФИКАЦИИ ДЛЯ ОБРАБОТКИ ТЕЛЕМЕТРИЧЕСКОЙ ИНФОРМАЦИИ
Рассматриваются вопросы применения методов Data Mining, в частности алгоритмов кластеризации и классификации, для анализа телеметрической информации. Дается описание системы обработки телеметрической информации, приводятся результаты испытания системы на реальных задачах.
В докладе рассматриваются вопросы применения алгоритмов Data
Mining [2], в частности алгоритмов кластеризации и классификации, в
задачах анализа и интерпретации телеметрической информации (ТМИ),
получаемой в ходе испытаний сложных технических систем.
Типовой задачей анализа ТМИ является задача обработки быстроменяющихся параметров. Применение систем автоматического приобретения знаний в задаче обработке ТМИ открывает пути создания эффективных программных комплексов, использование которых возможно при
минимальных человеческих ресурсах.
Процесс приобретения знаний о телеметрическом (ТМ) сигнале основан на построении продукционных правил, описывающих особенности
сигнала. На основе продукционных правил строятся классификаторы.
Примерами классов выделяемых событий могут являться временные
участки соответствующие ударным вибрациям, вибрациям на переходных
режимах, вибрациям на установившихся стационарных, квазистационарных режимах.
Основными этапами анализа ТМ сигнала являются:
1. Предварительная обработка сигнала и получение векторного описания сигнала с использованием спектрально-временного анализа Фурье и
разложения сигнала по алгоритму вейвлет-пакет.
2. Кластер-анализ на основе полученных векторных описаний сигнала
решает задачу автоматической сегментации ТМ сигнала с целью выделения стандартных и нерегламентированных событий. Выделенные участки
используются в качестве эталонов.
3. Получение описания знаний в виде продукционных правил с помощью алгоритмов «Деревья решений». Полученные после кластер-анализа
участки сигнала могут быть компактно описаны с помощью методов поISBN 5-7262-0710-6. НАУЧНАЯ СЕССИЯ МИФИ-2007. Том 3
184
УДК 004.896(06) Интеллектуальные системы и технологии
строения деревьев решений. Особенностью такого описания является то,
что в нем используется небольшое количество наиболее информативных
признаков, позволяющих описать каждый сегмент сигнала. Продукционные правила наполняют базу знаний, описывающую различные события в
телеметрическом сигнале.
4. Реализация полученных правил для автоматического анализа ТМ
сигнала.
Для описания процесса выделения основных событий, содержащихся в
записях ТМИ, была разработана система приобретения знаний. Данные,
поступающие на вход системы, располагаются в таблицах базы данных и
представляют собой ТМ сигналы. Каждый этап анализа ТМ сигнала реализован в виде отдельный подсистемы. В рамках подсистемы кластеранализа реализованы следующие алгоритмы: алгоритм К-внутригрупповых средних [1], алгоритм максимизации ожидания (ЕМ) [3]. В
подсистеме описания знаний в виде продукционных правил реализованы
алгоритмы построения деревьев решений С4.5 [5] и СART [4].
Проведенные экспериментальные исследования на модельных и реальных ТМ сигналах показали принципиальную возможность решения
следующих задач с помощью алгоритмов Data Mining:
- задача автоматической сегментации ТМ сигнала на основе использования алгоритмов кластер анализа;
- задача автоматического описания сегментированного сигнала с использованием деревьев решений;
- задача автоматической классификации участков ТМ сигнала с целью
обнаружения нерегламентированных процессов;
- создание эталонной базы спектрального описания с использованием
методов кластер-анализа.
Представленные методы могут существенно повысить эффективность
и наглядность обработки ТМИ.
Список литературы
1 Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.
2 Ian H., Eibe F. Data Mining. Academic Press, San Dieg, CA, USA, 2000.
3 McLaghlan G. and Krishnan T. The EM algorithm and extensions. Wiley, 1997.
4 Murthy S. Automatic construction of decision trees from data: A Multi-disciplinary survey.
– Kluwer Academic Publishers, 1997.
5 Quinlan J. Ross. C4.5: Programs for Machine learning. – Morgan Kaufmann Publishers,
1993.
ISBN 5-7262-0710-6. НАУЧНАЯ СЕССИЯ МИФИ-2007. Том 3
185
Download