П. Потапов, д.т.н О.Л. Пястунович м.н.с Институт угля и углехимии СО РАН Интегрированная информационная система для решения горнотехнологических задач Аннотация В работе рассматривается подход к созданию интегрированной информационной системы для решения широкого круга задач горного производства. Его особенностью является то, что разработанная система использует самую различную пространственную информацию, включающую в себя электронные карты, данные дистанционного зондирования и различные горнотехнологические данные, получаемые в процессах горного производства. Их интеграция позволяет построить и использовать широкий класс математических моделей для описания различных геомеханических, газодинамических и технологических характеристик систем горного производства. На примере угольной промышленности Кузбасса рассматривается решение некоторого класса задач. При построении системы был использован принцип тунелирования вычислительных модулей, когда решение одной задачи формирует входные параметры для последующей и таким образом пользователь может решать сразу несколько связанных задач, заботясь лишь о схеме вычислений, и не определяя параметры для каждого вычислительного процесса. В настоящее время пространственная информация используется для решения широкого круга задач горного производства. При этом на предприятиях накоплены большие массивы разнородной информации: векторные и растровые карты, космо- и аэроснимки, базы данных характеристик пространственных объектов, которые практически нигде не используются. Часто возникает проблема анализа разнородных данных, их обработки. При решении некоторых горно-технологических задач также формируются большие потоки разнородной информации. Возникает необходимость регламентированного получения данных и их настройка для последующей интеграции. Последние десятилетия в угольной промышленности различными коллективами ученых (ИУУ СО РАН, ИГД СО РАН, ИГД УРО РАН и др.) создавались базы данных и разрабатывались программные комплексы решения прикладных задач для горного производства. Анализ опыта решения таких задач показал, что существующие разработки, как правило, обеспечивают возможность работы только с конкретным типом пространственных данных и очень сложно обеспечить их расширение. Практически отсутствуют работы по научному обоснованию и созданию единого хранилища для различных типов пространственных данных и их интеграции с вычислительными модулями. Решение такой задачи можно осуществить путем создания интегрированной информационной системы, которая бы объединила различные типы пространственных данных (векторные, растровые форматы, данные дистанционного зондирования), наборы конкретных программных модулей и вычислительных моделей и технологий. При этом система должна иметь свой собственный механизм настройки, ориентированный на решение задач горного производства, включая тунелирование вычислительных модулей и вычисления по заранее заданным схемам. Поэтому создание такой проблемноориентированной интегрированной информационной системы является актуальной задачей, отвечающей потребностям горного производства. При разработке системы решались следующие задачи: 1. Построение комплексной модели пространственных данных, ориентированной на решение задач горного производства. 2. Разработка методики формирования хранилища пространственных данных по угольной тематике. 3. Создание комплекса информационных структур и вычислительных модулей для решения задач горного производства. 4. Создание механизма подключения к системе вычислительных модулей. 5. Разработка схем тунелирования вычислительных модулей и типовых топологий для решения конкретных горнотехнологических задач. Для решения вышеуказанных задач была предложена иерархическая модель пространственных данных, которая позволяет выявить данные, необходимые для решения горно-технологических задач, и интегрировать их в рамках единой информационной системы. Разработана методика сбора и подготовки пространственных данных обеспечивающая создание качественного нового инструмента для хранения и исследования пространственных данных по угольной тематике На ее основе была спроектирована информационная система обеспечивающая интеграцию вычислительных модулей и хранилища пространственных данных, и организован механизм подзагрузки позволяющий подключать к информационной системе вычислительные модули, расширяя спектр решаемых горнотехнологических задач. Был предложен и реализован программно принцип тунелирования, предполагающей передачу результатов расчета от конкретного модуля к последующему, в соответствие с определяемой пользователем схемой вычислений и интерфейсом подключения к хранилищу данных. Разработанная интегрированная информационная система позволяет объединять разнообразные программные средства решения научно-технических и производственных задач и разнородные пространственно-распределенные картографические и реляционные хранилища данных в соответствии с предметной областью использования. Созданная технология формирования хранилища пространственных данных является универсальной, поскольку легко может быть перенесена на другую предметную область с учетом специфических особенностей последней, не требуя при этом принципиальных изменений в структуре. Исходя из предметной области конкретного горного производства ( угольная промышленность) нами были проанализированы модели пространственных данных и существующие технологии создания и ведения электронных карт. Определено принципиальное отличие горных пространственных данных от других видов информации, которое заключается в наличии трех взаимосвязанных частей: географического пространства (координаты типа X, Y), схематического пространства (геометрия) и атрибутов (некоторый набор характеристик). Наличие трехмерных данных обуславливает применение специальных моделей при создании проблемно-ориентированных информационных систем. Выявлены модели, которые могут быть использованы для создания многофункционального хранилища пространственных данных горной тематики: картографическая модель для создания системы цифровых основ различных масштабов; модель САПР для поддержки графических схем объектов горного производства; атрибутивная модель для учета параметров и характеристик объектов. Предложена иерархическая модель, претендующая на полноту представления пространственных данных горной тематики в рамках специализированного их хранения. Выявлены возможные связи между различными их типами (рис. 1). Пространственные данные условно можно разделить на три основных класса (карты, аналитические данные, ДДЗ). При этом между первым и вторым классом существует тесная взаимосвязь, т.к. любые аналитические пространственные данные либо могут генерироваться за счет использования карт, либо отображаются на них. Третий класс (данные дистанционного зондирования Земли) является элементом контроля вы- шестоящих классов. С помощью данных этого класса осуществляется мониторинг точности и достоверности данных первых двух классов. Рис. 1. Иерархическая модель хранилища пространственных данных Главным условием при создании хранилища является специфика хранимых данных, выраженная в их трехмерной структуре. Согласно анализу пространственных данных горной тематики и теории построении хранилищ нами предложена следующая схема его организации (рис. 2). Сбор данных для хранилища данных горной тематики представляет собой низовой уровень аккумуляции в одном месте «сырой» информации. В качестве источников информации выступают традиционные карты разных масштабов, ДДЗ, данные мониторинга и наблюдений. Первичная обработка предполагает согласование данных для обеспечения их целостности и непротиворечивости, т.е. приведение к единому формату представления, системе координат и.т.п. В данном случае, при создании хранилища главным требованием для загрузки цифровых карт и ДДЗ являлось наличие единой проекции. Поэтому на этом этапе осуществляется перевод материалов в цифровую форму (векторизация традиционных карт, сканирование ДДЗ и т.п.), привязка их к конкретной системе координат. В итоге формируются базы данных векторных материалов и ДДЗ, а также базы атрибутивных данных. Анализ данных Отчеты Произвольные запрос Многомерный анализ Извлечение знаний (Data Mining) Доступ: «клиент-сервер» или Internet Витрины данных Витрины данных Хранение данных Хранилище данных Извлечение, преобразование, загрузка Источники данных Рис. 2. Архитектура информационно-аналитической системы на основе хранилища данных На этапе загрузки в систему подготовленных пространственных данных происходит отслеживание повторяемости материалов, связка таблиц данных по первичным и вторичным ключам, т.е. формирование некоторого «куба» пространственных данных, их хранилища. Разработанная структура хранилища накладывает определенные требования на реализующее его программное обеспечение. Так как основой построения информационно-вычислительной системы является хранилище, то его программное обеспечение должно обеспечивать поддержку форматов пространственных данных, например, формат shp-файла. Кроме этого безусловным требованием является обеспечение возможности подключения к хранилищу систем сторонних разработчиков, поддерживающих идеологию открытых систем. Этим и другим не менее важным требованиям отвечает пакет Oracle, как наиболее развитое программное средство, обеспечивающее обработку пространственных данных, их интеграцию с традиционными форматами хранения информации (текстовые документы, реляционные БД), и предоставляющее встроенные методы обработки информации типа стандартного механизма построения отчетов и DataMining [1]. Система позволяет подключить к хранилищу данных специализированные аналитические модули решения горно-технологических задач. При этом не имеет значения язык разработки модуля. Так как обработку пространственных данных аналитическим модулем можно отнести к разновидности Data Mining, то процесс его подзагрузки описывается стандартом CRISP (The Cross Industries Standard Process for Data Mining – стандартный межотраслевой процесс Data Mining). [2] Разработанная система обеспечивает полноту работы с данными, посредством использования ГИС-методов для обработки электронных карт и ДДЗ и механизма интеграции с вычислительными модулями сторонних разработчиков Пользователю представляются средства для проведения анализа данных. Имеется блок отчетов, которые строятся с использованием модулей многомерного анализа пространственных данных, осуществляемом средствами Oracle Reports, Oracle Discoverer, OLAP, Oracle Data Mining. Для их выполнения система передает управление среде Oracle. Работоспособность данного проекта подтверждена успешным подключением и функционированием в системе модулей «Энтропийный анализ» (среда Mathlab) и «Напряженно-деформированное состояние массива (по В.И. Мурашеву)» (среда Delphy), модулей обработки знаний [3]. Важная особенность системы - интеграция различных видов пространственной информации (электронные карты, космоснимки) с традиционными вычислениями. Поэтому горно-технологические задачи, решаемые с использованием картографического материала, выделены в отдельный класс. Для работы с электронными картами пользователю предоставляется перечень карт, находящихся в хранилище, и стандартные методы работы с ними, включая послойное отображение слоев, вывод атрибутов и т.п. Для отображения карт установлена связь с программной средой ArcGIS. Для решения отдельных горно-технологических задач пользователю предоставляется встроенные инструменты ERDAS для работы с БД космоснимков территории Кемеровской области (схема RASTER_ADM хранилища), визуализируемые в форме мозаичных картин территории, ее геолого-экономических районов и городов. Отдельным классом выделены горно-технологические задачи, связанные дешифрованием пространственных объектов с использованием ДДЗ. Отработана методика выделения этих объектов на космоснимке, основанная на интеграции ДДЗ и векторных карт. С ее помощью решена задача контроля границ отработки участков полезных ископаемых открытым способом. Для ее решения использовались космоснимки территории Кузнецкого бассейна и специализированная БД «Новые лицензионные участки». Для выделения границ участков и их отрисовки применялись пороговая обработка и специализированные фильтры Фурье (Butterworth с радиусом 100-150, Hanning 20-100, Gaussian 150-200). Путем совмещения выделенных границ и векторного слоя «Новые лицензионные участки» были вычислены области расхождения. Решение данной задачи позволило разработать уникальный инструмент контроля границ отработки полезных ископаемых открытым способом. Уточнение границ пространственных объектов по космоснимкам позволяет актуализировать устаревшие электронные карты и формировать специализированные БД горных объектов. Заключение. Созданная информационно-вычислительная система с использованием хранилища пространственных данных по Кузнецкому угольному бассейну (ИУУ СО РАН), позволяет интегрировать различные типы пространственных данных и решать широкий спектр горнотехнологических задач. Реализованный в системе подход на основе туннельной обработки данных позволяет осуществлять потоковое решение таких задач в рамках единой системы и осуществлять интеграцию полученных результатов с другими пространственными данными из хранилища. Система достаточно легко расширяется и настраивается на другие типы данных. Литература Oracle Spatial User’s Guide and Reference Release 9.0.1, June 2001, Part No. A88805-01. – 472 c. 2. https://www1.ietf.org/mailman/listinfo/crisp 3. Потапов В.П. Интеграция пространственных геоданных и распределенных вычислительных модулей для решения горно-технологических задач / В.П. Потапов, С.Е. Попов // Геоинформатика – 2007.- № 3.- С. 42-47 1.