129661_section3

advertisement
Геоинформатика
Раздел 3. Работа с
пространственными данными.
Пространственные данные как основа
создания специализированных
информационных систем
• Пространственный объект (геообъект, геоинформационный объект,
географический объект) – цифровая модель материального или
абстрактного объекта реального или виртуального мира с указанием
его идентификатора, координатных и атрибутивных данных. Объектом
может быть неподвижный или движущийся простой или сложный
объект, явление, событие, процесс и ситуация.
• Пространственные данные (географические данные, геоданные) –
данные о пространственных объектах, включающие сведения об их
местоположении и свойствах, пространственных и непространственных
атрибутах. Пространственные данные обычно состоят их двух
взаимосвязанных частей: координатных и атрибутивных данных.
• Координатные данные определяют позиционные характеристики
пространственного объекта. Они описывают его местоположение в
установленной системе координат в виде последовательности
координат точек.
Пространственные данные как основа
создания специализированных
информационных систем
• Атрибутивные данные представляют собой совокупность
непозиционных характеристик (атрибутов) пространственного объекта,
определяют смысловое содержание (семантику) объекта и могут
содержать качественные или количественные значения. Таким
образом, любой предмет или явление может быть описано в
пространстве согласно следующей модели: парой координат
(географическое множество), геометрией (схематическое множество) и
некоторым набором характеристик (атрибутов). Атрибутивная
структура данных может быть представлена в виде таблиц и текстов.
При этом атрибутивные данные могут иметь пространственную
привязку, либо не иметь ее. Любые атрибутивные данные могут быть
«привязаны» к конкретному объекту, дополняя тем самым его
пространственные характеристики.
Пространственные данные как основа создания
специализированных информационных систем
• Географическое (картографическое) множество содержит
все образы объектов (точечных, линейных, площадных) с
реальными географическими координатами; его
выражением является цифровая модель местности (карта,
изображение снимка).
• Схематическое (графическое) множество – это
схематическое описание образов объектов, например, в
виде картосхем с условными координатами объектов,
сетевых графиков планирования, схем телефонной сети,
коммуникаций и т.п.
• Между схематическим и географическим множествами
существует тесная взаимосвязь, т.к. для решения задач
анализа часто требуется совмещение схем и реальных
карт, поэтому условные координаты переводятся в
реальные, и наоборот.
Модели данных
• Атрибутивная модель.
• Картографическая модель:
▫ 0-мерные модели – точечные;
▫ 1-мерные модели – линейные (дуги, отрезки, ломаные);
▫ 2-мерные модели – площадные (полигоны, окружности, многоугольники) и
модели геополей (представлены в основном изолиниями);
▫ 2,5D-модели – двухмерные модели, отображенные в трехмерном
пространстве (например, для отображения модели рельефа);
▫ 3D-модели – трехмерные модели. На основе этих моделей строятся модели
поверхности, среди которых выделяются два основных вида:
 модель в виде регулярной сети данных – «решеточная» (lattice) и
«ячеистая» (grid) модель;
 модель, построенная по нерегулярным наборам данных –
триангуляционная (TIN – Triangulated Irregular Network).
• Графическая модель:
• Модель, используемая в системах автоматизированного проектирования
общего назначения (САПР)
• Модель инженерных сетей.
Модели пространственных данных для создания
хранилища данных заданной тематики
•
Системы с пространственной локализацией данных включают различные базы:
1.
базы данных,
2.
базы моделей объектов
3.
базы программ
4.
алгоритмов обработки.
•
В общем случае эти разнообразные базы можно рассматривать как базы
данных различного содержания.
• Большинство современных БД, построенных на основе так называемых
реляционных моделей, имеют табличную форму и иногда называются
табличными.
Структуры БД ГИС
• Главным принципом организации таких БД является создание одной или
совокупности взаимосвязанных между собой таблиц.
• Первым этапом создания БД является определение включаемых в нее
характеристик и построение логической записи, включающей все
описательные характеристики.
• Вторым этапом является создание на основе полученной логической
записи нескольких таблиц с помощью процедур нормализации.
• Основными понятиями реляционных баз данных являются
•
тип данных
•
домен
•
атрибут
•
кортеж
•
первичный ключ
•
отношение
Структуры БД ГИС
• Главным принципом организации таких БД является создание одной или
совокупности взаимосвязанных между собой таблиц.
• Первым этапом создания БД является определение включаемых в нее
характеристик и построение логической записи, включающей все
описательные характеристики.
• Вторым этапом является создание на основе полученной логической
записи нескольких таблиц с помощью процедур нормализации.
• Основными понятиями реляционных баз данных являются
•
тип данных
•
домен
•
атрибут
•
кортеж
•
первичный ключ
•
отношение
Модель описания объектов хранилища
пространственных данных класса «карта»
Параметр
Представление
Формат хранения
Система координат
Проекция
Датум
Масштаб
Тематика
Геометрия объектов
Значение
векторная
растровая
shp
img
jpg
Долгота/широта
Сфероид Красовского
Пулково 1942
1:100000
Горно-геологическая
Гидрография
Физико-химические свойства углей
Точка
Полилиния
Полигон
Модель описания объектов хранилища
пространственных данных
Класс «аналитические данные»
Параметр
Название
Тип данных
Значение
Названия объектов (название шахт, марок углей и т.п.)
Integer, Char, Long
Класс «космоснимки»
Параметр
Номер
Название
Формат хранения
Система координат
Проекция
Датум
Значение
Градация внутри геолого-экономических районов
Имя снимка
Img
Долгота/широта
Сфероид Красовского
Пулково 1942
Хранилище пространственных данных
• Создание хранилища пространственных данных
• Две основные идеи:
▫ Интеграция разъединенных детализированных данных в едином
хранилище. Под детализированными данными понимаются некоторые
конкретные факты, свойства, события и т.п. В процессе интеграции должно
выполняться согласование рассогласованных детализированных данных и,
возможно, их агрегация. Данные могут поступать из различных источников:
исторических архивов корпорации, оперативных БД, внешних источников.
▫ Разделение наборов данных, используемых для оперативной обработки, и
наборов данных, применяемых для решения задач анализа.
• Информационное хранилище представляет собой ядро всей системы – один
или несколько серверов БД.
• Метаданные (репозиторий) играют роль справочника, содержащего сведения
об источниках первичных данных, алгоритмах обработки, которым исходные
данные были подвергнуты и т.д.
Общая архитектура корпоративной информационной
системы на основе хранилища данных
Разработанный банк данных ГИС
Хранилище пространственных данных
Проблемы реализации хранилища данных:
• неоднородность программной среды;
• распределенный характер организации;
• повышенные требования к безопасности данных;
• необходимость наличия многоуровневых справочников метаданных;
• потребность в эффективном хранении и обработке очень больших объемов
информации.
Схема организации хранилища
пространственных данных
Существующие подходы и решения создания
хранилищ данных
 Компания IBM. Программный продукт - A Data Warehouse Plus.
 Oracle. Warehouse Technology Initiative.
▫ наличие реляционной СУБД Oracle, которая постоянно совершенствуется
для лучшего удовлетворения потребностей складов данных;
▫ существование набора готовых приложений, обеспечивающих возможности
разработки склада данных;
▫ высокий технологический потенциал компании в области анализа данных;
▫ доступность ряда продуктов, производимых другими компаниями
 Hewlett Packard
 Sybase
 Informix Software
 AT&T GIS
 SAS Institute
 Software AG
1. IBM
A data
Warehouse Plus
Комплект
программных
продуктов
Warehouse
Technology
Initiative
3. Hewlett Intelligent
Packard
Warehouseплатф
орма Unix
4. Sybase Warehouse
WORKS
2. Oracle
СУБД DB2 +
Реляционна +
я СУБД
Oracle
+
Хранение данных
Средства
данных
обработки
компаний
др.
компании
БД
Интеграция
ПО
Название
Производитель
Сравнительный анализ программных продуктов,
реализующих технологию хранилища данных
Централизованное,
несколько
распределенных
рынков данных
Централизованное,
несколько
распределенных
рынков данных
Реляционна +
я СУБД
Централизованное
Реляционна +
я СУБД
Sybase
System 11
Централизованное,
несколько
распределенных
рынков данных
Средства аналитической
обработки,
статистического анализа
Одномерный анализ,
многомерный анализ
(OLAP, DataMining )
Средства аналитической
обработки,
статистического анализа
5.
Informix
Software
6. AT&T
GIS
Enterprise
Information
Factory
Open Data
Warehouse
Initiative
СУБД
Teradata
Средства
данных
обработки
Централизованное
Централизованное,
несколько
распределенных
рынков данных
+
Реляционн +
ые,
нереляцион
ные БД
+
Хранение данных
компаний
др.
компании
On-Line Dinamic Реляционна +
Parallel Server
я СУБД
7. SAS
Institute
8.
Software
AG
БД
Интеграция
ПО
Название
Производитель
Сравнительный анализ программных продуктов,
реализующих технологию хранилища данных
4GL
ADABA
S,
Natural
4GL
Средства аналитической
обработки,
статистического анализа
Download