Обзор технологий интеграции информации

advertisement
Обзор технологий интеграции информации
Одним
из
информации.
новейших
Задача
приложений
интеграции
СУБД
информации
является
-
это
интеграция
использование
содержимого нескольких источников данных для конструирования единого
информационного пространства. В общем случае роль источников данных
могут выполнять как традиционные базы данных, так и другие совокупности
данных (например, наборы файлов па диске, коллекции Web-страниц). В
данной работе рассматривается интеграция информации из реляционных баз
данных. При этом набор реляционных источников может быть гетерогенным,
то есть содержать базы данных, находящиеся под управлениям различных
СУБД. Наиболее распространенные подходы к интеграции информации,
согласно :
1. Федеративные базы данных. Источники независимы, но каждый из них
способен получать требуемую информацию из других. Этот подход удается
применять только в случаях, когда количество гетерогенных источников
данных, входящих в федерацию, невелико. Дело в том, что каждая база
данных
должна
быть
оснащена
дополнительными
компонентами,
обеспечивающими трансляцию запросов к другим членам федерации и
преобразование результатов. Количество таких компонентов определяется
как n (n — 1), где n - число источников данных. Быстрый рост расходов при
добавлении
новых
источников
данных
делает
этот
подход
неудовлетворительным для решения задачи интеграции большого количества
систем.
2. Хранилища данных. В хранилище копируются фрагменты (возможно
предварительно обработанные) данных из различных источников. Как
правило, хранилища данных предназначены для оперативного анализа
информации, собранных из многих источников. Основными проблемами
этого подхода являются необходимость регулярного копирования больших
объемов данных из источников в хранилище (что обычно делает источники и
хранилища недоступными для других видов работы), а также невозможность
обновления данных источников путем манипуляций с хранилищем.
3.
Медиаторы.
Медиаторы
-
это
программные
компоненты,
обеспечивающие поддержку так называемых виртуальных баз данных. С
точки зрения интерфейсов виртуальная база данных выглядит так, как будто
содержит всю информацию в материализованном виде. На самом деле,
медиатор не сохраняет данные источников, а лишь предоставляет
унифицированный доступ к ним. Он транслирует запрос клиента в один или
несколько запросов к источникам и производит преобразование результатов,
полученных от источников в единую форму представления. С понятием
медиатора тесно связано понятие оболочки. Оболочки прикрепляются к
каждому источнику данных с тем, чтобы
предоставить медиатору
возможность обращаться ко всем источникам по унифицированной схеме.
Таким образом, введение в систему новых источников требует не изменения
медиатора, а лишь наличия соответствующей оболочки. Зачастую удается
создать настраиваемые оболочки, которые подходят для широкого круга
источников и требуют лишь настройки (например, формального описания
отображения между схемой источника и схемой медиатора).
В этой работе используется подход, базирующийся на применении
медиаторов с целью создания виртуальных баз данных.
Related documents
Download