Информационный менеджмент предприятия совместным

advertisement
Информационный
менеджмент предприятия
совместным использованием
SSIS, MDS и DQS [учебник]
Для управления информацией на предприятии, как правило, требуется интеграция данных со всего
предприятия и из-за его пределов, очистка данных, проверка данных на наличие повторений,
стандартизация данных, обогащение данных, согласование данных с юридическими и
нормативными требованиями и последующее сохранение данных в централизованном
расположении со всеми необходимыми параметрами безопасности.
SQL Server 2012 предоставляет все компоненты, необходимые для реализации эффективного
управления информацией на предприятии (EIM), в одном продукте. Ключевые компоненты SQL
Server 2012, которые помогают построить решение EIM, перечислены ниже.
 Службы SQL Server Integration Services
 Службы SQL Server Data Quality Services
 Службы SQL Server Master Data Services
Службы SQL Server Integration Services (SSIS) предоставляют мощную, расширяемую платформу для
интеграции данных из различных источников в комплексное решение по извлечению,
преобразованию и загрузке (ETL), которое будет поддерживать рабочие процессы компании,
хранилище данных и управление основными данными. Краткий обзор типичных примеров
использования служб SSIS cм. в разделе Обзор служб Integration Services.
Службы SQL Server Data Quality Services (DQS) позволяют очистить, сопоставить, стандартизировать
и обогатить данные, чтобы вы могли предоставлять надежные данные для рабочих нагрузок
бизнес-аналитики, хранилища данных и обработки транзакций. Описание бизнес-задачи служб DQS
и возможностей DQS, позволяющих добиться ее выполнения, см. в разделе Общие сведения о
службах Data Quality Services.
Службы SQL Server Master Data Services (MDS) предоставляют центральный концентратор данных,
который обеспечивает целостность информации и согласованность данных в различных
приложениях. Краткое описание важных функций служб MDS см. в разделе Общие сведения о
службах Master Data Services.
В технических документах Управление информацией на предприятии с помощью SQL Server
2012 и Очистка и сопоставление основных данных с помощью технологий EIM представлены
подробные рекомендации по реализации решения EIM с совместным использованием этих
технологий EIM от Майкрософт. В видеороликеУправление информацией на предприятии (EIM):
объединение служб SSIS, DQS и MDS представлена демонстрация сценария реализации EIM.
В этом учебнике вы научитесь совместно использовать службы SSIS, MDS и DQS для внедрения
примера решения по управлению данными предприятия (EIM). Сначала службы DQS будут
использованы для создания базы знаний с набором знаний о данных (метаданные), очистки данных
в файле Excel с использованием базы знаний и сопоставления данных для обнаружения и удаления
повторений в данных. Затем надстройка MDS для Excel будет использована для передачи
очищенных и сопоставленных данных в MDS. Затем весь процесс будет автоматизирован с
помощью решения служб SSIS. Решение SSIS в этом учебнике читает входные данные из файла
Excel, но его можно расширить, чтобы читать данные из различных источников, таких как база
данных Oracle, Teradata, DB2, SQL Windows Azure.
Предварительные требования
1.
2.
3.
4.
5.
6.
7.
8.
Microsoft SQL Server 2012 со следующими установленными компонентами.
a. Службы Integration Services (SSIS)
b. Службы Master Data Services (MDS)
c. Службы Data Quality Services (DQS)
d. SQL Server Data Tools
Дополнительные сведения об установке продукта см. в разделе Руководство по
установке SQL Server 2012.
Настройка служб MDS с помощью диспетчера конфигурации Master Data Services
Используйте диспетчер конфигурации для создания и настройки базы данных служб Master
Data Services. После создания базы данных MDS создайте веб-приложение для служб MDS
на веб-сайте (например, http://localhost/MDS) и свяжите базу данных MDS с вебприложением MDS. Обратите внимание, что для создания веб-приложения MDS на
компьютере должны быть установлены службы IIS. Дополнительные сведения о
предварительных требованиях для настройки базы данных и веб-приложения MDS см. в
разделах Требования к веб-приложению (службы Master Data Services) иТребования к базе
данных (службы Master Data Services).
Установите и настройте службы DQS с помощью установщика сервера DQS. Откройте
меню Пуск, выберите Все программы, щелкните Microsoft SQL Server 2012, Службы Data
Quality Services, а затем щелкните Установщик сервера служб Data Quality.
Microsoft Excel 2010 (рекомендуется 32-разрядная версия).
Установите надстройку служб Master Data Services для Excel (32- или 64-разрядная
версия в зависимости от версии Excel на компьютере) здесь. Чтобы узнать версию Excel,
установленную на компьютере, откройте Excel, щелкните Файл в строке меню и выберите
пункт Справка. После этого версия будет показана на правой панели. Учтите, что
необходимо установить среду выполнения средств Visual Studio 2010 для Office перед
установкой надстройки Excel.
(Необязательно) Создайте учетную запись в Windows Azure Marketplace. Для одной из задач
в этом учебнике требуется наличие учетной записи портала Azure Marketplace (который
ранее называлсяData Market). Эту задачу можно пропустить, если необходимо, и перейти к
следующей задаче.
Загрузите файл Suppliers.xls из центра загрузки Майкрософт.
Службы DQS не позволяют экспортировать результаты очистки или сопоставления в файл
Excel при использовании 64-разрядной версии Excel. Это известная проблема. Чтобы
обойти ее, выполните следующие действия.
a. Установите SQL Server 2012 с пакетом обновления 1 (SP1) (на 64-разрядных
компьютерах с 64-разрядной версией Excel).
b. Выполните команду DQLInstaller.exe –upgrade. Если был установлен экземпляр SQL
Server по умолчанию, файл DQSInstaller.exe будет находиться в папке «C:\Program
Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn». Дважды щелкните
файл DQSInstaller.exe.
c. В разделе Диспетчер конфигурации Master Data Services нажмите
кнопку Выбрать базу данных, выберите существующую базу данных MDS и
нажмите кнопку Обновить.
Download