Анализ данных и интеграция информационных систем Станислав Чистяков Старший Консультант [email protected] 5 апреля 2011 года, гостиница «Золотое кольцо» Данные в современном мире Объем собираемых данных постоянно увеличивается, что вызывает ряд вопросов: • Требуется больше оборудования • Требуется больше ресурсов на обслуживание и резервное копирование • Усложняется обработка и анализ данных Как получить пользу от данных? Чтобы получить преимущества от наличия большого объема данных необходимо иметь возможность быстро обрабатывать эти данные, строить по ним требуемые отчеты, не вдаваясь в технические детали хранения этой информации Какие бывают данные и как их хранить? Данные можно разделить на два больших блока: • Структурированная текстовая информация • Мультимедийные данные – фотографии, рентгеновские снимки, аудио или видео записи и т.д. но они тоже имеют структурированное текстовое описание Большинство структурированных данных в информационных системах хранится с базах данных, которые обеспечивают следующий функционал: • Хранение • Индексирование и поиск • Обеспечение устойчивости к отказу оборудования • Резервное копирование Microsoft SQL Sever 2008 R2 • Database Engine – хранилище данных • Reporting Services – отчеты • Analysis Services – аналитика • Integration Services интеграция Базовые компоненты Microsoft SQL Server 2008 R2 Reporting Services – служба отчетов • Широкие возможности по построению отчетов • Отчеты могут быть сформированы в различных форматах (Microsoft Word или Excel, HTML, TIFF, PDF и т.д.) • Возможно использование графиков, карт, вложенных отчетов • Возможность публикации отчетов на Microsoft SharePoint • Возможность рассылки отчетов по расписанию • Возможность создания отчетов БЕЗ привлечения технических специалистов Reporting Services – служба отчетов Одной из интересных особенностей SQL Server является возможность создавать геопространственные отчеты: • Поддержка геопространственной визуализации с использованием карт, маршрутов и пользовательских областей • Сочетание бизнес-информации с географическим представлением дает новую почву для анализа • Поддержка геопространственных типов Microsoft SQL Server и интеграция с Microsoft Virtual Earth Analysis Services – служба анализа • Мощный инструмент аналитического анализа • OLAP анализ • Возможность самостоятельного анализа не вникая в технические детали хранения информации • Возможность работы с данными через Microsoft SharePoint Server • Возможность анализа данных с использованием Microsoft Excel Что такое аналитический куб? Что такое аналитический куб? Инструменты анализа Анализ в Excel Аналитический Web портал Integration Services – служба интеграции При наличии нескольких несвязанных информационных систем вопросы комплексного анализа данных резко усложняются Возникает необходимость в консолидации данных в едином хранилище данных SQL сервер предоставляет такую возможность без использования сторонних продуктов за счет использования Integration Services Integration Services – служба интеграции • Возможность работы с различными источниками данных (базы данных, файлы) • Возможность гибкой настройки процедуры обработки данных (конвертирование форматов, сложная трансформация данных и т.д.) • Высокая производительность и масштабируемость решения Excel - регламентная отчетность - поиск скрытых зависимостей - прогнозирование - произвольные запросы Система 4 Система 1 MS SQL Хранилище данных Система 2 БД Microsoft SQL Server Система 3 БД Система 5 Портал 5 4 3 2 1 - публикация отчетов - документооборот - соместная работа - контроль исполнения поручений - мониторинг Интеграция систем Зачастую возникают более сложные сценарии, чем интеграция данных из нескольких источников в единое хранилище. В некоторых случаях требуется более глубокая интеграция нескольких информационных систем со сложной логикой обмена информацией Что делать? • Реализовывать все самостоятельно • Воспользоваться платформой для интеграции Пример произвольной интеграции Система1 Система4 Система2 Система3 Интеграция с помощью BizTalk Server Система1 Система2 BizTalk Система4 Система3 Microsoft BizTalk Server 2010 Основная идея: • Для каждой системы настраивается адаптер • Внутри реализуется бизнес логика взаимодействия систем Основные особенности: • Поддержка международных стандартов обмена (XML, SOAP, WS-*, EDI, SWIFT, HL7, …) • Гарантированная доставка сообщений • Расширенный бизнес мониторинг • Широкий выбор адаптеров + различные решения от партнеров • Возможность реализовывать интеграционные сценарии как в пределах одной организации, так и сценарии взаимодействия систем различных ведомств Итоги • • • • • Рост объемов информации заставляет решать вопросы анализа данных Интеграция данных из различных систем облегчает анализ данных и позволяет сделать этот анализ максимально полным Интеграция систем гораздо сложнее интеграции данных и требует тщательно продуманного подхода Большинство стандартных задач анализа и интеграции данных может быть решено встроенными средствами SQL Server 2008 R2 Интеграционная платформа Microsoft BizTalk Server 2010 позволяет реализовать сложные сценарии интеграции систем как в пределах организации, так и между системами различных ведомств Спасибо!