АРХИТЕКТУРА ИНФОРМАЦИОННЫХ СИСТЕМ ЛЕКЦИЯ 4. ЭЛЕМЕНТЫ АРХИТЕКТУРЫ ДАННЫХ АРХИТЕКТУРА ИНФОРМАЦИОННОЙ СИСТЕМЫ Бизнесархитектура ИТ-архитектура Архитектура данных Архитектура приложений Технологическая архитектура КОНТЕКСТ И ОСНОВНЫЕ ЭЛЕМЕНТЫ АРХИТЕКТУРЫ ИНФОРМАЦИИ Различные формы информации зачастую требуют специфических технологий и методов работы с ней: • структурированная информация (реляционные и объектные модели); • развивающиеся, основанные на XML стандарты для полуструктурированной информации; • неструктурированная информация в форме текстов, графиков, образов, сопровождаемая определенными описательными данными (метаданными и каталогами). АРХИТЕКТУРА ИНФОРМАЦИИ Архитектура информации описывает, каким образом информационные технологии обеспечивают возможности для обработки данных, быстрого принятия решений, распространения информации внутри организации, а также за ее пределы, например, партнерам по бизнесу. • Бизнес-архитектура отвечает на вопрос: "С учетом нашего общего видения, целей и стратегий, кто и что будет делать?" • Архитектура информации отвечает на вопрос: "Какая информация должна быть предоставлена для того, чтобы эти процессы могли выполняться теми, кто их должен выполнять?" АРХИТЕКТУРА ИНФОРМАЦИИ Архитектура информации включает в себя: • модели, которые описывают процессы обработки информации, • основные информационные объекты, связанные с бизнессобытиями, • информационные потоки, • принципы управления информацией. Архитектура информации должна описывать: • данные, которые требуются для выполнения процессов (операционные), • так и аналитические данные и "контент", публикуемый на Web. АРХИТЕКТУРА ИНФОРМАЦИИ И АРХИТЕКТУРА ДАННЫХ Понятие "архитектура информации" является расширением понятия "архитектура данных". • Под архитектурой информации понимается процесс организации и представления значимой информации для пользователей в интуитивно-понятной форме, с использованием соответствующих средств каталогизации, навигации, пользовательского интерфейса. ОСОБЕННОСТИ АРХИТЕКТУРЫ ИНФОРМАЦИИ ПРЕДПРИЯТИЯ Аналитические компании считают, что при разработке новых систем до 70% времени тратится на решение задач, связанных с идентификацией источников данных, которые должны использоваться прикладной системой, и на написание программного кода для доступа и трансформации данных. • Для большинства средних и практически всех крупных предприятий использование нескольких различных СУБД, средств управления и преобразования данных является скорее правилом, чем исключением. • Современной тенденцией является все более широкого использования готовых прикладных систем (финансового учета, управления кадрами, управления закупками, управления продажами и т.д.), каждая из которых имеет свои модели данных. ПРИМЕР ПОТОКОВ ДАННЫХ НА ПРЕДПРИЯТИИ МОДЕЛИ, ИСПОЛЬЗУЕМЫЕ ДЛЯ РАЗЛИЧНЫХ ПРЕДСТАВЛЕНИЙ (ДОМЕНОВ) И ПЕРСПЕКТИВ (УРОВНЕЙ АБСТРАКЦИИ) Домены/перспекивы (уровни абстракции) Архитектура информации Контекст ("планировщик") •Список бизнес-сущностей – объектов, важных для бизнеса ("клиент", счет") •Связи между сущностями (бизнес-объектами) Концептуальный уровень("владелец" предприятия) •Семантические модели •Модели связей •Модели "сущность-связи" Логический ("проектировщик") •Логические модели данных •Схемы данных •Спецификации документов Физический ("разработчик") •Физические модели данных •Схемы БД •Код доступа к данным •Справочники данных РАЗРАБОТКА АРХИТЕКТУРЫ ИНФОРМАЦИИ В ходе разработки архитектуры информации решаются следующие задачи: • идентификация и инвентаризация существующих данных, включая определение их источников, процедур изменения и использования, ответственность, оценка качества; • сокращение избыточности и фрагментарности данных с целью уменьшения затрат на устройства хранения, стоимости их обслуживания, а также повышение качества данных за счет исключения неоднозначности и противоречивости различных экземпляров; • исключение ненужных перемещений или копирования данных, особенно связанных с наличием большого количества унаследованных или устаревших приложений; • формирование интегрированных представлений данных, таких как витрины и хранилища; • обеспечение доступности данных в режиме, приближенном к режиму реального времени, за счет использования средств обмена сообщениями, интеграционных брокеров и шлюзов; • интеграция метаданных, что позволит обеспечить целостное представление данных из различных источников; • сокращение числа используемых технологий и продуктов, что позволяет снизить расходы на обслуживание, а также получить дополнительные, объемные скидки от поставщиков применяемых продуктов; • улучшение качества данных, прежде всего, за счет привлечения бизнес-пользователей к определению данных; • улучшение защиты данных на основе использования последовательных и согласованных мер, обеспечивающих, с одной стороны, защиту от несанкционированного доступа, а с другой – доступность данных для их использования на практике. КОНЦЕПТУАЛЬНЫЙ УРОВЕНЬ АБСТРАКЦИИ АРХИТЕКТУРА ИНФОРМАЦИИ Процессы управления информацией: • получение данных из внутренних и внешних источников; • классификация данных по типам; • хранение и извлечение данных; • редактирование (или обновление) данных; • контроль качества (удаление или исправление некорректных данных); • презентация (трансформирование данных для определенной аудитории потребителей); • распространение информации для различных групп потребителей; • оценка (полезности, а также соотношения цены/качества данных); • обеспечение безопасности информации (например, аутентификация данных от различных источников, назначение адекватного уровня доступа; определение требований по аудиту; обеспечение механизмов резервного хранения и восстановления). ОБЩАЯ АРХИТЕКТУРА ИНФОРМАЦИИ (ДАННЫХ) ТИПЫ ПРИКЛАДНЫХ СИСТЕМ ДОСТУПА К ДАННЫМ Системы онлайновой обработки транзакций (OLTP – Online Transaction Processing) Системы он-лайновой аналитической обработки (OLAP – Online Analitical Processing) Системы управления неструктурированными данными (контентом). OLTP-СИСТЕМЫ Применяются для выполнения критически важных, повседневных операций. Системы используются многими пользователями одновременно для ввода, обновления и извлечения данных. OLTP-системы способны выполнять атомарные бизнес-функции и четко обозначенные единицы работ, в форме одной или нескольких транзакций, выполняемых как одно целое. •(например, транзакция "изменение адреса клиента"). OLAP-СИСТЕМЫ Используются для анализа, планирования и управления получением отчетов путем обеспечения интерактивного доступа к информации. В OLAP-системах обычно обрабатываются агрегированные данные Данные для OLAP-систем, как правило, извлекаются из транзакционных OLTP-систем и помещаются или реплицируются в специальные базы данных – хранилища или витрины данных. Витрины данных являются специализированными хранилищами, которые ориентированы на предоставление информации, требующейся для бизнес-анализа на предприятии. ОБЛАСТИ АРХИТЕКТУРЫ ДАННЫХ • федеративные данные (метаданные); • модели данных; • системы управления базами данных; • программное обеспечение промежуточного слоя (middleware) для доступа к данным; • механизмы доступа к данным; • безопасность данных. РЕКОМЕНДУЕМЫЕ ШАГИ СОЗДАНИЯ АРХИТЕКТУРЫ ИНФОРМАЦИИ Рекомендуемыми первыми шагами на пути создания архитектуры информации являются: • создание словаря данных и репозитория метаданных; • выбор системы записи информации о каждом элементе данных. ПОСЛЕДУЮЩИЕ ШАГИ • Создание оперативного хранилища данных (ODS – Operational Data Store), которое обеспечивает стандартные процессы извлечения, трансформации и загрузки данных (ETL – Extract, Transform, Load), а также очистки данных и создания метаданных. • Оперативное хранилище – основа для повторного, многократного использования данных, а в последующем – для создания хранилищ и витрин данных. РЕЗУЛЬТАТЫ РАЗРАБОТКИ АРХИТЕКТУРЫ ИНФОРМАЦИИ документированное описание существующих источников данных; модели данных; описание существующих и планируемых информационных потоков, соответствующих интерфейсов, алгоритмов преобразования или консолидации данных, а также необходимые соглашения по уровню сервиса, связанного с передачей данных; описание решений по организации хранения данных – от общих каталогов до витрин и хранилищ данных; используемые технологии и средства для преобразования и управления данными. ЦЕЛЬ РАЗРАБОТКИ МОДЕЛИ ИНФОРМАЦИИ • Цель разработки моделей информации и моделей данных – создание графических представлений потребностей организации и отдельных бизнес-процессов в информации. • Моделирование – основа для реорганизации бизнеспроцессов и конструирования новых прикладных систем, описания взаимодействий и информационного обмена, который происходит между организацией и клиентами, партнерами. УРОВНИ МОДЕЛИРОВАНИЯ ИНФОРМАЦИИ • На концептуальном уровне определяются высокоуровневые модели, описывающих информационные потоки между функциональными подразделениями организации в самом общем виде. • На уровне логического описания модели информации и данных описывают требования к информации в форме и терминах, понятных бизнес-пользователям. • Процесс моделирования на логическом уровне обеспечивает средства обнаружения, анализа, определения, стандартизации и нормализации отношений между бизнеспроцессами и прикладными системами, идентификацию потоков информации и соответствующих элементов данных, которые требуются организации. • Процессы, информационные потоки и элементы данных являются логическими фактами, которые организация должна поддерживать для выполнения бизнес-операций. • Этот уровень анализа уже позволяет идентифицировать общие элементы данных, которые используются разными организационными единицами и разными бизнес-процессами, что позволяет уменьшить пересечения и конфликты между этими элементами. УРОВНИ МОДЕЛИРОВАНИЯ ИНФОРМАЦИИ • На физическом уровне даются точные ответы на вопросы типа: "Какие данные требуются для того, чтобы реализовать логику бизнес-процесса соответствующей прикладной системой?", "Сколько требуется различных информационных объектов (сущностей)?", "Каков набор элементов данных каждой сущности?". • Физическая модель данных служит представлением того, как данные, приведенные в логической модели, будут храниться в системе управления базами данных. СРАВНЕНИЕ МОДЕЛЕЙ Концептуальная Модель данных Точка зрения Реализация данных Бизнес-взгляд на ИТ ИТ-взгляд на бизнес ИТ-взгляд на ИТ Фаза Планирование Анализ Реализация Рассматриваемые связи Связи данных с бизнес-функциями, интерфейсами, технологиями Связи данных с другими данными Связи данных с системами хранения Фокус Сбор, обработка и использование данных Структура данных Объемы и степень использования данных Модель/уровень УПРАВЛЕНИЕ ФЕДЕРАТИВНЫМИ ДАННЫМИ И МЕТАДАННЫМИ ПРИНЦИПЫ ИНТЕГРАЦИИ