Архитектура информации

реклама
АРХИТЕКТУРА
ИНФОРМАЦИОННЫХ СИСТЕМ
ЛЕКЦИЯ 4.
ЭЛЕМЕНТЫ АРХИТЕКТУРЫ ДАННЫХ
АРХИТЕКТУРА ИНФОРМАЦИОННОЙ
СИСТЕМЫ
Бизнесархитектура
ИТ-архитектура
Архитектура данных
Архитектура приложений
Технологическая архитектура
КОНТЕКСТ И ОСНОВНЫЕ ЭЛЕМЕНТЫ
АРХИТЕКТУРЫ ИНФОРМАЦИИ
Различные формы информации зачастую
требуют специфических технологий и методов
работы с ней:
• структурированная информация (реляционные и
объектные модели);
• развивающиеся, основанные на XML стандарты для
полуструктурированной информации;
• неструктурированная информация в форме текстов,
графиков, образов, сопровождаемая определенными
описательными данными (метаданными и каталогами).
АРХИТЕКТУРА ИНФОРМАЦИИ
Архитектура информации описывает, каким образом
информационные технологии обеспечивают возможности для
обработки данных, быстрого принятия решений, распространения
информации внутри организации, а также за ее пределы,
например, партнерам по бизнесу.
• Бизнес-архитектура отвечает на вопрос: "С учетом нашего
общего видения, целей и стратегий, кто и что будет делать?"
• Архитектура информации отвечает на вопрос: "Какая
информация должна быть предоставлена для того, чтобы эти
процессы могли выполняться теми, кто их должен выполнять?"
АРХИТЕКТУРА ИНФОРМАЦИИ
Архитектура информации включает в себя:
• модели, которые описывают процессы обработки
информации,
• основные информационные объекты, связанные с бизнессобытиями,
• информационные потоки,
• принципы управления информацией.
Архитектура информации должна описывать:
• данные, которые требуются для выполнения процессов
(операционные),
• так и аналитические данные и "контент", публикуемый на Web.
АРХИТЕКТУРА ИНФОРМАЦИИ И
АРХИТЕКТУРА ДАННЫХ
Понятие "архитектура информации" является
расширением понятия "архитектура данных".
• Под архитектурой информации понимается процесс
организации и представления значимой информации
для пользователей в интуитивно-понятной форме, с
использованием соответствующих средств
каталогизации, навигации, пользовательского
интерфейса.
ОСОБЕННОСТИ АРХИТЕКТУРЫ
ИНФОРМАЦИИ ПРЕДПРИЯТИЯ
Аналитические компании
считают, что при
разработке новых систем
до 70% времени тратится
на решение задач,
связанных с
идентификацией
источников данных,
которые должны
использоваться
прикладной системой, и
на написание
программного кода для
доступа и
трансформации данных.
• Для большинства средних и
практически всех крупных
предприятий использование
нескольких различных СУБД, средств
управления и преобразования данных
является скорее правилом, чем
исключением.
• Современной тенденцией является
все более широкого использования
готовых прикладных систем
(финансового учета, управления
кадрами, управления закупками,
управления продажами и т.д.), каждая
из которых имеет свои модели
данных.
ПРИМЕР ПОТОКОВ ДАННЫХ НА
ПРЕДПРИЯТИИ
МОДЕЛИ, ИСПОЛЬЗУЕМЫЕ ДЛЯ РАЗЛИЧНЫХ
ПРЕДСТАВЛЕНИЙ (ДОМЕНОВ) И ПЕРСПЕКТИВ
(УРОВНЕЙ АБСТРАКЦИИ)
Домены/перспекивы
(уровни абстракции)
Архитектура информации
Контекст ("планировщик") •Список бизнес-сущностей – объектов, важных для бизнеса
("клиент", счет")
•Связи между сущностями (бизнес-объектами)
Концептуальный
уровень("владелец"
предприятия)
•Семантические модели
•Модели связей
•Модели "сущность-связи"
Логический
("проектировщик")
•Логические модели данных
•Схемы данных
•Спецификации документов
Физический
("разработчик")
•Физические модели данных
•Схемы БД
•Код доступа к данным
•Справочники данных
РАЗРАБОТКА АРХИТЕКТУРЫ
ИНФОРМАЦИИ
В ходе разработки архитектуры информации решаются следующие
задачи:
• идентификация и инвентаризация существующих данных, включая определение их источников,
процедур изменения и использования, ответственность, оценка качества;
• сокращение избыточности и фрагментарности данных с целью уменьшения затрат на устройства
хранения, стоимости их обслуживания, а также повышение качества данных за счет исключения
неоднозначности и противоречивости различных экземпляров;
• исключение ненужных перемещений или копирования данных, особенно связанных с наличием
большого количества унаследованных или устаревших приложений;
• формирование интегрированных представлений данных, таких как витрины и хранилища;
• обеспечение доступности данных в режиме, приближенном к режиму реального времени, за счет
использования средств обмена сообщениями, интеграционных брокеров и шлюзов;
• интеграция метаданных, что позволит обеспечить целостное представление данных из различных
источников;
• сокращение числа используемых технологий и продуктов, что позволяет снизить расходы на
обслуживание, а также получить дополнительные, объемные скидки от поставщиков применяемых
продуктов;
• улучшение качества данных, прежде всего, за счет привлечения бизнес-пользователей к определению
данных;
• улучшение защиты данных на основе использования последовательных и согласованных мер,
обеспечивающих, с одной стороны, защиту от несанкционированного доступа, а с другой – доступность
данных для их использования на практике.
КОНЦЕПТУАЛЬНЫЙ УРОВЕНЬ АБСТРАКЦИИ
АРХИТЕКТУРА ИНФОРМАЦИИ
Процессы управления информацией:
• получение данных из внутренних и внешних источников;
• классификация данных по типам;
• хранение и извлечение данных;
• редактирование (или обновление) данных;
• контроль качества (удаление или исправление некорректных данных);
• презентация (трансформирование данных для определенной аудитории
потребителей);
• распространение информации для различных групп потребителей;
• оценка (полезности, а также соотношения цены/качества данных);
• обеспечение безопасности информации (например, аутентификация
данных от различных источников, назначение адекватного уровня
доступа; определение требований по аудиту; обеспечение механизмов
резервного хранения и восстановления).
ОБЩАЯ АРХИТЕКТУРА
ИНФОРМАЦИИ (ДАННЫХ)
ТИПЫ ПРИКЛАДНЫХ СИСТЕМ
ДОСТУПА К ДАННЫМ
Системы онлайновой обработки транзакций
(OLTP – Online Transaction Processing)
Системы он-лайновой аналитической
обработки (OLAP – Online Analitical Processing)
Системы управления неструктурированными
данными (контентом).
OLTP-СИСТЕМЫ
Применяются для выполнения критически важных, повседневных
операций.
Системы используются многими пользователями одновременно
для ввода, обновления и извлечения данных.
OLTP-системы способны выполнять атомарные бизнес-функции
и четко обозначенные единицы работ, в форме одной или
нескольких транзакций, выполняемых как одно целое.
•(например, транзакция "изменение адреса клиента").
OLAP-СИСТЕМЫ
Используются для анализа, планирования и управления получением
отчетов путем обеспечения интерактивного доступа к информации.
В OLAP-системах обычно обрабатываются агрегированные данные
Данные для OLAP-систем, как правило, извлекаются из
транзакционных OLTP-систем и помещаются или реплицируются в
специальные базы данных – хранилища или витрины данных.
Витрины данных являются специализированными хранилищами,
которые ориентированы на предоставление информации,
требующейся для бизнес-анализа на предприятии.
ОБЛАСТИ АРХИТЕКТУРЫ ДАННЫХ
• федеративные данные (метаданные);
• модели данных;
• системы управления базами данных;
• программное обеспечение промежуточного
слоя (middleware) для доступа к данным;
• механизмы доступа к данным;
• безопасность данных.
РЕКОМЕНДУЕМЫЕ ШАГИ СОЗДАНИЯ
АРХИТЕКТУРЫ ИНФОРМАЦИИ
Рекомендуемыми первыми шагами на пути
создания архитектуры информации являются:
• создание словаря данных и репозитория метаданных;
• выбор системы записи информации о каждом элементе
данных.
ПОСЛЕДУЮЩИЕ ШАГИ
• Создание оперативного хранилища данных (ODS –
Operational Data Store), которое обеспечивает
стандартные процессы извлечения, трансформации и
загрузки данных (ETL – Extract, Transform, Load), а
также очистки данных и создания метаданных.
• Оперативное хранилище – основа для повторного,
многократного использования данных, а в последующем – для
создания хранилищ и витрин данных.
РЕЗУЛЬТАТЫ РАЗРАБОТКИ
АРХИТЕКТУРЫ ИНФОРМАЦИИ
документированное описание существующих источников данных;
модели данных;
описание существующих и планируемых информационных
потоков, соответствующих интерфейсов, алгоритмов
преобразования или консолидации данных, а также необходимые
соглашения по уровню сервиса, связанного с передачей данных;
описание решений по организации хранения данных – от общих
каталогов до витрин и хранилищ данных;
используемые технологии и средства для преобразования и
управления данными.
ЦЕЛЬ РАЗРАБОТКИ МОДЕЛИ
ИНФОРМАЦИИ
• Цель разработки моделей информации и моделей
данных – создание графических представлений
потребностей организации и отдельных бизнес-процессов
в информации.
• Моделирование – основа для реорганизации бизнеспроцессов и конструирования новых прикладных систем,
описания взаимодействий и информационного обмена,
который происходит между организацией и клиентами,
партнерами.
УРОВНИ МОДЕЛИРОВАНИЯ
ИНФОРМАЦИИ
• На концептуальном уровне определяются высокоуровневые модели, описывающих
информационные потоки между функциональными подразделениями
организации в самом общем виде.
• На уровне логического описания модели информации и данных описывают
требования к информации в форме и терминах, понятных бизнес-пользователям.
•
Процесс моделирования на логическом уровне обеспечивает средства обнаружения,
анализа, определения, стандартизации и нормализации отношений между бизнеспроцессами и прикладными системами, идентификацию потоков информации и
соответствующих элементов данных, которые требуются организации.
•
Процессы, информационные потоки и элементы данных являются логическими фактами,
которые организация должна поддерживать для выполнения бизнес-операций.
•
Этот уровень анализа уже позволяет идентифицировать общие элементы данных, которые
используются разными организационными единицами и разными бизнес-процессами, что
позволяет уменьшить пересечения и конфликты между этими элементами.
УРОВНИ МОДЕЛИРОВАНИЯ
ИНФОРМАЦИИ
• На физическом уровне даются точные ответы на вопросы типа:
"Какие данные требуются для того, чтобы реализовать логику
бизнес-процесса соответствующей прикладной системой?",
"Сколько требуется различных информационных объектов
(сущностей)?", "Каков набор элементов данных каждой
сущности?".
• Физическая модель данных служит представлением того, как
данные, приведенные в логической модели, будут храниться в
системе управления базами данных.
СРАВНЕНИЕ МОДЕЛЕЙ
Концептуальная
Модель данных
Точка зрения
Реализация
данных
Бизнес-взгляд на ИТ ИТ-взгляд на бизнес ИТ-взгляд на ИТ
Фаза
Планирование
Анализ
Реализация
Рассматриваемые
связи
Связи данных с
бизнес-функциями,
интерфейсами,
технологиями
Связи данных с
другими данными
Связи данных с
системами хранения
Фокус
Сбор, обработка и
использование
данных
Структура данных
Объемы и степень
использования
данных
Модель/уровень
УПРАВЛЕНИЕ ФЕДЕРАТИВНЫМИ
ДАННЫМИ И МЕТАДАННЫМИ
ПРИНЦИПЫ ИНТЕГРАЦИИ
Скачать