Система кодирования

advertisement
АРХИТЕКТУРА
ИНФОРМАЦИОННЫХ СИСТЕМ
ЛЕКЦИЯ 7.
ИНФОРМАЦИОННЫЕ ХРАНИЛИЩА
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
• Б. Я. Советов, А. И. Водяхо, В. А. Дубенецкий, В. В.
Цехановский. Архитектура информационных систем:
учебник для студ. учреждений высш. проф. образования. М. : Издательский центр «Академия», 2012.
• А.В. Данилин, А.И. Слюсаренко. Архитектура предприятия.
М: ИНТУИТ, 2007 http://www.intuit.ru/department/itmngt/entarc/
УРОВНИ РАБОТЫ С ДАННЫМИ
Презентационный
уровень
Логический
уровень
Физический
уровень
• Уровень пользователей
• Уровень прикладных
программистов и
администраторов
• Уровень файловой системы и
системных программистов
СТРУКТУРА ИНФОРМАЦИОННОГО
ОБЕСПЕЧЕНИЯ
Под информационным обеспечением принято
рассматривать методы и способы представления
экономической информации, характеризующей состояние
управляемой системы.
При этом информационное обеспечение включает в себя:
• систему показателей данной предметной области;
• системы классификации и кодирования;
• документацию;
• структуру информационных потоков — варианты организации
документооборота;
• структуру информационных массивов различной степени
организации на машинных носителей.
СИСТЕМЫ КЛАССИФИКАЦИИ И КОДИРОВАНИЯ
ИНФОРМАЦИИ
Для размещения информации в ИС необходимо данные упорядочить (выполнить
классификацию), а затем формализовать (кодировать) с использованием
специальных справочников — классификаторов данных.
Классификатор — документ, с помощью которого осуществляется
формализованное описание экономической информации, содержащий
наименование классификационных группировок данных и их кодовое
обозначение.
Основными объектами классификация являются справочные реквизитыпризнаки, например, наименования материальных, трудовых, финансовых
ресурсов, основных средств, товаров и т.п.
К объектам классификации относят также другие виды информационного
обеспечения, например, наименования показателей и документов.
КЛАССИФИКАТОРЫ ИНФОРМАЦИИ
Классификация — процесс распределения
объектов заданного множества по описанному
множеству признаков.
Система классификации – совокупность правил
распределения объектов множества на отдельные
подмножества (классы).
ТИПЫ СИСТЕМ КЛАССИФИКАЦИИ
Существует две основных системы
классификации:
• Иерархическая
• Фасетная:
ИЕРАРХИЧЕСКАЯ СИСТЕМА
КЛАССИФИКАЦИИ
• Иерархическая система — между классификационными
группировками устанавливаются отношения подчинения,
последовательной детализации свойств типа:
Класс
Группа
Вид
ФАСЕТНАЯ СИСТЕМА
КЛАССИФИКАЦИИ
Фасетная (многоаспектная) система — система
классификации, основанная на параллельном
использовании нескольких независимых
признаков.
Фасет — набор значений одного признака
классификации.
• Каждый объект может входить одновременно в разные
классификационные группировки.
ТИПЫ КЛАССИФИКАТОРОВ
По охвату области применения классификаторы делятся на:
• общегосударственные классификаторы — разрабатываемые
централизовано и являющиеся едиными для всей страны. Например,
различные классификаторы статистической отчетности:
общегосударственный классификатор предприятий и организаций
(ОКПО), общегосударственный классификатор отраслей народного
хозяйства (ОКОНХ);
• отраслевые классификаторы — разрабатываемые для классификации
объектов в отдельных отраслях (план счетов бухгалтерского учета, виды
оплат и удержаний, виды операций движения средств);
• локальные классификаторы — разрабатываемые для обозначения
номенклатуры объектов, характерных для конкретного предприятия,
организации, банка (коды подразделений, клиентов, внутренних
документов и т.п.).
Для обеспечения единого подхода к классификации экономической информации
используют целый ряд классификаторов входящих в Единую систему классификации и
кодирования (ЕСКК).
КОДИРОВАНИЕ ИНФОРМАЦИИ
Кодирование — процесс условного буквенно-числового обозначения
объектам и их группам по соответствующей системе кодирования.
Система кодирования — совокупность правил присвоения условного
обозначения объектов с использованием кода.
Код (условное обозначение объекта) базируется на определенном
алфавите (множестве знаков).
Число знаков алфавита называется основанием кода.
Код характеризуется рядом дополнительных признаков: длина кода,
основание кода, структура кода (распределение знаков по признакам и
объектам классификации).
СИСТЕМЫ КОДИРОВАНИЯ
Системы кодирования можно разбить на
два класса:
• Регистрационные
• Классификационные
РЕГИСТРАЦИОННЫЕ СИСТЕМЫ
КОДИРОВАНИЯ
Регистрационные системы кодирования
независимы от применяемой системы
классификации объектов.
К регистрационным относятся порядковая и
серийная системы кодирования.
РЕГИСТРАЦИОННЫЕ СИСТЕМЫ
КОДИРОВАНИЯ
Порядковая система —
• состоит в последовательном присвоении каждому
новому объекту в системе его порядкового номера.
Серийная (серийно-порядковая) —
• отличается от порядковой предварительным разбиением
номенклатуры кодируемых объектов по одному признаку,
и для каждой группы должна быть введена серия кодовых
обозначений, в пределах которой выполняется порядковое
присвоение кода.
КЛАССИФИКАЦИОННЫЕ
СИСТЕМЫ КОДИРОВАНИЯ
Классификационные системы кодирования
применяются для отражения взаимосвязей
объектов и групп.
В качестве квалификационных систем
используются:
• Разрядная;
• Комбинированная.
КЛАССИФИКАЦИОННАЯ
СИСТЕМА КОДИРОВАНИЯ
Разрядная (позиционная) система используется для
кодирования объектов, определяемых несколькими
связанными признаками.
При разрядной кодировке классификационные
группировки по младшим признакам, кодируются в
зависимости от старшего признака.
Код объекта, построенный по данной системе,
включает столько количество позиций, сколько было
учтено классификационных признаков.
КЛАССИФИКАЦИОННЫЕ
СИСТЕМЫ КОДИРОВАНИЯ
Комбинированная система применяется для кодирования
больших номенклатур объектов.
Такие объекты включают множество связанных и
независимых признаков.
Система кодирования основана на сочетании принципов
разрядной, порядковой и серийной систем кодирования.
ШТРИХ-КОДЫ
Для автоматизации ввода значений числового кода в
информационную систему получили широкое
распространение системы штрихового кодирования.
В данном методе применяется принцип двоичного
кодирования информации с помощью 0 и 1.
• Штрих-код представляет собой набор чередующихся черных и белых
полос.
• Широким полосам присваивается значение 1, узким — 0.
СИСТЕМЫ ШТРИХОВОГО
КОДИРОВАНИЯ
Система штрихового кодирования — совокупность вида
штрихового кода, технических и программных средств
нанесения кода на поверхность, считывания кода,
верификации предварительной обработки данных.
Для унификации штриховых кодов используются
унифицированные системы кодирования:
•UPC — универсальный торговый код, разработан и применяется в США и ряде стран
Америки;
•EAN — товарный код, разработан в Европе;
•UCC/EAN — единый стандартизованный штриховой код; создан объединенными
усилиями организаций США и Канады (Uniform Code Council) и Европейской
ассоциацией товарной нумерации (EAN International).
ДОКУМЕНТАЦИЯ
Документом называется совокупность сведений,
используемая при решении задачи или задачи
управления, расположенная на материальном
носителе в соответствии с установленной
формой.
Документы являются основным средством для
учета, хранения и представления информации.
КЛАССИФИКАЦИЯ ДОКУМЕНТОВ
Классификация документов может быть
выполнена по ряду признаков:
• по области применения — плановые, статистические,
банковские, бухгалтерские и др.;
• по содержанию хозяйственных операций —
материальные, денежные, расчетные;
• по назначению — распорядительные, исполнительные,
комбинированные;
• по виду отражаемых операций — единичные и сводные;
• по периодичности — годовые, квартальные, месячные и
т.д.;
• по способу заполнения — ручные или машинные.
УНИФИКАЦИЯ ДОКУМЕНТОВ
Унификация документов и их форм выполняется путем
отбора видов документов, используемых в
информационной системе, и введение для них единых
форм:
• Унифицированная система документации (УСД) — рациональным
образом организованный комплекс документов, отвечающий единым
правилам и требованиям и содержащий необходимую информацию
для оптимального управления некоторым экономическим объектом.
ПРОЦЕСС РАЗРАБОТКИ ПЕРВИЧНЫХ
(ВХОДНЫХ) ДОКУМЕНТОВ
Процесс разработки первичных (входных)
документов включает последовательность:
• определение реквизитного состава документа;
• классификация реквизитов: однозначные и многозначные;
признаки и основания; справочные и группировочные;
• определение иерархии соответствия между реквизитами;
• выбор определенной формы документа;
• выполнение расчета размера документа и выбор формата
бумажного носителя;
• построение эскиза документа соответствующей формы;
• редактирование заголовочной части документа (шапки) в
соответствии со словарем-тезаурусом.
СТРУКТУРА ПЕРВИЧНЫХ
ДОКУМЕНТОВ
Для первичных документов применяют
комбинированную форму, состоящую из трех зон:
• заголовочная зона — предназначена для размещения
справочных признаков (наименование объекта управления,
номер и название документа и т.п.).
• содержательная зона — включает многозначные реквизиты,
группировочные признаки и признаки-основания.
• оформляющая зона — располагаются подписи должностных
лиц и другие признаки, устанавливающие юридическую силу
документа.
СТРУКТУРА ВЫХОДНЫХ
ДОКУМЕНТОВ
При построении форм выходных документов с
результирующей информацией используют принципы:
• выделение трех зон в документе;
• разделение реквизитов на однозначные, т.е. принимающие одно
значение в документе и многозначные, принимающие несколько
значений;
• выделение группировочных реквизитов и размещение этих
реквизитов в порядке убывания старшинства признака
группировки;
• выделение признаков-оснований и размещение их в таблице, в
порядке соответствующем порядку группировочных реквизитов;
• выделение строк с подведением итогов по группам.
ИНФОРМАЦИОННЫЕ ПОТОКИ
При проектировании информационной системы
существенное значение имеет изучение информационных
потоков, сложившихся в системе.
При рассмотрении информационных потоков в системе с
точки зрения пользователей особое значение имеет
документооборот.
ДОКУМЕНТООБОРОТ
Документооборот — последовательность прохождения документа от
момента создания до сдачи его в архив.
Электронный документооборот — документооборот, основанный на
автоматизации процессов создания, хранения и движения документов.
Основой систем электронного документооборота являются вычислительные
машины и коммуникационные сети.
Системы управления документооборотом предназначены для
автоматизации движения документов на предприятии, их обработки и
хранения.
ВНУТРИМАШИННОЕ
ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
В состав внутримашинного информационного обеспечения
включают файлы, базы и банки данных, базы знаний и т.п.
Данные записываются на различных машинных носителях
(магнитные диски, флэш-память, сетевые носители, компакт-диски,
магнитная лента и др.).
Требования, предъявляемые к данному виду информационного
обеспечения, — быстрота и надежность при выполнении операций
по поиску, обработке и представлению данных для пользователя.
Содержание включает в себя фактические сведения, относящиеся
к выбранной предметной области.
ИНФОРМАЦИОННАЯ БАЗА
Основной частью внутримашинного обеспечения является
информационная база — специальным образом
организованная совокупность данных, хранимая в памяти
компьютера в виде файлов.
Файл — совокупность однородных по структуре записей,
предназначенное для решения экономической задачи.
Запись — набор полей заданного формата.
ОРГАНИЗАЦИЯ ДОСТУПА К
ДАННЫМ
Для организации доступа к данным существуют
следующие способы организации
информационных баз:
• Совокупность локальных файлов, поддерживаемых
функциональными пакетами прикладных программ;
• Интегрированная база данных, основанная на использовании
универсальных программных средств загрузки, поиска и
обработки данных, т.н. системы управления базами данных
(СУБД);
• Веб-представительства и витрины данных.
БАЗЫ И БАНКИ ДАННЫХ
Банк данных — система специальным образом организованной
информации — баз данных, а также программных, технических,
языковых, организационно-методических средств, предназначенных для
обеспечения централизованного накопления и коллективного
использования данных.
В отличие от локально организованных массивов информации банки
данных являются интегрированной информационной системой,
решающей следующие задачи:
•сокращение избыточности в хранения информации;
•устранение противоречивости в данных;
•совместное использование информации в решении большого круга задач;
•удобства организации доступа к данным;
•обеспечение безопасности хранения данных;
•снижение затрат на хранение данных и поддержание в актуальном состоянии;
•обеспечение независимости данных от изменяющихся внешних условий.
БАЗА ДАННЫХ
Ядром БнД является информационная компонента —
база данных.
База данных (БД) — именованная совокупность данных,
отражающая состояние объектов и их отношений в
рассматриваемой предметной области.
В общем случае данные в базе данных являются
интегрированными и общими.
СОСТАВ БАЗЫ ДАННЫХ
• В состав базы данных входит также метаинформация (т.е.
информация об информации), включающая описание базы
данных (схема БД), информацию о предметной области,
необходимую для проектирования системы, о пользователях БнД,
о проектных решениях и др.
• Программные средства БнД представляют собой комплекс
программ и программных модулей, обеспечивающий
взаимодействие всех частей информационной системы при ее
функционировании.
• Приложения базы данных — программы и программные модули,
с помощью которых пользователь выполняет операции с БД.
СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ
ДАННЫХ
Система управления базами данных (СУБД) — совокупность
языковых и программных средств, предназначенных для
создания, ведения и совместного использования БД многими
пользователями.
Основная функция, выполняемая СУБД — предоставление
пользователю базы данных возможности работать с ней, не
вникая в детали на уровне аппаратного обеспечения.
СТРУКТУРА СУБД
В СУБД можно выделить ядро СУБД, обеспечивающее
организацию ввода, обработки и хранения данных, а также
средства тестирования и утилиты, обеспечивающие выполнение
вспомогательных функций.
Важной компонентой СУБД являются трансляторы или компиляторы
для используемых ею языковых средств.
Языковые средства должны обеспечить интерфейс пользователей и
прикладных приложений разных категорий с банком данных.
Языковые средства большинства СУБД относятся к так называемым
языкам четвертого поколения.
СРЕДСТВА СУБД
В качестве технических средств БнД чаще всего используются
универсальные ЭВМ, периферийные устройства для вывода информации в
базу данных и отображения выводимой информации.
Организационно-методические средства представляют собой различные
инструкции, методические и регламентирующие материалы,
предназначенные для пользователей разных категорий, взаимодействующих
с банком данных.
Администратор БнД — лицо, определяющее правила манипулирования
данными в БД, устанавливает доступ различных пользователей к различным
участках информационной базы.
Пользователь БнД — лицо, выполняющее операции по вводу информации в
БД, запуск различных модулей обработки данных, вывода информации в
электронном виде или на бумажных носителях.
СИСТЕМА УПРАВЛЕНИЯ БАЗАМИ
ДАННЫХ
Прикладное
программное
обеспечение
СУБД
Данные
Настольные:
MS Access, MS FoxPro, ...
Промышленные:
Oracle, MS SQL Server,
PostgreSQL, ...
МОДЕЛИ ДАННЫХ
Файловая
Сетевая
Иерархическая
Реляционная
Объектная и объектно-реляционная
ФАЙЛОВАЯ МОДЕЛЬ
Первая модель, используемая при разработке ИС
•Модель без СУБД
Недостатки:
•Дублирование данных
•Проблема совместимости форматов
файлов
•Изменение структуры данных приводило к
изменению ПО
СЕТЕВАЯ МОДЕЛЬ
Базовые элементы:
•элемент данных – минимальная информационная единица, доступная пользователю
•агрегат данных:
•<город, улица, дом, квартира> → Адрес (агрегат типа «вектор»)
•<месяц, сумма> → Зарплата (агрегат типа «повторяющаяся группа»)
•запись – совокупность агрегатов или элементов данных, отражающих некоторую
сущность предметной области
•<Фамилия, Зарплата> → Зарплата сотрудника
•тип записей – совокупность подобных записей, моделирует некоторый класс реального
мира
•набор – двухуровневая иерархическая структура, содержащая запись-владельца и
записи-члены
ИЕРАРХИЧЕСКАЯ МОДЕЛЬ
Базовые элементы:
• поле – минимальная, неделимая единица данных,
доступная пользователю
• тип поля – совокупность полей одного типа
• сегмент (запись) – совокупность экземпляров полей
• тип сегмента – совокупность входящих в него типов полей
РЕЛЯЦИОННАЯ МОДЕЛЬ
• Экспериментальный проект компании IBM System R, язык
SQL
• Создатель Эдгар Кодд
• Примеры: CУБД INGRES, Oracle, MS SQL Server, Visual FoxPro,
MS Access, MySQL, Paradox, Interbase
ОБЪЕКТНАЯ И ОБЪЕКТНОРЕЛЯЦИОННАЯ МОДЕЛИ
Преодоление несоответствия между типами данных,
используемыми в языках программирования, и типами
данных, поддерживаемыми в SQL-ориентированных СУБД
• Возможность хранения в БД данных произвольно сложной структуры
• Ограниченность реляционной модели данных и языка SQL и потребности
использовать более развитые модели данных
• База данных – это набор объектов (контейнеров данных) произвольного
типа
• Литеральные и объектные типы данных
Появление объектно-реляционных продуктов ведущих
компаний-поставщиков SQL-ориентированных СУБД (Informix
Universal Server, Oracle8, IBM DB2 Universal Database)
Download