2. ВВЕДЕНИЕ В МОДЕЛИРОВАНИЕ ИНФОРМАЦИИ 2.1 Классификация моделей данных "разделяй и властвуй"

advertisement
2. ВВЕДЕНИЕ В МОДЕЛИРОВАНИЕ ИНФОРМАЦИИ
2.1 Классификация моделей данных
Проектирование сложных систем основано на принципе "разделяй и властвуй": сложная задача
делится на несколько более простых; они, в свою очередь, могут быть разделены на еще более
простые и т.д. до тех пор, пока каждая отдельная задача не станет обозримой и поддающейся
решению. Составные части сложной задачи образуют иерархическую структуру, на каждом уровне
которой описание задачи содержит новые детали. В соответствии с указанным принципом процесс
разработки ЭИС можно рассматривать как процесс все более точного описания системы: сначала
выясняются требования к системе со стороны пользователей, затем эти требования описываются с
помощью формальных и неформальных языков и моделей и, наконец, подбирается техническое и
системное программное обеспечение, в среде которого создаются прикладные программы и базы
данных. В этом процессе важно сохранить правильное и непротиворечивое (целостное)
представление системы при переходе от одного вида описания к другому.
Представим себе информационную систему в виде фабрики, в которой сырьем, продуктом и
инструментом обработки является информация. Информация имеет двоякую природу: фактуальные
знания (осмысленные данные) и операционные знания (правила обработки информации,
основанные на общих зависимостях между фактами). Например, сведения о том, что Цена товара =
20 руб., а Количество товара = 300 кг., относятся к фактуальному знанию; в то время как формула
расчета “Стоимость товара = Цена * Количество “ - это операционное знание. Сырьем и продуктом
нашей “фабрики” являются фактуальные знания, а инструменты и “станки” представляют собой
операционные знания, которые обычно реализуются в виде программ.
При разработке ИС требуется описать оба вида знаний об информации. Для этого на разных этапах
разработки ИС применяют различные информационные модели, которые представляют собой
формальные или полу формальные способы для описания знаний об информации. На рис.2.1
показана классификация информационных моделей.
Рис. 2.1
На начальном этапе создания ИС выявляют самые общие закономерности строения, изменения и
обработки экономической информации в конкретной предметной области. Совокупность этих знаний
называют концептуальной моделью (информационно-логической, инфологической моделью)
предметной области. Данная модель является самой общей моделью разрабатываемой
информационной системы; она не зависит от программно-аппаратной платформы ИС и
предназначена для конечных пользователей и системных аналитиков. Обычно концептуальную
модель представляют в виде трех компонентов: объектного, функционального и поведенческого.
Объектная модель - это описание структуры предметной области в виде совокупности
взаимосвязанных объектов (состав объектов, их свойства и связи). Элементарной единицей
структурного знания является факт, описывающий одно свойство или одну связь, который
представляется в виде триплета:
предикат ( Объект, Значение ),
например: профессия (Иванов, экономист) - описание свойства объекта “Иванов”; работает (Иванов,
Бухгалтерия) - описание связи между объектами “Иванов” и “Бухгалтерия”.
К типовым связям относят связи “род - вид”, “целое - часть”, “причина - следствие”, “цель - средство”,
“функция - аргумент”, “ассоциация”, “хронология”, “пространственное положение” и др. Для описания
объектной модели применяют диаграммы потоков данных (Data Flow Diagrams, DFD), диаграммы
структур данных (Data Structure Diagram, DSD) и диаграммы "сущность - связь" (Entity - Relationship
Diagrams, ERD).
Функциональная модель описывает действия над объектами и методы их преобразования. В
качестве единицы этого вида информации определяют функциональную зависимость фактов: факт В
имеет место только тогда, если имеет место конъюнкция фактов А1, А2, ...Аn:
A1 ^ A2 ^ ... ^ An => B.
Функциональная зависимость между фактами возникает как отражение причинно-следственных,
логических и арифметических зависимостей между реальными объектами.
Функциональная модель строится путем последовательной декомпозиции целей ИС и представляется
графически в виде дерева целей. Кроме того, для описания функций ИС применяют функциональные
диаграммы (Structured Analysis and Design Technique, SADT).
Поведенческая модель отражает изменение состояния объектов в результате некоторых событий.
Состояние объекта в какой - либо момент времени описывается набором значений его свойств.
Поведение объекта описывается в виде набора действий, связанных с событиями в предметной
области. Для описания поведения ИС применяют событийные графы и матрицы, диаграммы потоков
событий.
На следующем этапе создания ЭИС (проектирование реализации ИС) выбирается формальный метод
представления знаний и в его рамках проектируется логическая структура информационного
обеспечения ИС.
В интеллектуальных информационных системах применяют различные модели знаний, которые
отличаются характером представления объектного, функционального и поведенческого видов знаний.
Моделью знаний называют совокупность средств структурирования и обработки единиц знаний. В
настоящее время известны следующие модели знаний:
•логическая модель описывает объекты и операции над ними в виде предикатов первого порядка,
является строго формальной, применяет метод логического вывода новых знаний “от цели к данным”;
•продукционная модель описывает знания в виде набора фактов и правил вида “если - то”,
позволяет учитывать неопределенность знаний, использует эвристические правила вывода;
•семантическая сеть описывает знания в виде бинарных типизированных отношений между
объектами и наглядно изображается в виде графа (вершина - объект, дуга - связь между двумя
объектами);
•фреймовая модель - это семантическая сеть с N-арными отношениями между объектами и
присоединенными процедурами, которые реализуют операционные знания;
•объектно-ориентированная модель является дальнейшим развитием фреймовой модели, она
предусматривает инкапсуляцию процедур в структуру объектов и распространяет наследование
свойств на эти процедуры (полиморфизм процедур).
В обычных ИС операционные и поведенческие знания реализуются в виде программ, а объектные
знания - в виде базы данных. Для описания структуры БД применяют ту или иную модель данных совокупность правил структурирования данных, правил выполнения операций над ними, а также
ограничений целостности БД, которые описывают допустимые связи и значения данных, допустимые
последовательности их изменения.
Выделяют несколько типов формальных моделей данных. В настоящее время наиболее широко
применяют реляционную модель данных, основанную на теории отношений. Кроме того, исторически
сложились и применяются “дореляционные модели”: сетевая, иерархическая, инвертированные
списки и др.; разрабатываются и новые модели: постреляционные, многомерные, объектнореляционные и др.
Для описания логики работы программ, их структуры, их взаимодействия с данными и друг с другом
применяют схемы программ, схемы структуры программ, схемы данных, схемы взаимодействия
программ. Правила изображения этих схем описаны государственными стандартами ЕСПД [ ГОСТ
19.701-90. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила
выполнения].
На этапе физического проектирования логическая структура базы данных или базы знаний
отображается на физических носителях информации, а также производится разработка и отладка
программ. На этом этапе используются модели представления информации на физическом уровне:
физические и логические записи, файлы, указатели, индексы и т.п. В настоящее время
инструментальные средства разработки ИС позволяют практически полностью автоматизировать
процесс физического проектирования структуры данных и во многом автоматизируют процесс
разработки прикладных программ.
2.2. Единицы информации. Экономические документы и их структура
Состав документов, которые обрабатываются ИС, определяется на этапе формулировки требований к
ЭИС. При этом могут использоваться формальные модели типа DFD, а может быть составлен и
простой перечень входных и выходных документов. В любом случае после определения состава
документов необходим их анализ, чтобы определить, как же информация об объектах предметной
области будет отображается в ИС.
Пусть, например, требуется хранить сведения о деталях, поступивших на склад. Как объект реального
мира - деталь - будет отображена в базе данных? Для того чтобы ответить на этот вопрос, необходимо
знать, какие свойства детали будут необходимы для работы ИС. Среди них могут быть название
детали, ее вес, размер, цвет, дата изготовления, материал, из которого она сделана и т.д. Состав этих
свойств зависит от решаемых системой задач. Значения этих свойств объектов являются единицами
информации, и именно они хранятся в БД.
Каждый документ, как правило - это свидетельство какого-либо события реальной жизни, в процессе
которого взаимодействуют два или несколько объектов. Например, Приходный ордер отображает
факт поступления товара на склад, поэтому он содержит названия этих объектов и другие их свойства
(количество, цена товара, номер склада, ФИО кладовщика, сведения о поставщике товара), дату
события. То есть приходный ордер отображает взаимодействие таких объектов, как товары, склад,
поставщик товаров.
Целью анализа документов является выявление актуальных, существенных для ИС свойств объектов
и их группировка по смыслу.
Отдельные поля документа называют "реквизитами". Каждый реквизит отображает одно свойство
какого-либо объекта, имеет имя и значение. Множество всех допустимых значений реквизита
называется областью определения. Реквизиты делятся на два вида:
•признаки, которые определяют обстоятельства события (место, время, действующих лиц, единицы
измерения, номера документов и т.п.);
•основания, которые определяют количественные свойства объектов или процессов (цена, количество,
сумма, вес и др.).
Реквизит является элементарной единицей информации. Они могут группироваться и образуют
составные единицы информации (СЕИ), среди которых особо выделяют экономический показатель элементарный осмысленный фрагмент документа, содержащий один атрибут - основание и ряд
логически связанных с ним признаков П (О, Р1, Р2,….Рn). Минимальный набор атрибутов показателя
включает основание, имена объектов, участвующих в процессе, и время действия. Для наглядного
изображения логических и расчетных связей между показателями и для показа последовательности их
расчета применяют граф взаимосвязи показателей, в котором вершины соответствуют показателям, а
дуга идет от П1 к П2, если при расчете П2 используется основание П1.
Пример. На рис.2.2 показан примерный вид приходного ордера. Выделим признаки, снования и
показатели. Признаки: Номер ордера, Дата, Наименование п.п, Адрес, Код поставщика, Ном.№, Наим.
Товара.
Рис.2.2. Общий вид экономического документа
Наименование п.п. АО РУБИН
Адрес: Пенза, пр.Байдукова,5
Код поставщика
34
Номенкл. №
Наименование товара
Цена (тыс. руб)
Количество
Сумма
11
22
ПК
Бумага
5.
0.1
2
20
10
2
ИТОГО:
ПРИХОДНЫЙ ОРДЕР № 123 от 1.09.98
12
Основания: Цена, Кол., Сумма, Итог.
Показатели: П1 (Кол., Номер ордера, Дата, Ном. №)
П2 (Цена, Ном. номер, Код поставщика, Дата)
П3 (Сумма, Номер ордера, Дата, Ном. №)
П4 (Итог, Номер ордера, Дата).
Расчетные формулы, отражающие связь оснований показателей:
Сумма = Цена * Кол
Итог =
,
где n - количество строк в таблице приходного ордера.
Рис.2.6а. Граф взаимосвязи показателей
Таким образом, анализ документов проводят в следующем порядке:
•Анализ структуры документов, выделение существенных признаков, оснований, показателей.
•Выявление взаимосвязей между показателями, запись расчетных формул.
•Построение графа взаимосвязи показателей.
После этого начинается следующий этап: определение структур данных, хранящихся в базе данных.
Для этого чаще всего применяют диаграммы структуры данных (DSD) и ERD-диаграммы.
Download