міністерство освіти і науки україни национальна металургійна

реклама
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
НАЦИОНАЛЬНА МЕТАЛУРГІЙНА АКАДЕМІЯ УКРАІНЫ
РОБОЧА ПРОГРАМА,
методичні вказівки і завдання для контрольних робіт
до вивчення дисципліни «Системний аналіз інформаційних процесів» для
студентів напряму 6.020100-культура
Затверждено
на засіданні Вченої ради
академії
Протокол № _ от
Дніпропетровськ НМетАУ 2013
УДК 669.168
Робоча програма, методичні вказівки і завдання для контрольних робіт до
вивчення дисципліни «Системний аналіз інформаційних процесів» для
студентів напряму 6.020100-культура /Уклад. В.І. Кузнецов, Г.Л. Євтушенко. Дніпропетровськ: НМетАУ, 2013 – 74 с.
Містяться робоча програма дисципліни «Системний
аналіз інформаційних процесів» з коротким викладом
змісту її розділів і методичними вказівками з вивчення
навчального матеріалу, а також завдання до контрольної
роботи, на основі якої студент освоює основні питання
дисципліни такі, як основи теорії систем, системний
підхід
і
системний
аналіз,
загальна
методологія
системних досліджень, системний аналіз та прийняття
рішень; метод аналізу ієрархій, методи: зважених сум,
матриці рішень, інші методи; інформаційно-аналітичні
системи та системи підтримки рішень.
Призначені
для
студентів
напряму
6.020100-
культура заочної форми навчання.
Друкується за авторською редакцією.
Укладачі:
В.І. Кузнецов, канд. техн. наук, доц.,
Г.Л. Євтушенко, асистент.
Відповідальний за випуск О.І. Михальов, д-р техн. наук, проф.
Рецензент
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .............................................................................................................. 4
1. ОБЩИЕ МЕТОДИЧЕСКИЕ УКАЗАНИЯ ........................................................ 5
2. РАБОЧАЯ ПРОГРАММА И МЕТОДИЧЕСКИЕ УКАЗАНИЯ ..................... 6
2.1. Основы системных наук ............................................................................. 6
2.1.1. Основы теории систем; структура системных наук ............... 6
2.1.2. Системный подход ................................................................... 17
2.1.3. Системный анализ .................................................................... 21
2.1.4. Математическое моделирование в системном анализе ........ 26
2.2. Методы анализа систем и проблем ......................................................... 36
2.2.1. Системный анализ и принятие решений; количественный
анализ решений ............................................................................................... 36
2.2.2. Метод анализа иерархий .......................................................... 42
2.2.3. Метод взвешенных сумм и его аналоги ................................. 49
2.2.4. Методы матрицы решений и дерева решений....................... 52
2.3. Информация и экспертные знания в системном анализе ..................... 56
2.3.1. Основы семантической теории информации ......................... 56
2.3.2. Вербальный анализ решений................................................... 65
2.4. Прикладной системный анализ ............................................................... 70
2.4.1. Информационно-аналитические
системы
и
системы
поддержки решений ........................................................................................ 71
2.4.2. Информационные технологии в системном анализе: OLTP,
OLAP, Data Mining .......................................................................................... 80
3. КОНТРОЛЬНАЯ РАБОТА ............................................................................... 88
3.1. Теоретическая часть.................................................................................. 88
3.2. Практическая часть ................................................................................... 88
ВЫВОДЫ ............................................................................................................... 92
РЕКОМЕНДОВАННАЯ ЛИТЕРАТУРА ............................................................ 93
3
ВВЕДЕНИЕ
К настоящему времени вполне сформировался взгляд на системный
анализ как комплексную дисциплину, объектом которой являются
целенаправленные эргативные (человеко-машинные, организационнотехнические, информационные) системы, предметом – проблемы, связанные
с моделированием, анализом, проектированием и модернизацией таких
систем. Основное внимание системного анализа при таком подходе
концентрируется
на
структурировании
проблем
и
принятии
многокритериальных решений, часто – с учетом неопределенностей и
субъективных факторов (предпочтений, экспертных знаний). При таком
«структурно-операционном подходе» системный анализ выступает как
развитие и «расширение» исследования операций. Кратко, хотя и неполно
это можно выразить формулой: «системный анализ – это исследование
операций плюс набор неформальных методов». И, конечно, информационные
технологии: как информационные технологии для системного анализа, так и
системный анализ для них.
Этот подход предложен в работах Н.Н. Моисеева и получил развитие в
многочисленных научных работах, в учебниках. В ряду таких учебных
изданий следует отметить вышедшие в последние годы в Украине учебники
по системному анализу М.З. Згуровского и Н.Д. Панкратовой, А.В. Катренко,
К.А. Сороки.
В соответствии с действующим государственным образовательным
стандартом дисциплина «Системный анализ информационных процессов»
является обязательной для студентов направления 020100 «Культура» (ДИ) и
входит в цикл дисциплин естественнонаучной подготовки.
Основные требования к выполнению контрольной работы: в момент
приезда студента на экзаменационную сессию он должен иметь конспект
дисциплины, выполненную и зачтённую контрольную работу. Если
контрольную работу не зачтено, то студент не допускается к экзамену.
4
1. ОБЩИЕ МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Учебная дисциплина «Системный анализ информационных процессов»
является обязательной и входит в цикл дисциплин естественнонаучной
подготовки.
Цель изучения дисциплины – усвоение знаний и приобретение
навыков, необходимых для решения задач при анализе информационных
процессов.
В результате изучения дисциплины студент должен:
знать теоретические основы системны наук, основные методы
системного анализа, применение информационных систем и технологий в
системном нализе и синтезе.
уметь самостоятельно делать постановку (структурирование)
системной проблемы; применять алгоритмы методов анализа решений;
пользоваться
программными
средствами
системного
анализа
и
проектирования; анализировать и интерпретировать полученные результаты.
Для успешной сдачи экзамена по дисциплине необходимо: проработать
вопросы контрольной работы, подготовиться к экзамену по вопросам
дисциплины.
Связь с другими дисциплинами: дисциплина является начальной при
подготовке бакалавров направления «Культура». Навыки и умения этой
дисциплины применяются в таких дисциплинах, как «Информационноаналитическая деятельность», «Аналитико-синтетическая переработка
информации» и др.
Приобретенные знания и умения используются при дипломном
проектировании.
5
2. РАБОЧАЯ ПРОГРАММА И МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Рабочая программа для изучения дисциплины «Системный анализ
информационных процессов» для студентов заочной формы обучения
направления 020100 «Культура» представлена в таблице 2.1.
Таблица 2.1. Распределение учебных часов и формы контроля
Всего часов по учебному плану, в том числе:
Аудиторные занятия, из них:
Лекции
Лабораторные работы
Практические занятия
Семинарские занятия
Самостоятельная работа, в том числе при:
Подготовке к аудиторным занятиям
Подготовке к контрольным мероприятиям
Изучение разделов программы, которые не
рассматриваются на лекциях
2.1.
144
64
32
0
32
0
80
32
36
12
Основы системных наук
2.1.1. Основы теории систем; структура системных наук
Введение: системный взгляд на мир
Характерными свойствами окружающего нас мира (в особенности мира
современной
человеческой
цивилизации)
являются
сложность,
взаимозависимость, изменчивость. При этом и
сложность, и
взаимозависимость, и изменчивость постоянно возрастают, порождая всё
новые проблемы. Весьма удивительно, что окружающий нас мир существует,
причём довольно долго, развивается в целом прогрессивно, в сторону
усложнения. Эта проблема осознана ещё с середины XIX века, когда были
созданы две фундаментальные науки, - термодинамика (Клаузиус) и теория
эволюции (Дарвин), - выводы которых противоречили друг другу. Согласно
классической термодинамике, теоретической науке, основанной на
фундаментальных принципах, мир должен развиваться регрессивно, в
сторону упрощения, приближаясь в пределе к состоянию теплового
равновесия. Теория эволюции, наоборот, убедительно доказывает
6
прогрессивное развитие живой природы Земли, что подтверждается
данными, например, палеонтологии. Да и развитие человечества (особенно –
техники, технологий от каменного топора к мобильному телефону
спутниковой связи) свидетельствует об усложняющемся развитии,
сопровождающемся, к сожалению, всё возрастающими рисками,
опасностями, кризисами.
Ответ на вопросы возникновения, существования, развития, структуры
систем в рамках классических наук дают теория систем и теория
самоорганизации (синергетика). Применением основных принципов и
результатов этих наук к исследованию и проектированию сложных
искусственных систем занимается системный анализ
на основе так
называемого системного подхода. Более точные определения терминов
системных наук будут даны ниже.
Системный анализ – комплексная, синтетическая дисциплина.
Системный анализ учит широко и объективно мыслить, «разбирать»
сложные проблемы, синтезировать рациональные, правильные решения.
Системный аналитик должен быть эрудированным и объективно
мыслящим человеком, хорошо владеющим как методами собственно
системных наук, так и основными знаниями в предметной области, которую
анализирует. Например, в области информационных систем и технологий,
или в металлургии, или – космической техники, или – бизнес-процессов…
Системных аналитиков иногда называют генералистами в
противоположность «узким» специалистам. В любом достаточно сложном
деле, комплексном проекте нужны и те и другие. Крайне желательно при
этом, чтобы специалист, даже самый узкий, использовал системный подход и
владел системными методами в решении своих задач. А генералист
(руководитель, системный аналитик, проектант, эксперт) просто обязан это
делать, разбираясь при этом и в предметной области. На практике пока это,
увы, не всегда так, имеется много примеров узкого, своекорыстного подхода
к решению сложных проблем, что вместо решения порождает проблемы ещё
более сложные и неприятные. Наш краткий курс будет иметь три
составляющих.
Первая – общенаучная. Изучим современную структуру системных
наук, основные понятия, проблематику, задачи.
Вторая составляющая – методологическая (методология – это набор
согласованных методов исследования, решения задач). Изучим методы
системного анализа, понимаемого как а) анализ систем и б) анализ проблем.
7
Третья составляющая – практическая. Это решение
некоторых
системных задач. В основном (из-за дефицита времени) ограничимся
задачами
структурирования и многокритериального выбора, которые,
собственно говоря, и составляют «сердцевину», специфику системного
анализа.
Системный подход и системный анализ – мощные инструменты
упорядочения и эффективного использования знаний, опыта, интуиции
руководителей, экспертов, специалистов, да и современно образованных
людей в вопросах постановки целей и решения сложных проблем. Проблем
самого различного характера.
Основные понятия и определения
Самое основное, первичное здесь, конечно же, – система. В
математике первичным понятием является понятие множества или
совокупности.
Определение 1. Множество – это объединение в единое целое вполне
определённых, различаемых элементов (математических объектов: точек,
прямых, уравнений, операторов, элементов групп и т.д.). Множество задаётся
либо перечислением его элементов, либо указанием правила, определяющего
их [Толковый математический словарь].
Система – это тоже совокупность объектов любой природы
(называемых также элементами, компонентами), но не любая, не «абы
какая». Система как совокупность определяется не правилами, а свойствами.
Примеры систем: организм, автомобиль, компьютер, Интернет,
предприятие, государство. Ещё примеры: наука (система знаний и методов),
система международного права, информационно-аналитическая система.
Примеры «несистем» (кластеров): куча кирпичей, деталей, толпа,
пассажиры в трамвайном вагоне.
Мы видим, что системы могут быть весьма разнообразными.
Разнообразны принципы их классификации.
Так, по происхождению системы делятся на:
- естественные (природные): Солнечная система, биосфера Земли,
животное, растения;
- искусственные (технические);
- искусственные (абстрактные);
- комплексные (сочетание в одной системе нескольких типов).
8
Хорошим примером комплексной системы является компьютер с
программным обеспечением («железо» и софт).
Позже мы уточним классификацию, а пока определим то главное, что
отличает любую настоящую систему.
У всех объектов, образовавших систему, есть хотя бы одно свойство,
которое нельзя получить простым сложением или усреднением свойств
самих объектов.
У большинства систем таких свойств несколько или много.
Определение 2. Свойство совокупности объектов любой (в том числе –
различной) природы, которое не является суммой или средневзвешенный
свойств этих объектов и при этом является свойством более высокого
организационного порядка (более негэнтропийным – поясним позже), чем
свойства объектов называется интегративным свойством.
Часто используются равнозначные термины: эмерджентность
(эмергентность), эмерджентное свойство [Жилин, Перегудов и Тарасенко].
Integral – здесь нечто целое, неотъемлемое, существенное, цельное.
To emerge – появляться, возникать, проявляться.
Определение 3. Совокупность объектов, обладающая интегративным
свойством, называется системой [Жилин].
В литературе существует много (десятки!) определений системы. На
наш взгляд определения 2 и 3 дают наиболее компактное, цельное
(системное!) определение системы. Потому, что все другие определения
возникают из них как следствия, остановимся на них (следуя принципу «не
умножения сущностей без необходимости» - такт называемому принципу
«бритвы Оккама»).
Это сравнительно недавно выкристаллизованное
определение системы удивительным образом совпадает с утверждением
(ещё!) Аристотеля: «Целое больше своих частей».
Чтобы быть эмерджентной, обладать
интегративным свойством,
система должна иметь некоторую структуру, то есть набор (состав) своих
элементов и (главное!) взаимосвязи между элементами.
Определение 4. Система со сложным, автономным, неочевидным
поведением называется сложной системой.
Как правило, сложная система состоит из многих элементов, имеет
сложную структуру с разнообразными связями. Это иногда рассматривается
как определение сложной системы. Удивительно (есть примеры), что
сложное поведение могут демонстрировать и весьма простые по составу и
9
структуре системы. Согласно нашему определению, мы их также будем
называть сложными системами.
Определение 5. Система, состоящая из большого числа элементов,
называется большой системой.
Большая система часто, но не обязательно является сложной. Это
зависит от цели рассмотрения. Так, все материальные тела состоят из
огромного количества атомов, но далеко не всегда рассматриваются как
«большие системы из атомов». Сложность системы определяется в первую
очередь сложностью и разнообразием связей. В этой связи (простите за
тавтологию) дадим ещё два определения.
Определение 6. Элементом (компонентом) системы назовём
некоторый объект (материальный, абстрактный), который обладает
свойством или свойствами, важными для рассматриваемой проблемы, но
внутреннее строение его в рамках этой проблемы можно не рассматривать.
Грубо говоря, это «чёрный ящик» - но только в рамках данного
исследования, в рамках другой проблемы наш элемент может быть системой
(подсистемой). А наша система может в свою очередь быть подсистемой
более крупной системы – надсистемы. Например, вуз – это подсистема
системы высшего образования, мировая экономика – надсистема для
экономики национальной. Надсистему называют также вмещающей
системой.
Определение 7. Связь – это важный для целей рассмотрения обмен
веществом, энергией или информацией между элементами системы, или
между системой и внешней средой. Связью будем также называть
материальный канал такого взаимодействия (например, провод, оптическое
волокно, электромагнитное поле). Связи присоединяются к элементам через
входы и выходы.
Различие между элементом и связью (как каналом взаимодействия):
связь только передает нечто, а элемент это нечто (вещество, энергию,
информацию) существенно перерабатывает. Общее название элементов и
связей: звенья системы.
Теперь мы можем дать развёрнутое определение системы (это –
расширение определения 3).
Определение 8. Система – это совокупность элементов (объектов,
компонентов, звеньев), обладающая следующими признаками:
10
а) связями, позволяющими посредством переходов по ним от элемента
к элементу соединить два любых элемента совокупности (то есть систему
можно представить связным графом – графом связей);
б) интегративным (эмерджентным) свойством,
- назначением,
функцией, поведением, - отличным от свойств элементов и не являющимся
суммой (объединением) или средневзвешенным свойств отдельных
элементов [Губанов и др., Жилин].
Признак а) называют связностью системы, признак б) – функцией
системы. Указание элементов, связей и эмерджентных свойств (функций)
конкретной системы называется описанием (заданием) системы по
определению.
Структура системной науки
Для того чтобы предсказывать, прогнозировать свойства систем,
оптимизировать их, управлять ими необходимо владеть некоторым
инструментарием (набором знаний и методов). Этот инструментарий
создаётся комплексом системных наук, который можно назвать «системикс»
(systemics, по аналогии с economics – комплексом наук по экономике). Мы
чаще будем использовать термин «системная наука» - для обозначения
всего комплекса системных наук. В него входят три «базовых» науки: теория
систем (системология), системный анализ, системотехника (системный
синтез). Смежные науки: кибернетика, исследование операций, синергетика,
теория информации и информатика, искусственный интеллект.
Грамотное применение этого инструментария приносит плоды в
фундаментальных науках (экономика, экология, социология и даже история),
в прикладных науках и технологиях – особенно в информационных. В свою
очередь, компьютеры и информационные технологии создают возможности
для практического решения системных проблем практически во всех сферах
человеческой деятельности. Поскольку системы и системные проблемы
вездесущи, овладение инструментарием системных наук, развитие
системного взгляда на мир, выработка системного подхода к решению
проблем будут полезны любому человеку (особенно молодому), специалисту,
конечно – руководителю.
Системная наука («системикс») – сравнительно молодая наука. Она
начала складываться в XX-м веке и продолжает активно развиваться.
Конечно же, донаучный период системных знаний и практики очень
велик. Каждая наука имеет свой донаучный период. Люди (в первую
11
очередь – руководители и советники) всегда сталкивались с необходимостью
решения проблем государственных, экономических, военных. Решение этих
проблем сводилось к анализу сложной ситуации, формированию и изучению
альтернативных вариантов решения проблемы, выбору лучшего,
оптимального (по мнению решающего) варианта и выработке мер по
реализации этого варианта. Вот, кстати, основные этапы системного анализа
проблемы – они ещё от древних.
Но история системных наук короче многих других. Становление
математики началось задолго до нашей эры (от египтян и вавилонян до
Евклида), естественных наук – в XVII-м веке (Галилей, Ньютон). А
становление системных наук – это XX-й век, хотя предпосылки были ещё у
древних (как примеры - греки Аристотель и Плутарх, китайский историк
Сыма Цянь). Создателей системной науки в современном виде (как
формализованной системы знаний с методологией и математическим
аппаратом) много. Это - А.А Богданов («Тектология»), Людвиг фон
Берталанфи. Наши современники: М. Месарович, Я. Такахара, Дж.
Форрестер, Д. Медоуз, Т.Л. Саати, Р. Аккофф, Дж. Клир, П.Б. Чекленд.
Отечественные учёные: Н.Н. Моисеев, В.М. Глушков, Н.П. Бусленко, О.И.
Ларичев. Ведущие международные организации: Международный институт
прикладного системного анализа, Римский клуб. Правительства и большие
корпорации имеют аналитические центры со штатом системных аналитиков,
информационно-аналитическим обеспечением.
Колоссальным стимулом к развитию системной науки и смежных
дисциплин стала научно-техническая революция: разработка в середине XXго века ракетно-космических систем, атомной техники, электронных
вычислительных машин. В свою
очередь ЭВМ (компьютеры) стали
основным инструментом математического моделирования сложных систем и
процессов, то есть инструментом системного анализа и синтеза. Интернет
создал новые революционные возможности для прикладного системного
анализа.
Право на существование и полезность системных наук объясняются
тем удивительным фактом, что в системах из элементов различной природы
наблюдаются похожие (изоморфные) структуры и процессы. Системы, как
правило, являются развивающимися, причём они проходят похожие этапы
развития. Сам факт устойчивого существования системы накладывает очень
важные ограничения на формы и характер этого существования.
12
Ознакомившись кратко с системами, рассмотрим, какие науки их
изучают, то есть систему системной науки и её «окружения».
От общего к частному это:
- системный подход;
- теория систем;
- системный анализ;
- системный синтез;
- системотехника.
Основные «соседи»:
- кибернетика и теория управления;
- теория самоорганизации (синергетика);
- информатика и теория информации;
- исследование операций;
- искусственный интеллект.
Системный подход – это скорее философская, гносеологическая
(познавательная) и методологическая установка на поиск и применение
общих принципов и исследования систем. Известно около двух десятков
таких принципов. Вот главные.
1. Объекты надо рассматривать как системы.
2. Систему следует рассматривать:
а) отграниченной от внешней среды;
б) с учётом всех существенных связей с внешней средой.
3. Цели и оценки исследуемой системы следует устанавливать с
позиций системы более высокого порядка (надсистемы).
4. Проблемы (сложные, комплексные задачи) надо рассматривать как
системы, структурируя их.
Более подробно принципы системного подхода будут рассмотрены в
следующей лекции.
Теория систем (другие названия: общая теория систем, теория
сложных систем) – теоретическая
дисциплина, посвященная общим
вопросам исследования систем Теория систем изучает возможные структуры
естественных и искусственных систем, типы процессов в системах, общие
законы развития систем.
Системный анализ (СА) – прикладная дисциплина, посвященная
методам исследования и проектирования сложных искусственных систем.
Два основных аспекта системного анализа: анализ систем и анализ проблем.
Основная задача системного анализа: исследование проблемы принятия
13
решения в сложной системе [Губанов и др.], то есть решение сложной
проблемы. Сложные проблемы имеют несколько рациональных решений
(альтернатив), но, как правило, ни одно из них не является лучшим по всем
критериям. Поэтому можно сказать, что центральной проблемой системного
анализа является проблема многокритериального выбора. Рассмотрим в
части № 2 курса.
Термин «прикладной системный анализ» (сам СА – прикладная
наука) относится к системному анализу с использованием компьютеров и
специального программного обеспечения (CASE-технологии, OLAPтехнологии [Марка, Мак-Гоуэн]), технологии data mining («разработка
данных» - обнаружение закономерностей, интеллектуальный анализ больших
массивов данных [Дюк, Самойленко]). Рассмотрим в части № 3 курса.
Системотехника – применение теории систем и системного анализа к
области техники [Губанов и др.]. Она изучает проблемы анализа и
проектирования сложных автоматизированных технических систем –
энергетических, транспортных, информационных, комплексных. Системный
синтез (сравнительно новый термин) исследует проблемы проектирования
сложных
организационно-технических
систем
и
процессов
(производственных систем и процессов, бизнес-процессов), акцентируя
внимание на новых, инновационных направлениях. Основная задача этих
дисциплин – создание сложных человеко-машинных (эргативных) систем, в
частности – создание программного обеспечения для таких систем.
С системной наукой тесно связаны и даже пересекаются такие
комплексные науки: кибернетика, информатика, синергетика, исследование
операций. Их рассмотрение поможет уточнить область собственно
системных наук и системного анализа в частности.
Кибернетика – наука об управлении в сложных системах различной
природы на основе обратных связей и преобразования информации. Видно,
что граница между кибернетикой и системной наукой весьма условна.
Иногда её рассматривают как часть теории систем [Губанов и др.]. Но
проблема управления (сфера кибернетики) не совпадает полностью с
проблемой решения (сфера системного анализа). Кибернетика изучает
формализованные процедуры (описанные на языке математики), а системный
анализ – совокупность процессов и процедур, включающих в себя плохо
формализуемые процессы постановки целей (целеполагания), формирования
альтернатив, принятия решений. Можно сказать, что главная разница между
кибернетикой и системным анализом – это разница между управлением
14
(которое может быть и автоматическим) и принятием решения, которое
требует мыслительного и волевого усилия, осознания неполноты знаний и
ответственности, на что способен человек или консолидированная группа
людей. Напомним соответствующий термин – лицо, принимающее решение,
ЛПР.
Теория систем и системный анализ позаимствовали у кибернетики
много понятий и терминов, например: структуры и структурные схемы,
связи, потоки, входы и выходы, управление.
Синергетика изучает процессы возникновения и развития
(усложнения) систем различной природы, не обязательно искусственных и
целенаправленных. Поскольку система возникла, то у неё появилось
интегративное свойство, а с прогрессивным развитием системы это свойство
усиливается, и могут возникать новые. Поэтому можно утверждать, что
интегративное свойство – это синергетическое свойство, эмерджентность –
следствие самоорганизации. Системный анализ изучает, как правило,
целенаправленные системы. Цель системного анализа и системного синтеза –
построить эффективную систему с заданным интегративным свойством.
Можно сказать, что синергетика в исследованиях естественных систем
играет примерно ту же роль, что системный анализ – в исследованиях
искусственных систем. Использование достижений синергетики
при
создании искусственных, целенаправленных, саморазвивающихся (в нужном
направлении) систем – актуальная научная и прикладная проблема. Это –
одна из главных задач системного синтеза.
Информатика очень тесно связана с кибернетикой и прикладным
системным анализом. Она занимается проблемами измерения количества
информации, проблемами хранения, передачи, преобразования информации с
помощью технических средств (включая, конечно, компьютеры) и каналов
связи различной природы. Информатика имеет теоретический (теория
информации), системный (сети, структуры, процессы) и технический
(компьютеры) аспекты.
Искусственный интеллект можно определить как область
компьютерной науки, занимающуюся автоматизацией разумного поведения
[Люгер]. В той своей части, которая занимается решением сложных, плохо
формализуемых проблем, искусственный интеллект, несомненно, близок
прикладному системному анализу. В частности, он постоянно поставляет
новые методы и компьютерные технологии решения таких проблем.
15
Исследование операций – это комплекс математических дисциплин,
охватывающих разработку и изучение математических моделей особого
вида – оптимизационных моделей. Эти модели позволяют определить число,
вектор (набор чисел), функцию доставляющие максимум (или минимум – в
зависимости от задачи) некоторой функции (называемой целевой функцией
или критерием) или функционалу при заданной системе ограничений в виде
равенств и неравенств. То есть определяется экстремум в заданной области
аргументов и значения аргументов, дающие этот экстремум. Оптимизацией
функций многих переменных при ограничениях занимается комплекс
математических наук, называемый математическое программирование.
Это искажённый перевод англоязычного термина mathematical planning –
математическое планирование. Например, линейное программирование –
здесь и целевая функция и все ограничения линейны. Оптимизацией
функционалов занимаются вариационное исчисление и теория
оптимального управления.
Связи между исследованием операций и системным анализом наиболее
тесны. Но существенны и различия. В моделях исследования операций
критерий, как правило, один (скалярная целевая функция). Системное
аналитическое исследование часто можно свести к решению
однокритериальной
задачи
исследования
операций,
или
к
последовательному решению ряда таких задач. Но когда критериев
несколько, существуют неустранимые неопределённости, необходимы плохо
формализуемые экспертные знания - то это сфера собственно системного
анализа. Сферой системного анализа является также анализ результатов
исследования операций. Таким образом, системный анализ можно
рассматривать как обобщение исследования операций, он включает в себя
исследование операций со всем арсеналом его средств и методов.
Схема системного исследования: «Сначала системный анализ, затем
исследование операций, в конце – системный анализ результатов».
Системный анализ определяет, что нужно делать (и чего делать не нужно), а
исследование операций – как это сделать оптимальным образом.
Контрольные вопросы
1)
2)
3)
4)
5)
Иерархия систем в природе и технике.
Структура системных наук.
Провести сравнение системных наук с "частными".
Определения понятия «система».
Примеры систем и «несистем» (кластеров).
16
6)
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
17)
18)
19)
20)
Классификация систем по происхождению.
Дайте определение интегративного свойства (эмерджентности),
системы, приведите примеры.
Понятие «структура», связь его с понятиями «система» и «проблема».
Системный подход, его значение и ценность в науке и практике.
Что изучает теория систем?
Что изучают системный анализ и прикладной системный анализ?
Что изучают системотехника и системный синтез?
Иерархия систем: надсистема, подсистема, элемент, связь.
Понятия «сложная система» и «большая система»; провести сравнение.
Понятия «элемент», «связь», различие между элементами и связями.
Связи системных наук с философией и математикой; отличия от них.
Два основных признака системы; дайте развернутое определение
системы.
Классы систем (по элементам, отношениям) и разделение наук.
Структура и практическое значение системной науки.
Краткая история системных наук.
2.1.2. Системный подход
В современной науке термин «системный анализ» (СА) имеет два
различных значения [ФЭС, с.587].
1) СА «в широком смысле» – это синоним термина «системный
подход» (СП).
2) СА «в узком смысле» – это наука о методах и технологиях,
используемых для исследования сложных (как правило, искусственных,
целенаправленных) систем и для поддержки обоснования решений по
сложным
проблемам
технического, экономического, социального,
политического характера.
Далее для системного анализа «в широком смысле» будем
использовать термин «системный подход». А под термином «системный
анализ» будем понищать системный анализ в указанном выше «узком
смысле».
Системный подход (СП) – это методология (т.е. согласованный набор
методов) рационального научного познания и практики. В основе СП лежит
принцип системности, который указывает на необходимость и полезность
исследования объектов как систем.
17
Объекты – это сущности, существующие помимо человека. Но
объекты могут восприниматься человеком («исследователем») через свои
ощущения
(или
показания
приборов),
они
могут
изучаться,
конструироваться. От окружающих объектов человек получает те или иные
ощущения, сведения, знания (одним словом информацию). Во
взаимодействии с объектами человек достигает или не достигает своих
целей. Более того, только взаимодействие с объектами позволяет ему судить,
достиг ли он своих целей или нет.
Того, кто обладает сознанием, ощущениями, способностью ставить
цели и планировать свои действия, в системных науках называют субъектом.
В системных науках используется также термины «актор» (от англ. to act –
действовать) и «лицо, принимающее решение» (ЛПР). Эти термины
подчеркивает способность субъекта не только познавать и планировать, но и
действовать, активно влиять на ситуацию, принимать решения. Отметим, что
термины эти могут относиться не только к отдельному лицу, но и к так
называемой «консолидированной группе», выступающей как единое целое.
Возникает интересный вопрос: а другие люди, группы, коллективы –
это объекты или субъекты системного исследования?
Конечно же, каждый человек – субъект (это определение, а не оценка).
Субъектами являются и высшие животные – это известно любому владельцу
собаки или кошки. Но они (люди, их группы, коллективы и организации,
собаками и кошками в курсе заниматься не будем) могут быть и объектами
системного исследования. Это – объекты равные по сложности субъектуисследователю [Лефевр]. И существуют методы исследования таких
«объектов-субъектов».
Таким образом, системный подход – это методологическая основа
исследования сложных объектов любой природы, не только тех, что
изучаются в системном анализе. СП помогает правильно, адекватно ставить
проблемы науки и практики, вырабатывать эффективные стратегии их
решения [ФЭС, с.587] . Понятия «проблема» и «стратегия» определим позже.
Системный подход основан на достижениях теории систем,
системологии, системной философии. Но в еще большей мере – на
человеческой практике. Основная ценность СП для других наук, в том
числе – для системного анализа заключается в наборе некоторых основных
положений, которым он предписывает следовать в изучении и
проектировании систем. Это – так называемые «принципы системного
подхода» (иногда их называют «системные принципы»).
18
Принципы системного подхода
Разные авторы дают весьма различные наборы принципов системного
подхода. В лекции 1 даны основные (по мнению автора). Ниже приведен
достаточно полный, но не избыточный набор принципов.
1) Принцип системности (о нем сказано в самом начале): объекты
следует изучать и проектировать как системы, то есть как связные структуры
с интегративным свойством (свойствами).
2) Принцип взаимодействия системы и среды: систему следует
рассматривать отдельно от среды, но с учетов всех существенных связей
между ней и средой («контекстом», «окружением»). Обычно принимается,
что среда может влиять на систему, а влиянием системы на среду можно
пренебречь. Если же нельзя – то систему следует расширить, включив в нее
необходимую часть среды. Система проявляет свой свойства взаимодействуя
со средой, в том числе – с другими системами.
3) Принцип целостности: принципиально нельзя свести интегративные
свойства системы к сумме свойств ее элементов.
4) Принцип структурности: систему можно описать и изучать через
установление ее структуры – сети связей и отношений (т.е. через построение
структурной модели системы). Интегративные свойства системы можно
выявить и объяснить, изучая систему в целом как совокупность элементов,
связей и процессов.
5) Принцип иерархичности: система является частью надсистемы,
состоит из подсистем, те – из подсистем второго порядка и т.д. – до
элементов. Из принципа иерархичности следует два главных метода
изучения и проектирования систем: декомпозиция (анализ) и агрегирования
(синтез).
6) Принцип множественности описания: адекватное описание и
познание системы требует построения набора моделей различной сложности,
каждая из которых описывает определенный аспект системы. Этот набор,
как правило, – иерархия моделей. Основными «этапами» иерархии являются
структурная, функциональная и динамическая модели (определим позже).
7) Принцип зависимости: свойства и функции каждого элемента
(подсистемы) зависят не только (и не столько) от его природы, но и от его
места и связей в составе системы.
8) Принцип обусловленности: поведение системы обусловлено не
столько поведением ее отдельных элементов, сколько свойствами ее
структуры («примат структуры над содержанием»).
19
9) Принцип ограниченности: система ограничена в пространстве и во
времени. Соответственно, системное исследование должно иметь временные
рамки. Все параметры (численные характеристики) системы должны иметь
конечные значения. В системном анализе бесконечностей нет!
10) Принцип развития во времени: при изучении и проектировании
системы необходимо учитывать этапы ее жизненного цикла.
Следующие несколько принципов СП имеют отношение к
проектированию искусственных систем, т.е. к системному анализу «в узком
смысле» и
к системотехнике (системной инженерии, системному
проектированию).
11) Принцип приоритета надсистемы и глобальной цели: система
должна создаваться исходя из потребностей и целей системы более высокого
уровня.
12) Принцип единства рассмотрения (проектирования): систему надо
рассматривать и как целое и как совокупность компонентов. Каждый
компонент (подсистема, элемент) изучается, проектируется вместе со своими
связями исходя из его места в системе и его задач. Из принципа единства
следует итеративность процесса проектирования системы: система и ее
задачи уточняются в процессе проектирования.
13) Принцип функциональности: структура и функции системы
должны рассматриваться совместно. При этом функции имеют приоритет над
структурой.
14) Принцип модульности (иерархичности или объектной
декомпозиции): систему целесообразно создавать из подсистем модулей,
которые могут быть использованы (или используются) в других системах.
15) Принцип децентрализации: необходим компромисс между
единством системы в целом и самостоятельностью ее подсистем (то есть
между иерархией и горизонтальными связями).
16) Принцип обратной связи: устойчивое функционирование сложной
системы невозможно без необходимых отрицательных и (иногда)
положительных обратных связей.
17) Принцип многофакторности: при исследовании и проектировании
систем необходимо учитывать все существенные факторы, как качественные,
так и количественные. Необходимо рассматривать все существенные аспекты
проблемы, для решения которой создается система. Среди этих факторов и
аспектов особое внимание следует уделять факторам неопределенности и
риска, а также – «человеческому фактору»
20
Все эти принципы являются не догмами, а, скорее, разумными
советами. Они находятся в определенных противоречиях друг с другом. Это
вполне естественно: ведь изучаются и проектируются сложные системы.
Поэтому можно дать еще один принцип системного подхода.
18) Принцип осторожности: все указанные выше принципы применять
надо осторожно и с умом!
Контрольные вопросы
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
Системный подход, его методологическое и практическое значение.
Основные принципы системного подхода.
Провести сравнение теории систем и системного анализа.
Провести сравнение системного анализа и прикладного СА.
Основные задачи системотехники и системного синтеза.
Эргативные системы и системный синтез.
Провести сравнение кибернетики и системной науки.
Провести сравнение синергетики и системного анализа.
Роль информатики, искусственного интеллекта в системном анализе.
Исследование операций и его задачи.
Связь между исследованием операций и системным анализом.
Почему формулирование проблемы в системном анализе считают
наиболее ответственным шагом для ее решения?
Каково практическое значение системного анализа в сфере
информационных технологий?
Перечислите основные системные науки и их «окружение»; дайте
примеры связей между ними.
2.1.3. Системный анализ
Далее в этом курсе мы будем рассматривать системный анализ «в
узком смысле» – как науку и методологию анализа и проектирования
сложных искусственных систем и управлениями ими. Системный анализ «в
широком смысле» (пп. 2.1.2) далее будем называть системным подходом.
Две цитаты.
«Системный анализ – это формализованный здравый смысл».
«Системный анализ – это расширенный интеллект».
Смысл первой цитаты станет понятнее, когда мы познакомимся с
методами системного анализа проблем. Хотя результаты далеко не всегда
отвечают ожиданиям «здравого смысла».
21
Вторая цитата противопоставляет системное мышление (системный
подход + системный анализ) «традиционному» вербальному мышлению с
одной стороны и полностью формализованному (физикалистскому,
редукционному) подходу точных, естественных наук.
Современный системный анализ способен интегрировать в свою
методологию как точные методы (математические модели систем) так и
неформализованные «эвристические» методы и экспертные знания.
Системный анализ и синергетика позволяют определить границы
применимости редукционного подхода, пересмотреть такие понятия как
причинность и прогнозируемость [Чернавский]. Вместе с тем по мере своего
развития системный анализ «теснит» неструктурируемые проблемы,
превращая их в проблемы слабо структурируемые.
Системный анализ как анализ систем и анализ проблем
Системный анализ («в узком смысле») имеет две ветви: анализ систем
и анализ проблем. Рассмотрим схему, а затем поясним кратко ее элементы.
Более подробно они будут рассмотрены в следующих лекциях.
Системное исследование, т.е. применение методологии системного
анализа к существующей или проектируемой системе в общем случае имеет
целью возможность объяснить, предвидеть, конструировать (для
искусственных объектов) и управлять [Хомяков]. Первые две системные
задачи относятся к анализу систем, а вторые - к анализу проблем.
Напомним, что проблемой (системной задачей) в системном анализе
называется сложная и неопределенная задача, допускающая либо несколько
приемлемых результатов решения, либо ни одного (не разрешаемая на
данном этапе, в данных условиях проблема). Искусственная система
создается для решения некоторой проблемы (проблем). Последовательное,
скоординированное, системное решение «внешних» и «внутренних»
проблем, возникающих в процессе разработки системы, и составляет проект.
Проект – это осуществимый замысел.
Перейдем к схеме системного анализа «в узком смысле».
Системный анализ
Анализ систем
Анализ проблем
↓
↓
22
Экспертная задача
Проектная задача
↓
↓
Познавательная модель
Прагматическая модель
↓
↓
Моделирование
Структурирование
(прямая задача ИО)
↓
↓
Сценарий:
Оптимизация
объяснение, прогнозирование
(обратная задача ИО)
↓
↓
Оптимизация
Проект
Поясним схему. Базовых задач в анализе систем всего две: экспертная
и конструктивная. Всё человеческое познание (особенно в системной
сфере) направлено на решение этих двух задач [Жилин].
Экспертная задача: на основании знаний, имеющихся на настоящий
момент, описать прошлое или предсказать будущее рассматриваемой
системы, а также выявить неочевидные процессы в настоящем. Модель,
созданная для решения экспертной задачи, называется познавательной
моделью. Это – не обязательно математическая модель. Обязателен
системный подход.
Решение экспертной задачи – сценарий. Сценарий – это описание
эволюции системы с учётом её окружения. Сценарий должен обоснованно,
рационально отвечать на вопросы: «что происходит в настоящее время?»,
«что произошло бы, если…?», «что произойдет, если…?».
Можно сказать, что экспертная задача соответствует одной стороне
системного анализа – анализу систем. Другая сторона системного анализа –
анализ проблем. И вот что ему соответствует.
Конструктивная (проектная) задача: создать некоторую систему с
заданным интегративным свойством (свойствами). Причем – эффективную и
конкурентоспособную систему. Частный случай конструктивной задачи: не
допустить возникновение чего-либо с негативными свойствами и
последствиями.
Модель, созданная для решения проектной задачи,
23
называется прагматической моделью. А вот здесь без математических
моделей, как правило, не обойтись. И, конечно, системный подход.
Решение конструктивной задачи – проект. Проект – это совокупность
действий и решений, объединённая общим замыслом и целью, с временными
(ударение на «ы»!) и ресурсными ограничениями. Можно сказать, что
проект – это своеобразная идеальная система, которая, будучи реализованной
на практике, создаст новую систему (например, машину, технологию, фирму,
бизнес-процесс). Или существенно изменит, модернизирует систему
существующую.
Проект должен обоснованно, рационально отвечать на вопросы: «как
сделать, чтобы…?», «какими будут затраты и результаты (то есть – какова
эффективность проекта)?», «как это сделать лучшим образом?».
Чтобы хорошо решить проектную задачу (её «потребителя» называют
Заказчиком), проектанты и системные аналитики должны сформулировать и
решить одну или ряд экспертных задач. Распространённая ошибка – проект,
для которого не решена экспертная задача. Такой проект называется утопией
[Жилин].
Почему ошибка и почему распространённая?
Для конкретной системы экспертную и конструктивную задачу можно
сформулировать так. Экспертная задача: какими свойствами будет обладать
данная совокупность элементов, связей, входов и выходов, как она будет
развиваться во времени? Конструктивная задача: как создать или сохранить
такую взаимосвязанную совокупность объектов, чтобы получить или
сохранить нужное интегративное свойство.
В исследовании операций (где, как мы помним, используют полностью
формализованные, математические модели) экспертная и конструктивная
задачи называются прямой и обратной задачами исследования операций
соответственно. Для решения прямой задачи исследования сложной системы
создаётся (как правило) имитационная модель, а для решения обратной
задачи – оптимизационная модель.
Экспертная задача (по крайней мере, для технических систем) имеет
своими целями понимание, объяснение и прогнозирование (предвидение).
Объяснение проводятся на основе понимания. Объяснение непонятных и
(или) непонятых вещей – это сфера не только системного анализа, но и
«частных знаний», относящихся к конкретной предметной области. На
основании данных о состоянии системы в определённый момент настоящего
или прошлого
и знаний предметной области («универсально верных
24
обобщений») ставится задача описать прошлое и (или) предсказать будущее,
а также понять неочевидные процессы, если они имеют место в настоящем.
Проектная задача (иногда ее называют конструктивной, мы пока не
будем вдаваться в различия между проектированием и конструированием) –
создать систему с заданными интегративными свойствами, функциями,
назначением. Систему, соответствующую некоторой сформулированной явно
цели (или целям – есть и многоцелевые системы), выполняющую требования
и ограничения. При этом – систему, в некотором смысле наилучшую,
оптимальную, рациональную. Цели проектной задачи: проектирование и
управление.
Решением проектной задачи является проект. Проект должен отвечать
на вопросы: «каков облик системы?», «как ее создать?», «какие ресурсы
необходимы?». Решение проектной задачи должно сопровождаться
постановкой и решением экспертной задачи: «что будет, если проект будет
реализован?». Такая задача позволяет уточнить реализуемость проекта и
оценить возможные последствия, в том числе и негативные, чтобы не
получилось «как всегда» не смотря на цель «сделать как лучше».
На основании решения этой экспертной задачи проект при
необходимости должен быть доработан. Часто необходимы последующие
итерации: доработки – экспертная задача – доработки. Пока результаты
экспериментов (в первую очередь – компьютерных, а это реализация
сценариев на имитационной модели, например) не покажут, что проект
правильно и эффективно решает конструктивную задачу.
Основным методом решения и экспертной и проектной задачи является
математическое
моделирование.
Виды
математических
моделей,
применяемых на различных этапах решения этих задач, будут рассмотрены в
следующей лекции. Вопросы структурирования проблем – во второй части
курса.
Основные этапы системного исследования
1. Предварительная формулировка проблемы.
2. Установление объекта исследования: выделение системы из
окружающей среды и (или) надсистемы и установление связей между ней и
«контекстом» (окружающая среда, надсистема, другие системы).
3. Определение цели исследования и точки зрения.
4. Определение ресурсов и ограничений.
5. Организация группы детального изучения проблемы.
25
6. Декомпозиция системы (проблемы).
7. Моделирование частных проблем.
8. Синтез модели.
9. Исследования полномасштабные (компьютерный эксперимент).
10.Анализ результатов и выпуск отчетных или проектных материалов.
Контрольные вопросы
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
Структура системного анализа как анализа систем и анализа проблем.
Каковы последовательные шаги системного исследования на основе
системного подхода?
Значение определения цели (целей) для решения проблемы.
Как в системном анализе связаны понятия «проблема» и «система»?
Экспертная задача и познавательная модель в СА, сценарий.
Конструктивная задача и прагматическая модель в СА, проект.
Роль экспертной и проектной задач в системном анализе и синтезе.
Роль познавательной и прагматической моделей в системном анализе и
синтезе.
Дайте определение понятиям «анализ» и «синтез».
Опишите процессы декомпозиции, агрегирования; как они связаны с
анализом и синтезом информационных систем?
Объясните термины: «эксперт», «консультант», «системный
аналитик».
Объясните термины «организация», «лицо, принимающее решение»,
«консолидированная группа».
2.1.4. Математическое моделирование в системном анализе
Моделирование
Небольшое отступление. Вспомним, что исследователь в частных
науках, технике – специалист. Исследователь в системной науке, практике –
генералист (но, увы, не всегда генерал). Генералист, системщик обязан быть
широко мыслящим человеком, эрудитом. Например, хороший менеджер –
это системный практик.
«Специалист – это человек, который узнаёт всё больше о всё меньшем
и в пределе знает абсолютно всё абсолютно ни о чём. Эрудит – человек,
который узнаёт всё меньше о всё большем и в пределе узнаёт абсолютно
ничего абсолютно обо всём» (фольклор). Ни к одному из этих пределов
стремиться не нужно. Оптимум – где-то посредине. Но в сложном,
26
взаимозависимом и быстро меняющемся мире любой специалист обязан
быть эрудированным человеком и хоть немного – генералистом. Особенно
специалист в такой развивающейся сфере, как информатика,
информационные технологии. Изучение системной науки очень этому
способствует. Тем более что она, как ни одна другая объединяет точные
методы с гуманитарными, математику с психологией, технику с человеком и
организацией.
Теперь к методам изучения. Несмотря на, казалось бы, огромное
разнообразие систем существуют некие общие подходы к их изучению.
Главным методом изучения систем является моделирование, разработка
моделей. Вообще моделирование – это единственный рациональный
(основанный на разуме) метод познания действительности. Существуют ещё
интуиция, озарение (инсайт) и т.п., но это не в тему курса.
Моделирование - это построение и изучение структурных, логических,
математических и других абстрактных моделей систем и процессов в них.
Системы – как уже существующие, так и разрабатываемые. Есть ещё и
физическое моделирование, но оно используется в частных науках и в
технике (уменьшенные копии, модели самолётов, кораблей, зданий, мостов
для экспериментов), но не в системных исследованиях.
О видах моделях и методах моделирования
Определение 9. Модель – это отображение существенных свойств
объекта (системы) при его изучении.
Основным методом изучения систем является математическое
моделирование. А основным инструментом исследования математических
моделей сложных систем является компьютер. Только для некоторых очень
простых математических моделей систем
могут быть получены
аналитические (в виде формул) решения. Математические модели
представляют собой системы уравнений (чаще всего – дифференциальных
уравнений) и ограничений (в виде равенств и неравенств). Эти системы
разрабатываются исходя из базовых «законов природы» и конкретных теорий
в данной предметной области. В общем, для построения хороших
математических моделей надо знать предметную область, нужные разделы
математики и применять системный подход. Такие модели называют
физичными, физикалистскими, системными, или моделями «прозрачного
ящика». Они – основные в технике. Например: модель процесса выведения
спутника на орбиту, или модель работы прокатного стана. Применяются и в
27
экономике предприятия (модели «индустриальной динамики») и в мировой
экономике (модели «глобальной динамики»), и в экологии (модель «ядерной
зимы»), и во многих других областях. Эти модели очень трудоёмки и для них
критически важна проблема надёжных исходных данных. Но это – главное
направление моделирования в эпоху компьютеров.
Для многих сложных систем по разным причинам трудно (или не
нужно) построить хорошую физичную модель. Пример: экологические,
экономические, социальные системы. Известны входы и выходы системы и
имеется много данных о её «работе». Это – так называемая модель «чёрного
ящика», или кибернетическая модель. Если здесь можно применить
методы математической статистики и теории вероятностей, то это статистический метод моделирования, прикладной статистический
анализ. А модели, конечно, называются статистическими. Например,
модели систем массового обслуживания (они моделируют процессы
получения и обработки заявок, поступающих случайным образом на входы
системы).
Частным видом математических моделей всех видов являются
оптимизационные модели, о них говорилось выше.
Соединение физичных моделей сложных систем со статистическими
методами формирования наборов исходных данных и обработки результатов
называется имитационным моделированием, а сами модели –
имитационными.
Исследование поведения систем при помощи имитационных
математических моделей и компьютеров называется вычислительным
экспериментом.
В системном анализе ключевую роль играют системно-структурные
или просто структурные модели, представляющие проблему в виде системы
с определенной структурой. При построении их используется теория графов.
С ними мы познакомимся в разделе, посвященном методам
многокритериального анализа. Пока отметим, что структурные модели могут
при необходимости дополняться любыми другими.
Наконец, в системном анализе важную роль играет вербальная
(словесная) аналитика – рациональное, логичное описание системы и
процессов в ней на естественном языке. В системном исследовании не
обойтись без экспертных суждений и неформальных процедур. Это – так
называемый информационно-аналитический метод. Для гуманитариев –
28
это основной метод. Во второй части курса мы рассмотрим вербальный
анализ решений.
О требованиях к моделям
Свойств у объекта очень много и все их в модели не отразить. Да это и
не надо. Свойства, важные для целей исследования, называются
существенными. Модель, правильно учитывающая все существенные (для
данной задачи!) свойства и, поэтому, дающая достаточно правильные (для
данной задачи!) ответы называется адекватной. Критерий правильности –
практика.
Для каждой модели существует своя область применимости – такой
набор задач и диапазон исходных данных, где она даёт правильные ответы и
поэтому является адекватной.
Определение границ области применимости моделей сложных систем –
нетривиальная задача. Но о границах применимости модели (любой и любого
вида – вербальной, математической, статистической, системно-структурной)
забывать нельзя.
Модель должна быть эффективной, то есть давать ответы (в виде
чисел, графиков, таблиц, отчётов) за приемлемое время, с приемлемыми
затратами труда и средств (включая затраты на разработку самой модели) и в
удобном для пользователя виде. В частности, эффективными должны быть
модели реального времени, например, в компьютеризированных системах
управления движением, технологическим процессом. Они должны выдавать
результаты со скоростью или быстрее реального процесса. Например,
процесса в атомном реакторе.
Конечно, эффективная модель должна быть адекватной, а ответы –
правильными. Не следует забывать, что «любая сложная проблема имеет
простое, понятное всем неправильное решение» (научный фольклор),
основанное на неадекватной модели. А хорошая модель находится на «узкой
полосе между пустыней чрезмерного упрощения и болотом чрезмерного
усложнения» (Беллман).
Теперь о моделировании и основных задачах системного анализа.
При моделировании свойства одного объекта переносятся на другой
таким образом, чтобы процессы, структуры были изоморфными,
аналогичными по форме, не смотря на различную «физическую» сущность.
Тогда наблюдая за моделью (например, проводя расчёты на компьютере и
анализируя результаты) исследователь может делать выводы о поведении
29
системы, её функциях, интегративных (эмерджентных) свойствах. А также
исследовать влияние внутренних и внешних факторов и оптимизировать
систему. То есть модели помогают обоснованно решать задачи исследования
систем (если модели адекватные, конечно).
Проблемные ситуации в анализе систем
Проблема (системная задача) - это, как отмечалось ранее, сложная
многофакторная неопределенная задача, имеющая несколько допустимых
решений (если она их имеет вообще – или не одного, или несколько).
Различают три проблемные ситуации в анализе и моделировании
[Хомяков].
1) Хорошо структурированные проблемы. Здесь мы можем построить
адекватную количественную модель (лучше - физическую) и исследовать её,
опираясь на математические методы.
2) Слабо структурированные проблемы. Мы не можем построить
«полностью количественную» модель, но можем построить модель (или
иерархию моделей) на основе системного подхода, вербальных и
количественных методов системного анализа.
3) Неструктурируемые проблемы. Мы не можем построить
количественную модель, применяя методы частных наук и системного
анализа, поэтому можем и должны использовать системы и проблемы только
при помощи естественного или профессионального языка на основе знаний и
опыта.
Собственной
сферой
системного
анализа
являются
слабо
структурированные проблемы.
Но! Применение принципов системного подхода весьма полезно для
разработки моделей хорошо структурированных проблем и в анализе
результатов моделирования. Современный системный анализ имеет методы
для решения неструктурируемых проблем практически без использования
математики. Это вербальная аналитика, вербальный анализ решений, так
называемые неформальные и эвристические методы. То есть системный
анализ ведёт наступление на неформализуемые (пока что) проблемы.
И в этом одно из достоинств системного анализа: он находится между
формальными и гуманитарными науками, использует из методы, но имеет и
собственный инструментарий для решения системных задач.
30
Снова перечислим основные системные задачи: исследование,
прогнозирование относятся к экспертной задаче; проектирование,
управление – к проектной задаче.
Иерархия моделей в анализе систем и проблем
Процесс разработки моделей сложной системы имеет иерархические
уровни, такую последовательность.
1) Структурная модель («анатомия системы») – подсистемы, элементы
и связи.
2) Функциональная модель («физиология системы») – на качественном
уровне описывает функции, интегративные свойства системы и влияние на
них внешних воздействий.
3) Динамическая модель («поведение системы») – описывает
изменение состояний системы во времени и пространстве, описывает по
возможности количественно.
4) Имитационная модель – описывает поведение системы в различных,
в том числе и случайных условиях (случайных внешних воздействиях или
случайных изменениях параметров и структуры системы).
5) Оптимизационная модель – служит для поиска лучших проектных
параметров.
Этапы разработки модели сложной системы
1.
2.
3.
4.
5.
6.
7.
8.
9.
Анализ требований (и к проектируемой системе и к модели); уточнение
объекта моделирования; оценка необходимых ресурсов.
Определение структуры модели (архитектуры).
Выбор методов моделирования для частных моделей и выбор
программных средств (предварительный).
Планирование разработки и распределение работ.
Уточнение методов и программных средств, программирование и
тестирование частных задач.
Синтез частных моделей (задач) и тестирование модели в целом.
Идентификация параметров модели.
Проверка чувствительности.
Оптимизация структуры, параметров и (если необходимо) управлений
системы.
31
Имитационное моделирование
В изучении, проектировании, оптимизации сложных систем очень
важны имитационные модели. Имитационная модель – это возможно более
подробная математическая модель, отражающая структуру и поведение
исследуемой или проектируемой системы, её «виртуальный двойник»,
«аватар». Исследование системы посредством её компьютерной модели
называется имитационным моделированием (ИМ) или компьютерным
экспериментом. Единичный эксперимент (один «прогон» модели)
называется реализацией.
Современная
имитационная
модель
должна
предоставлять
возможности:
а) генерация сценариев, наборов исходных данных, правка их в
«ручном» и автоматическом режиме;
б) генерация случайных воздействий на систему и случайных
изменений её параметров;
в) оптимизация структуры и параметров системы; при необходимости –
поиск оптимальных управлений ею;
г) визуализация и анимация результатов компьютерного эксперимента.
Современные парадигмы имитационного моделирования
Можно выделить пять основных подходов к построению
имитационной модели сложной системы. Эти подходы (концепции)
совместно с используемым в них математическим аппаратом называется
парадигмами ИМ.
1.
Динамические системы.
2.
Системная динамика.
3.
Системы
с
дискретными
событиями
(системы
массового
обслуживания)
4.
Мультиагентные системы.
5.
Системы, моделирующие поведение «субъектов с рефлексией».
Гибридные имитационные модели сложных систем используют
несколько парадигм.
Разработка имитационной модели «с нуля» – очень трудоемкий
процесс. Но существует достаточно универсальные программные средства,
поддерживающие ту или иную парадигму, например Simulink (динамические
системы) GPSS (дискретно-событийные модели) Stella, Vensim, iThink,
Powersim – системная динамика. Из программных средств нового поколения
32
следует выделить российскую среду AnyLogic. В отличие от предыдущих она
поддерживает четыре первые парадигмы из указанных выше и (что особенно
важно) в ней могут создаваться гибридные имитационные модели.
Разработка программных сред для пятой парадигмы (имитационное
моделирование процессов принятия решений, анализ конфликтов и т.п.) –
актуальная задача.
Компьютерный эксперимент
Имитационные модели не поддаются аналитическим методам
исследования. Исследование сложной системы (существующей или
проектируемой) осуществляется путем организации, планирования и
проведения компьютерных экспериментов на имитационной модели этой
системы.
Понятие «компьютерный эксперимент» сейчас шире, чем
«вычислительный эксперимент», поскольку современные программные
среды для имитационного моделирования предоставляют широкие
возможности не только для расчетов, но и для символьной математики, а
также для визуализации и анимации результатов.
Компьютерный
эксперимент
находится
между
натурным
экспериментом, физическим моделированием, аналитическим исследованием
и умозрительным (вербальным) экспериментом. Он имеет ряд преимуществ
перед этими подходами к исследованию систем. И эти преимущества
усиливаются по мере развития компьютерной техники и программных
средств.
Натурный эксперимент очень дорог или экономически неэффективен,
или попросту невозможен – например, для еще не существующей системы.
Физическое моделирование (использование уменьшенных моделей)
дает ответы на частные, но не системные вопросы. Например, с его помощью
определяется значение параметров системы.
Аналитическое исследование («в формулах») можно провести только
для простых моделей. Оно очень важно для первичного понимания системы,
но не дает возможности анализировать детально её поведение. А такой
анализ может выявить и качественно новые эффекты.
Умозрительный эксперимент работает на основе знаний предметной
области, здравого смысла и общих, качественных, интуитивных
предположений о поведении системы. Но сложные системы обладают
33
антиинтуитивным поведением, и очевидное на первый взгляд решение
оказывается для них неверным [Форрестер].
Виды компьютерных экспериментов
Во-первых, различают детерминированный и стохастический
эксперимент.
Детерминированный эксперимент («what if», «что, если») должен
отвечать на вопросы:
«Как работает система при заданных значениях параметров?»
«К каким последствиям могут привести изменения структуры системы
и значений её параметров?»
«Что произойдет, если принять некие решения или реализовать некое
управление?»
Стохастический эксперимент исследует влияние случайных изменений
внешних и внутренних факторов на решение этих задач.
Во-вторых, по назначению различают три вида компьютерных
экспериментов (и детерминированных и стохастических)
1.
Простой эксперимент. Его цель – отладка модели, проверка её на
замкнутость и адекватность, понимание функционирования системы. Он
сводится к запуску модели и наблюдению за её поведением при заданных
значениях исходных факторов.
Схема простого эксперимента:
ИМ
или:
X = F (Y ) ,
где: X - входные факторы, Y - выходные значения.
2.
Проверка (анализ) чувствительности модели. Её цель – оценка
области применения модели и оценки влияния изменений факторов на
поведение системы
ИМ
“Генератор
Сценариев”
34
Средство
Визуализации
3.
Оптимизационный эксперимент. Его цель – нахождение
оптимальных значений параметров системы (а также оптимизация её
структуры и управлений)
Схема оптимизационного эксперимента
ИМ
W
Opt
W - целевая функция, в общем случае - векторная.
Существуют два основных подхода к оптимизации системы на основе
использования её имитационной модели.
1.
Результаты эксперимента («реализации») аппроксимируются
некоторой функцией (например, часто используется аппроксимация
многочленами: сплайн-аппроксимация), затем решается задача нелинейного
математического программирования.
2.
Используется
встроенный
в
программное
средство
универсальный оптимизатор. Как правило, в нем применяется поисковые
методы оптимизации: случайный поиск, генетические алгоритмы,
«рассеянный поиск» и т.п. Например, такой оптимизатор OptQuest встроен в
программное средство AnyLogic. А универсальный математический пакет
Maple содержит оптимизатор GOT for Maple (global optimization tool for
Maple).
Контрольные вопросы
1)
2)
3)
4)
5)
6)
Научное и практическое значение моделирования.
Моделирование и основные задачи системного анализа.
Понятия «модель» и «моделирование».
Основные виды моделей; примеры.
Математическое моделирование, основные виды моделей.
Оптимизационные модели, основные задачи и методы.
35
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
Специфические модели и методы системного анализа.
Структурные модели и графы; основные виды графов.
Представление графами основных структур в системном анализе.
Основные требования к моделям, область применимости.
Адекватность и эффективность моделей.
Роль компьютеров, информационных технологий в СА.
Дайте определение понятию «граф»; графы как модели систем.
Какой граф называют деревом, какую структуру системы он
моделирует?
Методы и инструменты изучения систем.
Значение моделирования в системном анализе и проектировании
сложных систем.
2.2.
Методы анализа систем и проблем
2.2.1. Системный анализ и принятие решений; количественный анализ
решений
Введение: многокритериальный сравнительный анализ
Системный анализ включает в себя методы из различных наук –
исследования операций, например. Но у него есть и свои специфические
методы исследования - методы многокритериального сравнительного
анализа, называемые также методами анализа решений. Можно сказать,
что эти методы составляют ядро, сердцевину системного анализа.
Методы многокритериального сравнительного анализа применяются в
самых разных задачах: выбора лучшего объекта, проектирования,
распределения ресурсов, управления.
Сравнение объектов по совокупности разнородных критериев является
одной из фундаментальных задач системного анализа. Для нас важно, что
сам процесс многокритериального сравнительного анализа – это
практическая реализация схемы системного исследования.
Разработано много методов многокритериального сравнения,
некоторые будут рассмотрены ниже. В различных прикладных задачах
целесообразно использовать различные методы. В многокритериальном
анализе сравниваемые объекты называются альтернативами. А под
объектами понимаются как существующие системы, так и проекты.
Сложность задачи многокритериального сравнительного анализа
заключается в том, что сравниваемые объекты, как правило, необходимо
36
сопоставлять по большому числу количественных и качественных
(оцениваемых экспертно) критериев. А стандартной является ситуация, когда
ни один из объектов не доминирует над остальными по всем показателям
одновременно.
Уточним определения. Критерий – количественная или качественная
характеристика, существенная для суждения об объекте. Показатель –
количественная или качественная оценка оцениваемого объекта по
определенному критерию. Можно сказать, что система критериев – это
система координат в многомерном пространстве, в котором анализируются
объекты, а набор показателей конкретного объекта – это точка или область,
занимаемая объектом в пространстве критериев.
Основные требования к практической методике многокритериального
сравнительного анализа объектов
1. Открытость и гибкость – могут использоваться различные системы
критериев, как количественных, так и качественных.
2. Достаточная универсальность – можно сравнивать и ранжировать
любые объекты, для которых можно построить общую систему критериев.
3. Обозримость и оперативность – все необходимые расчеты и
экспертные оценки по методике могут выполняться одним экспертом или
небольшой группой в приемлемые сроки. Поэтому в решении сложных
проблем необходимо использование компьютеров и специального
программного обеспечения.
4. Максимально возможная объективность – экспертам и лицам,
принимающим решения, должна быть предоставлена возможность проверки
обоснованности и согласованности суждений. Отметим, что при наличии
экспертных оценок субъективность полностью нельзя устранить
принципиально. А из системного исследования невозможно устранить
экспертные оценки.
Многокритериальные
методы
предназначены
для
принятия
индивидуальных решений индивидуумом (лицо, принимающее решение,
ЛПР) или консолидированной группой. Участники такой группы разделяют
общие ценности, имеют общую цель, никто не саботирует, не "мутит воду".
Но иногда их приходится применять в ситуациях, где имеется несколько лиц,
принимающих решения. При этом оказывается, что расхождения между
мнениями различных исследователей уменьшаются, если они обсуждают
проблему не в целом, а по отношению к отдельным критериям. Часто им
легче договориться о компромиссе, достигаемом путем исключения
37
определенного критерия или добавления новых, или согласования оценок.
Все эти преимущества могут усиливаться или ослабляться в зависимости от
особенностей конкретного метода принятия решений.
Применение многокритериальных методов
При применении большинства методов возникают две основные
проблемы: как получить оценки по отдельным критериям и как объединить,
агрегировать, эти оценки в общую оценку полезности альтернативы, в
каждом методе эти проблемы решаются по-своему. По сути, это проблемы
двух главных процедур системного анализа: декомпозиции и агрегирования.
В типичной схеме принятия решений по сложной проблеме три
группы участников (исследователей): руководители (лица, принимающих
решения, ЛПР), эксперты и консультанты. Консультанты вместе с
руководителем разрабатывают обычно перечень критериев. При этом
определяется, как измерять уровень качества по каждому критерию, т. е. как
строить шкалу измерений.
Часто используются балльные шкалы — шкалы, для которых,
например, высшее качество характеризуется 10 баллами, а низшее —1
баллом. Иногда балльные оценки одного уровня проблемы нормируются на
единицу. В методе анализа иерархий (МАИ) используются парные
сравнения.
Далее выступают эксперты, которые рассматриваются обычно в
качестве своего рода «измерительных приборов». Эксперты оценивают
каждую из альтернатив по шкале каждого из критериев. Если экспертов
несколько, то их оценки сводятся к единой (обычно средней –
арифметической или геометрической).
На основе полученных оценок каждой из альтернатив по каждому из
критериев осуществляется получение общей (глобальной) оценки каждой
альтернативы по всей системе критериев. Это делается на основании
формулы или алгоритма для агрегации (объединения) оценок по отдельным
критериям в общую оценку полезности альтернативы.
Выбор того или иного алгоритма (то есть метода анализа) чаще всего
определяется консультантом. Методов многокритериального анализа
довольно много, существуют две «ветви» методов – количественный
анализ решений и вербальный («словесный») анализ решений.
В количественном анализе решений при большом числе альтернатив и
критериев используется компьютер, в который вводятся оценки альтернатив
38
по критериям, алгоритм метода, и в результате расчётов получают общие
("глобальные") оценки альтернатив. Методы количественного анализа
решений также называются количественными.
Вербальный анализ решений оперирует с оценками, выполненными с
использованием словесных описаний и так называемых лингвистических
переменных. Но – по алгоритму, определяемому выбраны методом.
Анализируя глобальные оценки ЛПР принимает решение: выбирает
лучшую альтернативу, распределяет ресурсы между приемлемыми
альтернативами, уточняет задачу и т.д.
Краткий обзор количественных методов
Можно выделить шесть основных групп методов количественного
анализа решений.
I.
Аксиоматические методы. Здесь определяется ряд свойств,
которым должна удовлетворять зависимость общей полезности альтернативы
от оценок по отдельным критериям. Эти свойства (называемые аксиомами)
проверяются путем получения информации от лиц, принимающих решения.
В соответствии с этой информацией делается вывод о той или иной форме
зависимости. А когда зависимость известна, то используется один из прямых
методов.
Все методы оценки многокритериальных альтернатив, так или иначе,
используют измерение полезности, но аксиоматические методы подходят к
этим измерениям наиболее теоретически: они рассматривают их как
определенные шаги, подтверждающие справедливость выбора некоторых
аксиом и ведущие к возможности использования определенной функции
полезности.
Аксиоматические методы непосредственно опираются на теорию
ожидаемой полезности фон Неймана и Моргенштерна либо на более
современные теории полезности.
Следует отметить искусственность аксиоматических методов. Главная
практическая проблема, - многокритериальное сравнение альтернатив, отступает на второй план перед чисто формальной (математической)
проблемой поиска функции полезности в определенной форме.
II.
Прямые методы. Здесь зависимость общей полезности
альтернативы от оценок по отдельным критериям считается известной
заранее.
39
Существует большое число методов, в которых форма зависимости
результирующей полезности альтернативы от ее оценок по многим
критериям задается без всяких теоретических оснований, а параметры этой
зависимости задаются так:
a)
нормативно («закон есть закон»);
b)
непосредственно
устанавливаются
лицом
принимающим
решение («начальник всегда прав») или этим лицом и консультантами
(«система коллективной ответственности»);
c)
определяются из статистики, если она есть в достаточном объёме
и надёжна («статистика знает всё»).
К основным методам данной группы относятся следующие: метод
взвешенных сумм и его аналоги, метод матрицы решений, метод дерева
решений и ряд других.
III.
Методы компенсации. Здесь эксперты пытаются уравновесить
(скомпенсировать) оценки одной альтернативы оценками другой.
По идее, это наиболее простой метод, при котором человек выписывает
достоинства и недостатки каждой из альтернатив и, вычеркивая попарно
эквивалентные достоинства (недостатки), изучает то, что осталось и делает
выбор.
Переход от сравнения качеств по различным критериям к сравнению
альтернатив может быть осуществлен различными путями. Среди них
следует выделить построение кривых безразличия и сравнение разностей
оценок альтернатив по критериям.
Методы построения кривых или поверхностей безразличия очень
трудоемки и малопригодны при количестве критериев ≥ 3. Для оставшихся
альтернатив проще использовать метод анализа иерархий (МАИ) или один из
прямых методов.
IV.
Методы порогов несравнимости. Основаны на идее сужения
множества альтернатив и базируются на отношениях предпочтения,
эквивалентности и несравнимости при оценке альтернатив. Сужение
множества возможных решений осуществляется попарным сравнением
альтернатив. Задается правило сравнения двух альтернатив, при котором
одна альтернатива считается лучше другой. В соответствии с заданным
правилом, альтернативы попарно делятся на сравнимые, – одна лучше
другой, либо эквивалентные, – и несравнимые. Изменяя отношение
сравнимости, получают разное число пар сравнимых альтернатив, из них
делают выборку лучших и анализируют.
40
К методам данной группы относятся следующие: метод комитетов,
ЭЛЕКТРА I, ЭЛЕКТРА II, ЭЛЕКТРА III (исключение и выбор в условиях
реальности).
Методы данной группы дают возможность ЛПР вмешиваться в процесс
выбора, однако обилие параметров, которыми он располагает, ставит под
сомнение их эффективное использование. При применении данных методов
следует учитывать, что вид бинарного отношения, а также их
последовательность существенно предопределяют результат выбора.
V.
Человеко-машинные (интерактивные) методы применяются в
том случае, когда модель проблемы известна частично. Человек
взаимодействует с компьютером, определяя соотношения между критериями.
Далее обычно используется один из прямых методов.
Чаще всего в этой группе проблем рассматривается
задача
математического программирования при нескольких критериях качества. Она
решается в диалоговом режиме: исследователь определяет первоначальные
требования к соотношениям критериев, вводит их в компьютер, получает
решение изменяет свои требования, снова вводит в их в компьютер и т. д.
В ходе таких итераций у исследователя возникает понимание того, в
какой степени область возможных решений допускает одновременное
достижение экстремальных значений по всем критериям, насколько
противоречивыми являются эти критерии и т. д. Это понимание способствует
выработке разумного компромисса в требованиях к значениям, достигаемым
по разным критериям. Процесс заканчивается, когда компьютер выдает
приемлемое решение, либо когда ЛПР убедится в нецелесообразности
дальнейших попыток получить разумный компромисс при данной модели.
VI.
Метод анализа иерархий (МАИ) и его производные
применяются сейчас очень широко и для самых разных практических задач.
Аналитический иерархический процесс (другое название метода) обладает
рядом достоинств по сравнению с другими методами количественного
анализа решений.
Именно в этом методе полностью реализована схема системного
анализа проблем, а именно: представление проблемы как системы.
Контрольные вопросы
1)
2)
Понятия
«проблема»,
«выбор»,
«оптимальное решение».
Условия принятия решения, пояснить.
41
«рациональное
решение»,
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
Роль многокритериального анализа в системном анализе и принятии
решений.
Основная проблема многокритериального сравнительного анализа.
Понятия «цель», «критерий», «показатель», «альтернатива», примеры.
Основные
требования
к
методике
многокритериального
сравнительного анализа.
Достоинства многокритериальных методов.
Основные проблемы многокритериальных методов.
Количественный анализ решений: основные идеи, общая схема.
Основные группы методов количественного анализа решений.
Аксиоматические методы количественного анализа решений:
теоретическая основа, достоинства и недостатки.
Прямые методы количественного анализа решений: теоретическая
основа, достоинства и недостатки.
Основные группы прямых методов количественного анализа решений.
Основные системные задачи, где применяются методы анализа
решений.
2.2.2. Метод анализа иерархий
Характеристика метода анализа иерархий
В 70-80-е годы американский учёный Т.Л. Саати разработал и развил
«иерархический аналитический процесс» (analytic hierarchy process, AHP) –
мощный метод сопоставительного анализа и ранжирования объектов,
характеризующихся наборами критериев и показателей, количественных и
качественных. В литературе этот метод называют также методом анализа
иерархий (МАИ). Метод применяется для многих задач. Вот основные:
1.
Сравнительный
анализ
объектов
(многокритериальное
ранжирование)
2.
Многокритериальный выбор лучшего объекта (лучшей
альтернативы)
3.
Распределение ресурсов между проектами
4.
Проектирование систем по количественным и качественным
характеристикам.
Этот метод для успешного применения требует соблюдения
следующих условий:
42
a)
в процедуре принимают участие достаточно квалифицированные
эксперты, не допускающие существенных погрешностей в оценках, более
того, в МАИ требуется, чтобы группа экспертов была консолидированной,
т.е. имеющей общие позиции и стремящейся к согласованности своих
оценок;
b)
для множества сравниваемых объектов ("альтернатив") может
быть выстроена общая система критериев;
c)
оценки по «негативным» критериям не находятся в опасной
близости к ограничениям.
Алгоритм метода анализа иерархий
Шаги метода анализа иерархий:
1.
Представление исходной проблемы в виде иерархической
структуры (рис. 2.1). Цель составляет высший уровень иерархии (уровень 1).
На этом уровне может находиться лишь один объект. На следующем "вниз"
уровне 2 находятся критерии. По системе этих критериев оцениваются
сравниваемые
объекты
(называемые
обычно
"альтернативами").
Альтернативы располагаются на самом нижнем уровне.
Рисунок 2.1 – Трёхуровневая иерархия «цель – критерии –
альтернативы»
2.
Вынесение экспертных суждений на каждом уровне иерархии по
парным сравнениям: критерии сравниваются попарно по отношению к цели,
альтернативы – попарно по отношению к каждому из критериев.
Соответственно заполняются матрицы парных сравнений (таб. 2.2):
одна – для критериев, n матриц – для альтернатив; здесь n – количество
критериев.
43
Таблица 2.2. – Матрица парных сравнений
Операция парного сравнения: два объекта, находящихся на одном
уровне сравниваются по своей относительной значимости для одного объекта
высшего уровня. Если критерий имеет определенную числовую меру,
например, масса, производительность, цена, то в качестве результата оценки
удобно взять отношения соответствующих характеристик (заданных, или
рассчитанных). Если критерий не имеет принятой меры, то сравнение в МАИ
проводится с использованием специальной "шкалы относительной важности"
(другие названия: «шкала 1-9», «шкала Саати»). Эта шкала имеет 9 степеней
предпочтения, выбранные с учетом экспериментально установленных
психофизиологических особенностей человека, выполняющего сравнение
(таб. 2.3).
Числа из этой шкалы используются, чтобы показать, во сколько раз
элемент с большей оценкой предпочтительности доминирует элемент с
меньшей оценкой относительно общего для них критерия или свойства.
При операции парного сравнения также используют значения обратных
оценок предпочтения: если преимущество i-той альтернативы по сравнению
с j-той имеет одно из приведенных выше значений, то оценка предпочтения iтой альтернативы над j-той будет иметь обратное значение.
44
Таблица 2.3. – Шкала Саати
Степень
предпоОпределение
чтения
1
Равная
предпочтительность
2
Слабая
степень
предпочтения
3
Средняя
степень
предпочтения
4
Предпочтение
среднего
выше
5
Умеренно
предпочтение
сильное
6
Сильное предпочтение
7
Очень
(очевидное)
предпочтение
сильное
8
Очень, очень
предпочтение
сильное
9
Абсолютное
предпочтение
Комментарии
Две
альтернативы
одинаково
предпочтительны с точки зрения цели
Промежуточная
градация
между
равным и средним предпочтением
Опыт эксперта позволяет считать одну
из
альтернатив
немного
предпочтительнее другой
Промежуточная
градация
между
средним
и
умеренно
сильным
предпочтением
Опыт эксперта позволяет считать одну
из альтернатив явно предпочтительнее
другой
Промежуточная
градация
между
умеренно сильным и очень сильным
предпочтением
Опыт эксперта позволяет считать одну
из
альтернатив
гораздо
предпочтительнее
другой:
доминирование
альтернативы
подтверждено практикой
Промежуточная градация между очень
сильным
и
абсолютным
предпочтением
Очевидность
подавляющей
предпочтительности
одной
альтернативы над другой имеет
неоспоримое подтверждение
3.
Математическая обработка матриц парных сравнений для
нахождения локальных и глобальных приоритетов.
45
При точном процессе определения вектора локальных приоритетов
задача сводится к нахождению собственного вектора матрицы парных
сравнений:
где A – матрица парных сравнений (МПС), X – n-мерный вектор,
составленный из искомых приоритетов, λ - собственное значение МПС;
и последующего нормирования этого вектора:
В рассматриваемой задаче искомым является вектор, соответствующий
максимальному собственному значению.
Вектор локальных приоритетов может быть приближенно вычислен
упрощенным способом:
1)
Для каждой строки матрицы парных сравнений находим среднее
геометрическое ее элементов:
2)
Находим сумму всех этих средних геометрических.
3)
Делим каждое среднее геометрическое на их сумму («нормировка
на единицу»). Результат - вектор локальных приоритетов данной матрицы.
В МАИ есть возможность проверки согласованности экспертных
оценок, т.е. чисел в каждой матрице парных сравнений. Для контроля
согласованности этих оценок вводятся две связанные характеристики индекс согласованности (CI) и отношение согласованности (CR):
где Pn – это индекс согласованности для положительной обратно
симметричной матрицы случайных оценок размера n × n ; элементы этой
матрицы получены случайным выбором из множества допустимых оценок,
т.е. из чисел ряда {1/9, 1/8, 1/7, 1/6, 1/5, 1/4, 1/3, 1/2, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
Таблица 2.4 – Значения индекса согласованности
N
1
2
3
4
5
46
6
7
8
9
10
Pn
0
0
0.58
0.90
1.12
1.24
1.32
1.41
1.45
1.49
Допустимым считается отношение согласованности (CR), не
превышающее 10 - 20%. Если CR выходит из этих пределов, то экспертам
необходимо исследовать задачу и проверить свои оценки.
4.
Имея вектор локальных приоритетов критериев размерности m
(m - число критериев) и m векторов локальных приоритетов альтернатив
размерности n (n - число альтернатив), вектор глобальных приоритетов
альтернатив по отношению к цели вычисляется так: каждый компонент этого
m-вектора – это скалярное произведение вектора локальных приоритетов
критериев на m-вектор, составленный из локальных приоритетов
альтернативы для данного критерия.
Пример решения задачи методом анализа иерархий
1 Пусть число критериев m=4 и вектор локальных приоритетов
критериев имеет вид:
(0.4; 0.3; 0.2; 0.1), сумма компонентов = 1.
2 Пусть число альтернатив n=3, их 4 вектора локальных приоритетов
имеют вид (4 вектора – потому что у нас 4 критерия и, соответственно, 4
матрицы парных сравнений альтернатив по критериям):
(0.15; 0.44; 0.41),
(0.22; 0.31; 0.47),
(0.46; 0.33; 0.21),
(0.19; 0.39; 0.42).
И здесь все суммы равны 1.
3 Составляем три вектора оценок альтернатив по критериям. Легко
заметить, что это – наши столбцы:
(0.15; 0.22; 0.46; 0.19) – оценка 1-й альтернативы по всем 4-м
критериям,
(0.44; 0.31; 0.33; 0.39) – оценка 2-й альтернативы,
(0.41; 0.47; 0.21; 0.42) – оценка 3-й.
Здесь суммы компонентов, конечно, не всегда будут равны 1.
4. Находим три скалярных произведения. Вспоминаем, что скалярное
произведение – это число, равное сумме парных произведений компонент с
одинаковыми номерами в векторе (1-ю на 1-ю, 2-ю на 2-ю и так m раз, а
потом сложить). Первый сомножитель у нас один и тот же. Это вектор
47
локальных приоритетов критериев (0.4; 0.3; 0.2; 0.1). Вторые сомножители –
наши последние вектора.
1) (0.15; 0.22; 0.46; 0.19)
0.4x0.15+0.3x0.22+0.2x0.46+0.1x0.19 = 0.237
2) (0.44; 0.31; 0.33; 0.39)
0.4x0.44+0.3x0.31+0.2x0.33+0.1x0.39 = 0.374
3) (0.41; 0.47; 0.21; 0.42)
0.4x0.41+0.3x0.47+0.2x0.21+0.1x0.42 = 0.389
0.237+0.374+0.389 = 1.
Сумма компонентов равна 1, нормировать не надо, мы сразу получили
решение задачи - вектор глобальных приоритетов:
(0.237; 0.374; 0.389).
5. Анализ результатов. Мы видим, что у нас лучшей оказалась третья
альтернатива, вторая немного хуже. Явного победителя нет. Поэтому,
вообще говоря, следовало бы провести дополнительное сравнение этих двух
альтернатив, отбросив первую. Например, добавить новые, менее важные
критерии.
6. Выводы по МАИ. Вычисленные глобальные приоритеты
альтернатив,
т.е.
нормированные
векторы,
представляют
собой
математическое решение поставленной задачи.
Вектор приоритетов уровня критериев показывает направления
совершенствования объекта, отображая важность каждого из свойств или
параметров ("что важно и чего недостаёт объекту в сравнении с другими").
Вектор приоритетов уровня альтернатив позволяет произвести ранжирование
объектов: каждому из них соответствует свой приоритет (компонента
вектора) – число в интервале (0 - 1). Сумма приоритетов равна 1.Чем это
число больше, тем объект предпочтительнее.
Вектор приоритетов уровня альтернатив дает числовую характеристику
для каждого возможного варианта выбора, его можно использовать в
качестве критерия обобщенной ценности в задачах распределения ресурсов.
Если в состав альтернатив включить лучшие из известных объектов данной
отрасли, то, вычислив приоритеты, можно определить уровень предлагаемых
технических, организационных и бизнес проектов.
К настоящему времени разработано много вариантов метода анализа
иерархий, упрощённых и усложнённых. Мы изучили классический вариант
метода [Саати].
48
Для анализа решений в сетевых структурах Т. Саати разработал
«аналитический сетевой процесс» (analytic network process).
Контрольные вопросы
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
Метод анализа иерархий: сущность, условия, основные задачи.
Базовая иерархическая структура метода анализа иерархий.
Построить 3-уровневую полную доминантную иерархию МАИ.
Построить 4-уровневую полную доминантную иерархию МАИ.
Парные сравнения в МАИ и шкала Саати, построить матрицу парных
сравнений.
Пояснить свойства матрицы парных сравнений, построив её.
Каково количество матриц парных сравнений для 3-уровневой
иерархии: 1 цель, m критериев и n альтернатив?
Главное собственное число и собственный вектор матрицы парных
сравнений.
Локальные приоритеты и методы их вычисления.
Построить матрицу парных сравнений 3-го порядка, упрощённо
вычислить её локальные приоритеты.
Согласованность, индекс и отношение согласованности в МАИ.
Глобальные приоритеты и их вычисление, пример вычисления.
Анализ результатов в МАИ: что показывают локальные и глобальные
приоритеты.
Придумать и сформулировать задачу выбора в терминах МАИ,
построить матрицы парных сравнений для неё.
Основные системные задачи, где применяется метод анализа иерархий.
Какие виды иерархий Вы знаете? Назвать уровни иерархии. Какая
иерархия называется доминантной полной иерархией? Привести
пример 3-х или 4-х уровневой иерархии.
2.2.3. Метод взвешенных сумм и его аналоги
Метод взвешенных сумм (наиболее популярный
наряду с методом анализа иерархий количественный метод)
Здесь глобальная оценка альтернативы (то есть её функция полезности)
имеет вид:
N
U = ∑ wi xi
i =1
49
,
где wi — вес (важность) i -го критерия, назначаемый ЛПР; xi — оценка
альтернативы по i -му критерию.
Заметим, что это – скалярное произведение вектора весов (локальных
приоритетов) критериев на вектор оценок альтернатив.
Сумма весов критериев в методе взвешенной суммы должна быть
нормирована:
N
∑ wi = 1 .
i =1
Иногда этот метод используют при одинаковых весах критериев. Это
уже известный нам метод простой суммы.
Если, wi = 1 , (i = 1,..., N ) а xi , измеряется в целых числах (баллах), то это –
балльный метод.
Логическим обоснованием метода взвешенной суммы является
представление об общей полезности альтернативы как о сумме оценок
нескольких независимых критериев. Коэффициенты wi выражают
относительную важность оценок критериев.
Критерии могу быть комплексными, то есть и в прямых методах могут
возникать древовидные структуры. В них расчёт глобальных показателей
идёт от частных критериев к общим, то есть вверх по уровням иерархии.
Оценка альтернатив методом взвешенной суммы – скоринг, от
английского to score – подсчитывать очки, баллы. Результаты оценки –
рейтинги, (rating – оценка, определение ценности). Рейтинг вуза, рейтинг
студента. Понятно, что эти методы используются на практике очень широко.
Мультипликативный метод
Здесь глобальная функция полезности альтернативы
произведение «частных» функций полезности с учётом их веса:
–
это
N
U = ∏ wi f ( xi )
i =1
Чаще
f ( xi ) = e xi .
всего
принимают f (xi ) = xi .
Реже
используют
зависимость
Путем логарифмирования мультипликативный метод можно свести
к суммированию логарифмов оценок, поэтому иногда его объединяют с
методом взвешенных сумм. Логическим обоснованием мультипликативного
метода является представление об оценках по критериям, как о вероятностях
достижения определенных показателей качества.
50
Метод ранжирования (упорядочения) критериев
В данном методе критерии упорядочиваются по важности, после чего
веса критериев определяются только их позицией (номером) в
упорядоченном списке. Иногда считается лучшей альтернатива, имеющая
более высокую оценку по более важному критерию вне зависимости от
оценок по прочим критериям (то есть здесь вес первого критерия равен 1, а
остальных 0).
Методы сравнения разностей оценок альтернатив
Во многих методах принимается порядок действий: сначала оценивают
полезность альтернативы, а уже потом сравнивают альтернативы между
собой. Между тем существует группа методов, в которых принят совсем
иной порядок: альтернативы сначала сравниваются по критериям, а уже
потом осуществляется общее сопоставление всех достоинств и недостатков
каждой из них.
Пусть (x1 , x2 ,..., xN ) , ( y1 , y2 ,..., y N ) — оценки альтернатив x и y по N
критериям. Тогда альтернатива x предпочтительней, чем альтернатива y ,
если
N
∑ ϕ i [U i (xi ) − U i ( yi )] ≥ 0 ,
i =1
где U i — функция полезности для i -го критерия, ( ϕ i — функция,
определяющая влияние разностей оценок по i -му критерию на результат
сравнения двух альтернатив.
Теоретическое обоснование этих методов показало, что метод
сложения разностей оценок совпадает с методом взвешенных сумм, если в
первом из них все функции линейны.
Контрольные вопросы
1)
2)
3)
4)
5)
Провести сравнение метода анализа иерархий и метода взвешенной
суммы.
Методы простой и взвешенной суммы, скоринг и рейтинг.
Придумать пример определения рейтинга методом взвешенной суммы.
Придумать пример определения рейтинга методом простой суммы.
Мультипликативный метод и его связь с методами сумм.
51
2.2.4. Методы матрицы решений и дерева решений
Метод матрицы решений
Для этого метода и его аналогов исходная информация по проблеме
аккумулируется в специальной таблице – матрице решений (табл. 2.5).
Таблица 2.5 – Матрица решений
Варианты внешних условий
АльтернаB1
B2
тивы
…
A1
U 11
U 12
…
…
…
…
…
AN
UN 1
UN
Bm
U 1m
…
UN
2
m
Элементы матрицы решений называются полезностями (utilities).
Полезности – это некоторые количественные оценки (например, в деньгах
или в натуральных показателях) результата принятия решения (выбора
конкретной альтернативы) при том или ином варианте внешних условий,
характеризующих обстановку после принятия решений.
Возможны два случая:
1) вероятности внешних условий заранее известны (ситуация риска);
2) вероятности внешних условий заранее неизвестны (ситуация
неопределённости).
Но в любом случае считается, что сама таблица известна при принятии
решений (весьма сильное предположение).
Выбор лучшей альтернативы (с полезностью U * ) производится на
основании одного из следующих критериев:
1) Максиминный критерий (наибольшая осторожность). Выбирается:
U * = max min U i j
j
i
где i — индекс строки, j — индекс столбца таблицы.
2) Критерий, минимаксного сожаления. Вводится понятие сожаления
для i -й альтернативы при j -м варианте внешних условий:
C i j = max U i j − U i j
i
,
Далее выбирается:
U * = min C i j
j
,
3) Критерий максимакса (крайний оптимизм)
52
U * = max max U i j
i
j
,
4) Критерий Гурвица. Пусть для i -й альтернативы
mi = min U i j
M i = max U i j
j
j
,
.
Для каждой альтернативы A вычисляют показатель:
U i (α ) = α mi + (1 − α ) M i ,
где 0 ≤ α ≤ 1 .
Далее выбирается (при заданном α )
U * = max U i (α )
i
5) Критерий Лапласа. Все варианты внешних условий принимаются
равновероятными и для каждой альтернативы Ai определяется показатель
U i ср =
m
m∑
j =1
1
Ui j
Далее выбирается:
U * = max U i ср .
i
Обычно нет особых оснований априорно считать один критерий чем-то
лучшим, чем другой. Поэтому принято, что такой выбор должен делать
руководитель. Тем более, что он всегда прав (или так думает). Если
исключить очевидные случаи (доминирование одной альтернативы над
всеми), то для ЛПР выбор критерия столь же труден, как и прямой выбор
одной из альтернатив. В решении сложных и ответственных проблем
исследование надо проводить по нескольким критериям.
Метод дерева решений
В англоязычной литературе иногда этот метод называют «наука о
решениях» (decision science). Хотя, конечно, это лишь один из методов науки
о принятии решений и не более того. Этот метод связан с оценкой
вероятностей внешних условий и математических ожиданий эффектов
(полезностей или рисков) на специальных графах - деревьях решений.
Основную идею данного подхода рассмотрим на ростом ппримере. Имеются
два варианта действий: А и Б (например, разрабатывать одну либо другую
технологию производства нового продукта). Пусть при выборе варианта А
точный результат заранее неизвестен и возможны три альтернативных
исхода 1, 2, 3, привлекательность которых может быть оценена в деньгах:
D1 , D2 , D3
. Предположим, что известны вероятности этих исходов: p1 , p 2, p3 .
53
Тогда полезность варианта А определяется по формуле (ожидаемая денежная
оценка):
3
U A = ∑ pi Di
i =1
.
Аналогично оценивается полезность варианта Б . Выбор между А и Б
должен соответствовать большему значению полезности.
Остаются две проблемы: как заранее определить все возможные
исходы различных действий – для этого строится так называемое дерево
решений; как определить вероятности исходов – для этого используется
метод лотерей.
Деревья решений строят, исходя из последовательного анализа всех
возможных событий. Примером может служить небольшое дерево на рис. 2.
Более интригующим является вопрос о том, как получить
субъективные вероятности («шансы»). Это - вероятности, назначаемые ЛПР
и экспертами, ведь статистики неизвестных событий у них практически нет.
Ответ на это сформулирован следующим образом. Пусть E —
некоторое случайное событие реального мира, а l E — лотерея, которая дает
выигрыш W , если E произойдет и выигрыш L — в противном случае. Если
ЛПР не может определить, что для него лучше — лотерея l E или лотерея,
дающая W с вероятностью p и L с вероятностью (1 − p ) , то субъективная
вероятность E принимается равной p .
Итак, определение субъективных вероятностей событий производится
путем поиска безразличия между двумя лотереями подбором вероятности
осуществления событий в одной из них.
Подход применим как при оценках альтернатив по одному критерию,
так и при многокритериальных альтернативах.
54
Рисунок 2.2
Основные прикладные задачи многокритериального анализа
Базовой задачей многокритериального анализа является ранжирование.
Альтернативы, занимающие область в многомерном пространстве критериев
в результате многокритериального ранжирования (например, методом
анализа иерархий или методом взвешенных сумм) становятся линейно
упорядоченными – от «лучшей» к «худшей».
Решение задачи ранжирования служит основой для решения более
сложных и комплексных проблем (системных задач). В этой лекции
рассмотрим основные из них.
1 Выбор одной или нескольких альтернатив, лучших по совокупности
критериев.
2 Кластеризация и классификация.
3 Многокритериальная оптимизация.
4 Проектирование по количественным и качественным критериям.
5 Анализ эффективности проектов.
6 Распределение ресурсов.
7 Управление проектами.
Контрольные вопросы
1)
Метод матрицы решений, построить и объяснить матрицу решений.
55
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
Критерии максимального оптимизма и гарантированного результата;
построить матрицу решений и вычислить.
Критерий Гурвица; построить матрицу решений и вычислить.
Критерии Лапласа и Байеса-Лапласа; построить матрицу решений и
вычислить.
Критерий минимаксного сожаления (критерий Сэвиджа); построить
матрицу решений и вычислить.
Критерий Ходжа-Леманна; построить матрицу решений и вычислить.
Сущность метода дерева решений.
Сущность метода компенсаций.
Сущность метода порогов несравнимости.
Множество Парето, показать пример на плоскости 2-х критериев для
7-ми объектов.
Основные идеи интерактивных методов, их связь с прикладным
системным анализом.
2.3.
Информация и экспертные знания в системном анализе
2.3.1. Основы семантической теории информации
Определение понятия информации
Существует ряд определений, но до сих пор нет общепризнанного.
Вместе с тем информация играет в науке все более фундаментальную роль: в
кибернетике, компьютерных науках, системных науках, биологии, даже в
таких науках как физика (кибернетическая физика) и механика.
Прикладное
значение
информации
очевидно.
Перейдем
к
существующим определениям.
«Информация есть информация, а не материя и не энергия» (Н.Винер).
«Материя и энергия – сохраняемые сущности реального объекта, а
информация – несохраняемая сущность, она связана со структурой объекта и
её изменениями, процессами (Жилин).
В гуманитарных науках часто используется тавтологическое
определение: «информация есть сведения, знания, переданные кем-то другим
или приобретенные собственным путем исследования или изучения…»
«Информация – это сведения, содержащиеся в сообщении, объекте
передачи, хранении, обработке».
Иногда информацию связывают с упорядоченностью:
56
«Информация означает порядок, создания порядка из беспорядка,
увеличение степени порядка после построения сообщения».
Философы часто определяют информацию как отражение
«Информация – это отражения в сознании людей причинноследственных связей в окружающем мире».
«Информация – это содержание процессов отражения».
Информацию определяют и как алгоритм:
«Информация есть некий алгоритм, совокупность примеров правил и
сведений».
Можно сделать вывод, что общепринятого определения информации
всё ещё нет.
Синергетика (наука о процессах самоорганизации) внесла свой вклад,
поскольку в ней информация: а) используется в исследовании процессов
самоорганизации; б) здесь актуален вопрос о возникновении и эволюции
ценной информации.
Понятие ценной информации является очень важным и для системного
анализа. Его мы рассмотрим позже, а сейчас – два определения информации,
важные именно для синергетики и системного анализа.
Определение Г. Кастлера:
«Информация есть случайный и заполненный выбор одного варианта
из нескольких возможных и равноправных».
Но это определение не исчерпывает всех случаев, и поэтому Д.С.
Чернавский уточнил определение Кастлера.
Определение информации по Д.С. Чернавскому:
«Информация
- есть запомненный выбор одного варианта из
нескольких возможных и равноправных».
Здесь исчезло слово «случайный», поскольку выбор может быть как
случайным, так и неслучайным, сделанным, например, под внешним
воздействием. Или, добавим от себя, выбор как результат решения проблемы:
решил – и сделал выбор.
Согласно Д.С. Чернавскому, неслучайный выбор – это рецепция
(приём) информации, а случайный выбор – генерация информации. В любом
из этих случаев если информация не запоминается, то
это –
микроинформация, а запомненный выбор - макроинформация.
Возможный и равноправный выбор – это значит, что варианты выбора
принадлежат одному множеству (например, слов одного языка, букв одного
57
алфавита) и априорные (заранее предполагаемые) различия между ними
невелики.
Количество информации
Понятие «количество информации» сформулировано в работах
американских учёных Хартли и (особенно) Шеннона. Оно является
центральным в «классической» теории информации, основная проблема
которой – изучение передачи информации по каналам связи, хранения её,
кодирования и декодирования, борьбы с шумами и помехами. Отметим –
безотносительно к смыслу (семантике) передаваемых сообщений. В
настоящее время развиваются и другие разделы теории информации –
динамическая теория информации, семантическая теория информации,
теория квантовой информации. Но в их основе находится теория
информации Шеннона и её методы измерения количества информации. Мы
рассмотрим основные формулы, относящиеся к передаче информации в
дискретном (цифровом, алфавитном) виде. Сейчас – это основной метод
работы с информацией. Да и формулы проще, чем в «непрерывной» теории.
По К. Шеннону количество информации IN в сообщении, содержащем
N символов определяется по формуле:
(1)
M - число букв (символов) в используемом алфавите;
pi - частота (статистическая вероятность) появления i-той буквы в
языке сообщения;
минус – чтобы величина IN была неотрицательной.
Двоичные логарифмы используются в теории информации исходя из
естественного требования, чтобы в минимальном сообщении содержалось
количество информации, равное 1. Минимальный алфавит состоит из двух
символов, например 0 и 1 (меньше нельзя): M=2, минимальное сообщение –
из одного символа N=1, частоты символов равны: Pi= .
Подставив эти значения в формулу (1) действительно получим 1:
I2= -1 (
(-1) + (-1)) = 1.
Это минимальное количество информации I=1, получило название
«бит» (от английских слов binary digit – двоичный знак). Если в (1)
58
использовать натуральные логарифмы, то единица информации называется
«нат». Между битами и натами существуют соотношения:
1 бит = 1.44 ната;
1 нат = 0.69 бита.
Поскольку в компьютере, калькуляторе содержится стандартная
функция для вычисления натуральных логарифмов, то в практическом плане
удобнее сначала вычислить количество информации в натах, а затем
перевести в биты, умножив на 1.44.
Рассмотрим иную ситуацию – выбор варианта (напомним, что в
системном анализе варианты называются альтернативами).
Если делаем выбор одного из n возможных вариантов (с известными
вероятностями этих вариантов pi, i= 1;2;…n) то количество информации, то
количество информации определяется по формуле:
(2)
Если все варианты равновероятны:
, тогда формула (2) принимает
вид:
(3)
Это исторически первая формула теории вероятностей, формула
Хартли.
В частном случае бинарного алфавита (M=2; 0 и 1) число вариантов
равно 2N; pi = E-N; log2pi = -N; I=N.
Это совпадает с (1) при бинарном равновероятном алфавите и N
символах в сообщении.
Формулы (1) и (2) отражают количество информации, но не ее
ценность. Количество информации в сообщении, определяемое формулой
Шеннона, не зависит от сочетания букв: переставив (случайным образом или
кодированием) буквы мы можем делать сообщение бессмысленным.
Количество информации по Шеннону сохранится, а ценность информации
может исчезнуть.
Эта информация (по Шеннону) полезна в статистической теории связи,
но бесполезна в системном анализе и других дисциплинах, занимающихся
знаниями.
Количество и ценность информации – разные понятия и не стоит
подменять одно другим.
59
Допустим, что любое сочетание букв в тексте является ценным. В этом
умозрительном, нереальном случае количество ценной информации
совпадает с полным количеством, определяемым формулой (2) и не может
превышать его. По жизни ценной информации в тексте меньше, иногда её
нет вообще. Поэтому максимальное количество информации в (2) названо
информационной тарой [Корогодин]. Это понятие играет существенную
роль при рецепции (приеме/ передаче) информации и при ее перекодировке.
Текст на русском языке содержит Nr букв кириллицы (алфавит
содержит 32 буквы; Mr =32;). Английский перевод содержит Na букв; Ma=26;
Русский текст – результат выбора определенного варианта из Na = 32Na
возможных. Английский перевод – выбор (преопределенный русским
текстом) одного варианта из Na = 26 Na возможных. Если смысл не искажён,
то количество ценной информации одинаково, а количество информации по
Шеннону
различно.
Процессы
генерации,
рецепции
обработки
сопровождаются «переливаем» информации из одной тары в другую. При
этом, как правило, количество информации по Шеннону уменьшается, а
количество ценной информации сохраняется и, даже, возрастает.
Таким образом, информационная тара – это мощность множества, из
которого могут быть выбраны варианты (алфавит, слова, тексты).
Информационная емкость – свойство информационных систем (например,
информационная емкость компакт-диска равна 720 МБ).
Ценность информации
Создатель классической теории информации К. Шеннон отметил, что
смысл (т.е. семантика) сообщений не имеет никакого отношения к его теории
информации и занимающегося текстовыми сообщениями. Но возможность
точного измерения информации в сообщениях, созданная теорией
информации Шеннона, наводила на мысль о возможности существования
способов измерения информации более общего вида – макроинформации
Кастлера и Чернавского и семантической информации, содержащейся в
предложениях естественного или (хотя бы) формализованного языка.
Эта задача далека от своего решения, но имеет всё возрастающее
теоретическое и практическое значение.
Понятия ценности, осмысленности информации – центральные в
современной информатике, системном анализе. Ценностью информации,
смыслом сообщений занимается семантическая теория информации.
Основные положения семантической теории информации.
60
1. Ценность информации зависит от цели.
Если цель достижима, то ценность информации может быть определена
по уменьшению затрат на её достижение.
Если достижение цели – не обязательно то ценность информации V по
Бонгарду и Харкевичу равна:
(5)
p - вероятность достижения цели до получения информации (она в
знаменателе формулы);
P - вероятность достижения после получения информации (она в
числителе);
Априорная вероятность p зависит от информационной тары, от полного
количества информации I, определяемого по формуле (2): p=2-I.
Так если все варианты равновероятны то p=1/n; I=log2n;
Апостериорную вероятность P может быть как больше, так и меньше p;
тогда (P < p). Это – дезинформация. При изменении апостериорной
вероятности P в пределах 0<P<1, ценность информации по Бонгарду и
Харкевичу изменяется в пределах -∞<V<Vmax;
Ценность информации по Корогодину даётся формулой:
V=
(6)
Она изменяется в пределах V ≤ V≤ 1.
2. Ценность информации зависит от величины p , от так называемого
тезауруса (предварительной информации).
Если предварительной информации нет, то p= ;
а если p=1 то ценность V=Vmax = log2n; т.е. совпадает с максимальным
количеством информации в данном множестве символов (в данной
информационной таре).
Это совпадение не случайно, именно для этого была выбрана формула
(5) для определения ценности информации– при этом ценность информации
можно понимать как количество ценной информации.
В формуле (6) при
1
1
n = 1.
p = , P = 1 получаем: V = V max =
1
n
1−
n
1−
61
Итак, по Бонгарду-Харкевичу:
-∞ < V ≤ log2 n.
По Корогодину (здесь нет понятия дезинформации)
0 ≤ V ≤ 1.
3. Количество информации, имеющей нулевую ценность, как правило,
не мало с количеством информации, имеющем хоть какую-то ценность для
реципиента (получателя).
Понятно, что ценность информации субъективна – она зависит от целей
и тезауруса реципиента.
Бессмысленная информация – это информация, не имеющая ценности
ни для кого из тех, кого интересует смысл текста. Соответственно, как
противоположность, возникает понятие осмысленной информации.
Объективность понятия «осмысленная информация» основана на
следующем утверждении: в информационной таре, куда может быть
помещена данная информация, можно выделить определенное количество
информации, которая ни для кого, ни для каких дел не понадобится. Это –
бессмысленная информация, все остальное – осмысленная. Но!
Осмысленность текста зависит от тезауруса. Для человека, не знающего
иероглифов, любой текст, составленный из них – текст бессмысленный.
Итак, различение понятий «количество информации», «ценность
информации», «осмысленность информации» очень важно.
Во-первых, в традиционной информатике, основанной на классической
теории информации (названной автором, Шенноном «математической
теорией связи»), не существуют и не обсуждаются вопросы о ценной
информации, её возникновении и эволюции. Ценность рассматривается в
предположении, что цель задана извне. Вопрос о спонтанном возникновении
цели внутри системы не рассматривается.
С точки зрения теории систем, здесь рассматриваются процессы в
связях, а системному анализу нужны и связи, и элементы. И понятие цели
играет в системном анализе основополагающую роль, поскольку он
занимается целенаправленными системами.
В синергетике где также исследуются эти проблемы, показано
[Чернавский], что ценность информации способна эволюционировать:
неценная информация становится ценной, а бессмысленная – осмысленной, и
наоборот. Цели системы могут возникать, меняться и исчезать в процессе
развития.
62
Во-вторых, отождествление понятий просто информации, ценной
информации, осмысленной информации приводит к недоразумениям. Для
них невозможно дать единое объективное (воспринимаемое всеми) и
конструктивное (полезное для развития науки и практики) определение.
Напротив, разделив эти понятия можно дать конструктивное определение
каждому из них, оговорить меру условности и субъективности.
Вот еще две меры, связанные с истинностью информации [Лидовский].
Первая:
inf(s) = -log2 p(s) = -1.44 ln p(s)
где s – предложение, смысл которого измеряется;
p(s) – вероятность того, что предложение S – истинно.
Понятно, что эта мера подходит только для простых предложений. Но
тем не менее.
Некоторые свойства функции inf(s):
1) inf(s) ≥ 0 поскольку 0 ≤ p(s) ≤ 1;
2) при p(s) = 1, inf(s) = 0 (в тривиальном (истинном) предложении
никакой информации не содержится);
3) при p(s) → 0, inf(s) → ∞ – чем неожиданнее сообщение, тем больше
информации в нём содержится.
Из свойств (2) и (3) следует, что p(s) совпадает с априорной
информацией р в формулах Бонгарда и Корогодина.
Но здесь это «внешняя» информация, находящаяся в сообщении, а там
– «внутренняя», определяемая также и тезаурусом получателя.
4) если s1 → s2 (из s1 следует s2) истинна, то inf(s1) ≥ inf(s2);
5) условия независимости: inf(s1s2) = inf(s1) + inf(s2) ↔ p(s1) * p(s2) =
p(s1*s2).
Значение функции-меры inf(s) больше для предложений, исключающих
большое количество возможностей. Пример: из s1: “a > 3” из s2: “а = 7”,
следует, что s1 → s2 и inf(s2) > inf(s1). Ясно, что s2 исключает больше
возможностей, чем s1.
Вторая:
cont(s) = 1 - p(s).
Связь между этими мерами даётся формулами:
cont(s) = 1 – 2-inf(s) = 1 – e-0.69 inf(s);
inf(s) = -log2(1 - cont(s)) = -0.69ln(1 – inf(s))
63
Контрольные вопросы
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
17)
18)
19)
20)
21)
22)
Фундаментальность понятия «информация», основное отличие
информации от материи и энергии.
Формула Шеннона для сообщения, единицы измерения информации.
Формула Шеннона для выбора, связь с системным анализом.
Формула Хартли, единицы измерения информации.
Основные информационные процессы и системный анализ.
Значение и недостаточность классической теории информации для
системного анализа.
Роль информации в живой природе и технике.
Какие вопросы изучает теория информации – «классическая» и
семантическая.
Дайте собственное определение понятию «информация».
Что называют сигналом, для чего служат сигналы? Типы сигналов.
Соотношения между единицами информации: бит, байт, килобайт, нат.
Сколько битов и натов содержится в 1 Мб?
Связь между понятиями «энтропия» и «информация» в теории
информации.
В алфавите 10 символов, вероятности их появления в сообщении
равны. Найти количество информации по Шеннону (в битах и натах) в
сообщении из 10+n символов, где n – Ваш номер в списке группы.
В алфавите 4 символа, вероятности их появления в сообщении
возрастают по линейному закону начиная с p1=0.1. Найти количество
информации по Шеннону (в битах и натах) в сообщении из 12+2n
символов, где n – Ваш номер в списке группы.
Определение информации по Кастлеру и Чернавскому.
Понятия «ценная информация», «осмысленная информация»,
«тезаурус».
Понятия «информационный объём» и «информационная тара».
Какие характеристики информации сохраняются, а какие нет при
переводе информации из одной информационной тары в другую?
Мера ценности информации по Бонгарду-Харкевичу.
Мера ценности информации по Корогодину.
Вероятностные меры семантики высказываний.
Сравнить классический и семантический подходы к информации для
задач системного анализа.
64
23)
24)
25)
26)
27)
28)
Основные информационные процессы. Рецепция и генерация ценной
информации.
За счёт каких процессов может
возрастать количество ценной
информации в системе?
Найти ценность информации по Бонгарду-Харкевичу, если после её
получения вероятность достижения цели увеличилась в 4 раза.
Найти апостериорную вероятность достижения цели, если после
получения сообщения ценность информации по Бонгарду-Харкевичу
составила V=3. Априорная вероятность равна 1/(10+n), где n – Ваш
номер в списке группы.
Найти ценность информации по Корогодину, если после её получения
вероятность достижения цели увеличилась в e раз.
Найти апостериорную вероятность достижения цели, если после
получения некоторого сообщения ценность информации по
Корогодину составила V =0.99. Априорная вероятность равна 1/(10+n),
где n – Ваш номер в списке группы.
2.3.2. Вербальный анализ решений
Основой вербального анализа решений (ВАР) является качественное
(вербальное, то есть словесное) описание проблемы, которое сохраняется
(без перевода ее в числовую форму) на всех этапах анализа.
Теоретическое обоснование. Методологически ВАР опирается на
психологические модели человеческой системы переработки информации,
теории поведения индивида при решении многокритериальных задач.
Подход ВАР позволяет постепенно разработать решающее правило
методом "проб и ошибок", характерным для поведения человека.
Предусмотрена возможность получения для ЛПР объяснений результатов
анализа в виде, понятном для ЛПР. Подход ВАР опирается на некоторые
результаты многокритериальной теории полезности, связанные с
выполнением условий независимости. Эти результаты используются при
вербальных оценках.
Измерения. В рамках подхода ВАР большое значение уделяется
проблемам получения информации от ЛПР и экспертов. В качестве языка
описания (структуризации) решаемой проблемы используется естественный
язык, привычный для ЛПР и экспертов. Разрабатываются порядковые шкалы
оценок по критериям с вербальными оценками. Далее осуществляются
логические операции преобразования вербальной информации. Все
65
процедуры получения информации от ЛПР основаны на использовании
вербальных оценок качества по отдельным критериям.
В отличие от подхода количественного анализа решений (КАР), где
информация берется "одномоментно" в полном виде, в подходе ВАР
получение информации ЛПР - поэтапное.
Пример. Рассмотрим пример описания проблемы и выбора варианта
решения двумя подходами - КАР и ВАР.
Пусть имеется проблема выбора наилучшего проекта на конкурсе
проектов решения крупной социально-технической задачи (например,
предотвращение наводнений в крупном городе, постройка завода по
переработке отходов и т.д.). Предположим, что конкурсная комиссия
подготовила следующий список критериев для оценки проектов.
А. Эффективность проекта.
Б. Воздействие на окружающую среду.
В. Стоимость реализации.
Г. Шансы на реализацию в намеченный срок.
Пусть на конкурс поступило три проекта.
Рассмотрим, как задача выбора наилучшего проекта может быть
решена методом КАР. ЛПР (конкурсная комиссия) и эксперты, оценивают
проекты по приведенным выше критериям.
Пусть по каждому критерию имеется количественная шкала оценок от
0 (худшая) до 100 (лучшая). Далее назначается самый важный критерий.
Предположим, что это – эффективность проекта. Она изображается
графически в виде столбика (рис. 2.3). Эксперта просят графически
определить оценки по другим критериям, сравнивая их с высотой столбика,
соответствующего эффективности. Кроме того, ЛПР определяет
сопоставимую важность (веса) критериев в виде столбиков различной
высоты.
66
Рисунок 2.3 – Графическое представление оценок проектов при
подходе КАР
Измеряя высоту столбиков на рисунке 2.3, получим численные
значения оценок и весов критериев, представленные в таблице 2.6.
Таблица 2.6 – Численное представление оценок проектов при подходе
КАР
Критерии
А
Б
В
Г
Проекты
Р2
Р1
95
39
15
70
Р3
58
45
63
95
67
90
81
45
12
Веса
критериев
0,4
0,2
0,2
0,2
Далее применяем формулу взвешенных сумм оценок критериев:
N
U j = ∑ W i X ij ,
i =1
где Uj- полезность проекта j, j = 1, 2, 3; Wi – вес критерия i, i = 1,... 4;
Хij- оценка проекта у по критерию i; N – количество критериев.
Используя эту формулу, получим: U1 = 62,8; U2 = 63,8; U3 = 63,6.
Из анализа следует, что полезности проектов Р2 и Р3 мало
различаются, но Р2 немного лучше и должен быть выбран конкурсной
комиссией.
Приведем теперь способ описания и решения этого гипотетического
примера на основе подхода ВАР. Прежде всего, в качестве средства
измерения оценок проекта по критериям используются порядковые шкалы с
вербальными оценками, приведенные ниже.
А. Эффективность проекта.
1. Полностью удовлетворяет требованиям.
2. Удовлетворяет основным требованиям.
3. Не удовлетворяет основным требованиям.
Б. Воздействие на окружающую среду.
1. Нет заметного отрицательного воздействия.
2. Сравнительно небольшое и допустимое воздействие.
3. Заметное отрицательное воздействие.
В. Стоимость реализации проекта.
1. Не превышает реальные возможности финансирования.
2. Незначительно превышает возможные расходы.
3. Проект заметно дороже, чем первоначально ожидалось.
Г. Шансы реализации в срок.
1. Хорошие.
2. Средние.
3. Небольшие.
Приведенные описания представляют собой язык, принятый ЛПР и
экспертами. В табл. 2.7 представлены оценки проектов.
68
Таблица 2.7 – Оценки проектов при подходе ВАР
Проекты
Критерии
П1
П2
А
А1
А2
Б
Б2
Б2
В
В3
В2
Г
Г2
Г1
П3
А1
Б1
В2
Г3
Поясним таблицу. Запись А1 в клетке на пересечении строки матрицы
"Критерий А" (эффективность проекта) и столбца П1 (проект №1) – это
значит, что проект №1 по критерию эффективности полностью
удовлетворяет требованиям. И так по всем клеткам матрицы.
При подходе ВАР информация ЛПР выявляется поэтапно и проекты
сопоставляются попарно. При обсуждении проблемы уточняется, что
небольшое воздействие на окружающую среду допустимо. При
сопоставлении Р1 и Р2, задача сводится к сравнению пониженной
эффективности проекта с существенно большей стоимостью. Пусть ЛПР
выбирает Р2.
При сопоставлении проектов Р2 и Р3 сравнивается пониженная
эффективность
с
значительной
задержкой
реализации
проекта.
Предположим, что, будучи осторожным, ЛПР (конкурсная комиссия)
выбирает Р2.
Итак, получен тот же результат, но процесс решения был совершенно
иной. В вербальном анализе мы использовали парные сравнения как в МАИ,
но обошлись вообще без математических расчетов, даже таких простых, как
в методе взвешенной суммы. Разработано немало методов вербального
анализа решений [Ларичев, Мошкович].
Методы количественного анализа решений широко известны и
применяются при решении самых разных задач. В то же время результаты
психологических исследований убедительно демонстрируют возможности и
ограничения системы переработки информации человеком. Поэтому
заслуживают
внимания
методы
вербального
анализа
решений.
Многочисленные практические применения показали, что нет универсальных
методов и метод должен соответствовать особенностям решаемой задачи.
Контрольные вопросы
1)
2)
Провести сравнение количественного и вербального анализа решений.
Основные идеи и особенности вербального анализа решений.
69
3)
4)
5)
6)
7)
8)
9)
10)
Сравнить процедуры измерений (оценок) в количественном и
вербальном анализе решений.
Придумать пример задачи выбора для вербального анализа решений.
Построить систему критериев и оценок для вербального анализа
решений.
Построить и объяснить матрицу вербального анализа решений.
Провести (показать на примере) сравнительный анализ альтернатив
вербальной компенсацией.
Провести сравнение количественного и вербального подходов к
анализу решений.
Графическое представление оценок в количественном и вербальном
анализе решений.
Придумать и решить вербальным методом задачу выбора (2-3
альтернативы, 2-3 критерия, 3 уровня шкалы оценок).
2.4.
Прикладной системный анализ
Из всех видов информационных процессов: передача, получение,
хранение, обработка, анализ информации нам в нашем курсе, конечно же,
наиболее интересен анализ. В этом разделе курса рассматриваются вопросы
применения современных информационных технологий в прикладном
системном анализе.
Вспомним, что термин «прикладной системный анализ» (сам
системный анализ – прикладная наука) относится к системному анализу с
использованием компьютеров и специального программного обеспечения.
Прикладной системный анализ сложных проблем на современном
уровне невозможен без информационно-аналитической системы (ИАС)
особого типа. Это - система поддержки принятия решений (СППР),
использующая передовые информационные технологии. К таким
технологиям сегодня следует отнести в первую очередь: хранилища данных
(Data Warehouse), оперативный анализ данных (OLAP-технологии) [Барсегян
и др.]) интеллектуальный анализ данных (Data Mining). [Дюк и Самойленко,
Барсегян и др.].
При разработке таких систем используются СASE-технологии [Марка и
Мак-Гоуэн], такие, как SADT (при структурном подходе к проектированию
систем и программного обеспечения) и «унифицированный язык
моделирования» UML (при объектно-ориентированном подходе)..
70
Технологии Data Mining («разработка данных») служат для
обнаружения закономерностей в данных, взаимосвязей между данными, в
общем – для интеллектуального анализа больших массивов данных [Дюк и
Самойленко, Барсегян и др.]. Многокритериальные методы (часть 2) и
технологии Data Mining - это основные современные инструменты
прикладного системного анализа.
Эти технологии представляют собой «оболочку» СППР, «ядром» же
являются методы системного анализа, в том числе – рассмотренные в
предыдущем разделе. Любая СППР, независимо от методов и технологий,
должна обеспечивать возможность оперативного диалога с исследователем
(экспертом, аналитиком-консультантом или лицом, принимающим решение).
То есть она должна быть интерактивной, или как говорили в прошлом веке,
человеко-машинной.
Новые термины:
CASE –Computer Aided System/Software Engineering,
OLAP – On-Line Analytical Processing,
SADT – Structured Analysis and Design Technique,
UML – Unified Modeling Language.
2.4.1. Информационно-аналитические системы и системы поддержки
решений
Виды систем поддержки принятия решений
Основное требование к СППР - возможность не только оперативной
(онлайновой) обработки накопленных данных, но и проведение
аналитической обработки этих данных. То есть они должны обеспечить
оперативное проведение системных исследований, работая с большими
объёмами данных. Появление таких систем обусловлено достижениями в
области технологий получения, хранения и распределенной обработки
больших массивов информации.
СППР можно разделить на две группы:
- оперативные, предназначенные для немедленного реагирования на
текущую ситуацию;
- стратегические, предназначенные для анализа большого количества
информации из разных источников с привлечением знаний (методик
расчётов, многокритериального и статистического анализа…), экспертных
систем, аккумулирующих опыт решения проблем.
71
СППР первого типа по сути представляют собой генераторы отчетов,
построенные на основании данных из специализированной базы данных
(БД), в идеале адекватно отражающей в режиме реального времени все
аспекты производственного цикла предприятия или работы организации. Для
такой информационно-аналитической системы характерны следующие
основные черты:
- отчеты, как правило, базируются на стандартных для организации
запросах;
- система представляет отчеты в максимально удобном виде,
включающем, наряду с таблицами, деловую графику, мультимедийные
возможности и т. п.;
- как правило, эти системы ориентированы на конкретную сферу,
например финансы, маркетинг, управление ресурсами, документооборот.
Чаще всего результаты работы этой ИАС доступны лишь тем
подразделениям, в которых первичная информация собирается. Схема
использования данных в таких системах следующая:
«Специализированная БД -> Средство Анализа -> Отчёт»
(3.1)
Развитие СППР второго типа, работающих с большими массивам
информации, связано с появлением ряда новых концепций хранения и
анализа корпоративных данных:
- хранилища данных (ХД, Data Warehouse) [Архипенков и др.];
- оперативная аналитическая обработка (On-Line Analytical
Processing, OLAP) [Дюк и Самойленко, Барсегян и др.];
- интеллектуальный анализ данных
-(Data Mining) [Дюк и
Самойленко, Барсегян и др.].
В схеме (3.1) добавилось новое звено:
«БД-> Хранилище Данных <-> Средство Анализа ->Аналитик->
Отчёт»
(3.2)
Хранилища данных
Хранилища данных (Data Warehouse, информационные хранилища,
склады
данных)
определяют
как
предметно
ориентированные,
интегрированные, неизменчивые, поддерживающие хронологию наборы
данных, организованные для целей поддержки управления, обеспечивающего
аналитиков достоверной информацией, необходимой для оперативного
анализа и принятия решений.
72
Наличие ХД в схеме (3.2) вызвано появлением нерегламентированных
запросов аналитиков, ориентированных на обработку не только
количественных данных, а и важной информации, хранящейся в виде текстов
(обзоры, статьи, нормативные акты, стандарты, приказы и т.п.).
Основные требования к ХД сводятся к следующему:
- поддержка высокой скорости получения данных из хранилища;
- поддержка внутренней непротиворечивости данных;
- возможность получения и сравнения так называемых срезов данных;
- наличие удобных утилит просмотра данных в хранилище;
- полнота и достоверность хранимых данных;
- поддержка качественного процесса пополнения данных.
Хранилищам данных присущи следующие свойства.
1 Предметная ориентация. В традиционной схеме реализации
информационной системы источником данных для средств анализа являются
общие БД, а сами данные ориентированы на обработку и функциональность
систем сбора информации. В хранилищах данных данные ориентированы на
решение задач системного анализа проблем. Как правило – в конкретной
предметной области. Предметная ориентация является фундаментальным
отличием БД от ХД. Именно это свойство позволяет конечному
пользователю работать с данными, охватывающими предмет исследования в
целом. Разные приложения в ХД могут описывать одну и ту же предметную
область с разных точек зрения, поскольку решение, принятое на основе
данных, отражающих только одну сторону вопроса, могут быть
неэффективными, а то и неверными.
Предметная ориентация позволяет существенно ускорить доступ к
данным за счет предварительной структуризации данных. Предметная
ориентация позволяет также хранить в ХД только те данные, которые
необходимы для средств анализа.
2 Интеграция.
Различные
БД
разрабатываются
различными
коллективами разработчиков, зачастую в разное время и различными
средствами разработки. Это приводит к тому, что объекты, отражающие одну
сущность, имеют различные наименования и единицы измерения.
Обязательная интеграция данных в ХД позволяет решить эту проблему.
Это ключевое свойство ХД реализуется на таких принципах:
- единые правила наименования объектов;
- единые единицы измерения для однотипных объектов;
- единое физическое представление однотипных объектов;
73
- единые атрибуты представления однотипных объектов.
3 Поддержка хронологии. Требования к эффективности обычной базы
данных диктуют достаточно жесткие рамки для временного периода
хранения непосредственно доступных данных. Некоторые данные в БД
вообще не имеют временной привязки, а хронология данных в различных БД
может осуществляться разными способами.
Строгая и однотипная хронология в ХД позволяет решить все эти
проблемы за весь временной период существования данных. В результате
конечный пользователь всегда имеет точное и единообразное представление
о временной привязке всех данных и документов. Образное сравнение: база
данных – это супермаркет, где просроченные и старые товары заменяются
свежими и новыми, а хранилище данных – это архив, где документы
хранятся "вечно".
4 Неизменяемость. Данные в БД могут добавляться, удаляться и
модифицироваться, данные в ХД могут только загружаться и читаться. Это
свойство ХД позволяет решить две проблемы:
- однажды полученные результаты на основе исходных данных всегда
сохраняются;
- скорость доступа к данным повышается.
На рис. 2.4 изображена структура данных в хранилище данных.
Рисунок 2.4 - Структура данных в хранилище данных
Все данные в хранилище данных делятся на три основных категории:
- метаданные (данные о данных);
- детальные данные;
74
- агрегированные данные.
В отличие от БД хранилище данных имеет хорошо развитую
иерархическую структуру метаданных (данных о данных). Наличие
метаданных позволяет осуществлять быструю и удобную навигацию по
различным уровням данных, а также сильно упрощает реализацию и
использование средств анализа. Наличие метаданных позволяет наглядно
представлять реализованную структуру ХД, а для всех данных иметь
информацию об их источнике и произведенных над исходными данными
операциях.
Данные в ХД являются денормализованными, по сравнению с
нормализованными данными в большинстве БД, которые обычно
реализованы в реляционной модели БД. Это свойство ХД требует
значительно большей емкости носителей информации и быстродействия
компьютерной системы.
Проведенные исследования показали, что большинство конечных
пользователей не работают с детальными данными, а обращаются в
основном с агрегированными показателями. Структура ХД отражает эту
ситуацию и позволяет конечному пользователю быстро и удобно получать
интересующую его агрегированную информацию с последующей навигацией
по всем уровням агрегирования. Наличие хорошо развитой иерархии
агрегированных данных по уровням агрегации является второй
отличительной чертой хранилища данных.
Таблица 3.1 - Сравнение характеристик данных в информационных
системах ориентированных на операционную и аналитическую обработку
данных
Характеристика
Частота обновления
Источники данных
Объемы хранимых
данных
Возраст данных
Назначение
Операционные
Высокая частота, маленькими
порциями
В основном - внутренние
Сотни мегабайт, гигабайты
Аналитические
Малая частота, большими
порциями
В основном - внешние
Гигабайты и терабайты
Текущие (за период от
нескольких месяцев до
одного года)
Фиксация, оперативный
поиск и преобразование
данных
Текущие и исторические (за
период в несколько лет, десятки
лет)
Хранение детализированных и
агрегированных исторических
данных, аналитическая обработка,
прогнозирование и
моделирование
75
Таким образом, хранилище данных функционирует по следующему
сценарию. По заданному регламенту в него собираются данные из различных
источников – баз данных систем оперативной обработки и необходимые
данные из внешних источников. Самым распространенным форматом
последних является текстовый файл (документ), а средством доступа файловая операционная система. Эти источники данных называются
"внешними данными" (ВД на рис. 2.5). В хранилище поддерживается
хронология: наравне с текущими данными хранятся исторические данные с
указанием времени, к которому они относятся. В результате необходимые
доступные данные об объекте управления собираются в одном месте,
приводятся к единому формату, согласовываются и, в ряде случаев,
агрегируются до минимально требуемого уровня обобщения.
На рис. 2.5 изображена общая структура данных в информационноаналитической системе большой организации, построенной по технологии
ХД, включающей источники данных, хранилище данных и витрины данных.
Рисунок 2.5 - Общая структура данных в АИС
Под витриной данных (Data Mart) понимается сравнительно
небольшое хранилище данных, сконструированное для использования
отдельным подразделением с одним существенным отличием от "обычного"
хранилища данных: в витрине данных конечный пользователь может
создавать свои собственные структуры данных. Есть еще одна особенность у
витрины данных - источником для большинства хранящихся там данных
является ХД. Это приводит к тому, что при создании витрины данных редко
76
используется инструменты по очистке, денормализации и унификации
данных.
Введение промежуточного звена "витрина данных" имеет ряд
несомненных достоинств:
- конечный пользователь работает только с теми данными, которые ему
нужны;
- повышается информационная безопасность системы;
- структура данных отражает требования конечного пользователя;
- упрощается проектирование данных;
- снижается нагрузка на основное хранилище данных.
Часто хранилище данных используют в качестве единого
интегрированного источника для многочисленных витрин данных. В таком
варианте корпоративная информационно-аналитическая система имеет
трехуровневую структуру:
- общекорпоративное централизованное хранилище данных;
- тематические витрины данных на уровне подразделений;
- рабочие места конечных пользователей, снабженные аналитическим
инструментарием.
Структура развитой корпоративной ИАС представлена на рис. 2.6.
Рисунок 2.6 - Структура развитой корпоративной ИАС
77
Создание и развитие хранилища данных требует следующих компонент
программного обеспечения (ПО):
- СУБД хранилища данных. СУБД хранилища данных должна быть
ориентирована на особенности технологии ХД - работать с большими
объемами данных, обеспечивать необходимую безопасность данных,
позволять создавать очень сложные структуры данных (такие как
многомерные базы данных), осуществлять быстрый многопользовательский
доступ к данным;
- средства управления структурой данных ХД. Для быстрой реализации
логической структуры данных необходимо иметь удобное интерактивное
средство управления структурой ХД. Качество этого средства определяет
скорость разработки и развития ХД, поэтому является очень важным
фактором. Средство используется не только разработчиками, но и конечными
пользователями (аналитиками) для построения своих структур данных в
Витринах данных и должно иметь удобный и понятный интерфейс;
- средства задания источников данных. Они служат для задания
источников данных, загружаемых в хранилище, определения связи между
структурами ХД и источников, создания процедур трансформации, очистки,
автоматического анализа, задания регламента загрузки;
- средства построения витрин данных. Витрины данных - важная часть
технологии ХД. С развитием ХД часто бывает необходимо переносить
витрины данных на другое техническое оборудование, поэтому средство
должно иметь гибкий интерфейс работы с витринами данных.
Система поддержки принятия решений NooTron
Многокритериальный анализ (МКА), называемый также анализом
решений, является важнейшим разделом системного анализа. Его методы
используются в решении разнообразных практических задач, таких, как
выбор лучшей альтернативы, составление рейтингов, классификация,
проектирование и других.
Существует ряд СППР на базе многокритериальных методов, которые
используют один метод или несколько близких методов (СППР
«Император», СВИРЬ-Р, Expert Choice, Super Decisions, ELECTRA). Все
СППР работают в интерактивном, диалоговом режиме. Они не заменяют
исследователя, проектанта, лицо, принимающее решение (ЛПР), а помогают
им.
78
Система поддержки принятия решений NooTron разработана на
кафедре «Информационные технологии и системы» Национальной
металлургической акадамии Украины. Она содержит библиотеку программно
реализованных количественных методов многокритериального анализа. В
библиотеке содержатся как известные, наиболее часто применяемые на
практике методы МКА, так и оригинальные интегрированные методы, а
также метод, базирующийся на теории искусственных нейронных сетей. В
системе также содержится «Справка» с достаточно подробным описанием
теоретических основ всех методов, содержащихся в библиотеке СППР
NooTron, и примерами решения задач этими методами.
Система поддержки принятия решений NooTron выполнена в виде вебприложения и находится в свободном доступе (для пользователей категории
«Гость») по адресу: http://nootron.net.ua/.
Ниже излагается методика выполнения лабораторных работ по
дисциплине «Системный анализ» (раздел «Многокритериальный анализ») с
использованием системы поддержки принятия решений NooTron.
NooTron
–
это
система
поддержки
принятия
решений,
предназначенная,
как
для
студентов,
изучающих
методы
многокритериального анализа (МКА), так и для исследователей в различных
областях науки и практики, требующих проведения сравнительного анализа
и принятия решений.
NooTron предоставляет следующие возможности:
1. Изучение и применение таких методов многокритериального
анализа:
‒ Метод анализа иерархий (МАИ);
‒ Метод взвешенных сумм (МВС);
‒ Метод матрицы решений (ММР);
‒ Метод анализа сетей (МАС);
‒ Объединённый метод МАИ+ММР.
2. Изучение и применение метода распознавания образов (МРО),
основанного на искусственных нейронных сетях.
3. Проведение системного исследования с применением методов,
встроенных в СППР NooTron.
4. Получение результата решения задачи в виде таблиц и наглядных
диаграмм.
5. Исправление входных данных задачи с последующим обновлением
страницы результата.
79
Контрольные вопросы
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
Классификация информационно-аналитических систем.
Классификация систем поддержки принятия решений.
Основные технологии прикладного системного анализа.
Информационно-аналитические системы и системы поддержки
принятия решений.
Основные виды современных систем поддержки принятия решений.
Схема работы оперативной системы поддержки принятия решений.
Схема работы стратегической системы поддержки принятия решений.
Хранилища данных и витрины данных.
Основные свойства хранилищ данных.
Провести сравнение баз данных и хранилищ данных.
Структура и работа хранилища данных.
Показать структуру системы поддержки принятия решений.
Представление результатов анализа в системах поддержки принятия
решений.
Придумайте структуру системы поддержки принятия решений на
основе метода анализа иерархий.
2.4.2. Информационные технологии в системном анализе: OLTP, OLAP,
Data Mining
Оперативная обработка данных (OLAP)
Для того чтобы существующие хранилища данных способствовали
принятию управленческих решений, информация должна быть представлена
аналитику в нужной форме, то есть он должен иметь развитые инструменты
для доступа к данным хранилища и их обработки.
Системы поддержки принятия решений (СППР) обычно обладают
средствами предоставления пользователю агрегатных данных в виде
различных выборок из исходного набора. Причём в удобном для восприятия
и анализа виде. Как правило, такие агрегатные функции образуют
многомерный набор данных (нередко называемый гиперкубом или
метакубом). Оси гиперкуба содержат параметры, а ячейки — зависящие от
них агрегатные данные. Вдоль каждой оси данные могут быть организованы
в виде иерархии, представляющей различные уровни их детализации. То
есть – это иерархическая структура, но многомерная. Благодаря такой модели
данных пользователи могут формулировать сложные запросы, генерировать
80
отчеты, получать подмножества данных по выбранным наборам («срезы
данных»).
Технология комплексного многомерного анализа данных получила
название "процесс онлайнового анализа" (OLAP, On-Line Analytical
Processing) [Барсегян и др.]. OLAP — это ключевой компонент организации
хранилищ данных. В 1995 году был сформулирован так называемый тест
FASMI (Fast Analysis of Shared Multidimensional Information — быстрый
анализ разделяемой многомерной информации), включающий такие
требования к OLAP- приложениям для многомерного анализа:
- предоставление пользователю результатов анализа за приемлемое
время (обычно не более 5 с), пусть даже ценой менее детального анализа;
- возможность осуществления любого логического и статистического
анализа, характерного для данного приложения, и его сохранения в
доступном для конечного пользователя виде;
- многопользовательский доступ к данным с поддержкой механизмов
блокировок и средств авторизованного доступа;
- многомерное концептуальное представление данных, включая
полную поддержку для иерархий и множественных иерархий (это —
ключевое требование OLAP);
- возможность обращаться к любой нужной информации независимо от
ее объема и места хранения.
OLAP является ключевым компонентом построения и применения
хранилищ данных. Эта технология основана на построении многомерных
наборов данных — OLAP-кубов (гиперкубов), оси которых содержат
параметры, а ячейки — зависящие от них агрегатные данные.
Многомерное концептуальное представление (multi-dimensional
conceptual view) информации представляет собой множественную
перспективу, состоящую из нескольких независимых измерений, вдоль
которых могут быть проанализированы определенные совокупности данных.
Одновременный анализ по нескольким измерениям определяется как
многомерный анализ. Каждое измерение включает направления
консолидации данных, состоящие из серии последовательных уровней
обобщения, где каждый вышестоящий уровень соответствует большей
степени агрегации данных по соответствующему измерению. Так, измерение
"Исполнитель" может определяться направлением консолидации, состоящим
из уровней обобщения "предприятие - подразделение - отдел - служащий".
Измерение "Время" может даже включать два направления консолидации 81
"год - квартал - месяц - день" и "неделя - день", поскольку счет времени по
месяцам и по неделям несовместим. В этом случае становится возможным
произвольный выбор желаемого уровня детализации информации по
каждому из измерений. Операция спуска (drilling down) соответствует
движению от высших ступеней консолидации к низшим; напротив, операция
подъема (rolling up) означает движение от низших уровней к высшим.
Рисунок 2.8 - Уровни детализации информации
OLAP – это часть технологий, направленных на поддержку принятия
решений. Многомерный анализ данных в OLAP – технологиях может быть
произведен с помощью различных средств, которые условно можно
разделить на клиентские и серверные OLAP-средства.
Клиентские OLAP-средства представляют собой приложения,
осуществляющие вычисление агрегированных данных (сумм, средних
величин, максимальных или минимальных значений) и отображение их, при
этом сами агрегатные данные содержатся внутри адресного пространства
такого OLAP-средства.
Как правило, OLAP-функциональность реализована в средствах
статистической обработки данных (из продуктов этого класса на российском
рынке широко распространены продукты компаний StatSoft и SPSS) и в
некоторых электронных таблицах. В частности, неплохими средствами
многомерного анализа обладает Microsoft Excel 2000. С помощью этого
продукта можно создать и сохранить в виде файла небольшой локальный
многомерный OLAP-куб и отобразить его двух- или трехмерные сечения.
Необходимо отметить, что клиентские OLAP-средства применяются,
как правило, при малом числе измерений (обычно рекомендуется не более
шести) и небольшом разнообразии значений параметров, — ведь полученные
агрегатные данные должны умещаться в адресном пространстве подобного
средства, а их количество растет экспоненциально при увеличении числа
измерений. Поэтому клиентские OLAP-средства как правило, позволяют
82
произвести предварительный подсчет объема требуемой оперативной памяти
для создания в ней многомерного куба.
Таким образом, главной задачей OLAP-приложений является
возможность с заданной функциональностью предоставлять пользователю
результаты анализа за приемлемое время, осуществлять логический и
статистический анализ, поддерживать многопользовательский доступ к
данным, осуществлять многомерное концептуальное представление данных и
иметь возможность обращаться к любой нужной информации.
Интеллектуальный анализ данных (Data Mining)
Помимо средств оперативной аналитической обработки данных OLAP
появились технологии извлечения из хранилищ данных новой информации
(«знаний»). Эта технология получила название интеллектуального анализа
данных (ИАД или data mining).
Современные требования к такому анализу:
- данные могут иметь "неограниченный" объём;
- данные могут быть разнородными (количественными, качественными,
текстовыми);
- инструменты для обработки "сырых" данных должны быть по
возможности просты для пользователей (исследователей);
- результаты анализа должны быть конкретны, понятны и наглядны.
Целью технологи интеллектуального анализа данных является
производство нового знания, которое пользователь может в дальнейшем
применить в своей деятельности. Результат моделирования – это выявление
скрытых взаимосвязей и отношений в данных. Data Mining – это процессы
обнаружения в "сырых" данных знаний и закономерностей:
- ранее неизвестных;
- нетривиальных (неожиданных);
- практически полезных;
- необходимых для принятия решения.
Можно выделить по крайней мере шесть задач (типов
закономерностей) выявления и анализа знаний:
- классификация,
- регрессионный анализ,
- прогнозирование временных последовательностей,
- кластеризация,
- ассоциация,
83
- последовательность.
Классификация, вероятно, является наиболее распространенной
сегодня операцией интеллектуального анализа данных. С ее помощью
выявляются признаки, характеризующие группу, к которой принадлежит тот
или
иной
объект.
Это
делается
посредством
анализа
уже
классифицированных объектов и формулирования некоторого набора правил.
Однажды определенный эффективный классификатор используется для
классификации новых записей в базе данных в уже существующие классы и в
этом случае он приобретает характер прогноза.
Регрессионный анализ используется в том случае, если отношения
между переменными могут быть выражены количественно в виде некоторой
комбинации этих переменных. Полученная комбинация далее используется
для предсказания значения, которое может принимать целевая (зависимая)
переменная, вычисляемая на заданном наборе значений входных
(независимых) переменных. Обычно для этого используются стандартные
статистические методы, такие как линейная регрессия. К сожалению,
большинство реальных моделей не укладываются в рамки линейной
регрессии.
Прогнозирование временных последовательностей позволяет на
основе анализа поведения временных рядов оценить будущие значения
прогнозируемых переменных. Конечно, эти модели должны включать в себя
особые свойства времени: иерархия периодов (декада-месяц-год или месяцквартал-год), особые отрезки времени (пяти- шести- или семидневная
рабочая неделя, тринадцатый месяц), сезонность, праздники и др.
Кластеризация распределяет записи в различные группы или
сегменты. Кластеризация аналогична классификации, но отличается от нее
тем, что для проведения анализа не требуется иметь выделенный набор
классов – он определяется как результат кластеризации .
Ассоциация адресована, главным образом, к анализу структуры сделок
(транзакций), например, покупок товаров, услуг, акций.
Большое количество покупок совершается в супермаркетах, где
покупатели для удобства используют корзины или тележки, поэтому
наиболее известный метод исследования ассоциаций назван «анализ
корзины» покупки (market-basket analysis). Целью этого подхода является
нахождение трендов среди большого числа транзакций, которые можно
использовать для объяснения поведения покупателей. Эта информация
может быть использована для регулирования запасов, для продвижения
84
определенного вида продукции. В банковском деле - для анализа портфеля
ценных бумаг и нахождения наборов финансовых услуг, которые клиенты
часто приобретают вместе. Другими словами, ассоциация имеет место в том
случае, если несколько событий как-то связаны друг с другом.
Последовательность. Традиционный анализ структуры покупок имеет
дело с набором товаров или услуг, представляющим одну транзакцию.
Последовательность - вариант такого анализа, когда существует
дополнительная информация для связи различных покупок в единую
временную серию. Правила, которые устанавливают отношения структура
покупки - время, могут быть использованы для определения изменения во
времени типичного набора продаж для целей прогнозирования.
Эти основные типы задач используются для нахождения нового знания
в хранилище данных.
В интеллектуальных средствах анализа данных используются такие
методы для решения указанных выше задач (только перечислим):
- статистические пакеты;
- искусственные нейронные сети;
- деревья решений;
- системы индукции правил.
- системы рассуждения на основе аналогичных случаев;
- системы с нечеткой логикой;
- генетические алгоритмы;
- алгоритмы определения ассоциаций и последовательностей;
- анализ с избирательным действием;
- логическая регрессия (обнаружение логических закономерностей);
- эволюционное программирование;
- методы визуализации данных.
Часто применяется комбинация нескольких методов.
Арсенал методов постоянно пополняется, разрабатываются пакеты
программ. Это – развивающаяся область информационных технологий,
информационной деятельности.
По каждому из направлений существует большая литература. Можно
рекомендовать учебные курсы [Дюк и Самойленко], и [Барсегян и др.].
Сфера применений технологий Data Mining ничем не ограничена – она везде,
где имеются данные, но – в достаточном количестве. Вот некоторые
примеры. Сейчас эти технологии применяются:
85
- в банковском деле (выявление мошенничества с кредитками,
сегментация клиентов по категориям, прогнозирование изменений
клиентуры);
- в инвестициях и на биржах (прогнозирование курсов акций и валют,
прогнозирование цен на биржевые товары);
- в страховании (анализ рисков, выявление мошенничества);
- в прогнозировании спроса на товары и услуги;
- в медицине, генетике, генной инженерии;
Начинается применение в социологии и политологии.
То есть сфера приложений технологий Data Mining расширяется.
Нахождение нового знания – это процесс, который включает в себя
несколько шагов:
- определение проблемы (постановка задачи);
- подготовка данных;
- сбор данных: оценка данных, объединение и очистка данных, отбор
данных, преобразование данных;
- построение модели: оценка и интерпретация, внешняя проверка;
- использование модели;
- наблюдение за моделью;
- анализ результатов.
Все шаги – в диалоговом, интерактивном режиме. То есть нахождение
нового знания с использованием технологий Data Mining также содержит все
основные этапы системного исследования, как и многокритериальные
методы.
Основное различие состоит в том, что в многокритериальных методах
исследователь (группа) формирует и держит под контролем весь процесс
системного исследования (кроме расчётов), а в технологиях Data Mining
часть этапов исследования компьютер выполняет самостоятельно. Он
моделирует работу самоорганизующейся и самообучающейся системы,
например, нейронной сети. Поэтому технологии Data Mining можно назвать
синергетическими (часть 1).
Контрольные вопросы
1)
2)
3)
4)
5)
Оперативный анализ данных (OLAP): основные технологии.
Многомерное представление данных: гиперкубы и проекции («срезы»).
Задачи OLAP-технологий.
Интеллектуальный анализ данных (Data Mining): основные задачи.
Интеллектуальный анализ данных (Data Mining): основные методы.
86
6)
7)
8)
9)
10)
11)
12)
13)
14)
Интеллектуальный анализ данных (Data Mining): основные сферы
практического применения.
Статистический анализ в Data Mining.
Эволюционные алгоритмы в Data Mining.
Провести сравнение методов интеллектуального анализа данных с
многокритериальным анализом.
Прикладной системный анализ и информационные технологии
Провести сравнение задач, технологий и систем оперативного и
интеллектуального анализа данных.
Процесс нахождения нового знания
с использованием методов
системного анализа.
Провести сравнение многокритериальных методов и методов Data
Mining.
Роль Интернета в известных Вам технологиях прикладного системного
анализа.
87
3. КОНТРОЛЬНАЯ РАБОТА
Тема работы: Теоретические основы и методы системного анализа
информационных процессов.
Задание должно быть оформлено в соответствии с требованиями
заочного факультета.
Ответы должны быть развёрнутыми, с пояснениями и, желательно, с
примерами.
Задание состоит из теоретической части и решения задач. При решении
задач рекомендуется пользоваться системой поддержки принятия решений
NooTron (http://nootron.net.ua).
3.1.
Теоретическая часть
Методические указания состоят из четырёх разделов (2.1-2.4). В конце
каждого подраздела (например, 2.1.1, 2.1.2) приведены контрольные
вопросы. Из каждого раздела надо кратко, но содержательно ответить на
один или два вопроса. Общее количество ответов – не менее шести.
Поскольку проблема рационального выбора – одна из центральных в
системном анализе, студенту предоставляется возможность самостоятельно
выбрать наиболее важные или интересные (по его мнению) вопросы.
Желательно кратко обосновать свой выбор.
3.2.
Практическая часть
Необходимо решить три задачи методами количественного анализа
решений (в СППР NooTron: http://nootron.net.ua) и одну – вербальным
методом.
При решении многокритериальной задачи с помощью СППР NooTron
необходимо оформить отчет в практической части контрольной работы в
виде скриншотов каждого шага решения и пояснительных к нему
комментариев.
Поскольку в системном анализе постановка проблемы является не
менее важным этапом исследования, нежели её решение, студентам
необходимо самостоятельно сформулировать задачу выбора лучшей
альтернативы и решить её указанным в задании методом.
88
Пояснения к задачам
1. Решить задачу многокритериального выбора лучшей альтернативы
методом анализа иерархий (подраздел 2.2.2). Количество критериев – 3 или 4.
Количество альтернатив – 2 или 3.
Комментарий. Проблемой выбора может быть, например, покупка
некоторого объекта – компьютера, автомобиля и т.п. Критерии – некоторые
важные для выбора характеристики (с точки зрения покупателя). Например,
для ноутбука – это цена, быстродействие процессора, время работы батареи,
дизайн. Альтернативы – несколько (2 или 3) сравниваемых моделей
ноутбуков. Проблемой может быть и выбор места работы, там будут свои
критерии: зарплата, график работы, перспективы карьеры. Альтернативы –
несколько сравниваемых мест работы. Проблему, критерии и альтернативы
необходимо сформировать самостоятельно. Желательно дать краткое
вербальное (словесное) описание альтернатив.
При проведении парных сравнений использовать шкалу Саати (шкалу
1-9). Необходимо также учитывать ситуации «меньше – лучше» (например, в
критерии «цена») и «больше – лучше» (например, в критерии «время работы
батареи» или в критерии «зарплата»).
2. Составить рейтинг 2-х или 3-х объектов методом взвешенных сумм
(подраздел 2.2.3).
Комментарий. Рейтинг (порядок мест) надо составить для однородных
объектов. Например: потенциальных мест работы, учебных заведений (с
точки зрения абитуриента), мест отдыха. Рейтинг потенциальных невест
(женихов) не составлять! Дерево критериев должно иметь не менее 3-х
уровней. Шкала оценок объектов (альтернатив) – 10-ти или 100-балльная.
3. Метод матрицы решений (подраздел 2.2.4). Самостоятельно
заполнить матрицу решений (3 или 4 альтернативы, 5 вариантов внешних
условий) и выбрать альтернативы, лучшие по таким критериям:
- критерий максимакса (он же – критерий максимального оптимизма,
критерий Ржевского);
- критерий максимина (он же – критерий максимального пессимизма,
наибольшей осторожности, гарантированного результата, критерий Вальда);
- критерий Гурвица при двух значениях параметра α =0.25 и α =0.75;
- критерий Лапласа.
89
Итого должны быть 5 ответов, не обязательно различных.
Постараться сделать общий вывод: какая альтернатива является
лучшей по совокупности рассмотренных критериев (это не обязательно, но
желательно).
Комментарий.
В
этой
задаче
содержательная
постановка
необязательна. Можно просто заполнить матрицу положительными числами.
В методе матрицы решений термин «критерий» имеет своё значение,
отличающееся от всех остальных методов. Здесь – это формула или правило
для определения общей полезности альтернативы.
4. Решить задачу многокритериального выбора лучшей альтернативы
методом вербального анализа (подраздел 2.3.2). Количество критериев – 3
или 4. Количество альтернатив – 2 или 3. Количество уровней каждой
вербальной шкалы – 3.
Комментарий. Проблема выбора в этой задаче может быть
аналогичной задаче 1. Например, в задаче 1 – покупка, в задаче 3 – выбор
места работы. Могут рассматриваться, конечно, и другие проблемы. Но те,
которые известны и понятны исполнителю и не противоречат этическим
нормам. Отметим, что пример в конспекте решён двумя методами – вначале
методом взвешенных сумм, а затем вербальным. Вы можете ограничиться
только вербальным методом, показанным в конспекте.
Начало работы с СППР NooTron
Для начала решения многокритериальной задачи необходимо:
‒ зайти на сайт http://nootron.net.ua/ ;
‒ войти в систему как «Гость»;
‒ нажать на пункт меню «Решить задачу» (рис.3.1).
Рисунок 3.1 – Меню приложения
90
Прежде чем приступить к решению задачи необходимо на появившейся
странице «Выбор метода» задать имя проекта (в поле «Введите имя
проекта») и выбрать метод решения задачи, отметив соответствующий
переключатель.
Выбрать подходящий Вашей задаче метод могут помочь подсказки,
появляющиеся по нажатию на кнопку .
Если информации в подсказке оказалось недостаточно для выбора
метода, то, нажав на ссылку «Подробнее», Вы сможете перейти на страницу
«Справки» по этому методу.
Рисунок 3.2 – Заполненная страница «Выбор метода»
Метод выбран, имя проекта задано – можно переходить на страницу
метода, нажав кнопку «Далее».
Подробнее о решении многокритериальных задач в СППР NooTron по
каждому из методов можно ознакомиться в справке системы
(http://nootron.net.ua/Help).
91
ВЫВОДЫ
Подготовлены методические указания для студентов заочной формы
обучения направления 020100 «Культура».
Приведена технологическая карта для дисциплины «Системный анализ
информационных процессов».
Рассмотрены основные вопросы дисциплины: основы теории систем,
структура системных наук; системный подход, системный анализ;
математическое моделирование в системном анализе ; системный анализ и
принятие решений; количественный анализ решений ;
метод
анализа
иерархий; метод взвешенных сумм и его аналоги; методы матрицы решений
и дерева решений; основы семантической теории информации; вербальный
анализ решений; информационно-аналитические системы и системы
поддержки решений; информационные технологии в системном анализе
(OLTP, OLAP, Data Mining).
Материал предназначен для самостоятельной работы студентов
заочной формы обучения и может быть использован для выполнения
контрольной работы по дисциплине «Системный анализ информационных
процессов».
92
РЕКОМЕНДОВАННАЯ ЛИТЕРАТУРА
Основная
1. Сорока К.О. Основи теорії систем і системного аналізу: Навчальний
посібник. – Х.: Тимченко, 2005. – 288 с.
2. Катренко О.П. Основи системного аналізу об’єктів та процесів
комп’ютерізації: Навч. посібник. – Львів: Новий світ, 2003. –424 с.
3. Згуровский М.З, Панкратова Н.Д. Основы системного анализа. - К.: BHV,
2005 – 400 с.
4. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. – М.:
Высш. школа, 1989. – 367 с.
5. Жилин Д.М. Теория систем: опыт построения курса. – М.: Едиториал
УРСС, 2004. – 184 с.
6. Саати Т.Л. Принятие решений при зависимостях и обратных связях:
Аналитические сети. – М.: Изд-во ЛКИ, 2008. – 360 с.
7. Ларичев О.И. Теория и методы принятия решений: Учебник. – М.: Логос,
2000. – 296 с.
8. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений.
М.: Физматлит, 1996. – 340 с.
9. Коваленко И.И., Бидюк П.И., Баклан И.В. Системный анализ и
информационные технологии в управлении проектами. – К.: Экономика и
право, 2001. – 270 с.
10. Анфилатов В.С., Емельянов А.А., Кукушкин А.А. Системный анализ в
управлении: Учебное пособие. – М.: Финансы и статистика, 2002. – 368 с.
11. Дюк В., Самойленко А. Data Mining: Учебный курс. - СПб.: Питер, 2001. –
368 с.
Дополнительная
1. Згуровский М.З, Панкратова Н.Д. Системный анализ: проблемы,
методология, приложения. - К.: Наук. думка, 2005. – 744 с.
2. Губанов В.А., Захаров В.В., Коваленко А.Н. Введение в системный
анализ: Учебное пособие. – Л.: Изд. ЛГУ, 1988. – 230 с.
3. Тоценко В.Г. Методы и системы поддержки принятия решений. – К.:
Наукова думка, 2002. – 382 с.
4. Мушик Э., Мюллер П. Методы принятия технических решений. – М.:
Мир, 1990. – 208 с.
93
5. Юдин Д.Б. Вычислительные методы теории принятия решений. М.: Наука,
1989. – 320 с.
6. Маклаков С.В. BPwin и ERwin. CASE-средства разработки
информационных систем. – М.: Диалог-МИФИ, 2000.- 256 с.
7. Дюк В., Самойленко А. Data Mining: Учебный курс. - СПб.: Питер, 2001. –
368 с.
8. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы
анализа данных: OLAP и Data Mining. – СПб.: БХВ-Петербург, 2004. – 336
с.
9. Люгер Дж.Ф. Искусственный интеллект: стратегии и методы решения
сложных проблем, 4-е изд. – М.: Издательский дом «Вильямс», 2003. – 864
с.
10. Чернавский Д.С. Синергетика и информация – М.: УРСС, 2005. – 300 с.
11. Згуровский М.З, Панкратова Н.Д. Технологическое предвидение. - К.:
Политехника НТУ «КПИ», 2005. – 154 с.
94
Скачать