ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет радиофизики и компьютерных технологий Кафедра интеллектуальных систем КУРС ЛЕКЦИЙ по специальному курсу «Теория принятия решений» Учебное пособие для студентов факультета радиофизики и компьютерных технологий Электронная версия для специальности: 1-31 04 02 " РАДИОФИЗИКА” Специализация: 1-31 04 01-02 10 " Интеллектуальные информационные технологии " Минск 2011 1 УДК 681.31:621.38 ББК 32.841я43+32.85я43 ISBN 5-06-0004597 Шестаков К. М. Р15 Курс лекций по специальному курсу «Теория принятия решений»: Электронная версия. Учебное пособие для студентов факультета радиофизики и компьютерных технологий. – Мн.: БГУ, 149 с. ISBN 985-445-093 Рассматривается последовательность процедур поддержки принятия решений, методика формирования ситуаций, принятия решений в интеллектуальных системах.. Теоретические сведения помогают разрабатывать рациональные алгоритмы процедур принятия решений и реализовывать их в современных средах программирования. Предназначено для студентов факультета радиофизики и компьютерных технологий. УДК 681.31:621.38 ББК 32.841я43+32.85я43 ISBN 5-06-0004597 © БГУ, 2011 2 ВВЕДЕНИЕ Сегодня специалисты многих направлением сталкиваются с проблемой выбора приемлемых решений и поиска в них наилучших. Так, например, А. Александреску в своей книге «Современное проектирование на C++» пишет: «Область проектирования программного обеспечения как никакая другая техническая дисциплина демонстрирует большое разнообразие методов: одну и ту же задачу можно правильно решить самыми разными способами. Каждый новый способ открывает новый мир. При выборе одного из решений возникает множество возможных вариантов, начиная с уровня системной архитектуры и заканчивая малейшими деталями кодирования. Таким образом, разработка программных систем заключается в выборе решений из гигантского числа вариантов… причем обычно в конкретной области, для которой предназначено программное обеспечение, наилучшим является лишь одно решение». Сказанное приемлемо для многих направлений современной науки и техники. Cложно представить себе конструктора, разработчика электронных изделий вне специализированных профессиональных программ поддержки их работы. Лица, принимающие решения на многих уровнях обращаются к базам данных от случая к случаю. Схема процесса принятия решения, во многом, не зависит от той области, в которой принимается решение. Иначе говоря, законы принятия решений, практически, едины для всех предметных областей. Общее направление – поддержка принятия решений в последние годы окрепло и успешно развивается. Знание и умение пользоваться его плодами становятся неотъемлемой частью нового облика специалиста во многих научных, технических, гуманитарных областях деятельности. На примерах двух задач рассмотрим специфику и актуальность сказанного. Первая задача. Поддержка принятия решений в области эксплуатации с/х ресурсов, оптимальных для текущей обстановки и базирующихся на непрерывно накапливаемом опыте. Цель: поддержание наибольшей отдачи угодий с сохранением и улучшением плодородия земельных ресурсов для начального пользователя на эксплуатируемой им территории. Программа должна базироваться на: − знаниях профильных специалистов; − данных о характеристиках урожаев; − состоянии почвы и водоносного слоя предыдущих лет; − данных контрольных шурфов на исследуемых участках; 3 − метеопрогнозе; − метеоданных предыдущих временных интервалов; − на 3-D технологиях; − аэрокосмических снимках земной поверхности; − векторной картографической информации; − фотоснимках участков с\х угодий. Создание локальной программной среды поддержки решений производителей с/х продукции, гибкой и максимально наглядной графической оболочки близкой по функциональным возможностям к 3-D игровым программам, непрерывно наполняемой базе данных и знаний, аккумулирующей опыт и мнение ведущих ученых и специалистов региона. Вторая задача. Поддержка принятия решений на различных уровнях в среде эксплуатации сложной, дорогостоящей техники высокой значимости оборонного назначения. Каждое изделие окружено совокупностью датчиков, определяющих и прогнозирующих уровень его характеристик и параметров. Постановка же на ремонт, профилактику возможна только по решению центрального звена системы. Необходима консультационная поддержка ряда конструкторских, научных организаций разработчиков, важно и мнение экспертов. Изделие удалено от ремонтной базы, складов запасных частей. Ремонт и обслуживание должны быть проведены в минимальные сроки с высоким качеством. Необходимы переменные по составу, определяемым картам неисправностей, перечни комплектующих компонентов и инструмента, оптимальные маршруты движения ремонтной техники и т.п. Приведенные задачи резко разнятся по уровню используемых ресурсов, но близки к друг другу в главном – это попытки концентрировать текущие знания многих специалистов и предоставить пользователю возможность принимать обосновано решения, просчитывать его последствия. В курсе лекций анализируются истоки направления, математические методы, архитектура систем поддержки принятия решений. Рассмотрены модели, используемые для описания риска и полезности. Правила выбора решений, правила проверки гипотез. Учебное пособие ориентировано и на специалистов, работающих в области компьютерных систем и технологий. 4 1. Истоки курса Технология принятия решений бурно развивается. Ее основные положения относятся к теоретическим основам функционирования интеллектуальных систем (ИС). ИС должны функционировать, как в режимах сопровождения работы специалистов различного профиля (автоматизированные интеллектуальные системы), так и в автономном режиме (системы искусственного интеллекта). В целом ряде случаев принятие решений, как задача, отслеживается во многих программных продуктах (ПО управления компаниями, системах автоматизированного проектирования и т. п.), как в науке, так и в технике. 1.1. Системы поддержки принятия решения Исторически, прежде всего, получили развитие автоматизированные системы поддержки принятия решений в средах управления компаниями. Система поддержки принятия решений (СППР) (англ. Decision Support System, DSS) — программное обеспечение, наполнение баз данных и знаний комплекса компьютеров, служащая поиску и оценки последствий решений специалистами различных уровней. СППР возникли в результате слияния управленческих, информационных систем и систем управления базами данных. С помощью СППР может производиться выбор решений некоторых неструктурированных и слабоструктурированных задач, в том числе и многокритериальных. Поддержка принятия решений сопровождается и совокупностью расчетов, базирующихся на теории баз данных, искусственного интеллекта, интерактивных компьютерных систем, методов имитационного моделирования. Ранние определения СППР (в начале 70-х годов прошлого века) отражали следующие три момента: (1) возможность оперировать с неструктурированными или слабоструктурированными задачами, в отличие от задач, с которыми имеет дело исследование операций; (2) интерактивные автоматизированные (то есть реализованные на базе компьютера) системы; (3) разделение данных и моделей. 5 В настоящее время нет общепринятого определения СППР, поскольку конструкция СППР существенно зависит от вида задач, для решения которых она разрабатывается, от доступных данных, информации и знаний, а также от пользователей системы. Приведем определение СППР. Одно из них: СППР — совокупность процедур по обработке данных и суждений, помогающих руководителю в принятии решений, основанная на использовании моделей. Можно привести, тем не менее, некоторые элементы и характеристики, общепризнанные, как части СППР: Идеальная СППР: оперирует со слабоструктурированными решениями; предназначена для специалистов различного уровня; может быть адаптирована для группового и индивидуального использования; поддерживает как взаимозависимые, так и последовательные решения; поддерживает 3 фазы процесса решения: интеллектуальную часть, проектирование и выбор; поддерживает разнообразные стили и методы решения, что может быть полезно при решении задачи группой специалистов; является гибкой и адаптируется к изменениям в ситуации; проста в использовании и модификации; улучшает эффективность процесса принятия решений; позволяет человеку управлять процессом принятия решений с помощью компьютера, а не наоборот; поддерживает эволюционное использование и легко адаптируется к изменяющимся требованиям; может быть легко построена, если может быть сформулирована логика конструкции СППР; поддерживает моделирование; позволяет использовать знания. В автоматических самообучаемых системах роботов и т. п. система сама принимает решение и корректирует правила выбора. История создания СППР Системы поддержки принятия решений и соответствующая им ИТ (информационные технологии) появились усилиями в основном американских учёных в к 70-х - начале 80-х гг., чему способствовали широкое распространение персональных компьютеров, стандартных пакетов прикладных программ, а также успехи в создании систем искусственного интеллекта. 6 До середины 60-х годов прошлого века создание больших информационных систем (ИС) было чрезвычайно дорогостоящим, поэтому первые ИС менеджмента (так называемые Management Information Systems — MIS) были созданы в эти годы лишь в достаточно больших компаниях. MIS предназначались для подготовки периодических структурированных отчетов для менеджеров. В конце 60-х годов появляется новый тип ИС — модельориентированные СППР (Model-oriented Decision Support Systems — DSS) или системы управленческих решений (Management Decision Systems — MDS). По мнению первооткрывателей СППР Keen P. G. W., Scott Morton M. S.[16] (1978), концепция поддержки решений была развита на основе «теоретических исследований в области принятия решений… и технических работ по созданию интерактивных компьютерных систем». В 1971 г. — опубликована книга Scott Morton, в которой впервые были описаны результаты внедрения СППР, основанной на использовании математических моделей. 1974 г. — в работе дано определение информационной системы менеджмента — MIS (Management Information System): «MIS — это интегрированная человеко-машинная система обеспечения информацией, поддерживающая функции операций, менеджмента и принятия решений в организации. Системы используют компьютерную технику и программное обеспечение, модели управления и принятия решений, а также базу данных». 1981 г. — Bonczek, Holsapple и Whinston в своей книге создали теоретические основы проектирования СППР. Они выделили 4 необходимых компонента, присущих СППР: 1) Языковая система (Language System — LS) — СППР может принимать все сообщения; 2) Система презентаций (Presentation System (PS)) (СППР может выдавать свои сообщения); 3) Система знаний (Knowledge System — KS) — все знания СППР сохраняет; 4) Система обработки задач (Problem-Processing System (PPS)) — программный «механизм», который пытается распознать и решить задачу во время работы СППР. 1981 г. — R.Sprague и E.Carlson описали, каким образом на практике можно построить СППР. Тогда же была разработана информационная система руководителя (Executive Information System (EIS)) — компьютерная система, предназначенная для обеспечения текущей адекватной информации для поддержки принятия управленческих решений менеджером. 7 Начиная с 1990-х, разрабатываются так называемые Data Warehouses — хранилища данных. В 1993 г Е. Коддом (E.F. Codd) для СППР специального вида был предложен термин OLAP (Online Analytical Processing)- оперативный анализ данных, онлайновая аналитическая обработка данных для поддержки принятия решений. Исходные данные для анализа представлены в виде многомерного куба, по которому можно получать нужные разрезы — отчёты. Выполнение операций над данными осуществляется OLAP-машиной. По способу хранения данных различают MOLAP, ROLAP и HOLAP. По месту размещения OLAP-машины различаются OLAP-клиенты и OLAP-серверы. OLAP-клиент производит построение многомерного куба и вычисления на клиентском ПК, а OLAP-сервер получает запрос, вычисляет и хранит агрегатные данные на сервере, выдавая только результаты. В начале нового тысячелетия была создана СППР на основе Web. 27 октября 2005 года в Москве на Международной конференции «Информационные и телемедицинские технологии в охране здоровья» (ITTHC 2005), А. Пастухов (Россия) представил СППР нового класса — PSTM (Personal Information Systems of Top Managers). Основным отличием PSTM от существующих СППР является построение системы для конкретного лица, принимающее решение, с предварительной логикоаналитической обработкой информации в автоматическом режиме и выводом информации на один экран. Интересно отметить создание предтечи СППР коллежским советником С. Н. Корсаковым, опубликовавшим еще в 1832 году описание механических устройств, так называемых «интеллектуальных машин». Они предназначались для использования при решении различных задач в повседневной жизни, для того, чтобы сделать какой бы то ни было вывод, например, помочь принять решение о наиболее подходящих лекарствах по наблюдаемым у пациента симптомам заболевания. Развитие инструментария и методов принятия решений ведется во многих областях деятельности специалистов. Можно выделить использование результатов следующих научных направлений: для поисковые СППР - нелинейного программирования; для распределенных СППР линейного программирования; для СППР в управлении запасами - теории управления запасами; для СППР календарного планирования - теории расписания; для СППР состязательных задач - теории игр и т.п. Выделились конкретные задачи которые помогают решать СППР. Более полный – критериальный вариант: 8 сформировать множество альтернативных вариантов решения (далее альтернатив), сформировать множество критериев оценки альтернатив, получить оценки альтернатив по критериям, выбрать лучшую альтернативу, которая и выдается системой в качестве рекомендации. Реализация этого варианта СППР требует решения некоторых нетривиальных проблем. Например: Учет различной важности критериев. Выбор способа построения обобщенного критерия (часто называемого "функция полезности"). Важно отметить, что есть методы выбора лучшей альтернативы и без построения обобщенного критерия. Критерии иногда удобно группировать в виде дерева (иерархии). Например, получил большое распространение метод анализа иерархий, предложенный Саати. Есть критериальные методы, не учитывающие сравнительную важность критериев. Таков, например, классический метод выделения множества не доминирующих альтернатив (так называемого "множества Парето"). В простейшем случае, без использования критериев оценки альтернатив: сформировать множество альтернативных вариантов решения, получить результаты сравнения (например, попарного) альтернатив, выбрать лучшую альтернативу, которая и выдается системой в качестве рекомендации. 1.2. Краткий анализ рекомендуемых литературных источников Рассматриваемые в курсе вопросы тесно связаны с предметной областью теорий статистических выводов, игр, полезности, планирования эксперимента, оптимального управлением, оптимальной обработки сигналов и т. п. Математическая статистика, дающая наиболее гибкие инструменты для анализа экспериментальных данных, часто рассматривается и с активной позиции, как наука о статистических решениях, вырабатывающая рекомендации по выбору оптимальных способов поведения и управления в случайных ситуациях [1…4]. Однако, каждый слушатель может опираться и только на полученные знания в университете. Наиболее полно и близко к курсу материал изложен в [1]. 9 В работах [5, 6] рассмотрено место курса в базисе интеллектуальных систем. Учебные пособия [7-8] образуют предельно минимальный набор литературных источников, дополняющих курс лекций. Работы в Республике частично отражены в книгах [11…12]. В последние годы наибольшее применение в описании проблематики теории принятия решений находит понятие нечеткой информации, модели и их анализа. Такой подход можно изучить по работам [23, 26…29]. Остальные работы дополняют список литературы, конкретизируя отдельные вопросы, рассматриваемые в курсе. Как правило, смысловое содержание названия книги соответствует специфике рассматриваемого в ней вопроса. Лабораторные практикумы позволят Вам получить навыки в формировании исходного материала и принятию решений применительно к специфике курса – [9, 10]. 2. Описание ситуаций 2.1. Модели в описании ситуаций и процедур Предметом анализа ТПР являются объекты различной физической, химической, биологической, социальной природы. Это могут быть радиофизические сигналы, описания возможных конфигураций сложных систем, рыночной конъюнктуры по виду товара в определенной области земного шара, математические формулы, концепции и т. п. В результате анализа формируется математическая модель объекта – вспомогательный искусственный объект, имеющий сходство с оригиналом в определенном пространстве его свойств и характеристик. Модель должна удерживать только полезные для изучения свойства объекта, это один из наиболее очевидных путей получения более простого представления об оригинале, чем он сам. Модель должна быть при последующем использовании адекватна оригиналу с заданной точностью, удерживать частное в общем в конкретной группе задач, эффективна (проще, удобнее или давать новую информацию об объекте), экономична т.е. не требовать для анализа больших ресурсов, чаще вычислительных, чем имеет исследователь в своем распоряжении для решения поставленной задачи. Процесс создания модели включает в себя следующие механизмы: 10 определения состава (кортежа, алфавита) свойств объекта, подлежащих исследованию, составление набора технических средств для оценки выбранных свойств объекта, получения сведений (опыта, знаний), от других систем об свойствах подобных объектов, использование аналогий, анализ всех данных для формирования описания области существования объекта в пространстве обозначенных свойств. Можно выделить две цели, преследуемых при анализе конкретного объекта: 1. Составление описания группы схожих объектов (класса), в пространстве выбранных свойств (признаков); 2. Отнесения текущего объекта к одной из обозначенных групп (классов). В системах с самообучением, как правило, параллельно стремятся достичь обе цели. Свойства объекта в математической формулировке – переменные могут быть детерминированными и случайными, числовыми и лингвистическими. Детерминированные числовые не требуют пояснения. Числовые случайные и лингвистические переменные рассмотрим подробнее. Например, современное производство промышленной продукции является сложным процессом, требующим учета большого количества факторов и параметров. Каждый этап жизненного цикла имеет свои специфические характеристики, но параметры этапов тесно взаимосвязаны и взаимозависимы. Сложность и многообразие отношений между производственными параметрами приводит к усложнению их формализации, что в свою очередь затрудняет применение традиционных математических методов и средств автоматизации. Теория нечетких множеств в последнее время начала широко применяться в производственных системах поддержки и принятия решений при реализации сложно формализуемых задач. Интересен подход к решению проблем управления производством с применением нечетких моделей (НМ). Целесообразность применения НМ в управлении производством диктуется следующим: _ невозможность сколь угодно точного измерения реальных величин в каждом этапе жизненного цикла производства; _ невозможность полного и четкого описания многих технологических процессов, объектов и производственных ситуаций; 11 _ неточность функциональных действий, которые не редко не достигают поставленных системой(производством) целей; _ недостаточная размерность модели, не позволяющая отразить все значимые свойства объекта технологической среды; _ не все производственно-технологические показатели различных производственных ситуаций могут быть выражены в виде количественных отношений; _ ненаблюдаемость ряда характеристик этапов производственного цикла, требующих интуитивных оценок. Структурно НМ включают в себя множество признаков ситуаций, множество причин, которые соответствуют этим признакам, множество действий, для принятия решений при данной ситуации, множество отношений между признаками ситуаций и причин, причинами и действиями , оцененных функциями принадлежности. Функции принадлежности в данном случае отражают степень соответствия параметров и их установка зависит от опыта и знаний эксперта. Наиболее важной и ответственной частью создания советующих систем с нечеткой логикой является формирование базы знаний. При создании базы знаний рекомендуют проводить следующие процедуры: 1. Сбор и систематизация признаков ситуаций. Признаками ситуаций могут быть характеристики и параметры производства (конструкторские и технологические); 2. Определение соответствий между признаками ситуаций и причинами; 3. Установление функций принадлежностей между признаками ситуаций и причинами (от 0 до 1); 4. Определение соответствий между причинами и действиями; 5. Установление функций принадлежностей между причинами и действиями. Программной реализацией НМ являются Экспертные советующие системы с нечеткой логикой, которая включает следующие подсистемы: 1. Ввод, контроль и преобразование информации; 2. Логический вывод; 3. Интерпретация знаний и решений; 4. База знаний; 5. Вывод информации. История лингвистических перемен начинается с трудов исследователя Заде Л. Он описал их кортежем: [X,T(X),U,G,P], где: X – имя переменной (пример о возрасте на шкале лет - молодой); T(X) – множество значений переменной (термы) (очень молодой, молодой, старый, очень старый); 12 U – универсальное множество (универсум), на котором задана переменная (возраст), такое множество удерживает свойства всех объектов (например: множество всех действительных чисел, на шкале которого задается возраст, или множество всех комплексных чисел используемых для отображения спектральных образов колебательных процессов); G – синтаксическое правило, порождающее термы; P – семантическое правило, ставящее каждому X его смысл, P(X) – нечеткое множество заданное на U (27 лет – молодой, 62 года – старый или очень старый). Рис.2. Области задания лингвистических переменных (ин, ик, нн, нк, ндн, ндк – начало и конец идеальной, нечеткой, недопустимой областей) Семантическое правило может выдавать и цифры, например вероятности, в данной точке U существования конкретного терма. Область существования свойств X на U реально может быть ограничена. Ограничения на существование x в u отображаются зависимостями R(x;u). Они допускают только те x=u, которые удовлетворяют условию 13 u R(x) . Например: возраст человека ограничивается диапазоном чисел от 0 до 200. На рис.2 представлены примеры областей задания логических переменных: 2а – на оси одного свойства, 2б – в пространстве трех свойств на поверхности. Наряду с ограничениями задается и семантическое правило формирования имени переменной. На рис. 2в приведен пример задания вероятности P определения конкретного значения переменной в границах нечеткой области. Причиной появления не четкого описания переменных служат: 1. Ограничения на ресурсы измерительных средств, средств наблюдения, средств очувствления и т. д. приводят к описанию объекта в нечеткой словесной (символьной) форме. 2. Пакет передачи опыта включает в себя и совокупность не четких правил. Оценки свойств интервальные или заданы по экспертным заключениям с разрешением не достаточным для проведения анализа. 3. В процессе создания (жизни) объекта реализуется ряд альтернативных вариантов промежуточных решений по его самоорганизации, которые приводят к неопределенности свойств объекта , появляется нечеткое описание свойств, например, образ самолета противника. 4. В описании цели присутствует ряд не четко заданных словесных конструкций. Различают так же синтаксическую нечеткость (Железные болты и гайки. Ограничение, железные, действует только на болты или и на гайки тоже) и семантическую – не ясен смысл фразы. Часто в литературе встречаются термины: случайные исходы, нечеткая информация, нечеткая функция полезности, нечеткая цель и т. п. Новая терминология порождает и новую формулировку задач, как, например. Интерпретация вероятности и возможности на основе распределения уверенности. Лингвистические переменные в первом приближении можно оцифровать, ранжировав их по эффективности. Тогда переменная превращается в вектор, число степеней свободы которого равно числу ее термов. Далее эффективно используется аппарат анализа числовых случайных переменных. Случайной функцией называется функция, значение которой при каждом данном значении аргумента (или нескольких аргументов) является случайной величиной. Всякая функция, которой оказывается равна случайная в результате опыта, называется реализацией случайной функции. Скалярная функция одного скалярного вещественного аргумента (в качестве которого обычно выступает время) называется случайным про14 цессом. Случайная функция нескольких скалярных вещественных аргументов (обычно координат точек пространства) называется случайным полем. Случайная величина, событие появляется в некотором пространстве размерностью n . Это пространство определено в классической теории вероятностей, как пространство исходов. Размерность пространства зависит от числа составляющих случайную величину частей (компонентов) и возможных числовых значений (уровней), которые могут принимать эти компоненты. В компьютерных приложениях, как правило, число разрешимых уровней i для i -го компонента принимается равным i 2ti , где t i - целое число. Изображения имеют некоторую специфику формирования потока данных. Растровые форматы представления изображений передают информацию о нем по точкам. Если точка (пиксель) характеризуется кодированием цвета с ti 1 , то говорят о бинарном представлении i - компоненты, при ti 1 - о полутоновом. Точка обычно представлена в трех RGB или четырех RGB компонентном пространстве, в последнем случае добавляется - компонента, характеризующая прозрачность пикселя. Трех компонентное пространство в целочисленном представлении для полутонового описания пикселя может быть представлено в формате с перекодировкой, это 16 - и 256 - цветные модели. Такой файл описания изображений сопровождается перекодировочной таблицей. По таблице коды преобразуются в представление без кодировки с ti 8 . Эти форматы получили еще название индексированных. Элемент матрицы ai,j является указателем на таблицу цветов. Число используемых цветов равно 2K, где K - количество бит, используемый для хранения элемента матрицы. Цвета в указываемой таблице могут кодироваться другим числом бит. Например, в 256 цветовых режимах видеоадаптеров выбирается 256 цветов из 262144 возможных, так как выбираемые цвета представляются в RGB формате и для каждой цветовой компоненты кодируется 6-ю битами. Существует много методов преобразования многоканальных изображения в индексированные (Error diffusion, ближайшего цвета ...). Распознаваемый объект представлен j пикселями. Тогда объем пространства исходов ti i или 2 j i . j 15 Специфика описания ситуации в задачах распознавания образов и принятия решений в значительной величине объема пространства исходов. Даже для сегмента описания объекта 3 3 и с 24 - битным представлением пикселя он превышает 10 65 . Наряду с пространством исходов в математической статистике вводятся понятия F - - алгебры подмножеств заданных на . Которое определяет совокупность подмножеств множества , базирующихся на теоретико-множественных операциях – объединении, пересечении, образовании дополнения и замкнутых относительно счетных объединений. В ТПР особенно актуален расчет метрики пространства, она определяет расстояния между объектами и в конечном итоге потери при не правильных решениях. Третий объект P - вероятность на F . Набор объектов , F, P называется вероятностной моделью или вероятностным пространством задачи и полностью описывает ситуацию, если определены в нем все рассматриваемые классы, цели и потери. 2.2. Оценка параметров и функций в анализе ситуаций Наиболее употребимы определения точек ожидания появления событий, это математическое ожидание, медиана, мода. Для одномерного пространства исходов это скаляры, для многомерного - вектора. Математическое ожидание можно определить по плотности функции распределения - x p x , или по выборке размером n 1 x 1 xi , где i - порядковый номер зафиксированного события xi , n 1 i i изменяется от 0 до n , недостоверные отсчеты не фиксируются. Данная характеристика получила еще название абсциссы центра тяжести плотности распределения случайной величины. Не достоверные выбросы, которые могут появляться в ряде случаев сильно смещают этот параметр. Математическое ожидание, как основная характеристика свойства объекта часто используется в задачах с многократным повторением процедур распознавания или принятия решения. Медиана ( median ) определяет координаты точки, относительно которой появление событий справа и слева равновероятно. Другое определение – абсцисса прямой, параллельной оси ординат и делящей фигуру под плотностью вероятности на две одинаковой площади. Для возрастающего ряда x без интерполяции можно записать: 16 x max x , median min x pi i x pi i x min где xmin , xmax - границы интервала проявления x , знак выделяет условие, которому должен удовлетворить переменная, в данном случае x выбираются только те, для которых x xmax i xmin ix pi pi . Ориентация на медиану оправдана тогда, когда величина отклонения случайной величины от интервала положения медианы не играет роли и важно только попадание в цель. При этом процедура распознавания применяется многократно. Медиана более устойчивая к аномальным явлениям характеристика, чем математическое ожидание. Мода ( moda ) выделяет точку или отрезок на оси, на котором величина плотности вероятности имеет максимальное значение. Другое определение – абсцисса наиболее вероятного события. moda x max p . x Мода часто выбирается в качестве цели при однократном применении решения. Эта характеристика наиболее чувствительна к помехам и не четкости информации, чем математическое ожидание. Перечисленные параметры оценивают координату ожидаемого результата. Возможна в практическое применение и их комбинации, как нелинейная так и линейная, например, величина wait _ : wait _ k1 k 2 median k3 moda , где k1 , k 2 , k3 - коэффициенты доверия и 3 ki 1 . i 1 Вторым по важности параметром является оценка ожидания разброса случайной величины. Эти оценка могут быть выражена числом, или интервалом на оси абсцисс, а для многомерных величин эллипсоидом, нередко носящим имя эллипсоида рассеяния. На практике наибольшее применение получили функционалы вида g m 1 1 n m m xi или m 1 p j x j , n j 0 i 0 где i - номер зафиксированного события (0-n), j - номер канала, 17 x j , p j - абсцисса канала, вероятность попадания события в канал, на графике плотности вероятности (0-g), m - показатель степени, положительная величина, целая или дробная, определяет метрику данного критерия. При m =1, говорят об оценке разброса через величину среднего арифметического отклонения, при m =2, оценивается разброс через величину среднеквадратичного или стандартного отклонения. Чем выше величина m , тем более влияют выбросы в измерениях и соответственно величина отклонения. Определим усредненную симметричную оценку параметра разброса s случайной величины при наличии неопределенности в задании коэффициента m . b s k i mi , i 1 где k i коэффициенты доверия оценки отклонения с mi - показателем степени и b k i 1; i - порядковый номер функционала со степенным i 1 коэффициентом mi , i изменяется от 1 до b - числа конкурирующих оценок. Оценка интервала (его границ), существования проявлений объектов исследуемого события, обычно ведется при задании ограничения на вероятность появления события вне интервала или внутри интервала. Рис.13. Интервалы анализа Для одномерного случая с равным распределением вероятности ошибки определения интервала справа и слева границы доверительного интервала можно определить, как x1 max( x x p ) ; i x2 min( x i min_x max_x pi ix 2 ), 2 где - заданная вероятность ошибки, min_x, max_x границы интервала учета событий. 18 Определение доверительного интервала позволяет уменьшить пространство исходов. Очень часто одно из граничных значений координаты появления события берется за исходную точку для осторожного принятия решения, которое обычно ориентируется на наихудшее стечение обстоятельств. Эта координата соответствует появлению наиболее не желательного события. В этом случае вводится понятие допустимой вероятности появления более неблагоприятного события, чем те которые учитываются. Исходя из этого ограничения и определяется наиболее важная граница доверительного интервала. Наряду с естественными системами координат, описывающими пространство исходов, используются и искусственные системы, производные от естественных. Например, из координат трехмерного пространства и времени формируются системы пространственных и временных частот. В таких системах так же задаются интервалы существования объектов одного класса. 2.3. Риск и его описание В структуру основных математических конструкций ТПР входит матрица последствий принятия решений. В таблице представлена квадратная матрица состоящая из n столбцов и n строк. Предъявлен/ Распознан Образ 1 Образ 1 ... Образ j ... Образ n e1,1 ... e1,j ... e1,n ... Образ i ... ... ... ... ... ... ... ... Образ n ... ... ... ... ... ... ... ei,1 en,1 ei,j en , j ei,n en , n Строки показывают ситуации, которые могут возникнуть при принятии решения, например объекта с номером i . Столбцы показывают последствия решений ei,j при наличии (предъявлении) образа из j -го класса, а распознавании его как образа из i -го класса. В ТПР данная матрица как правило не симметрична. Строки отражают последствия конкретного решения (1... n ), столбцы выделяют ситуации в которых осуществляется принятое решение (1... m ). Под ситуацией часто понимается внешняя обстановка, например, характер и объем решаемых 19 задач, которые могут возникнуть при функционировании компьютерной системы, решения по типу конфигурации которой принимается. Ситуация 1 ... Ситуация j ... Ситуация m e1,1 ... e1,j ... e1,m ... Решение i ... ... ... ... ... ... ... ... Решение n ... ... ... ... ... ... ... Ситуация/ Решение Решение 1 ei,1 en,1 ei,j en , j ei,m en, m Для конкретной области применения ei,j часто называют полезностью решения т. е. предполагается то, что данная величина положительна. В заранее убыточных задачах матрица заполняется величинами платы за принимаемые решения. Реально ei,j - вектор, нередко объединяющий оценки разнородных величин, например, потери мощности, стоимость, безопасность в эксплуатации, габариты в задачах проектирования систем электропитания. Если компоненты вектора ei,j нельзя привести к одному знаменателю, например, денежному эквиваленту, то такие задачи относят к многокритериальным. Отдельный разговор о метрике компонентов ei,j , не редко на практике существует нелинейность в оценке платы за неправильные решения и отдельные потери не допустимы, тогда говорят о границах приемлемости существования ошибки. Например, перегрев процессора без системы защиты, приводящий к его разрушению, не допускается. При распознавании образов правильное решение для всех образов в большинстве случаев оценивается одинаково. ei,i const . Тогда целесообразно перестроить матрицу полезности, превратив ее в матрицу рисков от принятия не правильных решений. В ТПР возможна также подобная процедура, но за желаемый результат принимается выигрыш или минимальные потери при оптимальном решении. Вычисление величины риска для квадратной матрицы выполняется по формуле ri, j ei, j ei,i . Результаты представлены в таблице. Квадратная матрица в этом случае имеет нулевые диагональные элементы. 20 Предъявлен/ Распознан Образ 1 Образ 1 ... Образ j ... Образ n 0 ... r1,j ... r1,n ... Образ i ... ri,1 ... ... ... ri,j ... ... ... ri,n ... Образ n ... rn,1 ... ... ... rn, j ... ... ... 0 В конечном итоге формируется некоторый алгоритм распознавания. Его эффективность в значительной степени зависит от интегральной величины среднего риска при выбранной стратегии. По строкам можно определить усредненный риск от принятия решения с индексом i , который не зависит от стратегии. ri ri, j p j , j где p j вероятность появления образа j - го типа. Учет стратегии заключается в ведении коэффициента pki j , который имеет смысл вероятности оценки объекта j , как i в стратегии k . Тогда для стратегии k средний риск при принятии i - го решения rki ri, j p j pki j . j Наряду со средней величиной риска при решении i используют понятие максимального риска. Учитывая отрицательный характер величины ri , j получим . r max i min ri, j j Эта величина не зависит от стратегии и часто используется, как опорная, показывающая наибольший риск от принятия решения i , его опасность. Средний риск принятия решения при стратегии k rk rki . i В системах с противодействием матрица потерь немного изменяется. В качестве опорной ситуации ищется наилучшее решение противника. Тогда матрица, например, платежей ai , j принимает вид расплаты в случае применения противником решения j и нами решения i . 21 По минимаксному критерию ищется решение, которое обеспечивает наибольший выигрыш в наихудших условиях. По Бейесу ищется решение минимизирующее средний риск. По Нейману – Пирсону - решение дающее максимальную величину условной вероятности правильного обнаружения при заданной величине ложной тревоги. Таким образом работа с матрицей рисков – итоговая процедура распознавания образов, принятия решений. Анализ ситуации, формирование описаний классов подготавливает условия корректного решения этой процедуры. Сказанное не снимает целесообразности запуска итерационного процесса (подготовки описания ситуаций, дополнительных измерений и т. д.), если прогнозируемый риск выше допустимого или желательного. Теория полезности изучает предпочтения в среде последствий решений. При этом считается то, что каждое решение порождает вектор или матрицу полезности ui, j U учитывающую интересы всех агентов (инвесторы, работники и т. п.). Считается что решение i1 предпочтительнее или эквивалентно решению i 2 , если полезность ui1, j ui 2, j для всех j . В матрице рисков для отдельных задач учитывается и вероятность появления придельных последствий, таких как смерть человека. При принятии решений она должна быть ниже, чем вероятность летального исхода указанная в шкале профессионального риска. Например: Горные работы 3 10 7 чел/час; Металлургическая промышленность 0,6 10 7 чел/час; Транспортные работы 10 10 7 чел/час; Работа с электричеством - 51 10 7 чел/час. 2.4. Управление рисками Причиной возникновения рисков являются неопределенности, существующие в каждом проекте. Риски могут быть "известные" -- те, которые определены, оценены, для которых возможно планирование. Риски “неизвестные” – те, которые не идентифицированы и не могут быть спрогнозированы. Хотя специфические риски и условия их возникновения не определены, менеджеры проекта знают, исходя из прошлого опыта, что большую часть рисков можно предвидеть. 22 Реализуя проекты, имеющие высокую степень неопределенности в таких элементах, как цели и технологии их достижения многие компании уделяют внимание разработке и применению корпоративных методов управления рисками. Данные методы учитывают как специфику проектов, так и корпоративных методов управления. Американский Институт управления проектами (PMI), разрабатывающий и публикующий стандарты в области управления проектами, значительно переработал разделы, регламентирующие процедуры управления рисками. В новой версии PMBOK (принятие которого ожидается в 2000 году) описаны шесть процедур управления рисками. В данной статье мы предлагаем краткий обзор процедур управления рисками (без комментариев). Управление рисками – это процессы, связанные с идентификацией, анализом рисков и принятием решений, которые включают максимизацию положительных и минимизацию отрицательных последствий наступления рисковых событий. Процесс управления рисками проекта обычно включает выполнение следующих процедур: 1. Планирование управления рисками – выбор подходов и планирование деятельности по управлению рисками проекта. 2. Идентификация рисков – определение рисков, способных повлиять на проект, и документирование их характеристик. 3. Качественная оценка рисков – качественный анализ рисков и условий их возникновения с целью определения их влияния на успех проекта. 4. Количественная оценка – количественный анализ вероятности возникновения и влияния последствий рисков на проект. 5. Планирование реагирования на риски– определение процедур и методов по ослаблению отрицательных последствий рисковых событий и использованию возможных преимуществ. 6. Мониторинг и контроль рисков - мониторинг рисков, определение остающихся рисков, выполнение плана управления рисками проекта и оценка эффективности действий по минимизации рисков. Все эти процедуры взаимодействуют друг с другом, а также с другими процедурами. Каждая процедура выполняется, по крайней мере, один раз в каждом проекте. Несмотря на то, что процедуры, представленные здесь, рассматриваются как дискретные элементы с четко определенными характеристиками, на практике они могут частично совпадать и взаимодействовать. Планирование управления рисками – процесс принятия решений по применению и планированию управления рисками для конкрет23 ного проекта. Этот процесс может включать в себя решения по организации, кадровому обеспечению процедур управления рисками проекта, выбор предпочтительной методологии, источников данных для идентификации риска, временной интервал для анализа ситуации. Важно спланировать управление рисками, адекватное как уровню и типу риска, так и важности проекта для организации. Идентификация рисков определяет, какие риски способны повлиять на проект, и документирует характеристики этих рисков. Идентификация рисков не будет эффективной, если она не будет проводиться регулярно на протяжении реализации проекта. Идентификация рисков должна привлекать как можно больше участников: менеджеров проекта, заказчиков, пользователей, независимых специалистов. Идентификация рисков - итерационный процесс. Вначале идентификация рисков может быть выполнена частью менеджеров проекта или группой аналитиков рисков. Далее идентификацией может заниматься основная группа менеджеров проекта. Для формирования объективной оценки в завершающей стадии процесса могут участвовать независимые специалисты. Возможное реагирование может быть определено в течение процесса идентификации рисков. 24 Качественная оценка рисков – процесс представления качественного анализа идентификации рисков и определения рисков, требующих быстрого реагирования. Такая оценка рисков определяет степень важности риска и выбирает способ реагирования. Доступность сопровождающей информации помогает легче расставить приоритеты для разных категорий рисков. Качественная оценка рисков это оценка условий возникновения рисков и определение их воздействия на проект стандартными методами и средствами. Использование этих средств помогает частично избежать неопределенности, которые часто встречаются в проекте. В течение жизненного цикла проекта должна происходить постоянная переоценка рисков. Количественная оценка рисков определяет вероятность возникновения рисков и влияние последствий рисков на проект, что помогает группе управления проектами верно принимать решения и избегать неопределенностей. Количественная оценка рисков позволяет определять: Вероятность достижения конечной цели проекта Степень воздействия риска на проект и объемы непредвиденных затрат и материалов, которые могут понадобиться. 25 Риски, требующие скорейшего реагирования и большего внимания, а также влияние их последствий на проект. Фактические затраты, предполагаемые сроки окончания. Количественная оценка рисков часто сопровождает качественную оценку и также требует процесс идентификации рисков. Количественная и количественная оценка рисков могут использоваться по отдельности или вместе, в зависимости от располагаемого времени и бюджета, необходимости в количественной или качественной оценке рисков. Планирование реагирования на риски - это разработка методов и технологий снижения отрицательного воздействия рисков на проект. Берет на себя ответственность за эффективность защиты проекта от воздействия на него рисков. Планирование включает в себя идентификацию и распределение каждого риска по категориям. Эффективность разработки реагирования прямо определит, будут ли последствия воздействие риска на проект положительными или отрицательными. Стратегия планирования реагирования должна соответствовать типам рисков, рентабельности ресурсов и временным параметрам. Вопросы, обсуждаемые во время встреч, должны быть адекватны задачам на каждой стадии проекта, и согласованы со всеми членами группы по управлению проектом. Обычно требуются несколько вариантов стратегий реагирования на риски. 26 Мониторинг и контроль. Мониторинг и контроль следят за идентификацией рисков, определяют остаточные риски, обеспечивают выполнение плана рисков и оценивают его эффективность с учетом понижения риска. Показатели рисков, связанные с осуществлением условий выполнения плана фиксируются. Мониторинг и контроль сопровождает процесс внедрения проекта в жизнь. Качественный контроль выполнения проекта предоставляет информацию, помогающую принимать эффективные решения для предотвращения возникновения рисков. Для предоставления полной информации о выполнении проекта необходимо взаимодействие между всеми менеджерами проекта. Целью мониторинга и контроля является выяснить, было ли: Система реагирования на риски внедрена в соответствии с планом Реагирование достаточно эффективно или необходимы изменения Риски изменились по сравнению с предыдущим значением Наступление влияния рисков Необходимые меры приняты Воздействие рисков оказалось запланированным или явилось случайным результатом. Контроль может повлечь за собой выбор альтернативных стратегий, принятие корректив, перепланировку проекта для достижения базового плана. Между менеджерами проекта и группой риска должно быть постоянное взаимодействие, должны фиксироваться все изменения и явления. Отчеты по выполнению проекта должны формироваться регулярно. 27 Алгоритм управления рисками. В последнее время много пишется на тему управления рисками - о процедурах оценки рисков, о возможности применения различных процедур в российских условиях и т. д. Но на практике зачастую сталкиваешься с тем, что руководство компаний и банков не понимает смысла организации риск-менеджмента. Начальник подразделения по управлению рисками одного крупного банка однажды на семинаре по Value at Risk (одна из возможных оценок риска, представляющая собой ожидаемый максимальный убыток в течение установленного периода времени и с установленным уровнем вероятности) в сердцах произнес: "Какие там VaRы, когда у нас неизвестно кто, где, когда и зачем рисками занимается!" Для банков вопрос управления рисками - это вообще особенный вопрос. Западные банки обычно посвящают десятка два страниц годового отчета описанию того, как у них организована система управления различными типами рисков. Руководитель риск-менеджмента западного банка по статусу - один из основных руководителей банка. В России же должность вице-президента по управлению рисками есть всего в нескольких банках, да и появилась она в большинстве из них после кризиса 1998 г., когда многие банки пересмотрели свой подход к управлению рисками. Проблема главным образом состоит в том, что немногие понимают, что к каждому риску необходим комплексный подход. Он должен состоять из следующих этапов: Прежде всего необходимо разработать стратегию управления риском. Как можно управлять риском, не зная, чего мы хотим этим управлением добиться? Общеизвестный принцип no free lunch (бесплатного обеда не бывает) как нельзя лучше иллюстрирует это: чем больше 28 доход, тем больше риск, связанный с получением этого дохода. Необходимо четко сформулировать "аппетит на риск" и строить политику управления риском на основании этого. После определения стратегии управления риском необходимо выявить присущие данной организации риски и разработать подходы для их количественной оценки: какие методы должны использоваться, на каких данных будут основываться расчеты и т. д. Многие риск-менеджеры считают приоритетным именно этот шаг, хотя без всей описываемой цепочки самые современные методы оценки рисков будут бесполезны. Огромное значение имеет выбор программного обеспечения для расчетов. Для некоторых вычислений вполне достаточно стандартных пакетов, таких как Excel. Для более сложных задач необходимы специализированные пакеты по оценке рисков. Особое внимание необходимо уделить интегрированию систем и данных, необходимых для вычислений. Следующий шаг - собственно разработка процедур по управлению риском. Управление рисками, которое часто принимают за "основную науку", - это всего лишь один из этапов описываемого процесса, пусть даже один из наиболее важных. В мире существует множество методов по управлению рисками, наиболее распространенный из которых хеджирование - мало применим к России ввиду почти полного отсутствия производных финансовых инструментов. Российские компании и банки используют множество своих методов для управления рисками: это и работа по предоплате, и особые условия в договорах, и многое, многое другое. Вот один из характерных примеров управления рисками по-российски: один из крупных трубных заводов, прогнозируя рост цен на металл, взял кредит в банке и закупил металл впрок, вычислив, что проценты по кредиту ниже, чем предполагаемый рост цен на металл. Необходимо разработать процедуры внутреннего контроля для каждого типа риска. Это включает в себя как оценку эффективности управления риском, так и контроль соблюдения процедур на различных этапах, например проверку соблюдения установленных лимитов или мониторинг чувствительности к риску. Теперь можно разработать отчетные формы для данного типа риска: кому, что и когда предоставляется. Необходимо также понимать, кем и какие управленческие решения должны быть приняты на основе полученной информации. И наконец, нужно определить, кто в организации занимается данным риском: кто оценивает риск, кто готовит отчетность, кто устанавливает лимиты, кто их контролирует и т. д. Здесь основную роль играет 29 четкое разграничение ответственности, а также разделение обязанностей. Например, сотрудники, рассчитывающие лимиты, не должны подчиняться тому же руководителю организации, что и сотрудники, заключающие сделки, ведь вознаграждение этого руководителя зависит от дохода, полученного по сделкам, а лимиты ограничивают операции и, следовательно, величину дохода. Внедрение этого процесса представляет собой сложную задачу, но от ее решения во многом зависит качество всей системы управления организацией, ведь получение любого дохода связано с теми или иными рисками. Пройдя этот путь, организация может обеспечить себе условия для построения эффективной системы управления. 3. Поддержка принятия решений. Математика и структуры 3.1. Анализ математических методов поддержки принятия решений Методы теории полезности. Теория полезности, изложенная в работе "Теория игр и экономическое поведение", носит аксиометрический характер. Авторы показали, что, если предпочтения людей по отношению к определенным играм (лотереям) удовлетворяют ряду аксиом, то их поведение может рассматриваться как максимизация ожидаемой полезности. В работах Дж. фон Неймана и О. Моргенштерна предполагается, что вероятности даны как объективно известные величины. Д. Сэдвиж разработал аксиоматическую теорию, позволяющую одновременно измерять полезность и субъективную вероятность. Это нашло отображение в модели субъективной ожидаемой полезности (СОП), где вероятность уже определяется как степень уверенности в свершении того или иного события. Модель нашла широкое применение среди экономистов и рассматривается ими как обоснованное средство выбора наилучших решений. Достоинством модели СОП является возможность задним числом так подобрать параметры модели СОП, что она объясняет любой сделанный выбор. СОП рассматривается и в работе Х. Райфа "Анализ решений: введение в проблему выбора в условиях неопределённости". Автором обоснован метод деревьев решений, суть которого состоит в разбиении задачи на ряд подзадач, а те, в свою очередь, на другие подзадачи, и так далее. В результате основная задача представляется в виде дерева решений (ДР). В части вершин ДР выбор осуществляется непосредственно ЛПР, в 30 другой части - на основе субъективной вероятности свершения событий. ДР завершается исходами, каждому из которых приписывается определенная полезность. Вероятность каждого исхода подсчитывается как произведение субъективных вероятностей на пути, идущем от вершины ДР. Путем "сворачивания" ДР от конца к началу выбирается исход с наибольшей субъективной ожидаемой полезностью. Метод деревьев решений позволяет ЛПР, определить оптимальную последовательность действий (стратегию) с учетом личных оценок и предпочтений. Выбранная стратегия будет "лучшей" на данный момент из тех многих, которые имеются в распоряжении. "Лучшей", в смысле сравнения с множеством стратегий, которые стоило бы рассмотреть, стратегия будет в том случае, если она будет наиболее эффективной и рациональной в данной ситуации. В основу многокритериальной теории полезности (МТП) положен научный труд Р. Кинни и Х. Райфа "Принятие решений при многих критериях: предпочтения и замещения". Учеными делается предположение, что варианты решений имеют оценки по многим критериям. В качестве дополнительных к общим аксиомам выступают аксиомы (условия) независимости, на основании которых доказываются теоремы о виде функции полезности. Авторы доказали, что при выполнении условия строгой условной независимости по полезности, функция полезности имеет либо аддитивный, либо мультипликативный вид, причем при , где: - - весовые коэффициенты критериев (0 ≤ К < 1); - - функции полезности по i-му критерию; - U - общая функция полезности. МТП, как и предыдущие методы, строится аксиоматическим способом. В качестве достоинства МТП отмечается детальная проработанность процедур выявления предпочтений ЛПР. Методы теории проспектов (ТП). Проспект - игра с вероятностными исходами. В методах ТП учитывается 3 поведенческих эффекта: 1. Эффект определенности - тенденция придавать больший вес детерминированным исходам. 2. Эффект отражения - к измерению предпочтений при переходе от выигрышей к потерям. 31 3. Эффект изоляции - тенденция к упрощению выбора путем исключения общих компонент вариантов решения. Методы ТП, также как и предыдущие методы, имеют аксиоматические основы. Недостатком является то, что данный метод не снимает все проблемы, возникающие при изучении поведения людей в задачах выбора решения. Главным недостатком всех перечисленных аксиоматических теорий является непроверяемый характер аксиом, что означает на практике требование к человеку принимать на веру правила рационального поведения, вытекающие из той или иной теории. Методы ELECTRE. Французской школой теории принятия решений, возглавляемой Б. Руа, был предложен конструктивный подход к выработке решений, в рамках которого методы, модели и концепции рассматриваются как вспомогательные средства практического анализа ситуации. Эти средства позволяют, как уяснить цели принятия решения, так и лучше понять предпочтения ЛПР. Недостатком методов ELECTRE является то, что они являются вспомогательными средствами, а не способом выработки лучшего решения как при аксиоматическом подходе. Метод анализа иерархий (МАИ). Часто используемый в последнее время метод принятия решений - МАИ, опирающийся на многокритериальное описание проблемы, был предложен и детально описан Саати Т. в своей работе "Принятие решений: метод анализа иерархий". В методе используется дерево критериев, в котором общие критерии разделяются на критерии частного характера. Для каждой группы критериев определяются коэффициенты важности. Альтернативы также сравниваются между собой по отдельным критериям с целью определения каждой из них. Средством определения коэффициентов важности критериев либо критериальной ценности альтернатив является попарное сравнение. Результат сравнения оценивается по бальной шкале. На основе таких сравнений вычисляются коэффициенты важности критериев, оценки альтернатив и находится общая оценка как взвешенная сумма оценок критериев. Не смотря на то, что МАИ не имеет строгого научного обоснования и больше примыкает к эвристическим методам, этот метод нашел широкое практическое применение из-за своей простоты и наглядности. В ходе детального исследования МАИ были выявлены следующие существенные недостатки, такие как: 1. Рассогласование оценок, связанное с трудностями оценки отношений сложных элементов - 1-й вид рассогласования. 32 2. Рассогласование 2-го вида, связанное с предложенной дискретной шкалой для оценки элементов. 3. Резкое увеличение количества оценок с увеличением набора элементов. Не рекомендуется набор элементов больше 9. 4. Пересчет отношений значимости элементов в их важность осуществляется приближенным методом. Эвристические методы. К эвристическим методам относят следующие методы: метод взвешенной суммы оценок критериев. Каждой альтернативе дается числовая (бальная) оценка по каждому из критериев. Критериям приписывается количественные веса, характеризующие их сравнительную важность. Веса умножаются на критериальные оценки, полученные числа суммируются - так определяется ценность альтернативы. Далее выбирается альтернатива с наибольшим показателем ценности. метод компенсации. Данный метод используется при попарном сравнении альтернатив. Достоинством всех эвристических методов является простота и удобство, а основным недостатком то, что все они не имеют научного обоснования. Таким образом, проведенный анализ показал, что рассмотренные методы, положенные в основу теории принятия решения, носят аксиоматический и эвристический характер, т.е. не имеют строгого научного доказательства. Данные методы не позволяют интеллектуализировать процесс принятия решения, так как выработка окончательного решения всегда остается за командиром. Поэтому, предложен подход, ориентированный на методы интеллектуального анализа данных, необходимых ЛПР в процессе принятия решения. Данный подход основывается на методах машинного обучения, которые лежат в основе современных информационных технологий интеллектуальной обработки данных. Метод опорных векторов (SVM — support vector machines) — это набор схожих алгоритмов вида «обучение с учителем», использующихся для задач классификации и регрессионного анализа. Этот метод принадлежит к семейству линейных классификаторов. Он может также рассматриваться как специальный случай регуляризации по А. Н. Тихонову. Особым свойством метода опорных векторов является непрерывное уменьшение эмпирической ошибки классификации и увеличение зазора. Поэтому этот метод также известен как метод классификатора с максимальным зазором. 33 Основная идея метода опорных векторов — перевод исходных векторов в пространство более высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве. Две параллельных гиперплоскости строятся по обеим сторонам гиперплоскости, разделяющей наши классы. Разделяющей гиперплоскостью будет гиперплоскость, максимизирующая расстояние до двух параллельных гиперплоскостей. Алгоритм работает в предположении, что чем больше разница или расстояние между этими параллельными гиперплоскостями, тем меньше будет средняя ошибка классификатора. Несколько классифицирующих разделяющих прямых (гиперплоскостей). Но только одна достигает оптимального разделения. Часто в алгоритмах машинного обучения возникает необходимость классифицировать данные. Каждый объект данных представлен как вектор (точка) в p-мерном пространстве (последовательность p чисел). Каждая из этих точек принадлежит только одному их двух классов. Нас интересует, можем ли мы разделить точки гиперплоскостью размерностью «p−1». Это типичный случай линейной разделимости. Таких гиперплоскостей может быть много. Поэтому вполне естественно полагать, что максимизация зазора между классами способствует более уверенной классификации. То есть, можем ли мы найти такую гиперплоскость, чтобы расстояние от нее до ближайшей точки было максимальным. Это бы означало, что расстояние между двумя ближайшими точками, лежащими по разные стороны гиперплоскости, максимально. Если такая гиперплос34 кость существует, то она нас будет интересовать больше всего, она называется оптимальной разделяющей гиперплоскостью, а соответствующий ей линейный классификатор называется оптимально разделяющим классификатором. Мы полагаем, что точки имеют вид:: где ci принимает значение 1 или −1, в зависимости от того, какому классу принадлежит точка . Каждое это p-мерный вещественный вектор, обычно нормализованный значениями [0,1] или [-1,1]. Если точки не будут нормализованы, то точка с большими отклонениями от средних значений координат точек слишком сильно повлияет на классификатор. Мы можем рассматривать это, как учебную коллекцию, в которой для каждого элемента уже задан класс, к которому он принадлежит. Мы хотим, чтобы алгоритм метода опорных векторов классифицировал их таким же образом. Для этого мы строим разделяющую гиперплоскость, которая имеет вид: 35 Оптимальная разделяющая гиперплоскость для метода опорных векторов, построенная на точках из двух классов. Ближайшие к параллельным гиперплоскостям точки называются опорными векторами. Вектор — перпендикуляр к разделяющей гиперплоскости. Параметр b зависит от кратчайшего расстояния гиперплоскости до начала координат. Если параметр b равен нулю, гиперплоскость проходит через начало координат, что ограничивает решение. Так как нас интересует оптимальное разделение, нас интересуют опорные вектора и гиперплоскости параллельные оптимальной и ближайшие к опорным векторам двух классов. Можно показать, что эти параллельные гиперплоскости могут быть описаны следующими уравнениям (с точностью до нормировки). Если учебная коллекция линейно разделима, то мы можем выбрать гиперплоскости таким образом, чтобы между ними не лежала ни одна точка обучающей выборки и затем максимизировать расстояние между гиперплоскостями. Ширину полосы между ними легко найти из сообра[1] жений геометрии, она равна , таким образом наша задача минимизировать . Чтобы исключить все точки из полосы, мы должны убедиться для всех i, что Это может быть также записано в виде: Проблема построения оптимальной разделяющей гиперплоскости сводится к минимизации , при указанном условии. Это задача квадратичной оптимизации, которая имеет вид: 36 По теореме Куна-Таккера эта задача эквивалентна двойственной задаче поиска седловой точки функции Лагранжа где — вектор двойственных переменных. Сведем эту задачу к эквивалентной задаче квадратичного программирования, содержащую только двойственные переменные: Допустим, мы решили данную задачу, тогда формулам: и можно найти по В итоге алгоритм классификации может быть записан в виде: Обратим внимание, что суммирование идет не по всей выборке, а только по опорным векторам, для которых . Для того, чтобы алгоритм мог работать в случае, если классы линейно неразделимы, позволим ему допускать ошибки на учебной коллекции. Введем набор дополнительных переменных , характеризующих величину ошибки на объектах . Возьмем за отправную точку, смягчим ограничения неравенства, так же введем в минимизируемый функционал штраф за суммарную ошибку: 37 Коэффициент C — параметр настройки метода, который позволяет регулировать отношение между максимизацией ширины разделяющей полосы и минимизацией суммарной ошибки. Аналогично, по теореме Куна-Таккера сводим задачу к поиску седловой точки функции Лагранжа: По аналогии сведем эту задачу к эквивалентной: На практике для построения машины опорных векторов решают именно эту задачу, так как гарантировать линейную разделимость точек на два класса в общем случае не представляется возможным. Этот вариант алгоритма называют алгоритмом с мягким зазором (soft-margin SVM), тогда как в линейно разделимом случае говорят о жёстком зазоре (hard-margin SVM). Для алгоритма классификации сохраняется формула (4), с той лишь разницей, что теперь ненулевыми обладают не только опорные объекты, но и объекты-нарушители. В определённом смысле это недостаток, поскольку нарушителями часто оказываются шумовые выбросы, и построенное на них решающее правило, по сути дела, опирается на шум. Константу C обычно выбирают по критерию скользящего контроля. Это трудоёмкий способ, так как задачу приходится решать заново при каждом значении C. Если есть основания полагать, что выборка почти линейно разделима, и лишь объекты-выбросы классифицируются неверно, то можно применить фильтрацию выбросов. Сначала задача решается при некото38 ром C, и из выборки удаляется небольшая доля объектов, имеющих наибольшую величину ошибки . После этого задача решается заново по усечённой выборке. Возможно, придётся проделать несколько таких итераций, пока оставшиеся объекты не окажутся линейно разделимыми. Алгоритм построения оптимальной разделяющей гиперплоскости, предложенный в 1963 году Владимиром Вапником — алгоритм линейной классификации. Однако в 1992 году Бернхард Босер, Изабель Гуйон и Вапник предложили способ создания нелинейного классификатора, в основе которого лежит переход от скалярных произведений к произвольным ядрам, так называемый kernel trick (предложенный впервые М. А. Айзерманом, Э. М. Броверманом и Л. В. Розоноером для метода потенциальных функций), позволяющий строить нелинейные разделители. Результирующий алгоритм крайне похож на алгоритм линейной классификации, с той лишь разницей, что каждое скалярное произведение в приведённых выше формулах заменяется нелинейной функцией ядра (скалярным произведением в пространстве с большей размерностью). В этом пространстве уже может существовать оптимальная разделяющая гиперплоскость. Так как размерность получаемого пространства может быть больше размерности исходного, то преобразование, сопоставляющее скалярные произведения, будет нелинейным, а значит функция, соответствующая в исходном пространстве оптимальной разделяющей гиперплоскости, будет также нелинейной. Стоит отметить, что если исходное пространство имеет достаточно высокую размерность, то можно надеяться, что в нём выборка окажется линейно разделимой. Наиболее распространённые ядра: Полиномиальное (однородное): Полиномиальное (неоднородное): Радиальная базисная функция: для γ > 0 Радиальная базисная , функция Гаусса: Сигмоид: , κ>0иc<0 С другой стороны в основе Метода опорных векторов лежит понятие плоскостей решений, определяющих границы принятия решения. Плоскость решения разделяет объекты с разной классовой принадлежностью. Ниже приведен схематичный пример, в котором участвуют объекты двух типов GREEN и RED. Разделяющая линия задает границу, спра 39 ва от которой все объекты типа GREEN, а слева типа RED. Любой новый объект (белый кружок), попадающий направо, помечается (классифицирует) как объект класса GREEN (или помечается как объект класса RED, если он расположился по левую сторону от разделяющей прямой). Выше приведен классический пример линейного классификатора, т.е. классификатора, который разделяет множество объектов на соответствующие группы (в нашем случае это GREEN и RED ) прямыми. Однако, большинство задач классификации не так просты, и часто необходимо строить оптимальные разбиения множеств объектов намного более сложной структуры. Другими словами, необходимо правильно классифицировать новые объекты (тестовые наблюдения) на основе имеющегося опыта (учебных наблюдений). В сравнении с предыдущим примером видно, что для полного отделения объектов типа GREEN от объектов типа RED потребуется кривая, т.е. более сложный разделитель, чем прямая. Методы решения классификационных задач, в которых дифференциация объектов с разной классовой принадлежностью осуществляется построением разделяющих прямых, называют гиперплоскостными классификаторами. Метод опорных векторов специально предназначен для решения такого типа задач. Нижеприведенная иллюстрация демонстрирует основную идею Метода опорных векторов. На ней представлены исходные объекты (в левой части схемы), которые далее преобразуются или, по-другому, переупорядочиваются при помощи специального класса математических функций, называемых ядрами. Этот процесс переупорядочивания называют еще преобразованием объектов (перегруппировкой). Отметим, что новый набор преобразованных объектов (в правой части схемы) уже линейно разделим. Таким образом, вместо построения сложной кривой (как 40 показано в левой части схемы) требуется лишь провести оптимальную прямую, которая отделит объекты типа GREEN от объектов типа RED. Технические замечания STATISTICA Метод опорных векторов (МОВ) - метод первоначальной классификации, который решает задачу построением гиперплоскостей в многомерном пространстве, разделяющих группы наблюдений с разными классовыми метками. STATISTICA МОВ применяется как для регрессионных, так и для классификационных задач с несколькими непрерывными и категориальными переменными. Для категориальных переменных создается фиктивная двоичная переменная, принимающая значения 0 или 1. Таким образом, категориальная зависимая переменная, с тремя различными значениями (например, A,B,C), представляется набором фиктивных двоичных переменных: A: {1 0 0}, B: {0 1 0}, C: {0 0 1} Для построения оптимальных гиперплоскостей МОВ использует итеративный минимизирующий ошибку алгоритм обучения. По типу функции ошибки МОВ модели делятся на несколько групп: Классификация МОВ Типа 1 (по - другому, С - МОВ классификация) Классификация МОВ Типа 2 (по - другому, ню - МОВ классификация) Регрессия МОВ Типа 1 (по - другому, эпсилон - МОВ регрессия) Регрессия МОВ Типа 2 (по - другому, ню - МОВ регрессия) Кратко опишем каждую группу моделей. Классификация МОВ Классификация МОВ Типа 1 Для этой группы МОВ обучение связано с минимизацией функции ошибки вида: 41 с ограничениями: где C - константа емкости, w - вектор коэффициентов, b - константа, и - параметры для обработки неразделимых наблюдений (входов), i индексирует N учебных наблюдений. Отметим, что - метка класса, x - независимая переменная. Ядро преобразует данные из входного (независимого) пространства в пространство признаков. Обратим внимание на то, что чем больше значение C, тем выше штраф ошибки. Классификация МОВ Типа 2 В отличие от модели Классификации МОВ Типа 1, в модели Классификации МОВ Типа 2 минимизируется функция ошибки: ограничения: При построении регрессии МОВ оценивается функциональная зависимость переменной y от набора независимых переменных x. Как и во всех регрессионных задачах, здесь предполагается, что связь между зависимыми и независимыми переменными задается детерминированной функцией f и аддитивным шумом: y = f(x) + noise Задача состоит в том, чтобы найти функциональное представление для f, которое бы правильно предсказывало новые наблюдения. Цель достигается обучением МОВ модели на образцовой выборке (на учебных наблюдениях). Процесс обучения, как и в случае классификационных задач, связан с последовательной оптимизацией функции ошибки. В зависимости от вида функции ошибки различают две типа МОВ моделей: Регрессия МОВ Типа 1 Для этого типа МОВ моделей функция ошибки имеет вид: 42 Функция минимизируется с условиями: Регрессия МОВ Типа 2 Для этого типа МОВ моделей функция ошибки имеет вид: Функция минимизируется с условиями: Ядро STATISTICA МОВ для построения различных моделей методом опорных векторов использует набор из нескольких ядер. Он включает: линейное, полиномиальное ядро, радиальную базисную функцию (РБФ) и сигмоидное ядро: 43 3.2. Классификация СППР Разные авторы предлагают разные классификации. На уровне пользователя Haettenschwiler (1999) делит СППР на пассивные, активные и кооперативные СППР. Пассивной СППР называется система, которая помогает процессу принятия решения, но не может вынести предложение, какое решение принять. Активная СППР может сделать предложение, какое решение следует выбрать. Кооперативная позволяет ЛПР изменять, пополнять или улучшать решения, предлагаемые системой, посылая затем эти изменения в систему для проверки. Система изменяет, пополняет или улучшает эти решения и посылает их опять пользователю. Процесс продолжается до получения согласованного решения. На концептуальном уровне Power (2003) отличает СППР, управляемые сообщениями (Communication-Driven DSS), СППР, управляемые данными (Data-Driven DSS), СППР, управляемые документами (Document-Driven DSS), СППР, управляемые знаниями (KnowledgeDriven DSS) и СППР, управляемые моделями (Model-Driven DSS). СППР, управляемые моделями, характеризуются в основном доступ и манипуляции с математическими моделями (статистическими, финансовыми, оптимизационными, имитационными). Отметим, что некоторые OLAP-системы, позволяющие осуществлять сложный анализ данных, могут быть отнесены к гибридным СППР, которые обеспечивают моделирование, поиск и обработку данных. Управляемая сообщениями (Communication-Driven DSS) (ранее групповая СППР — GDSS) СППР поддерживает группу пользователей, работающих над выполнением общей задачи. СППР, управляемые данными (Data-Driven DSS) или СППР, ориентированные на работу с данными (Data-oriented DSS) (также известные 44 как Business Intelligence) в основном ориентируются на доступ и манипуляции с данными. СППР, управляемые документами (Document-Driven DSS), управляют, осуществляют поиск и манипулируют неструктурированной информацией, заданной в различных форматах. Наконец, СППР, управляемые знаниями (Knowledge-Driven DSS) обеспечивают решение задач в виде фактов, правил, процедур. На техническом уровне Power (1997) [19] различает СППР всего предприятия и настольную СППР. СППР всего предприятия подключена к большим хранилищам информации и обслуживает многих менеджеров предприятия. Настольная СППР — это малая система, обслуживающая лишь один компьютер пользователя. Существуют и другие классификации (Alter [3], Holsapple и Whinston [13], Golden, Hevner и Power [11]). Отметим лишь, что превосходная для своего времени классификация Alter‘a, которая разбивала все СППР на 7 классов, в настоящее время несколько устарела. В зависимости от данных, с которыми эти системы работают, СППР условно можно разделить на оперативные и стратегические. Оперативные СППР предназначены для немедленного реагирования на изменения текущей ситуации в управлении финансово-хозяйственными процессами компании. Стратегические СППР ориентированы на анализ значительных объемов разнородной информации, собираемых из различных источников. Важнейшей целью этих СППР является поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, таких как конъюнктура целевых для компании рынков, изменения финансовых рынков и рынков капиталов, изменения в законодательстве и др. СППР первого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия, в идеале адекватно отражающей в режиме реального времени основные аспекты производственной и финансовой деятельности. Для ИСР характерны следующие основные черты: отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико; ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т. п.; как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами. 45 СППР второго типа предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые на основе агрегированных данных дают возможность менеджерам компании обосновывать свои решения, использовать факторы устойчивого роста бизнеса компании и снижать риски. СППР второго типа в последнее время активно развиваются. Технологии этого типа строятся на принципах многомерного представления и анализа данных (OLAP). При создании СППР можно использовать Web-технологии. В настоящее время СППР на основе Web-технологий для ряда компаний являются синонимами СППР предприятия. Архитектура СППР представляется разными авторами по-разному. Приведем пример. Marakas (1999) [18] предложил обобщенную архитектуру, состоящую из 5 различных частей: (a) система управления данными (the data management system — DBMS), (b) система управления моделями (the model management system — MBMS), (c) машина знаний (the knowledge engine (KE)), (d) интерфейс пользователя (the user interface) и (e) пользователи (the user(s)). Аналоги систем принятия решений ищут и в биологических моделях. Очевидно, что это трудно сделать по нескольким причинам. Сверхвысокая сложность человеческого мозга затрудняет понимание принципов его функционирования. Трудно понять общие принципы функционирования и взаимодействия его приблизительно 1011 нейронов и 1014 синоптических связей. Кроме того, существует множество проблем при проведении экспериментальных исследований. Микроскопические исследования требуют тщательно подготовленных образцов (заморозка, срезы, окраска) для получения маленького двумерного взгляда на большую трехмерную структуру. Техника микропроб позволяет провести исследования внутренней электрохимии узлов, однако трудно контролировать одновременно большое количество узлов и наблюдать их взаимодействие. Наконец, этические соображения запрещают многие важные эксперименты, которые могут быть выполнены только на людях. Большое значение имели эксперименты над животными, однако животные не обладают способностями человека описывать свои впечатления. В общей схеме принятия решений (рис. 35) преобладающей по трудовым затратам является операция преобразования пространства наблюдений с целью получения компактного описания ситуации. 46 Системы поддержки принятия решений – сложные динамические системы с элементами искусственного интеллекта. Эти системы могут включать и подготовленных специалистов, экспертов т. е. быть комплексными человеко-машинными системами. Сегодня они в основном специализированны. Рис.35. Обобщенная схема принятия решений В процессе разработки таких систем формируются описания физикоматематических, химических, биологических, социальных моделей характеризующих объекты исследования. Для формирования зон описаний ситуаций, характеристики и параметры которых носят случайный характер, используют методы математической статистики. Наиболее часто - это определение законов распределения и их параметров по имеющимся выборкам. По результатам наблюдений проявлений признаков в различных случаях, ситуаций формируется статистическая гипотеза о виде и параметрах закона распределения. Классификация на основе анализа структуры альтернатив. Слева изображено неструктурированное множество альтернатив. Справа показано разбиение исходного множества на 4 класса. Можно считать, что каждый класс есть подмножество исходного множества альтернатив. Здесь важно отметить, что классы НЕУПОРЯДОЧЕНЫ друг относительно друга. Т.е. нельзя сказать, что какой-то класс "важнее (лучше, старше, дороже и п.т.)" другого. Например, людей можно клас47 сифицировать по полу или национальности. Правильная постановка диагноза - также пример классификации. Компьютерные системы, помогающие врачу ставить диагноз, существуют. И решают они именно задачу классификации, т.е. отнесения больного к нужному классу, который эквивалентен названию болезни. (А как же быть с легкими и тяжелыми заболеваниями? Ведь по определению классы НЕ упорядочены. Действительно, заболевания можно упорядочивать по тяжести, но здесь мы договоримся не принимать это в расчет.) Второй способ структурирования называется СТРАТИФИКАЦИЯ. Это название произошло от английского термина "страта", (strata) что означает "слой", "пласт". Иными словами, стратификация есть разбиение множества на ряд уровней или слоев. В отличие от классов, страты упорядочены. Рассмотрим рисунок Серая и зеленая альтернативы помещены на верхнюю страту. Это означает, что они одинаковы по значимости (для ЛПР) и, одновременно, важнее (лучше) остальных альтернатив. В примере с обменом квартиры, если удалось стратифицировать варианты, то окончательный выбор, естественно, будет сделан среди вариантов, занимающих верхнюю страту. Удобно считать, что страты выражают некоторые уровни "качества". Несколько примеров классических стратификаций: оценки уровня знаний звезды отелей спортивные разряды Связь страт с неким абстрактным "качеством" крайне важна для понимания идеи стратификации. Пятизвездный отель не просто лучше двухзвездного, а можно говорить на сколько он лучше. Следующий способ структурирования называется РАНЖИРОВАНИЕ. Внешне он напоминает стратификацию (см. предыдущий рисунок), но в отличие от нее уровни НЕ выражают "качества", а трактуются просто как "номер в списке". Это различие настолько важно, что на нем стоит остановиться подробнее. Упорядочение называется ранжировкой, если указан только номер места объекта в упорядочении (и больше ничего). Если нам сообщают только места, полученные спортсменами по резуль48 татам соревнований (но не сообщают результаты), то это - типичная ранжировка. Например, объявляют, что первые 3 места распределились следующим образом: 1. Иванов 2. Петров 3. Сидоров Если указанные спортсмены - прыгуны в высоту, то, зная результаты каждого, можно было бы говорить на сколько, к примеру, Иванов прыгнул выше Петрова или Сидорова. Знание только мест (без результатов) дает нам право говорить, что Иванов лучше Петрова, но не дает нам возможности говорить "на сколько лучше". Места в ранжировке естественно называются "рангами". Ранг 1 принято присваивать наилучшему объекту. (Вспомним морское "капитан 1-го ранга"). Итак, в отличие от стратификации, здесь играет роль только номер "полочки", на которую кладут альтернативы. Один и тот же ранг может быть присвоен нескольким объектам. Тогда ранжировка называется нестрогой. Тогда как в строгой ранжировке каждому объекту присваивается уникальный номер ранга. В терминах спортивного примера, нестрогая ранжировка - это когда Петров и Сидоров делят второе место. Мы рассмотрели в общих чертах основные понятия структуризации множества альтернатив. Вспомним теперь, что структура была нам нужна не сама по себе, а с целью выполнить ВЫБОР. Классификация здесь стоит особняком, поскольку для нее выбор сводится по сути к выбору определенного класса, к которому следует отнести альтернативу. Стратификация и ранжировка предоставляют нам более широкие возможности выбора. Но как выполнить структуризацию? Как найти структуру в изначально аморфном множестве альтернатив? Этим мы теперь и займемся. Методы структуризации - это по существу и есть сердцевина поддержки принятия решений. Две классификации методов структурирования множества альтернатив Такие методы можно классифицировать различным образом. Прежде всего, и чаще всего эти методы делят на критериальные и некритериальные. Я не буду здесь давать определение термину "критерий". Будем считать, что читатель интуитивно понимает смысл этого слова. Иногда встречаются такие синонимы термина, как "фактор", "показатель". Термин фактор чаще всего употребляют, когда говорят о влиянии. Например, "нужно учесть влияние этого фактора". Словом показатель чаще всего описывают разные стороны некоторого объекта. Например, гово49 рят о "показателях деятельности предприятия". Термин критерий чаще всего применяют для описания ситуации выбора. Например, говорят о "критериях выбора автомобиля". Понятно, что критериальное структурирование основано на сопоставлении альтернатив по некоторому набору критериев. Что же такое некритериальные методы структурирования? Предположим у нас есть множество альтернатив. Будем выбирать из него пары, предъявлять их экспертам или ЛПР и просить их сравнить членов пары "в целом" (предполагается, что все альтернативы попарно сравнимы!). При этом эксплуатируется способность человеческого мозга создавать общее представление (мнение) о предмете. В психологии и, затем, в кибернетике такое общее представление обозначают термином "гештальт" (ударение на букве "а"). Это - целостный образ объекта, лишенный какой бы то ни было детализации. Когда мы спрашиваем знакомого, какой город ему больше нравится, Москва или С-Петербург, не интересуясь, почему один из городов нравится больше - мы по существу просим знакомого выполнить сравнение гештальтов. Следующий по важности способ классификации методов структурирования связан с количеством ЛПР или экспертов, участвующих в процессе выбора. Говорят либо об индивидуальных, либо о групповых решениях. Одна из классических монографий, написанная известным математиком Б.Г.Миркиным, так и называется "Проблема группового выбора" (Москва, изд. "Наука", 1974 год). Рейтинговое голосование в Думе - пример одного из методов группового принятия решений. Допустим, на роль спикера претендуют 5 человек. Тогда каждый из депутатов дает свою ранжировку (возможно нестрогую) этих пяти кандидатов. Возникает задача построения обобщенной (синонимы: интегральной, результирующей, компромиссной) ранжировки, на основе которой и будет определено - кто же станет спикером. Некритериальное структурирование множества альтернатив Возьмем две альтернативы А и Б. При их парном сравнении возможны только 3 варианта результата: А лучше Б (будем обозначать это как А > Б) А хуже Б (А < Б) А и Б равноценны (А = Б) Если сравнить попарно все альтернативы исходного множества, то часто можно получить нестрогую ранжировку. Например, для множества {a,b,c,d,e} можно получить: c > d > a = e > b, или тот же результат с номерами рангов № ранга альтернатива 50 1 c 2 d 3 a, e 4 b В итоге мы получили структурированное множество, не используя понятия "критерий". Существует ли общий путь получения ранжировки на основе результатов парных сравнений? Оказывается это далеко не всегда просто. Рассмотрим пример. Пусть есть множество альтернатив {a,b,c,d} и следующие результаты парных сравнений: a > b, b > d, d > c, c > a, a > d, b = c. Эти результаты удобно представить в виде рисунка. Здесь окружности представляют альтернативы. Результат парного сравнения типа А > В изображается стрелкой, идущей от А к В. Двунаправленная стрелка между альтернативами означает их равенство. Как мог получиться такой результат - нам сейчас не важно. Чаще всего подобные структуры получаются в результате коллективного творчества. Можно представить, например, что разные пары альтернатив сравнивали разные эксперты (ЛПР, если их несколько). Существует более десятка способов преобразования подобных структур в ранжировку. Приведем один из наиболее часто применяемых способов, который называется "метод строчных сумм". Для реализации метода, прежде всего, нужно построить таблицу парных сравнений. Для нашего примера она выглядит следующим образом. a b c d *** 1 0 1 2 a 0 *** 1/2 1 1,5 b 1 1/2 *** 0 1,5 c 0 0 1 *** 1 d 51 Наименования строк (желтый фон) и столбцов (голубой) соответствуют именам альтернатив. На пересечении строки и столбца ставятся числа по следующим правилам: ставится 1, если альтернатива с именем строки лучше альтернативы с именем столбца, ставится 0, если альтернатива с именем строки хуже альтернативы с именем столбца, ставится 1/2, если альтернатива с именем строки равноценна альтернативе с именем столбца. Клетки таблицы, у которых имя строки совпадает с именем столбца, не заполняются (в нашем примере в этих клетках проставлены "звездочки"). Затем подсчитываются суммы строк (в примере - красные числа в крайнем справа столбце). Наконец, строится ранжировка альтернатив следующим способом. Альтернативе, имеющей максимальную строчную сумму присваивается ранг 1. Альтернативе, имеющей следующую по величине сумму, присваивается ранг 2 (в нашем примере таких альтернатив две: b и c). И так далее, пока не будут отранжированы все альтернативы. В итоге, получаем ранжировку: № ранга альтернатива 1 a 2 b, c 3 d Повторим еще раз: описанный метод – лишь один из многих методов упорядочения альтернатив на основе результатов парных сравнений. Структурирование множества альтернатив с использованием критериев исходная модель имеет вид следующей таблицы. a1 a2 ... an k1 x11 x21 ... xn1 >k2 x12 x22 ... xn2 ... ... ... ... ... km x1m ... ... xnm Имена строк представляют имена альтернатив, имена столбцов имена критериев. На пересечении i-й строки и j-го столбца записывается оценка xij альтернативы ai по критерию kj . Назовем такую форму представления модели выбора "критериальной таблицей". В такой форме публикуются многие "рейтинги", результаты сравнительного анализа и 52 т.п. Читатель, привыкший иметь дело с критериальными таблицами, обычно сразу же припоминает нехитрый способ упорядочения альтернатив. В подавляющем большинстве случаев это – так называемая "линейная свертка" (взвешенная сумма) – любимый всеми народами и во все времена способ обработки критериальной таблицы. Суть его проста. Сначала некоторым образом выбираются весовые коэффициенты критериев. Обозначим их вектором (w1 , w2 ,... , wm). Затем, для каждой альтернативы (каждой i-ой строки таблицы) рассчитывается следующая величина si = xij wj (сумма берется для всех j от 1 до m). Наконец, принимается правило: чем больше значение si, тем лучше альтернатива ai. Вот и все! К сожалению, эта схема, не всегда дает верный результат! Следуют заявления типа того, что приведенная схема "соответствует здравому смыслу", или "отвечает интуитивному представлению о сравнительном качестве альтернатив" и т.п. Здесь мы сталкиваемся с типичной ситуацией, которая удачно выражается известной фразой "наука начинается там, где кончается здравый смысл". Увы, это так! В конце ХХ-го века математика достигла такого уровня абстрактности, что здравый смысл отступил на второй план. В одной из классических книг по методам ППР, а именно, в книге американских математиков Р.Л. Кини и Х. Райфа "Принятие решений при многих критериях: предпочтения и замещения" (Москва, изд-во "Радио и связь", 1981) строго доказано, что линейная свертка корректна только тогда, когда все критерии попарно независимы по предпочтению. Что такое "зависимость" критериев, какие виды зависимости бывают, и что из этого следует – все это выходит за рамки нашего краткого введения. Линейная свертка основана на неявном постулате: "низкая оценка по одному критерию может быть компенсирована высокой оценкой по другому". Однако, этот постулат верен отнюдь не для всех моделей сравнительной оценки "качества". Простейший пример – ухудшение качества изображения телевизора не может быть компенсировано улучшением качества его звука. Но и это еще не все. Серьезные проблемы связаны с критериями. Прежде всего, не всегда удается обосновать тот набор критериев, который необходим и достаточен для решения ЗПР. Может показаться, что набор критериев "естественно" возникает в каждой конкретной задаче. Но, увы, это далеко не так. Еще сложнее обстоит дело с весами критериев. Можно даже сказать, что веса критериев – самое тонкое место в проблеме критериально53 го упорядочения альтернатив. Чаще всего веса назначают, исходя из интуитивного представления о сравнительной важности критериев. Однако исследования показывают, что человек (эксперт, ЛПР) не способен непосредственно назначать критериям корректные численные веса. Более того, есть данные, (они еще не опубликованы) которые свидетельствуют о том, что человек не может корректно назначать веса даже на базе нечисловых шкал. Почему же люди так часто и так охотно манипулируют взвешенной суммой? По этому поводу не могу удержаться от искушения процитировать отрывок из великолепной книги Елены Сергеевны Вентцель "Исследование операций (задачи, принципы, методология)". В следующем отрывке веса критериев называются "коэффициентами", альтернативы – "решениями". "Здесь мы встречаемся с очень типичным для подобных ситуаций приемом – "переносом произвола из одной инстанции в другую". Простой выбор компромиссного решения на основе мысленного сопоставления всех "за" и "против" каждого решения кажется слишком произвольным, недостаточно "научным". А вот маневрирование с формулой, включающей (пусть столь же произвольно назначенные) коэффициенты – совсем другое дело. Это уже "наука"! По существу же никакой науки тут нет, и нечего обманывать самих себя". Книга была написана в конце 70-х годов. Интересно, что примерно в это же время зародился научный подход к проблеме весов критериев. Его автор – замечательный математик Владислав Владимирович Подиновский. В цитированной книге Е.С.Вентцель есть ссылка на одну из ранних работ Подиновского, написанную им в соавторстве с В.М. Гавриловым: "Оптимизация по последовательно применяемым критериям", - Москва, "Советское радио", 1975.Любопытно, что анализ всего лишь одного подхода (последовательного рассмотрения упорядоченных по важности критериев) занял около 8 печатных листов! В дальнейшем, Подиновскому удалось дать строгое определение понятию "важность критерия" и опубликовать в этой области прикладной математики несколько монографий и множество статей. Владислав Владимирович по праву может считаться основоположником научного подхода к проблеме важности критериев. По сей день он остается признанным авторитетом №1 в мире по этой проблеме. Но вернемся к существу вопроса. Если все так сложно, то как все же взяться за структурирование альтернатив, представленных в виде критериальной таблицы? Этим мы сейчас и займемся. Прежде всего, заметим, что в таблице могут оказаться альтернативы, которые имеют оценки по всем критериям хуже, чем дру54 гие альтернативы. Сразу ясно, что такие альтернативы неконкурентоспособны. Их можно смело вычеркивать из таблицы. После вычеркивания заведомо наихудших альтернатив, в таблице остаются только такие альтернативы, которые хотя бы по одному критерию, не хуже, чем другие. Множество таких альтернатив получило название "множество не деноминирующих альтернатив", или "множество Парето". Итальянский экономист и социолог Вильфредо Парето (1848 - 1923). Именно он первый обратил внимание на то обстоятельство, что начинать упорядочение многокритериальных альтернатив нужно с удаления явно худших. С его именем связано еще одно математическое понятие. В статистике известна "диаграмма Парето". Это – гистограмма, упорядоченная по убыванию высоты "столбиков". Критерии необходимо упорядочить по важности без назначения им весов. Сделать это можно, например, методом парных сравнений. Оказывается, что существуют методы структурирования альтернатив, построенные на использовании только информации о результатах попарного сравнения критериев по важности. Автор исторически одного из первых методов этого класса – все тот же В.В.Подиновский. Суть метода можно упрощенно пояснить на следующем примере. Пусть имеется 2 альтернативы и 2 критерия. И пусть задана критериальная таблица. k1 k2 a x y b z t Пусть, далее, известно, что критерий k1 важнее критерия k2 (k1 > k2). Тогда, если y = t и x > z, то можно утверждать, что a > b. При этом не играет роли насколько x больше z. Обратим внимание на то, что для упорядочения альтернатив нам не понадобились веса критериев. Мы использовали только качественную информацию о сравнительной важности критериев. Заметим, что если y < t, то метод ничего не может сказать об относительной предпочтительности альтернатив. Это говорит о том, что метод является достаточно грубым. Если распространить описанную логику на таблицы произвольного размера – получим метод Подиновского. Он описан в статье "Многокритериальные задачи с упорядоченными по важности критериями" (журнал "Автоматика и телемеханика", №11, 1979 год). Несмотря на кажущуюся простоту, общее описание метода доступно только хорошо подготовленным математикам. Самым известным, классическим методом упорядочения альтернатив на основе качественной информации о сравнительной важности критериев является метод, основанный на понятии "единая порядковая шка55 ла" (ЕПШ). Для объяснения этого понятия возьмем школьный пример. Пусть ставится задача упорядочить студентов по оценкам, полученным ими по двум предметам. Для определенности пусть этими предметами будут математика и физкультура. Задано также, что математика важнее физкультуры (да простят меня учителя физкультуры!). Решим задачу "в лоб", т.е. перечислим все возможные пары оценок и упорядочим их по убыванию предпочтительности. Две верхние строчки такого упорядочения построить легко. Это Ранг Математика Физкультура 1 5 5 2 5 4 А дальше мы сразу наталкиваемся на проблему. Что лучше (5, 3) или (4, 5)? Со всей откровенностью приходится признаться, что ответ на это вопрос зависит от произвола лица, принимающего решение. Если для этого лица математика значительно важнее физкультуры, скорее всего, будет принято решение считать (5,3) более важным, чем (4,5). Тогда первые четыре строчки будут выглядеть так Ранг Математика Физкультура 1 5 5 2 5 4 3 5 3 4 4 5 Продолжая в том же духе, можно достроить всю таблицу до конца. Она, естественно, завершится парой отметок (1,1). Таблица такого типа и называется "единой порядковой шкалой". Пользоваться ею – одно удовольствие! Сравнение любой пары учеников сводится к поиску в таблице соответствующих их оценкам строк. Тот, чья строка оказалась выше – считается лучше. Если все так замечательно, почему же ЕПШ не нашла широкого распространения? Ответ прост – она может быть построена только для небольшого числа критериев. Попробуйте построить ЕПШ хотя бы для 7 предметов, и вы быстро убедитесь в справедливости указанного недостатка. Итак, мы рассмотрели несколько способов упорядочения (структуризации) альтернатив без построения обобщенного критерия. Кстати, в теории принятия решений обобщенный критерий получил название "функция ценности" или "функция полезности". Линейная свертка – простейший пример функции полезности. Таких функций разработано достаточно много. Есть, например, мультипликативная свертка. Она ис56 пользуется в моделях, основанных на постулате: "низкая оценка хотя бы по одному критерию влечет за собой низкое значение функции полезности" (вспомните пример с телевизором!). Записывается такая свертка следующим образом si = xijwj (произведение берется для всех j от 1 до m). При этом, должны быть выполнены условия: 0 xij 1 и wj = 1. (где w – вес критерия) В теории многокритериального анализа метод структурирования множества альтернатив (с учетом весов критериев или без него) принято называть "решающим правилом". Разнообразие решающих правил очень велико. Мы познакомились только с самыми простыми из них. Даже беглое описание основных классов решающих правил выходит за рамки этого краткого введения. В заключение этого раздела для развлечения читателей приведу одно из самых замысловатых решающих правил. Оно родилось в недрах известной французской школы математиков, возглавляемой Б.Руа, получило название "Метод Электрá" и на русском языке опубликовано в статье: Б.Руа "Классификация и выбор при наличии нескольких критериев" (в сборнике "Вопросы анализа и процедуры принятия решений", под редакцией И.Ф.Шахнова, М., изд. "Мир", 1976 г.). "Электрá" относится к редкому классу методов, использующих численные веса критериев, но не использующих функцию полезности. Пусть сравниваются две альтернативы a и b. I+ a b (x > y) x y I= (x = y) x y I- (x < y) x y Пусть все веса {w1, w2, ... , wm} критериев есть положительные действительные числа и сумма этих чисел равна W. Разобьем все множество критериев на 3 группы. В первую группу (обозначим ее I+ ) включим критерии, для которых a лучше b, т.е. оценки а больше оценок b (x > y). Во вторую группу (I=), включим критерии, для которых справедливо x=y, наконец, в последнюю группу (I-), включим критерии, для которых x < y. Отметим, что вопрос происхождения весов критериев лежит за рамками метода. Важно также, что группа I- не пуста, иначе можно было бы сразу сделать вывод, что a > b. Введем величину, называемую "индекс согласия" (имеется в виду согласие с тем, что a > b) и определяемую как c (a>b) = (1/W) wj, где сумма берется для всех критериев, в ходящих в группу I+ . 57 Вторую величину назовем "индекс несогласия" и определим как d (a>b) = (1/dmax) max (yj – xj) для всех j, принадлежащих весам, входящим в группу I-. Здесь dmax – максимальный размах шкалы оценок по критериям. Например, если оценки выставляются в разных шкалах и максимальная шкала имеет 10 градаций, то dmax = 10. Заметим, что для группы I- справедливо yj > xj для всех j, поэтому разность (yj – xj) всегда положительна. Введем две константы: "порог согласия" p (величина, немногим меньшая 1), и "порог несогласия" q (величина, немногим большая нуля). И, наконец, определим, что будем считать альтернативу a предпочтительнее альтернативы b (a>b) тогда и только тогда, когда справедливо: c (a>b) p и одновременно d (a>b) q. Содержательно это означает, что мы принимаем альтернативу a предпочтительнее альтернативы b в том и только в том случае, когда удельная сумма весов критериев, для которых (a>b) достаточно велика, а максимальное единичное превосходство второй альтернативы над первой достаточно мало. Пороги согласия и несогласия выбираются из содержательных соображений. В дальнейшем, при детальном анализе метода "Электра", у него выявились некоторые недостатки. Группа Руа совершенствовала метод. Появились методы "Электра II" и "Электра III". Групповые решения. До сих пор можно было считать, что у нас есть один эксперт. А что делать, если их несколько? Пусть, для примера, мы готовим одно решение и хотим учесть мнение нескольких экспертов. Рассмотрим такой случай применительно к модели критериального выбора. При групповой экспертизе наиболее типична следующая ситуация: у экспертов разные мнения по поводу набора критериев, у экспертов разные мнения о сравнительной значимости критериев, эксперты дают разные оценки альтернатив по критериям. Можно сказать, что методы группового выбора позволяют структурировать множество альтернатив в ситуации "разноголосицы" суждений экспертов. Для начала вспомним, как преодолевается разница мнений в обычной практике. На ум тут же приходит способ решения спорных вопросов методами голосования: консенсус (полное согласие), простое большинство, квалифицированное большинство. При всей хрестоматийности и широкой распространенности, эти методы имеют по меньшей мере один существенный недостаток. Они отбрасывают мнение меньшинства (кроме консенсуса, где изначальное меньшинство попросту сводится на нет путем убеждения). В методах поддержки принятия ре58 шений пытаются, по возможности, обрабатывать экспертные суждения без отбрасывания. Действительно, ведь мы имеем дело с экспертами, т.е. со специалистами высокой квалификации. Как же можно просто отбрасывать их мнения? Иногда к отбрасыванию все же прибегают, но – в редких случаях, например, в методах, так называемой, "борьбы с манипулированием", т.е. сознательным искажением экспертами своих оценок с целью лоббирования тех или иных альтернатив. Любители фигурного катания знают, что при выставлении оценки участнику соревнований крайние оценки судей отбрасываются, а оставшиеся усредняются. Это пример одного из простых методов борьбы с манипулированием. Какие же методы применяются для решения проблем, обозначенных в начале этого раздела? При формировании набора критериев можно попросить каждого эксперта дать свое множество критериев, а затем объединить все множества в одно. Если есть жесткое ограничение по количеству критериев, то тут без отбрасывания не обойтись. Проще всего упорядочить критерии по частоте упоминания и "подвести черту" в том месте, которое удовлетворяет заданному ограничению. Итак, набор критериев сформирован. Как получить их сравнительную значимость? Здесь хорош, например, метод построения компромиссной ранжировки. Каждый эксперт дает свою ранжировку критериев по важности. На основе индивидуальных ранжировок нужно построить обобщенную. Это можно сделать разными методами. Наиболее корректным (но и наиболее трудоемким) считается метод "медианы Кемени" (по имени автора – американского математика и экономиста, лауреата Нобелевской премии). Для нахождения медианы, прежде всего, нужно задать способ определения расстояния между ранжировками, как говорят математики "определить метрику в пространстве ранжировок". После этого, нужно найти (построить) такую ранжировку, суммарное расстояние от которой до всех заданных экспертных ранжировок было бы минимально. Искомая ранжировка и будет медианой Кемени. Заметим, что тем самым мы получаем обобщенное мнение экспертов не отбрасывая ни одного мнения, поскольку при построении медианы существенно учитываются все индивидуальные ранжировки. Теперь займемся оценками альтернатив по критериям. Эта часть текста, к сожалению, содержит математические категории и читателямгуманитариям рекомендуется ее пропустить. Итак, первое, что приходит в голову – нужно взять среднее арифметическое оценок экспертов. К сожалению, все не так просто. Прежде всего, нужно задуматься о согласованности экспертных суждений. Действительно, если эксперты оценивают реальный объект, то их оценки не должны сильно расходиться. А ес59 ли они все-таки существенно расходятся? Тогда, прежде всего, нельзя использовать среднее арифметическое, поскольку тогда мы получаем так называемую "среднюю температуру по больнице". Действительно, если сложить температуру всех высокотемпературных больных и температуру тел в морге, а потом поделить на общее количество замеров, то можно получить 36,6°. Свидетельствует ли это о том, что "в среднем" все находящиеся в больнице здоровы? Тем не менее, абсурдность усреднения оценок без предварительного анализа согласованности мало кто понимает. А как считать согласованность? Если распределение оценок близко к Гауссовому, можно использовать стандартное отклонение. Если нет, нужно использовать непараметрические методы расчета согласованности. А если согласованность все же оказалась низкой? В этом случае нужно пытаться выяснить причину расхождений и по возможности попытаться устранить ее. Часто причиной может быть отсутствие важной информации у некоторых экспертов. Иногда ситуация слишком неопределенна, "размыта". В некоторых случаях эксперты разбиваются на две устойчивые группы (ситуация разных научных школ). В этом случае также нельзя строить обобщенные оценки. Группы нужно уметь выявлять и обрабатывать отдельно. Таким образом, способ обработки оценок в каждом конкретном случае должен подбираться индивидуально и тщательно обосновываться. 3.3. Принятие решений с анализом данных в трех измерениях 3D технологии анализа исходных материалов и последствий принимаемых решений естественны для человека – эксперта. Представим систему анализа структур управления. Пусть реорганизация описана как системный объект, который в результате планируемых воздействий на него переходит в новое состояние и оценивается новыми смысловыми или качественными показателями, выбранными в качестве показателей состояния организации. Осмысленное воздействие на организацию с целью перевода (либо поддержания ее в заданном состоянии) требует процесса управления, т.е. планирования хода и последствий воздействия. Наиболее значимыми параметрами процесса управления при этом являются: 60 Планируемый ход и последствия воздействия на организацию. Состояние ресурсов, формирующих организацию. Оценка преобразования системы от исходного состояния в желаемое (либо сохранение равновесного состояния). Все три вышеперечисленных параметра определяют условия создания организации, раскрывают ее организационноштатную структуру с тремя ярко выраженными функциональными группами, а именно: планирующей (административной), обеспечивающей, производственной. Теперь очевидно, что процесс управления – это планируемое воздействие на все структурные подразделения организации с целью перевода ее в новое состояние или поддержания ее в установленном режиме. Указанное определение позволяет интерпретировать управление в виде трехмерной модели, у которой по одной оси откладывается последовательность воздействия на систему во времени, по другой – последовательность воздействия на ресурсы, формирующие систему, и по третьей оси – последовательность преобразования системы в ходе управляющего воздействия (рис.1.). Управление объектом в трехмерной модели выглядит следующим образом (см. рис.2.): 61 Любая структура легко раскладывается на функциональные группы по направлениям воздействия (см. рис.3): 62 Из выше предложенного ясно, что процесс управления объектом – есть комплекс управляющих воздействий по всем осям и не может осуществляться по отдельному направлению. Рассматривая процессы управленческой деятельности в организации по методу трехмерной модели, хорошо видны три основных направления управленческой деятельности: планирование и принятие решения; управление ресурсами; управление производственно-технологическими процессами. Сам процесс формирования организационно-штатной структуры и технического управления должен строго отвечать следующим требованиям: Стратегическое управление должно осуществляться путем формирования рациональных организационных структур, рассчитанных на жизненный цикл организации. Оперативное управление должно осуществляться путем формирования рациональных функциональных структур, рассчитанных на жизненный цикл продукта. Расширение организационной формы организации не должно выходить за пределы ее внутренних возможностей. Появление новых задач или модификаций должно соответствовать внутренней логике данного организационного образования. Заданные критерии качества должны выполняться при соответствующем уровне автоматизации. Рис. 3.23. 63 Основываясь на принципах создания функциональных групп по направлениям воздействия, следующим очень важным шагом становится процесс определения путей воздействия команд и внутренние взаимодействия на структуры и между структурами, т.е. нужно определить пути информационных потоков. Логическая связь между структурными подразделениями определяется путем наложения матрицы на взаимосвязанные плоскости трехмерной модели: Таким образом, ориентируясь на логические связи между подразделениями, создается возможность выбора топологии сети всей организации в целом. Для решения каждой задачи в организации исполняется определенный процесс согласно алгоритму, который заложен в принципах руководства этой организации. Подводя итоги вышеперечисленному, следует отметить: Данная методология позволяет выделить структурные подразделения по функциональным признакам. Она показывает, что процесс управления охватывает все структурные подразделения независимо от специфики их деятельности. Методология определяет оптимальные пути информационных потоков, ориентируя на выбор топологии сети. Анализ структуры управления на базе трехмерной модели дает возможность оптимального выбора новейших технических средств и разработки информационных технологий с учетом реальных условий деятельности и перспектив развития организации. 3.4. Структуры систем поддержки принятия решений На сегодняшний день можно выделить четыре наиболее популярных типа архитектур систем поддержки принятия решений: 1. Функциональная СППР. 2. Независимые витрины данных. 3. Двухуровневое хранилище данных. 4. Трехуровневое хранилище данных. Функциональная СППР Функциональная СППР (Рисунок 1) является наиболее простой с архитектурной точки зрения. Такие системы часто встречаются на прак- 64 тике, в особенности в организациях с невысоким уровнем аналитической культуры и недостаточно развитой информационной инфраструктурой. Рисунок 1. Функциональная СППР Характерной чертой функциональной СППР является то, что анализ осуществляется с использованием данных из оперативных систем. Преимущества: Быстрое внедрение за счет отсутствия этапа перегрузки данных в специализированную систему Минимальные затраты за счет использования одной платформы Недостатки: Единственный источник данных, потенциально сужающий круг вопросов, на которые может ответить система Оперативные системы характеризуются очень низким качеством данных с точки зрения их роли в поддержке принятия стратегических решений. В силу отсутствия этапа очистки данных, данные функциональной СППР, как правило, обладают невысоким качеством Большая нагрузка на оперативную систему. Сложные запросы могут привести к остановке работы оперативной системы, что весьма нежелательно СППР с использованием независимых витрин данных Независимые витрины данных (Рисунок 2) часто появляются в организации исторически и встречаются в крупных организациях с боль- 65 шим количеством независимых подразделений, зачастую имеющих свои собственные отделы информационных технологий. Рисунок 2. Независимые данные Преимущества: Витрины данных можно внедрять достаточно быстро Витрины проектируются для ответов на конкретный ряд вопросов Данные в витрине оптимизированы для использования определенными группами пользователей, что облегчает процедуры их наполнения, а также способствует повышению производительности Недостатки: Данные хранятся многократно в различных витринах данных. Это приводит к дублированию данных и, как следствие, к увеличению расходов на хранение и потенциальным проблемам, связанным с необходимостью поддержания непротиворечивости данных Потенциально очень сложный процесс наполнения витрин данных при большом количестве источников данных Данные не консолидируются на уровне предприятия, таким образом, отсутствует единая картина бизнеса СППР на основе двухуровневого хранилища данных Двухуровневое хранилище данных (Рисунок 3) строится централизованно для предоставления информации в рамках компании. Для поддержки такой архитектуры необходима выделенная команда профессионалов в области хранилищ данных. 66 Рисунок 3. Двухуровневое хранилище данных Это означает, что вся организация должна согласовать все определения и процессы преобразования данных. Преимущества: Данные хранятся в единственном экземпляре Минимальные затраты на хранение данных Отсутствуют проблемы, связанные с синхронизацией нескольких копий данных Данные консолидируются на уровне предприятия, что позволяет иметь единую картину бизнеса Недостатки: Данные не структурируются для поддержки потребностей отдельных пользователей или групп пользователей Возможны проблемы с производительностью системы Возможны трудности с разграничением прав пользователей на доступ к данным 67 СППР на основе трёхуровневого хранилища данных Рисунок 4. Трёхуровневое хранилище данных Хранилище данных представляет собой единый централизованный источник корпоративной информации. Витрины данных представляют подмножества данных из хранилища, организованные для решения задач отдельных подразделений компании. Конечные пользователи имеют возможность доступа к детальным данным хранилища, в случае если данных в витрине недостаточно, а также для получения более полной картины состояния бизнеса. Преимущества: Создание и наполнение витрин данных упрощено, поскольку наполнение происходит из единого стандартизованного надежного источника очищенных нормализованных данных Витрины данных синхронизированы и совместимы с корпоративным представлением. Имеется корпоративная модель данных. Существует возможность сравнительно лёгкого расширения хранилища и добавления новых витрин данных Гарантированная производительность Недостатки: Существует избыточность данных, ведущая к росту требований на хранение данных 68 Требуется согласованность с принятой архитектурой многих областей с потенциально различными требованиями (например, скорость внедрения иногда конкурирует с требованиями следовать архитектурному подходу) Мы рассмотрели основные варианты архитектур систем поддержки принятия решений. Выбор конкретного варианта зависит от условий, в которые поставлена проектная группа. Нужен ли быстрый возврат от инвестиций, или можно потратить больше времени и построить надежную инфраструктуру? Является ли проектная группа профессиональной или состоит из новичков? Существует ли формализованная методология или механизмы работы еще не отлажены? Ответы на эти и ряд других вопросов могут повлиять на ваш выбор. Подробное описание преимуществ и недостатков каждого варианта архитектуры можно найти в литературе. Характерно для архитектуры систем поддержки принятия решений наличие больших объемов данных, — это гигантские задачи, которые требуют преодоления серьезных технических трудностей, огромных затрат и адекватных организационных решений. Системы оперативной обработки транзакций (online transaction processing — OLTP) позволяют накапливать большие объемы данных. Приложения OLTP, как правило, автоматизируют структурированные, повторяющиеся задачи обработки данных, такие как ввод заказов и банковские транзакции. Эти подробные, актуальные данные из различных независимых точек ввода объединяются в одном месте, и затем аналитики смогут извлечь из них значимую информацию. Агрегированные данные применяются для принятия каждодневных бизнес-решений — от управления складом до координации рекламных рассылок. Компоненты систем поддержки принятия решений Система поддержки принятия решений — сложная структура с многочисленными компонентами. Рассмотрим гипотетическую компанию Footwear Sellers Company, которая производит обувь и предлагает ее покупателям по каналам прямых продаж и через реселлеров. Руководителям отдела маркетинга FSC необходимо извлечь следующую информацию из агрегированных бизнес-данных: пять штатов, сообщивших о самых больших за последний год темпах роста объема продаж в категории продуктов для молодежи; общий объем продаж обуви в Нью-Йорке за последний месяц по различным видам продуктов; 50 городов с самым большим количеством индивидуальных клиентов; 69 один миллион клиентов, которые, скорее всего, приобретут новую модель обуви Walk-on-Air. Прежде чем создавать систему, которая предоставит такую информацию, в FSC должны рассмотреть и решить три основных вопроса: какие данные накапливать и как на концептуальном уровне моделировать данные и управлять их хранением; как анализировать данные; как эффективно загрузить данные из нескольких независимых источников. Как показано на рис. 1, эти вопросы можно соотнести с тремя основными компонентами системы поддержки принятия решений: сервер хранилища данных, инструментарий оперативной аналитической обработки и добычи данных и инструменты для пополнения хранилища данных. Рис. 1. Архитектура систем поддержки принятия решений, которая состоит из трех основных компонентов: серверов хранилища данных, инструментария анализа и добычи данных и базовых средств хранилища данных Хранилища данных (data warehouse) содержат информацию, собранную из нескольких оперативных баз данных. Хранилища, как правило, на порядок больше оперативных баз, зачастую имея объем от сотен гигабайт до нескольких терабайт. Как правило, хранилище данных поддерживается независимо от оперативных баз данных организации, по70 скольку требования к функциональности и производительности аналитических приложений отличаются от требований к транзакционным системам. Хранилища данных создаются специально для приложений поддержки принятия решений и предоставляют накопленные за определенное время, сводные и консолидированные данные, которые более приемлемы для анализа, чем детальные индивидуальные записи. Рабочая нагрузка состоит из нестандартных, сложных запросов, которые обращаются к миллионам записей и выполняют огромное количество операций сканирования, соединения и агрегирования. Время ответа на запрос в данном случае важнее, чем пропускная способность. Поскольку конструирование хранилища данных — сложный процесс, который может занять несколько лет, некоторые организации вместо этого строят витрины данных (data mart), содержащие информацию для конкретных подразделений. Например, маркетинговая витрина данных может содержать только информацию о клиентах, продуктах и продажах и не включать в себя планы поставок. Несколько витрин данных для подразделений могут сосуществовать с основным хранилищем данных, давая частичное представление о содержании хранилища. Витрины данных строятся значительно быстрее, чем хранилище, но впоследствии могут возникнуть серьезные проблемы с интеграцией, если первоначальное планирование проводилось без учета полной бизнес-модели. Инструментарий оперативной аналитической обработки и добычи данных позволяет проводить развернутый анализ информации. Базовые инструменты — средства извлечения, преобразования и загрузки — служат для пополнения хранилища из внешних источников данных. Большинство хранилищ используют технологию реляционных баз данных, поскольку она предлагает надежные, проверенные и эффективные средства хранения и управления большими объемами данных. Важнейший вопрос, связанный с конструированием хранилищ данных, — архитектура базы данных, как логическая, так и физическая. Создание логической схемы корпоративного хранилища данных требует всеобъемлющего моделирования бизнеса. В архитектуре, основанной на схеме «звезда», база данных состоит из таблицы фактов, которая описывает все транзакции, и таблицы измерений для каждой из сущностей. В примере с FSC каждая транзакция охватывает несколько сущностей — клиент, продавец, продукт, заказ, дата сделки и город, где сделка состоялась. Каждая сделка также имеет параметры — в нашем случае число проданных экземпляров продукта и общая сумма, которую заплатил покупатель. 71 Каждый кортеж в таблице фактов состоит из указателя на каждый объект в транзакции и численные параметры, связанные с транзакцией. Каждая таблица измерений состоит из столбцов, которые соответствуют атрибутам объекта. Вычисление соединения между таблицей фактов и набором таблиц измерений — более эффективная операция, чем вычисление соединения произвольных реляционных таблиц. Логическая архитектура базы данных. Некоторые сущности, однако, связаны в иерархии, которые схема «звезда» корректно не поддерживает. Иерархия — это многоуровневая группировка, каждый уровень которой состоит из непересекающихся групп значений уровня, находящегося непосредственно ниже данного. Так, все продукты могут группироваться в непересекающееся множество категорий, которые, в свою очередь, сгруппированы в непересекающееся множество семейств. Рис. 2. Схема «снежинка» для гипотетической компании Footwear Sellers Company. Набор атрибутов описывает каждое измерение и связывается через иерархию отношений. Схема «снежинка» — усовершенствованная схема «звезда», в которой иерархия измерений представляется точным образом благодаря нормализации таблиц измерений. В «звезде», приведенной на рис. 2, набор атрибутов описывает каждое измерение и может быть связан иерархией отношений. Например, измерение продукта FSC состоит из пяти атрибутов: имя продукта (Running Shoe 2000), категория (спортивная), семейство продуктов (обувь), цена (80 долл.) и маржа (80%). Физическая архитектура базы данных. Системы баз данных используют избыточные структуры, такие как индексы и материализованные представления для эффективной обработки сложных запросов. Определение самого подходящего набора индексов и представлений — это сложная задача формирования физической архитектуры. Хотя поиск 72 в индексе и сканирование индекса могут быть эффективны для запросов, связанных с выбором данных, запросы, предполагающие интенсивную обработку данных, могут потребовать последовательного сканирования всей реляционной таблицы или ее вертикальных фрагментов. Увеличение эффективности сканирования таблиц и использование распараллеливания для уменьшения времени ответа на запрос — важные моменты, которые следует учитывать при проектировании. Индексные структуры. Методы обработки запросов, которые используют операции пересечения и объединения индексов, полезны при ответе на запросы с множественными предикатами. Пересечение индексов используется при выборке по нескольким условиям и может значительно снизить необходимость (или вообще устранить ее) в доступе к базовым таблицам, если все столбцы проекции можно получить посредством сканирования индексов. Благодаря особой природе «звезды» соединение индексов детальных данных особенно удобно для систем поддержки принятия решений. Хотя индексы традиционно устанавливают соответствие значения в столбце списку строк с этим значением, соединенный индекс поддерживает связь между внешним ключом и соответствующими ему первичными ключами. В контексте схемы «звезда» соединенный индекс может связать значения одного или нескольких столбцов таблицы измерений с соответствующими строками таблицы фактов. Схема на рис. 2, к примеру, может поддерживать соединенный индекс по атрибуту «Город», который каждому городу ставит в соответствие список идентификаторов тех кортежей в таблице фактов, которые описывают продажи в данном городе. Важно подчеркнуть, что соединенный индекс предварительно вычисляет бинарное соединение. Соединенные индексы по нескольким ключам могут представлять предварительно вычисленные n–кратные соединения. Например, многомерный соединенный индекс, созданный на основе базы данных продаж, может соединять Город.Название Города и Продукт.Название в таблице фактов. Элемент индекса для (Сиэтл, Running Shoe) указывает на идентификаторы записей в кортежах таблицы «Продажи» с такой комбинацией. Материализованные представления Многие хранилища данных используют запросы, которые требуют сводных данных и потому работают с агрегатами. Материализация сводных данных (т.е. их вычисление и сохранение) может ускорить обработку многих распространенных запросов. В примере с FSC два представления — общий объем продаж, сгруппированный по семейству продуктов 73 и городу, и общее число клиентов, сгруппированное по городам, — могут эффективно применяться для ответов на три первых из четырех «главных» запросов отдела маркетинга (см. выше). Задачи, которые возникают при использовании материализованных представлений, аналогичны тем, которые возникают при работе с индексами: определение представлений, которые следует материализовывать; использование материализованных представлений для ответа на запросы; обновление материализованных представлений при загрузке новых данных. Поскольку использование этого механизма требует исключительно большого дискового пространства, в настоящее время применяются решения, которые поддерживают только ограниченный класс структурно простых материализованных представлений. Оперативные аналитические приложения В типичном оперативном аналитическом приложении запрос агрегирует численные параметры более высоких уровней в иерархию измерений. Пример — первый маркетинговый запрос FSC, для выполнения которого необходим набор агрегированных параметров — пять штатов, сообщивших о самом большом увеличении объема продаж в категории молодежных продуктов за последний год. «Штат» и «Год» — обобщения сущностей «Город» и «Дата». Применительно к хранилищу данных FSC типичный сеанс OLAP, необходимый для определения региональных объемов продаж спортивной обуви в прошлом квартале, может выглядеть следующим образом. Аналитик выдает запрос select sum(sales) group by country («суммарный объем продаж для каждой страны»), чтобы просмотреть распределение объемов продаж спортивной обуви в последнем квартале по всем странам. После выбора страны с самым высоким или самым низким объемом продаж относительно размеров рынка, аналитик выдает второй запрос на вычисление сводного объема продаж в каждом штате данной страны, чтобы понять причины таких отклонений. Аналитик движется вниз по иерархии, связанной с измерением «Город». Такой анализ сверху вниз по иерархии от самого обобщенного до самого детального уровня называется уточненным (drill-down). При операции обобщения (roll-up) аналитик поднимается на один уровень — скажем, от уровня штата до уровня страны — в иерархии измерений. 74 Ключевые вопросы, касающиеся OLAP, связаны с концептуальной моделью данных и серверными архитектурами. Концептуальная модель данных.Многомерная модель, изображенная на рис. 3, использует численные параметры как объекты своего анализа. Каждый численный параметр в концептуальной модели данных зависит от измерений, которые описывают сущности в транзакции. Например, измерения, связанные с продажами в примере FSC, — это клиент, продавец, город, название продукта и дата совершения сделки. Все вместе измерения уникальным образом определяют параметр, поэтому многомерная модель данных трактует параметр как значение в многомерном пространстве. Рис. 3. Пример многомерной базы данных В многомерном представлении данных запросы drill-down и roll-up — это логические операции на кубе. Еще одна популярная операция — сравнить два параметра, которые агрегированы по одним и тем же измерениям, такими как продажи и бюджет. OLAP-анализ может включать в себя более сложные статистические вычисления, нежели простые агрегаты, такие как сумма или среднее. Примером может служить такая функция, как изменение процента 75 агрегата в определенный период по сравнению с различными периодами времени. Подобные дополнительные функции поддерживают многие коммерческие средства OLAP. Измерение «Время» имеет особое значение для таких процессов поддержки принятия решений, как анализ тенденций. К примеру, аналитикам FSC может понадобиться проследить покупательскую активность в отношении спортивной обуви перед крупнейшими национальными легкоатлетическими соревнованиями или после них. Развернутый анализ тенденций возможен, если база данных поддерживает встроенную информацию о календаре и ряд других характеристик «Времени». OLAP Council определил перечень операций для многомерных кубов. Архитектуры OLAP-серверов. Традиционные реляционные серверы не обеспечивают эффективное выполнение сложных OLAP-запросов и поддержку многомерных представлений данных. Но, тем не менее, три типа реляционных серверов баз данных — реляционной, многомерной и гибридной оперативной аналитической обработки — позволяют выполнять OLAP-операции в хранилищах данных, построенных с использованием систем управления реляционными базами данных. Серверы ROLAP. Размещаются между основным реляционным сервером, где находится хранилище данных и клиентским инструментарием переднего плана. Серверы ROLAP поддерживают многомерные OLAP-запросы и, как правило, оптимизированы для конкретных реляционных серверов. Они указывают, какие представления должны быть материализованы, возможные запросы пользователей в терминах соответствующих материализованных представлений, и генерируют сложные SQL-серверы для основного сервера. Они также предусматривают дополнительные службы, такие как планирование запросов и распределение ресурсов. Серверы ROLAP наследуют возможности масштабирования и работы с транзакциями реляционных систем, однако существенные различия между запросами в стиле OLAP и SQL могут стать причиной низкой производительности. Нехватка производительности становится менее острой, благодаря ориентированным на задачи OLAP расширениям SQL, реализованным в серверах реляционных баз данных наподобие Oracle, IBM DB2 и Microsoft SQL Server. Такие функции, как median, mode, rank, percentile дополняют агрегатные функции. К другим дополнительным возможностям относятся агрегатные вычисления на перемещающихся окнах, текущие сводные значения и точки прерывания для улучшенной поддержки формирования отчетов. 76 Многомерные электронные таблицы требуют группировки по различным наборам атрибутов. Для того чтобы удовлетворить эти требования Джим Грей и его коллеги предлагают расширить SQL двумя операторами — roll-up и cube. Свертка списка атрибутов, включающего продукт, год и город, помогает находить ответы на вопросы, в которых фигурируют: группировка по продуктам, годам и городам; группировка по продуктам и годам; группировка по продуктам. Пусть дан список из k столбцов, оператор cube предлагает группировку по каждой из 2**k комбинаций столбцов. Многочисленные операции «group by» могут быть выполнены эффективно за счет распознавания общих частей вычислений. Разумно подобранные предварительные вычисления могут увеличить производительность серверов OLAP. MOLAP. Серверная архитектура, которая не опирается на функциональность основных реляционных систем, но напрямую поддерживает многомерные представления данных с помощью многомерного механизма хранения. MOLAP позволяет реализовывать многомерные запросы на уровне хранения путем установки прямого соответствия. Основное преимущество MOLAP заключается в превосходных свойствах индексации; ее недостаток — низкий коэффициент использования дискового пространства, особенно в случае разреженных данных. Многие серверы MOLAP при работе с разреженными множествами данных используют двухуровневую организацию памяти и сжатие. При двухуровневой организации пользователь либо непосредственно, либо с помощью специальных инструментов проектирования, идентифицирует набор подмассивов, которые, скорее всего, будут плотными и представляет их в виде массива. Индексировать эти массивы меньшего размера можно с помощью традиционных индексных структур. Многие из методик, разработанных для статистических баз данных, подходят и для MOLAP. Серверы MOLAP обладают хорошей производительностью и функциональностью, но не в состоянии должным образом масштабироваться в случае очень больших баз данных. HOLAP. Гибридная архитектура, которая объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные более менее плотные, серверы ROLAP лучше в тех случаях, когда данные довольно разрежены. Серверы HOLAP применяют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP — для плотных областей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к соответствующим фрагментам 77 данных, комбинируют результаты, а затем предоставляют результат пользователю. Материализация выборочных представлений в HOLAP, выборочное построение индексов, а также планирование запросов и ресурсов аналогично тому, как это реализовано в серверах MOLAP и ROLAP. Добыча данных. Предположим, что FSC хочет начать кампанию по рассылке каталогов, на которую отводится бюджет не более 1 млн. долл. Учитывая это ограничение, аналитики отдела маркетинга хотят определить круг клиентов, которые, вероятнее всего, отреагируют на эту акцию и начнут делать покупки по каталогу. Инструментарий добычи данных предлагает необходимые для этого функции прогнозирования и анализа за счет определения шаблонов и характеристического поведения в пределах набора данных. Обнаружение знаний (knowledge discovery) — процесс определения и достижения цели посредством итеративной добычи данных — как правило, состоит из трех этапов: подготовка данных; построение модели и ее оценка; применение модели. Подготовка данных. На этапе подготовки данных аналитик готовит набор данных, содержащий достаточно информации, для того чтобы создать точные модели на последующих этапах. В случае с FSC, точная модель должна помочь прогнозировать, с какой вероятностью клиент купит продукты, рекламируемые в новом каталоге. Поскольку эти прогнозы основаны на факторах, потенциально влияющих на покупки клиентов, множество данных в модели будет включать в себя всех клиентов, отреагировавших на рассылаемые по почте каталоги за последние три года, их демографическую информацию, десять самых дорогих продуктов, которые приобрел каждый клиент, а также информацию о каталоге, послужившем стимулом для этих покупок. Подготовка данных может включать в себя сложные запросы с объемными результатами. К примеру, подготовка множества данных FSC предусматривает соединение таблицы клиентов и таблицы продаж, а также выявление 10 самых дорогих покупок для каждого клиента. Все эти вопросы, касающиеся эффективной обработки запросов для поддержки принятия решения, одинаково актуальны в контексте добычи данных. Фактически, платформы добычи данных используют реляционные серверы или серверы OLAP для решения своих задач по подготовке данных. 78 Как правило, добыча данных включает в себя итеративно создаваемые модели на основе подготовленного множества данных, а затем применение одной или нескольких моделей. Поскольку создание моделей на больших множествах данных может оказаться весьма дорогостоящим, аналитики часто сначала работают с несколькими выборками множества данных. Платформы добычи данных, таким образом, должны поддерживать вычисления на случайно выбранных экземплярах данных в сложных запросах. Построение и оценка моделей. Только после того, как принято решение о том, какую модель применять, аналитик создает модель на всем подготовленном множестве данных. Цель этого этапа создания модели — указать шаблоны, которые определяют целевой атрибут (target attribute). Пример целевого атрибута во множестве данных FSC: приобрел ли клиент хотя бы один продукт из предыдущего каталога. Предсказать как точно указанные, так и скрытые атрибуты помогают несколько классов моделей добычи данных. На выбор модели влияют два важных фактора: точность модели и эффективность алгоритма для создания модели на больших множествах данных. С точки зрения статистики, точность большинства моделей увеличивается с ростом объема используемых данных, поэтому алгоритмы, на основе которых строятся модели добычи данных, должны быть эффективными и приемлемым образом масштабироваться при росте наборов обрабатываемых данных. Типы моделей. Классификационные модели позволяют делать прогнозы. Для данного нового кортежа классификационные модели прогнозируют, принадлежит ли кортеж одному из набора целевых классов. В примере с каталогом FSC классификационная модель, основываясь на накопленных к текущему моменту данных, определяет, приобретет ли клиент товар из каталога. Деревья решений и простые байесовы модели — два самых популярных типа классификационных моделей. Регрессионные деревья и логистическая регрессия — два самых распространенных типа регрессионных моделей, которые прогнозируют численные атрибуты, такие как зарплата или возраст клиента. В некоторых приложениях аналитики точно не знают набора целевых классов и полагают их скрытыми. Модели кластеризации, подобные K-Means и Birch, используются для определения соответствующего множества классов и классификации нового кортежа с отнесением его к одному из этих скрытых классов. Модели на базе правил, в частности модель правил ассоциаций, используются, чтобы выяснить, является ли покупка конкретного набора 79 предметов обуви, с определенной степенью уверенности, индикатором приобретения и другого продукта. Дополнительные факторы при оценке моделей. Не существует одного класса моделей или алгоритма, которые позволили бы в любом случае создать идеальную модель для всех приложений. В силу этого платформы добычи данных должны поддерживать несколько типов построения моделей и предоставлять дополнительные средства для обеспечения расширяемости моделей и взаимодействия между ними. В некоторых случаях аналитикам может потребоваться уникальная корреляционная модель, которую не поддерживает платформа добычи данных. Для этого платформы добычи данных должны быть расширяемыми. Многие коммерческие продукты создают модели для конкретных областей применения, но реальная база данных, на которой должна применяться такая модель, возможно, будет работать с другим сервером баз данных. Платформы добычи данных и серверы баз данных, таким образом, должны поддерживать взаимозаменяемость моделей. Недавно рабочая группа Data Mining Group (www.dmg.org) предложила воспользоваться Predictive Model Markup Language, стандартом на базе XML, для обмена рядом популярных классов моделей прогнозирования. Идея состоит в том, чтобы любая база данных, поддерживающая этот язык, могла импортировать и применять любую описанную на нем модель. Применение модели. На этом этапе аналитики применяют выбранную модель к наборам данных, чтобы прогнозировать целевой атрибут с неизвестным значением. Для каждого текущего набора клиентов в примере FSC, прогноз касается того, будут ли они приобретать продукты из нового каталога. Применение модели на входном наборе данных может породить другой набор данных. В примере FSC этап применения модели указывает подмножество клиентов, которым будет разослан каталог. Когда входной набор данных очень большой, стратегия применения модели должна быть достаточно эффективной. В этом случае может потребоваться использование индексов на входной таблице для фильтрации кортежей, которые не будут входить в развертываемый результат, но это требует более тесной интеграции между системами управления базами данных и применением модели. Дополнительные вопросы OLAP и добычи данных. К другим важным вопросам в контексте OLAP и технологии добычи данных относятся пакетные приложения, платформы и их API-интерфейсы, влияние XML, 80 приближенная обработка запросов, интеграция OLAP и добычи данных, а также добыча данных в Web. Пакетные приложения. При разработке полного решения добычи данных аналитик должен выполнить серию сложных запросов и создать, настроить и применить сложные модели. Компенсировать разрыв между требованиями реального решения для хорошо понятных областей и поддержкой данной платформы добычи данных или OLAP, призваны несколько коммерческих инструментальных средств. Пакетные приложения и средства формирования отчетов могут использовать знания о конкретной вертикальной отрасли для упрощения задачи анализа путем учета специфических для отрасли абстракций более высокого уровня. Data Warehousing Information Center (www.dwinfocenter.org) и KDnuggets (www.kdnuggets.com) предлагают обширный список решений, ориентированных на конкретные отрасли. Компании могут приобрести такие пакеты, а не разрабатывать свое собственное аналитическое решение, но пакеты, ориентированные на конкретную область применения, меняющиеся по мере развития бизнеса, ограничены по набору своих функций и потому не могут удовлетворить все потенциальные требования к анализу. API-интерфейсы и влияние XML. Некоторые платформы OLAP и добычи данных предлагают API-интерфейсы, которые позволяют аналитикам создавать собственные решения. Однако поставщики решений, как правило, вынуждены писать специальные программы для различных платформ, чтобы предоставить не зависящее от платформ решение. Новые ориентированные на XML службы на базе Web обеспечивают общий интерфейс для механизмов OLAP. Компании Microsoft и Hyperion опубликовали XML for Analysis API-интерфейс, основанный на протоколе SOAP, предназначенный специально для стандартизации взаимодействий при доступе к данным между клиентским приложением и источником данных, работающими через Web. На основе этой XMLспецификации поставщики решений смогут писать программы с помощью одного API-интерфейса, а не использовать множество интерфейсов, ориентированных на решения разных производителей. Приближенная обработка запросов. Обработка сложных агрегатных запросов, как правило, требует обращения к огромным объемам данных. Например, вычисление среднего объема продаж FSC в различных городах требует сканирования всех данных в хранилище. Во многих случаях, однако, очень быстро и достаточно точную оценку позволяет получить приближенная обработка запросов. Идея состоит в том, чтобы на основе базовых данных максимально точно сформировать сводные 81 данные, а затем получать ответы на агрегатные запросы с помощью этих сводных, а не полных данных. Дополнительную информацию по этому вопросу можно найти в описании проектов Approximate Query Processing Интеграция OLAP и добычи данных. OLAP-инструментарий помогает аналитикам выявить актуальные порции данных, а модели добычи данных обогащают эту функциональность. Например, если темпы роста объема продаж FSC не соответствуют прогнозируемым, специалисты по маркетингу хотели бы знать аномальные регионы и категории продуктов, для которых не выполняются заданные показатели. Пробный анализ, который выявляет аномалии, использует методику, позволяющую отметить агрегатный параметр на более высоком уровне в иерархии измерений с аномальным результатом. Аномальный результат определяет общее отклонение реальных агрегатных величин от соответствующих прогнозируемых значений над всеми своими потомками [8, 9]. Для вычисления прогнозируемых значений аналитики могут использовать такие средства добычи данных, как регрессионные модели. Добыча данных в Web. Большинство крупных компаний поддерживают Web-сайты, где клиенты могут просмотреть информацию, запросить данные о товарах и приобрести их. Поскольку каждый клиент имеет личный контакт с компанией через Web-сайт, компании могут персонифицировать работу с ним. Например, сайт может рекомендовать клиенту продукты, услуги или статьи, относящиеся к области его интересов. Одной из первых такие персонифицированные системы начала развертывать компания Amazon.com. При создании таких Web-систем возникают два важных вопроса: сбор данных и методы персонификации. Анализ данных регистрации, автоматически накапливаемых данных о поведении клиента на Webсайте, позволяет выявить привычки предпочтения клиентов. Анализ такого рода позволит FSC предложить специальные спортивные носки клиентам, покупающим обувь. Модели добычи данных могут использовать подобную информацию о поведении клиента, особенно, когда она сочетается с данными, которые клиенты вводят при регистрации или оплате, чтобы персонифицировать посещаемые клиентами Webстраницы и снабдить их соответствующей рекламой. Со временем, по мере роста числа пользователей, компания может рекомендовать дополнительные продукты, учитывая схожесть предпочтений клиентов. Инструментарий хранилищ данных. Создание хранилища данных из независимых источников данных — многоэтапный процесс, который предусматривает извлечение данных из каждого источника, преобразование их в соответствии со схемой хранилища данных, очистку, а затем 82 загрузку в хранилище. Data Warehousing Information Center опубликовал обширный список инструментальных средств ETL (extract, transform, load — «извлечение, преобразование, загрузка»), выполняющих эту последовательность операций. Извлечение и преобразование. Цель этапа извлечения данных — перенести данные из разнородных источников в базу данных, где их можно модифицировать и добавить в хранилище. Цель последующего этапа преобразования данных — устранить несоответствия в схеме и соглашениях о значениях атрибутов. Набор правил и скриптов, как правило, выполняет преобразование данных из исходной схемы в итоговую схему. К примеру, дистрибьютор может разделить имя каждого клиента на три части: имя, отчество (или инициалы) и фамилия. Чтобы добавить предоставленную дистрибьютором информацию о продажах в хранилище FSC, схема которого показана на рис. 2, аналитик сначала должен извлечь записи, а затем, для каждой записи, преобразовать все столбцы с соответствующими тремя частями имени, чтобы получить значение для атрибута «Имя клиента». Очистка данных. Ошибки при вводе данных и различия в схемах могут привести к тому, что таблица измерений «Клиент» будет иметь несколько соответствующих кортежей для одного клиента, что приводит к неточным ответам на запросы и некорректным моделям добычи данных. К примеру, если таблица клиентов содержит по несколько кортежей для некоторых клиентов FSC в Нью-Йорке, то Нью-Йорк может ошибочно попасть в список первых 50 стран с самым большим числом индивидуальных клиентов. Инструменты, которые помогают определить и исправить аномалии данных, могут иметь высокую отдачу; значительное число исследований посвящено проблемам устранения дублирования и инструментам очистки данных. Загрузка. После того, как данные извлечены и преобразованы, возможно, что их еще необходимо дополнительно обработать перед тем, как добавить в хранилище. Как правило, утилиты фоновой загрузки поддерживают такие функции, как проверка ограничений целостности; сортировка; суммирование, агрегирование и выполнение других вычислений для создания производных таблиц, размещаемых в хранилище; создание индексов и других способов доступа. Помимо наполнения хранилища, утилита загрузки должна позволять системным администраторам проверять статус; отменять, приостанавливать и возобновлять загрузку; возобновлять работу после ошибки без потери целостности данных. Поскольку утилиты загрузки для хранилищ данных обрабатывают значительно 83 больше данных, чем содержится в транзакционных системах, они используют разного рода алгоритмы распараллеливания. Обновление. Обновление хранилища данных состоит в распространении обновлений на исходные данные, которые соответственным образом обновляют базовые таблицы и производные данные, материализованные представления и индексы, размещенные в хранилище. Должны быть рассмотрены два вопроса: когда обновлять и как обновлять. Обычно хранилища данных обновляются периодически в соответствии с заранее установленным расписанием, например, ежедневно или еженедельно. Распространять каждое обновление необходимо только в том случае, если для выполнения OLAP-запросов требуются текущие данные. Администраторы хранилища данных определяют правила обновления в зависимости от требований пользователей и трафика. Расписание обновлений может быть различным для разных источников данных. Администратор должен выбрать циклы обновления таким образом, чтобы накладные расходы, вызванные обработкой больших объемов данных, не превысили расходы на выполнение утилиты инкрементальной загрузки. Большинство коммерческих инструментов используют инкрементальную загрузку при обновлении с тем, чтобы сократить объем данных, добавляя только измененные кортежи, если, конечно, источники данных позволяют извлекать соответствующие фрагменты данных. Однако процесс инкрементальной загрузки может оказаться сложным в управлении, поскольку изменения должны быть скоординированы с текущими транзакциями. Управление метаданными. Метаданные — информация любого рода, которая требуется для управления хранилищем данных, а управление метаданными — существенный компонент архитектуры хранения. К административным метаданным относится вся информация, которая требуется для настройки и использования хранилища данных. Бизнесметаданные включают в себя бизнес-термины и определения, принадлежность данных и правила оплаты услуг хранилища. Оперативные метаданные — это информация, собранная во время работы хранилища данных, такая как происхождение перенесенных и преобразованных данных; статус использования данных (активные, архивированные или удаленные); данные мониторинга, такие как статистика использования, сообщения об ошибках и результаты аудита. Метаданные хранилища часто размещаются в репозитории, который позволяет совместно использовать метаданные различным инструментам и процессам при проектировании, установке, использовании, эксплуатации и администрировании хранилища. 84 Согласованные усилия коммерческих компаний и научных кругов привели к серьезному технологическому прогрессу в решении задач хранения данных. Это нашло отражение во множестве коммерческих продуктов, которые доступны для каждой из трех основных операций: пополнение хранилища данных из независимых транзакционных систем; хранение данных и управление ими; анализ данных с целью принятия обоснованных бизнес-решений. Однако, несмотря на изобилие коммерческого инструментария, остается еще несколько важных направлений для исследования. Очистка данных связана с интеграцией данных из неоднородных источников, проблемой, которую изучают уже много лет. На сегодняшний день основные усилия концентрируются на проблемах несогласованности данных, а не на проблемах несогласованности схем. Хотя очистка данных в последнее время привлекает большое внимание исследователей, предстоит еще немало сделать для создания инструментальных средств, не зависящих от предметной области, которые решают разнообразные проблемы очистки данных, связанные с разработкой хранилищ. Большая часть исследований в области добычи данных касается разработки алгоритмов для создания более точных моделей или алгоритмов, позволяющих ускорить этот процесс. Два других этапа процесса выявления знаний — подготовка данных и применение модели добычи данных — по большей части игнорируются. На обоих этапах возникает несколько проблем, в частности, связанных с достижением большей гармонии между системами управления базами данных и технологией добычи данных. В конечном итоге, новые инструментальные средства должны дать аналитикам более эффективные способы подготовки наборов данных, отвечающих конкретной цели, и более эффективные способы применения моделей к результатам произвольных SQL-запросов. Современные серверы баз данных, поддерживающие язык запросов SQL, способны быстро и качественно произвести любые операции над данными, хранящимися в базе, и выдать результат в наиболее удобной для анализа и использования форме. Это позволяет создавать высокоэффективные системы поддержки принятия решений на базе персональных компьютеров. Подобные системы при низкой совокупной стоимости позволяют оперативно, в реальном режиме времени, обрабатывать любую поступающую информацию, устанавливать необходимые связи между данными и выводить результат в наиболее удобной для пользователя графической форме. 85 Система поддержки принятия решений для предсказания катастрофических наводнений и оценки ущерба от них предложенная в БГУ базируется на персональных компьютерах. Подчеркивается наличие двух подходов к разработке геоинформационных систем, каждый из которых имеет как достоинства, так и недостатки, и их применение зависит как от конкретной задачи, так и от целей и возможностей разработчика. Непосредственно разработка приложения, выполняющего необходимую работу. Данный подход имеет ряд достоинств, основными из которых являются возможность неограниченного распространения (по усмотрению разработчика), быстрота и компактность программы, защита системы от несанкционированного изменения, наличие исходных текстов системы, широкие возможности организации и адаптации интерфейса системы. Недостатки – трудоемкость разработки, достаточно большое время создания системы, возможная несовместимость с самыми распространенными форматами цифровых данных. Адаптация существующей системы, разработанной сторонним производителем, для решения поставленной задачи. Данный способ наименее трудоемок, поскольку исходная система уже изначально обладает рядом инструментов, которые необходимы в нашей системе. Необходимо просто адаптировать данную систему (обычно с помощью встроенного макроязыка) под свои нужды. Но данный способ предполагает наличие значительных материальных средств на закупку исходной системы. Кроме того, подобные системы в силу своей универсальности обычно достаточно громоздки, медленны в работе и имеют достаточно ограниченные возможности в настройке интерфейса. Наиболее распространенной из подобных систем для PC-платформы являются ArcInfo и ArcView корпорации ESRI. Поскольку основным элементом любой системы принятия решений является наличие достаточно полных, многопрофильных тематических баз данных, обеспеченных источниками, каналами и средствами актуализации информации, особое внимание необходимо уделить единым стандартам и форматам подготовки данных для сохранения, обработки и использования их в составе реляционной базы данных. Современные базы данных предоставляют самые широкие возможности сбора и передачи информации, начиная с материалов в твердых копиях и кончая сетевыми технологиями и Интернетом. В зависимости от возможностей заказчиков системы и поставщиков информации необходимо в каждом конкретном случае максимальным образом использовать наиболее дешевые методы сбора и передачи информации. При разработке распределенной базы 86 данных необходимо в первую очередь учитывать, что в нашей республике накоплен большой объем самой разносторонней информации по различным экологическим системам. Однако значительная часть ее находится в виде, мало подходящем для использования современными компьютерными системами и требуют существенной предварительной обработки. На этапе разработки программного продукта количество затраченного времени зависит от выбранной для разработки системы и постановки задачи, а также наличия необходимого опыта. Для ускорения процесса необходимым элементом является кооперация специалистов из различных организаций, специализирующихся в данном вопросе. В частности система поддержки принятия решений для предсказания катастрофических наводнений и оценки ущерба для поймы реки Припять создавалась усилиями 6 организаций около года на языке Avenue ГИС ArcView. Наиболее ответственным и сложным, а в ряде случаев, и дорогостоящим этапом разработки является проверка адекватности результатов работы системы в целом и отдельных ее модулей. Этот этап настолько привязан к конкретным задачам системы, что дать какие-либо общие рекомендации не представляется возможным. 3.5. Технология поддержки принятия решений С информационной течки зрения цикл принятия решений можно разбить на две стадии: - сбор, хранение, накопление, обработка, передача и вывод информации; - принятие решения, результаты которого опять поступают в первый блок. Для сбора, накопления и хранения информации используются технологии баз и банков данных. Для обработки и вывода информации используются технологии текстовых и табличных редакторов, систем управления базами данных, технологии специальных прикладных программ. Проверки реакции на предлагаемое решение технология проводится вначале через механизмы имитационного моделирования. Для передачи информации используются сетевые технологии Для реализации автоматизированного формирования множества возможных решений и наиболее эффективного выбора используются экспертные системы. 87 Подготовить решение можно с помощью вычислительной техники и соответствующих технологий, но окончательный вывод в автоматизированных системах принятия решения остается за человеком. Для процессов, управление которыми поддается четкой формализации, эффективны автоматические системы вплоть до создания гибких автоматизированных производств. Человек выступает как наблюдатель за ходом протекания процесса. При проектировании перечисленных положений используются технологии реинжениринга бизнес процессов. Главной особенностью ИТ поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой технологии, происходит в результате итерационного процесса, в котором участвуют: система поддержки принятия решений в роли вычислительного звена и объектов управления; человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере. Дополнительно к этой особенности ИТ поддержки принятия решений можно указать ещё ряд её отличительных характеристик: ориентация на решение плохо структурированных (формализованных) задач; сочетание традиционных методов доступа и обработки компьютерных данных с возможностями математических моделей и методами решения задач на их основе; направленность на непрофессионального пользователя компьютера; высокая адаптивность, обеспечивающая возможность приспосабливаться к особенностям имеющегося технического и программного обеспечения, а также требованиям пользователя. ИТ поддержки принятия решений может использоваться на любом уровне управления. Кроме того, решения, принимаемые на различных уровнях управления, часто должны координироваться. Поэтому важной функцией и систем, и технологий является координация лиц, принимающих решения, как на разных уровнях управления, так и на одном уровне. В состав системы поддержки принятия решений входят, чаще всего, три главных компонента: база данных, база моделей и программная подсистема, которая состоит из системы управления базой данных, си- 88 стемы управления базой моделей и системой управления интерфейсом между пользователем и компьютером. База моделей требует определенного пояснения. Целью создания моделей являются описание и оптимизация некоторого объекта или процесса. Использование моделей обеспечивает проведение анализа в системах поддержки принятия решений. Модели, базируясь на математической интерпретации проблемы, при помощи определённых алгоритмов способствует нахождению информации, полезной для принятия правильных решений. Пример. Модель линейного программирования даёт возможность определить наиболее выгодную производственную программу выпуска нескольких видов продукции при заданных ограничениях на ресурсы. Использование моделей в составе ИС началось с применения статистических методов и методов финансового анализа, которые реализовывались командами обычных алгоритмических языков. Позже были созданы специальные языки, позволяющие моделировать ситуацию типа "что будет, если?" или "как сделать, чтобы?". Такие языки, созданные специально для построения моделей, дают возможность построения моделей определённого типа, обеспечивающих нахождение решения при гибком изменении переменных. Существует множество типов моделей и способов их классификации, например, по цели использования, области возможных приложений, способы оценки переменных и т.п. По цели использования модели подразделяются на оптимизационные, связанные с нахождением точек минимума или максимума показателей и описательные, описывающие поведение некоторых систем и не предназначенные для оптимизации. По способу оценки модели классифицируются на детерминированные, использующие оценку переменных одним числом при конкретных значениях исходных данных, и стохастические, оценивающие переменные несколькими параметрами, т.к. исходные данные заданы вероятностными характеристиками. По области возможных приложений модели разбиваются на специализированные, предназначенные для использования только одной системой, и универсальные - для использования несколькими системами. Специализированные модели более дорогие, они обычно применяются для описания уникальных систем и обладают большей точностью. В системах поддержки принятия решений база моделей состоит из стратегических, тактических и оперативных моделей, а также математи89 ческих моделей в виде совокупности модельных блоков, модулей и процедур, используемых как элементы для их построения. Стратегические модели используются на высших уровнях управления для установления целей организации, объёмов ресурсов, необходимых для их достижения, а также политики приобретения и использования этих ресурсов. Для этих моделей характерны значительная широта охвата, множество переменных, представления данных в сжатой агрегированной форме. Часто эти данные базируются на внешних источниках и могут иметь субъективный характер. Эти модели обычно детерминированные, описательные, специализированные для решения одной задачи. Тактические модели применяются на промежуточных уровнях (распределение и контроль ресурсов, финансовое планирование, планирование требований к работникам, планирование увеличения продаж, построения схем компоновки предприятий). Здесь также могут потребоваться данные из внешних источников, но основное внимание при реализации данных моделей уделяется имеющимся данным. Обычно тактические модели реализуются как детерминированные, оптимизационные и универсальные. Оперативные модели используются на низших уровнях управления для поддержки принятия оперативных решений с горизонтом, измеряемым днями и неделями. Оперативные модели обычно используют для расчётов внутрифирменные данные. Они, как правило, детерминированные, оптимизационные и универсальные. Математические модели состоят из совокупности модельных блоков, модулей и процедур, реализующих математические методы. Сюда могут входить процедуры линейного программирования, статистического анализа временных рядов, регрессионного анализа и т.п. - от простейших до сложных процедур. Модельные блоки, модули и процедуры могут использоваться как поодиночке, так и комплексно для построения и поддержания моделей. Система управления базой моделей должна обладать следующими возможностями: создавать новые модели или изменять существующие, поддерживать и обновлять параметры моделей, манипулировать моделями. Интерфейс. В человеко-машинных СППР необходимо должное внимание уделить и интерфейсному наполнению диалога: программа специалист. Эффективность и гибкость ИТ во многом зависят от характеристики интерфейса системы поддержки принятия решений. Интерфейс определяет: язык пользователя; язык сообщений компьютера, организующий диалог на экране дисплея; знание пользователя. 90 Управление компьютером при помощи человеческого голоса - простая и желанная форма языка пользователя. Существующие разработки требуют от пользователя серьезных ограничений: определенного набора слов и выражений; специальной настройки, учитывающей особенности голоса пользователя; управления в виде дискретных команд, а не в виде обычной гладкой речи. Технология этого подхода интенсивно совершенствуется, и в ближайшем будущем можно ожидать появления систем поддержки принятия решений, использующих речевой ввод информации. Форма предоставления выходных данных все чаще использует 3D виртуальные модели процессов и объектов. Важным измерителем эффективности используемого интерфейса является выбранная форма диалога между пользователем и системой. В настоящее время наиболее распространены следующие формы диалога: запросно-ответный режим, командный режим, режим меню, режим заполнения пропусков в выражениях, предлагаемых компьютером. Долгое время единственной реализацией языка сообщений был отпечатанный или выведенный на экран дисплея отчет или сообщение. Теперь появилась новая возможность представления выходных данных машинная графика. Она дает возможность создавать на экране и бумаге цветные графические изображения в трехмерном виде. Использование машинной графики, значительно повышающее наглядность и интерпретируемость выходных данных, становится все более популярным в информационной технологии поддержки принятия решений. Наметилось новое направление, развивающее машинную графику, - мультипликация 3D объектов и сцен. Мультипликация оказывается особенно эффективной для интерпретации выходных данных систем поддержки принятия решений, связанных с моделированием физических систем и объектов. Передача информации через форму, взаимное расположение, движение, цвет тесно связана с использованием основного биологического канала восприятия окружающего мира человека. 3.6. Методы теории игр в принятии решений Состязательные задач при принятии решения это задачи маскировки, противодействия и т. п. В них решение принимает не одно лицо, а два или большее число лиц. При этом либо оба лица стремятся "выиграть" (максимизировать свои целевые функции), либо одно лицо не стремится этого сделать (игры с природой). 91 Решению подобных состязательных задач посвящена теория игр. Стороны или лица, принимающие решения в состязательных задачах, называются игроками. Задача относится к теории игр, если: а) результат решения задачи зависит от решения двух или более лиц, которые принимают эти решения независимо; б) решения игроками принимаются в условиях неопределенности. Постановка задачи. Пусть имеется два лица (первое и второе) и оба эти лица стремятся получить максимальную выгоду. Следовательно, имеется две целевые функции: Q1 (x, y) – функция выигрыша первого лица, Q2 (x, y) – функция выигрыша второго лица, где x, y – решения, принимаемые соответственно первым и вторым лицом. Рис. 6.1 Зависимость целевой функции первого игрока от решения второго игрока Значение целевой функции первого игрока зависит не только от его решения x, которое он примет, но и от решения y, которое примет второй игрок. То же можно сказать и о целевой функции Q2 (x, y) второго лица. Если бы решение у второго игрока было бы точно известно, то для первого игрока выбор оптимального решения х* был бы традиционным где ^y – известное решение второго лица, Х – множество возможных решений первого лица. 92 Совсем иначе обстоит дело, если решение у второго лица неизвестно. В этом случае необходимо условиться, каким образом оценивать "удачность" выбора решения х, так как значение целевой функции Q1 (x, y) зависит не только от х, но и от у, что иллюстрируется графиком. Новая оценочную функцию Q^1(x) позволит бы сравнивать какое из решений х1 или х2 первого лица "лучше". Эта оценка является хорошей, она учитывает вклад каждого решения второго лица и вероятность принятия таких решений. Однако, в этом случае необходимо знать вероятность принятия решения вторым лицом или плотность распределения вероятности, если множество Х является континуумом. То же самое относится, очевидно, и к функции Q2 ( y). Если Р(у) не известно, то вычислить Q1( y) или Q2 ( y) невозможно, следует выбрать новую оценку "хорошего " решения. Естественной оценкой в этом случае является "наихудшее" (минимальное) значение целевой функции Чем больше минимальный выигрыш Q1 x , тем лучше х. Эта оценка слишком осторожна: на самом деле выигрыш получится больше, получиться меньше он уже не может. Такую оценку называют гарантированным выигрышем. Теорией решения задач оптимизации, в которых: а) решение принимает не одно, а два или более лиц, а результат решения зависит от совокупности решений всех этих лиц и б) каждому лицу не известны ни решения других лиц, ни вероятностные оценки их возможных решений, занимается математическая наука "Теория игр". Сами задачи оптимизации такого вида носят название игровых задач или задач теории игр. В теории игр принята следующая терминология. Лица, принимающие решения, называются игроками. Целевые функции называются платежными функциями, и считается, что они показывают выигрыш игрока. Так, платежная функция Q1 (x1, …, xn) показывает выигрыш первого игрока. Множество возможных решений Хi каждого игрока называется множеством чистых стратегий i-го 93 игрока, а решение хi из множества чистых стратегий Xi, xi ∈ Xi называется чистой стратегией i-го игрока. Таким образом, чистой стратегией является то, что раньше называлось решением (управлением). Отрицательное значение платежной функции означает "проигрыш" игрока, например, если Q1 (x, y) = 5, то это означает, что первый игрок выиграл 5 единиц, а если Q1 (x, y) = –5, то первый игрок проиграл 5 единиц. Целью первого игрока является максимизация выигрыша, т.е. функцию Q1 (x, y) необходимо максимизировать. Очевидно, что целью первого игрока могла бы быть минимизация функции проигрыша Q1 (x, y), которая равна функции выигрыша, взятой с обратным знаком Q1 (x, y) = –Q1 (x, y). Следовательно, Q1 (x, y) = 5 означает, что первый игрок проиграл 5 единиц, а Q1 (x, y) = –5 означает, что первый игрок выиграл 5 единиц. Эти две задачи имеют, очевидно, право на существование, однако, в теории игр первый игрок всегда полагается выигрывающим, и платежная функция Q1 (x, y) определяет его выигрыш. Проигрышу соответствует отрицательное значение Q1 (x, y). Аналогичные замечания могут быть отнесены к платежной матрице Qi любого i-го игрока. В теории игр используется такое понятие как смешанная стратегия, являющаяся более сложной конструкцией, использующая понятие чистой стратегии. Пусть Х – множество чистых стратегий, а х1, х2, …, хn – n чистых стратегий из этого множества. Пусть игрок принимает решение использовать все эти чистые стратегии с разными вероятностями ξ1, ξ2, …, ξn. При этом игрок выбирает (варьирует) не чистые стратегии х1, х2, …, хn – они всегда заданы (одинаковые), а частоту (вероятность) использования каждой из них. В этом случае стратегией будет вектор вероятностей ξ = (ξ1, ξ2, …, ξn), игрок должен пытаться найти такую стратегию (такое значение) ξ, при которой он получит максимальный успех. Стратегия выбора вероятности ξ называется смешанной стратегией. Рассмотрим следующий пример. Так, чистыми стратегиями является установка орудия на север, юг, запад, восток. Смешанная стратегия ξ = (0,1; 0,5; 0,2; 0,2) означает, что 10 % времени орудие смотрит на север, 50 % на юг и по 20 % времени оно повернуто на запад и восток. Принятие чистой стратегии означает, что игрок принял решение истратить все ресурсы на одно решение. Более сложные стратегии бывают в пошаговых (динамических играх), когда на каждом шаге оценивается ситуация предыдущих решений. В 94 общем случае стратегией называется набор правил, определяющих ход игры. Которые приведут к конечному состоянию. Если каждый из игроков выбрал стратегию, то совокупность этих стратегий называется ситуацией. Пусть в игре двух игроков первый игрок выбрал чистую стратегию х, а второй – чистую стратегию у, тогда ситуацией будет вектор (х, у). Ситуацией в смешанных стратегиях будет вектор (ξ, η), где ξ = (ξ1, …, ξn) – смешанная стратегия первого игрока, η = (η1, …, ηm) – смешанная стратегия второго игрока, ξi – вероятность использования чистой стратегии xi первым игроком, ηi – вероятность использования чистой стратегии yi вторым игроком. Если ситуация сформулирована, то говорят, что игра состоялась. Оценка стратегии игрока проводится по гарантированному выигрышу, т.е. по значению минимального выигрыша для данной стратегии. Так, для первого игрока оценка стратегии х проводится по функции в случае применения чистой стратегии или по функции в случае применения смешанной стратегии, где θ – множество значений вектора вероятности η = (η1, …, ηm) второго игрока. Очевидно, первому игроку хотелось бы выбрать такое х* или такой вектор ξ*, при котором гарантированный выигрыш Q1 x принял бы максимальное значение , или Стратегия х*, доставляющая максимум гарантированному выигрышу Q~ первого игрока, называется максиминной 95 Второму игроку также хотелось бы получить максимальное значение своего гарантированного выигрыша, который определяется аналогичным образом Однако ситуация (х*, у*) не всегда может считаться наилучшей. Действительно, х* – наилучшая стратегия, если у любая, а если у принимает конкретное значение у*, то, очевидно, что в общем случае можно найти другое х**, при котором Q1 (x**, y**) будет больше, чем Q1 (x*, y*). Наилучшей ситуацией будет такая ситуация, при которой ни первому, ни второму игроку не выгодно от нее отклоняться. В теории игр такая ситуация носит название равновесной Решением игровой задачи является нахождение наилучшей равновесной ситуации. Эта ситуация называется оптимальной. Задачей теории игр является разработка алгоритмов нахождения равновесной (оптимальной) ситуации. Классификация игровых задач. Классификация игр, используемых в игровых задачах, представлена ниже. Антагонистические игры моделируют конфликтные ситуации двух или многих лиц, интересы которых противоположны. Например, в случае двух игроков выигрыш одного равен проигрышу другого. Неантагонистические игры (бесконфликтные) – это игры, в которых интересы сторон частично могут совпадать, они не являются диаметрально противоположными. Неантагонистические игры делятся на коалиционные и некоалиционные. В коалиционных играх игроки могут договориться о целях, составить договор, объединиться. Все игры делятся на конечные и бесконечные. Конечными играми называются игры, имеющие конечное или счетное множество стратегий. В таких играх стратегии можно пометить цифрами i = 1, 2, …, n. Таким образом, вместо множества Х имеем множество (конечное или счетное) стратегий I = { i / 1, 2, …, n} – первого игрока и J = { j / 1, 2, …, m} – второго игрока. 96 Рис. 3.56. виды моделей игры 97 Различают следующие типы игры. Бесконечными называются игры, в которых множество стратегий хотя бы одного игрока – континуум, т.е. непрерывно. Статическая игра – это игра, в которой игроки выбирают свои стратегии только один раз, и эти стратегии сохраняются во всех играх. В динамической игре стратегия меняется во времени, при этом используется информация о развитии игры в прошлом. Динамические игры – многодневные. При анализе игровых задач широко используются и графические 3D образы результатов анализа. Например, ситуация с минимаксной и максиминной стратегиями двух игроков является оптимальной и является решением игры при наличии седловой точки, т.е. ν = ν . Для полного понимания термина "седловая точка" рассмотрим непрерывную задачу. Итак, х Х, у Y, х и у непрерывны, вместо платежной матрицы имеется платежная функция для первого игрока Q (x, y). При этом, как и раньше выигрыш одного игрока равен проигрышу другого. Рис. 6.3 Графическая иллюстрация оптимального решения в антагонистической игре с седловой точкой Максиминная стратегия первого игрока и минимаксная стратегия второго игрока находятся аналогичным образом дискретному случаю, т.е. 98 Если ν = ν , то имеется седловая точка (она же оптимум) . Графическая иллюстрация рассматриваемого непрерывного случая представлена выше. 4. Выбор решения в различных внешних условиях Издавна, в теории управления принятие решений было важным разделом. Но по мере становления теория принятия решений ТПР постепенно приобрела самостоятельное значение. В ТПР применительно к техническим системам исследуются принципы функционирования различных объединений, принимающих решения (живые системы, коллективы людей, автоматы), рассматриваются подходы к построению кибернетических моделей таких систем. Как в практически каждой науке, в ТПР формируется свой подход к формализации проблем, свой язык, аппарат выводов и методы исследования. На сегодня эти процессы развиваются и имеется еще ряд вопросов, которые можно выделить как ведущие. Строгое определение области явлений, о которых можно говорить, как о принятии решений. Познание механизмов ТПР в деятельности человека и в биологических системах. Изучение поведения биологических систем и целенаправленной деятельности. Формализация процесса ТПР. Взаимодействие человека и технических средств процессе ПР. Принятие решений в условиях неопределенности 99 Элементарная теория принятия решений рассматривается в условиях неопределенности и риска. Не утратила ТПР своего значения и в теории автоматического управления. В теории робототехнических систем как базовые анализируются три вида условных предложений: P1: если x есть A то y есть B. P2: если x есть A то y есть B P3: если x1 есть A1 и x2 есть A2 и ... xn есть An то y есть B Не четкость определений иначе C. множеств и их связей существенно усложняет принятие решений даже в простых одноступенчатых схемах. Например, для условного предложения P1 ряд авторов рекомендуют решения по схемам. Пусть A , A' , не четкие концепции в универсуме U; B , B ' , не четкие концепции в универсуме V. 1. Предпосылка 1: если x есть A, то y есть B. Предпосылка 2: x ' есть A' . Вывод: y ' есть B ' . 2. Предпосылка 1: если x есть A то y есть B. Предпосылка 2: x ' есть очень A' . Вывод: y ' есть очень B ' . 3. Предпосылка 1: если x есть A то y есть B. Предпосылка 2: x ' есть более или менее A' . Вывод: y ' есть более или менее B ' . 4. Предпосылка 1: если x есть A то y есть B. Предпосылка 2: x ' не есть A' . Вывод: y ' не есть B ' . 100 По сути это ситуации частично рассмотренные в разделе 2.1. Предложение №1 – детерминированный случай. Зоны, в которой действительны утверждения №2 и №4, четко определены (рис. 2). Зона действия утверждения №3 – нечеткая область. Пусть E - универсальное множество, х - элемент Е, а G -некоторое свойство. Обычное (четкое) подмножество А универсального множества Е, элементы которого удовлетворяют свойству G, определяется как множество упорядоченных пар: B B x / x, где B x - характеристическая функция, принимающая значение 1, если х удовлетворяет свойству G, и 0 - в противном случае. При задании нечеткого подмножества для элементов х из Е нет однозначного ответа «да или нет» относительно свойства G. И хотя нечеткое подмножество А универсального множества Е определяется также, как множество упорядоченных пар: A A x / x, где A x - характеристическая функция принадлежности (или просто функция принадлежности), принимающая значения уже в некотором упорядоченном множестве М (например, М = [0,...,1]). Функция принадлежности указывает степень (или уровень) принадлежности элемента х подмножеству А. Множество М называют множеством принадлежностей. Если М = {0, 1}, то нечеткое подмножество А может рассматриваться как обычное или четкое множество. Ниже приведен пример результирующей матрицы для операции сложения в условиях, когда функция принадлежности A x представлена L нечеткими величинами вида: x1,i / x1,i , x2,i / x2,i , ..., xn,i / xn,i , где i 1... L . Исходные функции принадлежности располагаются в левом столбце и верхней строке матрицы. Элементами этой матрицы являются дискретные нечеткие величины D x j ,i / x j ,i , где i 1... n , j 1... n и 101 D x j ,i min x1,i , x2, j , и x j ,i x1,i x2, j . 4.1. Общие положения Аналитически формально задача принятия решения описывается как упорядочная четверка. Кортеж Z определяет класс схем принятия решений Z F , A, E , Q , где F - множество возможных значений не наблюдаемого параметра; A - множество всех возможных решений (альтернатив); E - функция потерь, заданная на F , A ; Q - статистическая закономерность на F . Практически все величины, входящие в кортеж определены не четко. Пусть имеется совокупность действий, операций, решений а1, а2, ..., аm, m 2, которые может совершить система для достижения поставленной цели, причем одну и только одну операцию аi, i{1, 2, ..., m}, выбирает алгоритм, принимающий решение. Кроме того, представлен перечень объективных условий (ситуаций), F1, F2, ..., Fn, одно из которых Fj, j{1, 2, ..., n}, будет иметь место в действительности. Для каждой операции аi, i = 1, 2, ..., m, при каждом условии Fj, задан риск в некоторых единицах ei , j . Величины ei , j , играющие роль платежей в теории игр, получаются расчетным или оценочным путем. Они могут быть объективны или субъективны. Возникают определенные трудности при их числовой оценке, обусловленные многими факторами. Величины ei , j можно задавать относительно, поэтому нередко их называют показателями предпочтительности. На рис. 114 представлены виды двух типов функций рисков. Многоэкстремальной (а) и гладкой (б). Каждое значение функции рисков может быть нечетко заданным и многокомпонентным. Так как ei , j представляет собой основное наполнение матрицы решений, то рис. 114 можно определить как графическое представление матрицы решений. 102 а б Рис. 114. Вид различных типов функций риска Табличное представление матрицы решений в различных областях применения ТПР имеет свою специфику. Рассмотрим ее вид наиболее часто встречающийся в технических приложениях. В таблице 10 представлены по строкам: Вторая строка – символьное определение типа ситуации. В отдельных источниках можно встретить название явление природы или состояние природы. Все это говорит о желании авторов представить некоторый, не управляемый системой параметр внешней среды, от которого зависит эффективность возможных действий системы. Практическое решение в расчетах имеет только индекс ситуации j . Первая строка – характеристическая функция принадлежности q j . Как правило определяется в виде вероятности возникновения ситуации F j . Но это не ограничивает жестко ее суть. Данная величина чаще всего используется в расчетах в виде сомножителя e j , поэтому имеет вид весовой функции F j ситуации, ее дополнительного влияния на исход решения. Второй столбец – символьные обозначения возможных решений. Практическое значение имеет только индекс решения. Именно поиск данного индекса является базовой целью анализа. Его значение определяет оптимальное решение, дающее наибольший выигрыш или 103 наименьшие потери при заданном уровне возможного проигрыша, который может случится, если возникнет одна из не запланированных ситуаций. Первый столбец – характеристическая функция принадлежности pi . Определяет обычно вероятность осуществления решения Ai . В ряде случаев по объективным или субъективным причинам запланированное решение не реализуется полностью и реально осуществляется другое учтенное или неучтенное решение (параметры реализованного решения не позволяют говорить о том, что выполнено запланированное решение). Поле таблицы заполняется оценками риска или выигрыша ei , j от принятия решения Ai , при его реализации в условии F j . Таблица 10 q1 ... qj ... qn F1 ... Fj ... Fn p1 A1 e1,1 ... e1, j ... e1, n ... pi ... Ai ... ei ,1 ... ... ... ei , j ... ... ... ei , j ... pm ... Am ... em,1 ... ... ... em, j ... ... em, n При последующем анализе таблица видоизменяется. В нее вводятся новые строки и столбцы. Они уменьшают объем вычислительных операций, так как из рассмотрения удаляются отдельные, слабые по мнению авторов зависимости. Добавляемый столбец получил название оценочной функции eri , которая отражает установленный по выбранной схеме принятия решений (критерию) выигрыш или потери от решения с номером i . Добавляемая строка e p обычно используется, как уменьшаемое в пересчетах таблицы принятия решений. В ряде преобразований она представляет максимально возможный выигрыш в ситуации F j . Тогда таблица превращается в таблицу потерь от не оптимальных для данной ситуации решений. После добавления строк и столбцов таблица принимает новый вид (таблица 11). Таблица 11 104 q1 ... qj ... qn F1 ... Fj ... Fn er p1 A1 e1,1 ... e1, j ... e1, n er1 ... pi ... Ai ... ei ,1 ... ... ... ei , j ... ... ... ei , j ... eri ... pm ... Am ... em,1 ... ep ... ... em, j ... ... e p1 ... ... em, n erm ... ep j e pn Число добавляемых столбцов может составлять и десяток. Тогда r становится индексом критерия принятия решения. И таблица как бы представляет решения многих экспертов, пользующихся для анализа различными критериями. Последующая обработка проводится только с со столбцами er . Процедуры превращения матрицы принятия решений в вектор или вектора слабо связанные друг с другом, естественно снижают вычислительную нагрузку. Но стремится к этому, как к основной цели необходимо осторожно. Прежде всего надо понимать то, что расчет достаточно больших матриц по интегральным критериям высокой сложности, в конце концов, занимает несколько секунд, в крайнем случае минут рабочего времени современных компьютеров в том числе и встраиваемых в интеллектуальные приборы. В процессе преобразований не только дополняют но и вычеркиваются те строки, которые описывают заведомо худшие последствия, чем те, что предполагают остающиеся решения. Если в процессе преобразований m становится равным единице, матрица превращается в вектор, отображающий последствия единственного из возможных решений – фатальная ситуация в принятии решений (Таблица 12). Будущее не корректируется, остается только ждать. Таблица 12 q1 ... qj ... qn F1 ... Fj ... Fn 105 p1 ... e1,1 A1 ... e1, j e1, n Графическая интерпретация действий с матрицей последствий решений не ограничивается только построением 3D моделей. В практике последовательного анализа используется построение несколько не обычной графической модели. Проще всего дальнейшие графические формы представить для случая с двумя учитываемыми ситуациями. Таблица 13 1 1 1 1 1 1 1 1 1 1 A0 A1 A2 A3 A4 A5 A6 A7 A8 A9 0,5 0,5 F1 F2 27 61 41 37 42 27 39 35 36 55 35 73 38 78 44 64 48 39 20 16 В таблице 13 приведен пример выигрыша от принятия одного из десяти вариантов решений, которые могут быть реализованы в двух ситуациях. Для упрощения характеристические функции принадлежности опущены Для начала построим график, у которого введены оси: F - представлена числами 0, 1, являющихся индексами ситуаций F1 и F2 ; A - искомая величина представлена номерами принимаемых решений; e - ось последствий принятых решений осуществленных в одной из ситуаций. 106 Точки на графике (рис. 115) лежат в плоскости AF1e и плоскости ей параллельной, но проходящей через точку F2 . Проекции на плоскость F2 F1e и далее на ось F1e дают оценки выигрышей. Рис. 115. Последствия решений в двух ситуациях Таким образом, график образуется параллельными плоскостями отображающими столбцы таблицы и проходящими через индексы ситуаций. А пересечение их с плоскостью F2 F1e дает линии последствий различных решений в данной ситуации. Превратим их в координатные оси. Новые оси – числовые оценки последствий решений в каждой ситуации. Число осей и следовательно размерность пространства анализа равно числу рассматриваемых ситуаций плюс одна. Последняя ось – ось номеров решений отображает искомую величину – индекс оптимального решения. Ae1 ,...e j ,...en i 2 . График на рис. 116 показывает полученную фигуру. Ось e1 отображает последствия решений при ситуации F1 , ось e2 - последствия решений при ситуации F2 . 107 Рис. 116. Решения над полем принятия решений Плоскость e10e2 образует поле принятия решений, из которого «вырастают» возможные решения. Такое преобразование позволяет понизить размерность пространства анализа. На рис. 117 показано поле принятия решений (прямоугольник ABCD). Оно образовано отрезками линий параллельных оси e1 и проходящими через точки максимального и минимального выигрыша, который можно получить при ситуации F2 , а также отрезками линий параллельных оси e 2 и проходящими через точки максимального и минимального выигрыша, который можно получить при ситуации F1 . В зависимости от принятого критерия мы проходим различные точки в данном поле. Часть точек не попадает в рассмотрение. 108 Рис. 117. Поле принятия решений Пусть мы попали в рабочую точку РТ. Проведем через нее линии параллельные осям. Данные линии разделили поле принятия решений на четыре квадранта, которые получили название специальные названия. Первый квадрант – конус предпочтения. Все точки в этом квадранте отображают последствия более удачных во всех ситуациях решений. Термин конус хорошо отображает анализ решений в многомерном пространстве ситуаций. Третий квадрант – антиконус. Все точки в нем во всех ситуациях дают худшие результаты, чем выигрыш, который предполагает рабочая точка. Второй и четвертый квадранты называют областями неопределенности. При одной ситуации выигрыш в них больший, при другой – меньший чем в рабочей точке. Движение в поле принятия решений начинается от начала координат. Формируется линия предпочтения (в многомерном пространстве ситуаций – гиперповерхность), форма которой отображает выбранный тип критерия. Данная поверхность движется вдоль направляющей, уравнение которой также определяет выбранный критерий. На рис. 118 приведен пример таких построений для одного из критериев принятия решений. 109 а б Рис. 118. Движение линии предпочтения K вдоль направляющей u В первом случае рис. 118 а выше уровня предпочтения лежит пять точек и движение продолжается. В конце последняя точка на линии рис. 118 б выбирается решение (выше и правее линии предпочтения точек нет). Это решение с индексом 6 - A6 предполагающее выигрыш - 38 или - 78 в зависимости от ситуации. Подробно построение линий предпочтения будет рассмотрено ниже. Сложившаяся на сегодня методика поддержки принятия решений в большинстве случаев рекомендует последовательное прохождение следующих этапов: анализ ситуации с формированием матрицы решений; выработку одного или нескольких критериев принятия решений (задание оценочных функций); определение номеров решений по выбранным критериям; анализ полезности выбранных вариантов решений. Данные этапы, как правило, повторяются несколько раз с постепенным уменьшением числа возможных решений и перечня анализируемых ситуаций их применения. В системах искусственного интеллекта эти процедуры также программируются с различной степенью адаптации алгоритмов и их параметров к изменению ситуаций в процессе существования системы. 110 Все компоненты матрицы решений, целевые функции неизбежно имеют статистический характер, поэтому в процессе принятия решений многократно применяются методы анализа случайных процессов и событий. 4.2. Классические критерии принятия решений Ряд критериев принятия решений прошли достаточную проверку практикой и стали базой для формирования других критериев. Это позволило их выделить в отдельную группу. 4.2.1. Минимаксный критерий принятия решения Минимаксный критерий (ММ-критерий) занимает ключевое место в технических решениях. Он полностью исключает риск и, при этом ограничении, дает наилучшее решение. Это позиция крайней осторожности. Критерий предполагает формирование столбца оценочной функции с выигрышами, которые можно получить в наихудших условиях реализации выбранного решения. eri min ei, j . j Z MM max eri max min ei, j . i i j А схема выбора решения Ao Aio Aio A eio max min ei, j . i j Формула минимаксного критерия звучит следующим образом: Выбирается множество оптимальных вариантов Ao , которое содержит варианты Aio , принадлежащие множеству A и оценка eio максимальна среди всех минимальных результатов возможных решений. Рассмотрим пример. Пусть матрица решений содержит выигрыши от четырех решений A , которые можно реализовать в четырех условиях F . Таблица 13 содержит оценки условных выигрышей и упрощена исключением оценок функции принадлежности. Его критерий Таблица 13 F1 F2 111 F3 F4 A0 A1 A2 A3 60 55 62,5 62,5 35 57,5 77,5 67,5 20 62,5 92,5 65 10 67,5 82,5 100 Дополним ее столбцом er . Результат приведен в таблице 14. Таблица 14 A0 A1 A2 A3 F1 F2 F3 F4 er 60 55 62,5 62,5 55 35 57,5 77,5 67,5 35 20 62,5 92,5 65 20 10 67,5 82,5 100 10 Максимальное значение выигрыша можно получить при отсутствии риска в случае решения A0 и его величина составит 55 единиц. Какие бы условия реализации выбранного решения не встретились оно даст не меньший выигрыш, чем тот что запланирован по оптимальному решению. Какие бы решения не принимались, любое из них даст в худших для себя условиях меньший выигрыш чем оптимальное. Применение ММ-критерия оправдано если: О характеристических функциях принадлежности ситуаций F ничего не известно; Решение реализуется один или небольшое число раз; Риск полностью исключается. Сократим таблицу 13 до двух первых столбцов F1 и F2 . Графическая интерпретация ММ-критерия для двух первых столбцов матрицы решений таб. 13 приведена на рис. 119. Точки в поле принятия решений дискретны. Вне них возможных решений нет. Оси e1 и e2 непрерывны и можно задать функцию предпочтения. Функция предпочтения задается на основе оценочной функции рассматриваемого критерия. В данном случае для двух ситуаций min e1, e2 k , где k - текущий уровень рабочей точки. 112 Рис. 119. Функция предпочтения минимаксного критерия Так как мы максимализируем результат, то, если есть хоть одна точка выше данной линии необходимо увеличивать k . Уравнение задает конус, грани которого параллельны осям ординат (К на рис. 119). На рис. 119 k =28, выше есть две точки поэтому необходимо увеличивать k . Вершина конуса движется по направляющей являющейся биссектрисой угла оси ординат – функция u на рис. 119. 4.2.2. Критерий Байеса - Лапласа Критерий Байеса – Лапласа (BL-критерий) максимализирует средний выигрыш и допускает определенный риск. В реальной реализации выигрыш может быть существенно ниже, чем запланированный. Для его применения необходимо знать оценки вероятностей появления ситуаций. Это случай массового применения решения при полном отсутствии ограничения на риск. Критерий предполагает формирование столбца оценочной функции с выигрышами, которые дают средний результат многократного применения выбранного решения при всех ситуациях. eri ei, j q j . j Его критерий Z BL max eri max ei, j q j . i i j 113 А схема выбора решения Ao Aio Aio A eio max ei, j q j q j 1 . i j j Формула критерия Байеса – Лапласа звучит следующим образом: Выбирается множество оптимальных вариантов Ao , которое содержит варианты Aio , принадлежащие множеству A и оценка eio максимальна среди всех оценок математических ожиданий результатов возможных решений. Рассмотрим пример. Дополним матрицу решений таб. 13 строкой содержащей оценки характеристических функций принадлежности выбранных ситуаций F общему пространству возможных внешних событий. Детально процесс получения оценок изложен в первом разделе. Упростим их до оценок математических ожиданий вероятности появления ситуаций F1 , F1 , F3 , F4 . Результаты приведены в таблице 15. Таблица 15 A0 A1 A2 A3 0,1 0,08 0,75 0,07 F1 F2 F3 F4 60 55 62,5 62,5 35 57,5 77,5 67,5 20 62,5 92,5 65 10 67,5 82,5 100 Умножим столбцы матрицы на оценки математических ожиданий вероятности появления ситуаций и дополним ее столбцом er , вычислив его компоненты, как оценки математических ожиданий последствий каждого из решений. Результат приведен в таблице 16. Согласно схеме критерия Байеса – Лапласа найдем максимум er и по его положению определим оптимальное решение – это A2 . Оно оценивает прогнозируемых выигрыш в 80,92 единицы. Он выше чем прогнозирует минимаксный – 55, но может составить и 20, если окажется сильно заниженной оценка математического ожидания вероятности возникновения ситуации F1 . Т. о. присутствует риск не получения планируемого выигрыша. 114 Таблица 16 A0 A1 A2 A3 0,1 0,08 0,75 0,07 F1 F2 F3 F4 6 4,4 46,88 4,375 61,65 3,5 4,6 58,13 4,725 70,95 2 5 69,38 4,55 80,92 1 5,4 61,88 7 75,28 er Применение BL-критерия оправдано если: характеристических функциях принадлежности ситуаций F хорошо изучены и достоверность оценок их параметров достаточно высока; Решение реализуется многократно; Риск при небольшом числе реализаций допустим. Реально риск отсутствует только при большом числе реализаций. Это критерий длинных реализаций с резервными ресурсами и стабильным во времени видом и параметрами характеристических функций принадлежности. Для графической интерпретации сократим таблицу 15 до двух столбцов F1 и F3 изменив и q j . Столбцы F2 F4 убраны, как менее вероятные. Таблица 17 A0 A1 A2 A3 0,15 0,85 F1 F3 60 62,5 62,13 35 77,5 71,13 20 92,5 81,63 10 82,5 71,63 er Результаты представлены в таблице 17. Оценки выигрышей изменились но несущественно, оптимальное решение прежнее. Графическая интерпретация BL-критерия для выбранных столбцов матрицы решений таб. 13 приведена на рис. 120. Функция предпочтения задается на основе оценочной функции рассматриваемого критерия. В данном случае для двух ситуаций e1 q1 e3 q3 k , где k - текущий уровень выигрыша. Это прямая линия 115 q k e1 3 e3 . q1 q1 q k Угол ее наклона arctq 3 и смещение по оси e1 зависят от веq1 q1 роятностей ожидания возникновения ситуаций. Так как группа ситуаций полная, то - от вероятности возникновения одного из них. Так как мы максимализируем результат, то, если есть хоть одна точка выше данной линии необходимо увеличивать k . Уравнение задает полуплоскость. Луч определяющий ее начало зависит от планируемого выигрыша k . Точки попавшие на нее более предпочтительны, чем рабочая. Направляющая должна совпадать по направлению с движением точек функции предпочтения при увеличении k и проходить через вершину конуса предпочтения. Т. к. в нашем случае конус выродился в полуплоскость, то можно выбрать удобную точку. Пусть u проходит через начало координат. Нормаль к u совпадает с направлением функции предпочтения. Рис. 120. Функция предпочтения для критерия Байеса – Лапласа На рис. 120 приведены полученные графики. Функция предпочтения прорисована дважды при k 80 - K1 и при k 70 - K 2 . В первом случае оптимальное решение определено однозначно (в полуплоскости одна точка), во втором изменение k необходимо продолжать. Линия u на рис. 120 выглядит как не перпендикулярная к линиям K1 , K 2 . Это искаже116 ние обусловлено разным масштабом осей e1 и e3 . На рис. 118 также представлены функции предпочтения построенные по критерию BL при q 0,5 . BL – критерий для случая q j =const получил название нейтрального критерия. 4.2.3. Критерий азартного игрока или предельного оптимизма Критерий азартного игрока (H-критерий) редко используется в технических решениях. Он ориентирован на получение наибольшего выигрыша без учета, каких либо ограничений налагаемых возможными ситуациями. Это позиция предельного риска. Но с другой стороны это позиция и предельного оптимизма. Практически критерий ищет наибольший выигрыш в матрице решений и выбирает решение дающего его в одной из ситуаций. Для сохранения структуры исследований рассмотрим порядок действий по стандартной схеме. Критерий предполагает формирование столбца оценочной функции с наибольшими выигрышами, которые можно получить при реализации выбранного решения. eri max ei, j j . Z H max eri max max ei, j . i i j А схема выбора решения Ao Aio Aio A eio max max ei, j . i j Формула критерия предельного оптимизма звучит следующим образом: Выбирается множество оптимальных вариантов Ao , которое содержит варианты Aio , принадлежащие множеству A и оценка eio максимальна среди всех максимальных результатов возможных решений. Рассмотрим применение данного критерия на примере матрицы решений приведенной в таблице 13. Дополним ее столбцом er . Результат приведен в таблице 18. Максимальное значение выигрыша можно получить при отсутствии риска в случае решения A3 и его величина составит 100 единиц. Его критерий 117 Какие бы условия реализации выбранного решения не встретились оно не даст большего выигрыша, чем тот что запланирован по оптимальному решению. Какие бы решения не принимались, любое из них не даст большего выигрыша чем оптимальное. Таблица 18 A0 A1 A2 A3 F1 F2 F3 F4 er 60 55 62,5 62,5 62,5 35 57,5 77,5 67,5 77,5 20 62,5 92,5 65 92,5 10 67,5 82,5 100 100 Применение Н-критерия оправдано если: О характеристических функциях принадлежности ситуаций F ничего не известно; Решение реализуется один или небольшое число раз; Риск оправдан необходимостью получения предельного и менее выигрыша. Рис. 121. Функция предпочтения критерия придельного оптимизма Сократим таблицу 13 до двух первых столбцов F3 и F4 . Выбор их обусловлен наличием в одном из них выбранного выигрыша и высокой вероятностью появления ситуации для второго. 118 Графическая интерпретация H-критерия приведена на рис. 121 ( k =88). Функция предпочтения задается на основе оценочной функции рассматриваемого критерия. В данном случае для двух ситуаций max e3 , e4 k . Уравнение задает конус, грани которого параллельны осям ординат. Но по сравнению с ММ – критерием конус предпочтения как бы вывернулся. Если есть хоть одна точка выше или правее него, то необходимо увеличивать k . На рис. 121 k =88, выше есть две точки, поэтому необходимо увеличивать k . Вершина конуса движется по направляющей являющейся биссектрисой угла оси ординат – функция u. 4.2.4. Критерий Сэвиджа Критерий Сэвиджа (S-критерий) предполагает все ситуации равно вероятными и стремится снизить потери, которые могут возникнуть при выборе решения не оптимального для данной ситуации. Такое целевое устремление требует преобразования матрицы, появляется связь между данными внутри столбца. Новые компоненты s новой матрицы решений имеют отличный от начального смысл. si, j max ei, j ei, j . i Рассмотрим это преобразование на примере матрицы решений таб. 13. Выходной результат представлен в таблице 19. Новые элементы таблицы приобрели вид по сути потерь, от принятых решений, если выпала ситуация, в которой априори можно было принять лучшее решение. Оптимальным решением для данной ситуации является решение с нулевым значением si . Таблица 19 A0 A1 A2 A3 F1 F2 F3 F4 0 12,5 30 37,5 25 10 15 32,5 40 5 0 35 50 0 10 0 119 Далее схема действий аналогична схеме минимаксного критерия. Ищем наихудший результат в строках. Компоненты изменились по смыслу, это не выигрыши а потери, поэтому min меняется на max и наоборот. Критерий предполагает формирование столбца оценочной функции с наибольшими потерями, которые предполагает выбранное решение относительно наилучшего при его реализации в конкретной ситуации. sri max si, j . j Далее минимизируются потери от возможных решений. Его критерий Z S min sri min max si, j . i i j А схема выбора решения Ao Aio Aio A eio min max max ei, j ei, j . i j i Результаты действий приведены в таблице 20. Таблица 20 A0 A1 A2 A3 F1 F2 F3 F4 sr 0 12,5 30 37,5 37,5 25 10 15 32,5 32,5 40 5 0 35 40 50 0 10 0 50 Решение дающее гарантию минимальных потерь относительно оптимальных решений, которые могли бы быть приняты, если бы априори была известна ситуация их реализации, - A1 . Формула критерия Сэвиджа звучит следующим образом: Выбирается множество оптимальных вариантов Ao , которое содержит варианты Aio , принадлежащие множеству A и оценка eio минимальна среди всех оценок потерь от выбора не наилучших решений при конкретной ситуации. Применение S - критерия оправдано при сложных условиях анализа близких по выигрышу решений. Критерий допускает риск в исходной матрице решений e , но в матрице потерь s риск исключается. Можно 120 сказать так, мы не знали что случится, но мы проиграли меньше, чем могли бы от действий наилучшего в данной ситуации агента. Графическая интерпретация S - критерия для матрице потерь s аналогична минимаксной, т. к. данный критерий использует в матрице потерь схему минимаксного критерия. В исходной матрице e построение усложняется тем что оси переворачиваются и смещаются. Это разрывает конус предпочтения минимаксного критерия и переворачивает его. Появляются две зоны, в которых ищутся решения. 4.2.5. Критерий произведений Критерий произведений (P-критерий) не часто применяется в технических задачах, но его своеобразность, слабая связь с выше описанными позволяет его так же отнести к классическим. Оценочная функция по строкам формируется как произведение выигрышей. Мы, что бы не потерять размерность и наглядность, извлечем из полученного результата еще и корень размерности типов ситуаций. Положение максимума при этом не меняется. eri n ei, j . j Рассмотрим формирование нового столбца на примере матрицы решений таб. 13. Выходной результат представлен в таблице 21. Критерий предполагает формирование столбца оценочной функции с выровненными выигрышами, которые дает выбранное решение. Оценочная функция в приведенной форме дает лучшие результаты при примерном равенстве выигрышей в строке. Это свойство среднего геометрического хорошо известно. Таблица 21 A0 A1 A2 A3 F1 F2 F3 F4 er 60 55 62,5 62,5 59,92 35 57,5 77,5 67,5 56,96 20 62,5 92,5 65 52,36 10 67,5 82,5 100 48,58 Используют и логарифмическую форму представления оценочной функции критерия произведений. 121 erln ln ei, j . i j Ее максимум так же совпадает с максимумом er . Поэтому финишный результат не меняется. Выбор за исследователем. Далее ищется лучший вариант в столбце er и определяется номер решения. Критерий Z P max eri max ei, j . i i j А схема выбора решения Ao Aio Aio A eio max ei, j . i j В приведенном примере критерий произведений рекомендует решение A0 (таблица 21). В данном случае оно совпало с минимаксным. Формула критерия произведений звучит следующим образом: Выбирается множество оптимальных вариантов Ao , которое содержит варианты Aio , принадлежащие множеству A и оценка eio максимальна среди всех оценок произведений полезности от любого из решений. Применение P - критерия рекомендуется в следующих условиях: Все последствия решений положительны; Все ситуации примерно равновероятны и с каждым из них необходимо считаться в равной мере; Критерий применим в основном при малом числе реализаций; Риск допускается. Ограничение на положительность, вернее на однородность знака компонентов матрицы решений можно ослабить. Для этого вводится постоянная составляющая, т. е. ко всем компонентам прибавляется смещение. Однако следует учитывать то, что уровень постоянной составляющей может нивелировать сглаживающее действие критерия и номер решения измениться. Графическое представление операции выбора решения выполним на тех же данных, которые использовались при анализе BL-критерия. Функция предпочтения задается на основе оценочной функции рассматриваемого критерия. В данном случае для двух ситуаций e1 e3 k , 122 где k - текущий уровень выигрыша. Это семейство гипербол k e1 . e3 Эти гиперболы прилегают к лучам конуса предпочтения ММ – критерия. Рис. 122. Функция предпочтения для критерия произведений Так как мы максимализируем результат, то, если есть хоть одна точка выше или правее данной линии необходимо увеличивать k . Направляющая должна совпадать по направлению с движением точек функции предпочтения при увеличении k и проходить через вершину конуса предпочтения. Это биссектриса осей ординат. На рис. 122 приведены полученные графики. Функция предпочтения прорисована дважды при k 300000 - K1 и при k 100000 - K 2 . В первом случае оптимальное решение определено однозначно (в полуплоскости одна точка), во втором изменение k необходимо продолжать. 123 4.2.6. Расширенный минимаксный критерий Данный критерий более сложен и содержит в себе действия более характерные, например, BL-критерию. По сути по ММ-критерию он создает только расчетную ситуацию. Данная схема принятия решения допускает определенный риск. Пусть информация о виде характеристических функций принадлежности выбранных ситуаций F общему пространству возможных внешних событий не полная. Можно говорить о семействе векторов описаний ситуаций или о множестве n - мерных векторов W n . Пусть по каждому вектору принимаются решения Ei , i var . Появляется вероятность pi , отображающая частоту принятия решения Ei . Среднее значение выигрыша e p, q ei, j pi q j получено в множестве W n . i j Целью применения критерия является выбор оптимального вектора генерации решений p p1,..., pi ,... pm . Схема расширенного минимаксного критерия выглядит как A po A po A po A e po , qo max min ei, j pi q j . q i j p Она ориентируется на наихудшее распределение q из W n и при этом ищет лучший вариант. Рассмотренные классические критерии можно сравнить между собой прежде всего по виду целевой функции, который зависит от точки зрения эксперта или заложенного в систему принципа сохранения функционирования. Практически все примеры выбрали различные решения: A0 - ММ-критерий; A2 - BL-критерий; A3 - H-критерий; A1 - S-критерий. Это естественно, так как все возможные решения имеют смысл и целесообразны в том или ином случае. 124 4.3. Производные критерии принятия решений Формирование производных критериев идет в основном по двум схемам: Формирование оценочной функции как взвешенной суммы оценочных функций классических критериев; Установление по базовому критерию нижнего уровня риска и введение допуска на его превышение. Далее по более обнадеживающему критерию поиск нового решения в пределах установленного допуска. 4.3.1. Критерий Гурвица Критерий HW предполагает формирование оценочной функции как комбинации минимаксной и предельно оптимистической функций. eri c min ei, j 1 c max ei, j , j j где c - весовой множитель. Критерий HW Z HW max eri . i А схема принятия решения c min e 1 c max e i, j i , j Ao Aio Aio A eio max j j . i 0 c 1 Правило выбора по HW-критерию: Матрица решений дополняется столбцом, содержащим линейную комбинацию наибольшего и наименьшего для каждой строки. Выбираются те варианты E , в строках которых находятся наибольшие элементы этого столбца. Весовой множитель c (0...1) определяет степень доверия к ММкритерию относительно критерия азартного игрока. Обычно рекомендуют применять данный критерий, если о вероятности появления событий F ничего не известно, поэтому в равной мере надо считаться со всеми, реализуется небольшое количество решений, 125 риск допускается. 4.3.2. Критерий Ходжа – Лемана Критерий Ходжа – Лемана (HL-критерий) формирует оценочную функцию, как линейную комбинацию функций MM- и BL-критериев. eri v ei, j q j 1 v min ei, j , j j где v - (0...1) весовой множитель характеризующий степень доверия к BL-критерию относительно MM-критерия. Критерий HW Z HL max eri . i А схема принятия решения v ei, j q j 1 v min ei, j Ao Aio Aio A eio max j j i 0 v 1 . Правило выбора по HL-критерию: Матрица решений дополняется столбцом, содержащим линейную комбинацию среднего и наименьшего для каждой строки. Выбираются те варианты E , в строках которых находятся наибольшие элементы этого столбца. Критерий полагает многократное применение решения, стремится поднять средний выигрыш, но с ограничением на риск, выраженным через степень доверия к BL – критерию. 4.3.3. Критерий Геймейера Критерий Геймейера (G-критерий) ориентирован на выбор среди близких по эффективности решений и матрицу решений представленной потерями. eri min ei, j q j . j Критерий G Z G max eri . i 126 А схема принятия решения Ao Aio Aio A eio max min ei, j q j ei, j 0 . i j Наиболее определен он в расходных экономических задачах. При q j const он превращается в ММ-критерий. При наличии в исходной матрице решений ei , j 0, все компоненты матрицы могут быть уменьшены на определенную величину. Не надо стремиться выбрать ее большой, т. к. введение смещения может изменить результат итогового выбора. В отличии от ММ-критерия данный учитывает вероятность появления ситуаций и устраняет риск пропуска наиболее неблагоприятной ситуации с учетом вероятности ее появления. Устраняется риск в многократно повторяющемся решении. Таким образом расширяется действие ММ-критерия. 4.3.4. BL(MM) критерий Данный критерий относится ко второй группе производных критериев. Критерии этого типа получили название составных. Его база – ММ-критерий. Опорное значение eio , jo получается, как оценочная функция eio , jo Z MM max min ei, j , i j где io , jo - индексы оптимального решения, принятого по ММ-критерию и ситуации, которая определила это решение. Далее вводится некоторый допуск на риск >0, который позволяет отсортировать решения, последующее использование которых не должно дать больших потерь, относительно опорного, чем допускаемые. На практике один из вариантов пересортировки заключается в выборе индексов удовлетворяющих оговоренному условию (подмножество I1 множества индексов {1, ..., i, ..., m}) и вычеркивании строк с прочими индексами. I1 i i 1,...,m eio , jo min ei, j . j Не редко, что бы оправдать риск, из оставшихся берут в расчет только явно прибыльные решения. Например, требуют что бы в выбранной 127 строке (решение, претендующее на включение в новую матрицу) имелся выигрыш превышающий максимальный выигрыш, который есть в опорной строке и это превышение было большим чем максимальный проигрыш относительно опорного, который также есть в этой строке. I 2 i i 1,...,m max ei, j max eio , j i j j где i eio , jo min ei, j - наибольшие возможные потери при принятии j Ai в сравнении с задаваемыми ММ-критерием. Схема принятия решения Ao Aio Aio A eio max ei, j q j . iI1 I 2 j Правило выбора трактуется следующим образом. По ММ – критерию определяется планируемый выигрыш – опорное значение и опорное решение. Матрица решений дополняется тремя столбцами. В первом записываются математические ожидания строк. Во втором разности между опорным значением и наименьшим значением выигрыша в строке (проигрыш от опорного). В третьем столбце формируются разности между наибольшим выигрышем в рассматриваемой строке и наибольшим значением выигрыша в опорной строке. Выбираются те строки у которых значения во втором столбце меньше допуска. Из выбранных строк выбираются только те у которых значения в третьем столбце выше значений во втором столбце. В новой матрице ищут решения по BL – критерию. Если новая матрица не содержит строк оптимальным решением становится опорное. Критерий рекомендуется применять если Вероятности появления ситуаций определены с большими доверительными интервалами; Необходимо считаться со всеми ситуациями; Допускается риск и допуск задан; Решение планируется применить неоднократно. 128 Критериев построенных по данной схеме несколько. Каждый из них имеет разновидности, особенно в плане формулировки определения эффективности включаемого в новую матрицу решения по сравнению с опорным. Эти критерии как правило при определенном значении параметров, допусков и т. п. переходят в классические. Существует общий подход к построению гибких критерием, обобщающий известные. 4.4. Гибкий критерий принятия решения Рассмотренный ниже критерий детально с примерами применения в технических задачах приведен в работе Мушака-Мюллера [18]. Представим его в несколько упрощенном виде. Схема принятия решения Ao Aio Aio A G1 G 2 G3, где G1, G 2 - условные ограничения, а G 3 - Z r -гибкий критерий принятия решения. Рассмотрим их по отдельности. Первое условие задает ограничение на достоверность априорных данных об оценках характеристических функций принадлежности выбранных ситуаций F общему пространству возможных внешних ситуаций. Это ограничение выглядит в одном из вариантов, как V i Vd , где V i - доверительный фактор, например, эмпирический определяемый на основании упорядоченной выборки x1,..xn по формуле ~ V i x1i x1i , где x1i - минимальное (наиболее не благоприятное) значение параметра, отобранное для i - решения, - оценка математического ожидания дан~ ного параметра, - наиболее неблагоприятная для последствий решения граница оценки математического ожидания при заданной веро~ ятности ошибки принятия решения о значении . Доверительный 129 фактор V изменяется от 0 до 1. Верхнее значение соответствует достоверной информации о величине . Доверительный фактор вычисляется для каждой строки, таким образом он индивидуален для каждого решения. Индивидуально и определение x 1 . Для каждого решения, как i правило, есть свой наиболее не благоприятный фактор – ситуация ( x1i ). Выше сказанное говорит о том, что при анализе эмпирических данных стремятся прижаться к нижней, наиболее неблагоприятной границе оценки параметров, что бы обеспечить достоверность ММ-критерия. Vd - максимально допустимый доверительный фактор. При его достижении вес BL-критерия не повышается. Второе ограничение G 2 Z MM min ei, j , j по сути является допуском на превышение опорного значения риска определяемого согласно ММ-критерия. Оба ограничения учитываются в схеме решения по или. Их использование зависит от объема экспериментальных, а при применении отличной от написанной формулировки доверительного интервала вообще априорных данных о функциях принадлежности ситуаций. Возможна и проверка обеих ограничений. Строки не удовлетворяющие ограничениям из расчетов исключаются. Гибкий критерий принятия решения находит максимум от оценочной функции, близкой к функции BL (MM)-критерия. Z r max V i ei, j q j 1 V i min ei, j i . i j j Вновь доверительный фактор, теперь он играет роль коэффициента доверия BL-критерия. Рассмотрим более детально его специфику. Доверительный фактор опирается на наиболее не благоприятную ситуацию или ее параметр при принятии конкретного решения. В целом ei , j - матрица случайных чисел для каждого i и j . Как правило факторы влияющие на полезность решения разбивают на зоны, формируя в множестве J ( j J ) подмножества J d , где d - порядковый номер подмножества. Однако, редко это дробление настолько мелко, что бы обеспечить ei, j const . 130 Даже в однокритериальных задачах в каждой ячейке матрицы решений находится случайная функция какого то параметра. При превышении приращения параметра определенной границы меняется номер - d и как следствие номер ситуации j . Таким образом в общем поле матрицы имеются зоны влияния одного параметра, его изменение меняет и номер ситуации и в более малом масштабе последствия решения Ai при ситуации F j . Влияние этого параметра на последствие решения оценивается его релевантностью или одной из ее форм - коэффициентом влияния. Детально это свойство рассматривается в теории чувствительности, достаточно детально проработанной в технических приложениях, например, в схемотехнике электронных устройств. Если рассмотреть гладкую, без смена знака однопараметрическую релевантность и вернуть ei , j ее зависимость от параметра x1i , j в зоне ре- шения Ai при возникновении ситуации F j - ei, j x1i, j можно получить упрощенную числовую оценку абсолютной релевантности в данной точке. Ria, j x1 max ei, j x1li, j min ei, j x1li, j l l , ei, j где l - смещение параметра x1i , j в рассматриваемой зоне. В качестве точки исследования выбирается обычно точка, выносимая при формировании минимаксного решения в столбец оценочной функции. Значимость выбранного параметра вычисляют с учетом энтропии параметра x1i , j , зависящей от вероятности появления смещения l . Bx1i, j Ri, j x1 H x1li, j , где значение энтропии вычисляется по формуле H x1li, j ql ln ql . l Исследовав влияние различных параметров выбирают x1i , j или комбинацию параметров, наиболее влияющих на ei , j . Надо заметить то, что математические модели используемые в ТПР достаточно громоздки, можно сказать здесь идет «разгул» статистики, 131 так как нечеткость постановки самой задачи переплетается с нечеткостью определения элементов матрицы решений, описаний ситуаций, да и самих решений. Трактовка метрики пространств параметров в понятиях предметной области, для которой ведется анализ возможных решений и их последствий, еще более усложняет понимание правильности выводов теоретических концепций. Упрощение моделей позволяет нам выдержать понятийный уровень методик решения задач. Введение автоматического определения коэффициента доверия BLкритерия делает гибкие алгоритмы не зависимыми от человека, способными функционировать в автономном режиме. Конкурирующий с BL-критерием, ММ-критерий также видоизменен. В его формулировку введено смещение i . i min , d ,i , где d,i - индивидуальный допуск на превышение минимального значения выигрыша в i - решении. Здесь проведена не сортировка решений, а повышен уровень возможного выигрыша индивидуальный для каждого решения. В принципе в полном объеме гибкий критерий Мушака-Мюллера включает и вычеркивание строк не допустимых решений. Рассмотренный критерий позволяет рассматривать задачи с конкретными условиями и ориентироваться практически только на те эксперименты, измерения которые проведены для решения данной задачи. Он более пригоден для автоматизации, практически все его параметры вычисляются по результатам наблюдений за исследуемым процессом. Он обладает и признаками самоорганизации. 4.5. Адаптивный критерий Кофлера-Менга Данный критерий по своей сути близок к минимаксному, но несколько усложнен. Анализ данного критерия говорит о «бирнуллизации» ММ-критерия. По Бернулли при поиске оптимального решения стремятся максимализировать математическое ожидание результата. По критерию Кофлера-Менга в распоряжении системы принимающей решение имеется и постоянно дополняется информация о виде и параметрах вероятностных распределений Q внешних ситуаций. 132 Предлагается разбить пространство множеств вероятностных распределений на непересекающиеся подмножества B j . B B j , Bv B j ø для v j ( v , j - 1, 2, ...). j Вводятся оценки p j , адаптивно изменяющиеся, вероятностей появления B j . dQ p j , p j 1. j Bj При появлении ситуации F j B j и принятии решения Ai его результат e F j , Ai желательно максимализировать выбором i . Критерий Кофлера-Менга (КМ-критерий) записывается в виде Z KM max inf e F j , Ai dQ , Ai AQQ * Bj где Q* - полное информационное множество, достаточное для принятия решения с максимальной достоверностью его оптимальности, inf QQ * нижняя в смысле выигрыша (наихудшего результата) граница пространства Q . Множество априорных вероятностных распределений образует конечномерный симплекс. Частичная информация Q состоит в знании собственного подсимплекса (не вырождающегося до одного распределения) P . При реализации решения может учитываться релевантности выделенной ситуации к изменению объема информации. 4.6. Принятие решений по нескольким критериям Часто возникающая задача в экономике и технике. Например, в экономике одно из реальных эффективных решений задачи: Пусть есть фиксированная сумма S, которую решено использовать для поддержки N проектов. Требуется отобрать из всего множества проектов-кандидатов некое подмножество таким образом, чтобы обеспечить наиболее рациональное использование имеющегося капитала S. Пусть срок окупаемости 133 некоторого проекта оказался равным 7-ми месяцам. Хорошо это или плохо? Понятно, что для одного проекта такой срок может быть оценен как "отличный", для другого, как "удовлетворительный", а для третьего, как "плохой". Такие оценки и должен выставлять эксперт. Для решения задачи методами ППР была предложена технология рационирования, включающая следующие шаги: Шаг 1. Формирование экспертной группы (ЭГ). Шаг 2. Сбор и анализ мнений членов ЭГ по формированию набора критериев для оценки проектов и шкал оценок по каждому критерию. Шаг 3. Выявление индивидуальных мнений членов ЭГ о сравнительной значимости критериев и построение компромиссного мнения. В результате может быть сформирована обоснованная система весов критериев. Шаг 4. Сбор экспертных суждений (по каждому проекту) о значениях количественных критериев (посчитанных ранее) и экспертных оценок по качественным критериям. Шаг 5. Обработка оценок подходящим методом построения функции ценности. В результате получится обоснованное структурирование исходного множества проектов с точки зрения эффективности инвестирования. Шаг 2. Откуда берется набор критериев (в широком смысле, с учетом неэкономических показателей)? Если он формируется и утверждается руководителем – что ж, это неплохо, если место руководителя занимает самый компетентный эксперт. А если нет? Тогда разумнее учесть мнения всех экспертов, участвующих в отборе проектов. Сделать это легко, если экспертам удалось прийти к соглашению. А если нет? Тогда нужно вырабатывать правила формирования компромиссного решения. Вот тут-то на помощь и могут прийти методы ППР, арсенал которых существенно шире банального голосования. А собственно, что плохого в принятии решения большинством голосов? Ответим. Плохо отбрасывание мнения меньшинства. Такое отбрасывание имеет, по меньшей мере, 2 недостатка. Во-первых, есть риск отбрасывания наилучшего решения, если в дальнейшем станет ясно, что именно это решение предложено меньшинством. Во-вторых, есть и чисто человеческий недостаток: отбрасывание мнения части экспертов есть психологически признание их экспертами "второго сорта". Используя методы ППР можно избежать всех указанных недостатков. Например, на Шаге 3 можно построить компромиссную ранжировку критериев по сравнительной важности. Для этого подойдут такие методы, как медиана Кемени или строчная сумма. 134 Для Шага 5 вообще существует весьма представительный набор методов, как говорится, "на все случаи жизни". Что же дает такая технология? Прежде всего, она сводит к минимуму субъективизм принятия решения, поскольку на всех шагах выполняется так называемая "объективизация" данных путем построения обобщенных мнений всех экспертов, участвующих в проекте. Как следствие, она позволяет минимизировать вероятность ошибки. Наконец, она позволяет максимально эффективно использовать бюджет, выделенный на проведение процедуры отбора проектов (это можно строго доказать). Но и это еще не все. Практическая технология, помимо перечисленных шагов, должна обеспечивать также: Учет согласованности экспертных оценок. Если мнения экспертов сильно расходятся, то становятся бессмысленными процедуры построения обобщенных (компромиссных) оценок, поскольку есть опасность получить "среднюю температуру по больнице". Возможность учета различий в степени компетентности (авторитетности)экспертов в случае их привлечения со стороны. Защиту результатов от манипулирования, т.е. от искажения рядом экспертов своих оценок с целью лоббирования определенных проектов (для использования этого аппарата каждый проект должен оцениваться несколькими экспертами). Впервые описанная технология была использована при отборе проектов в Минтопэнерго и Минпроме РФ (90 – 93 годы) и т.д. На выставке ИнвестЭкспо’96 технология была использована для проведения конкурса инвестиционных проектов в масштабе России. В экспертную группу входило более 40 экспертов. Значительные ресурсы вычислительных мощностей предоставляемые современными интеллектуальными системами, позволяют определить номера оптимальных решений, промоделировав и неопределенность в описаний ситуаций. В этом случае, наряду с исходным описанием задачи (таблица 22), появляются и множественные результаты ее возможного решения. Представим эти данные так же в виде таблицы 23. Таблица 22 q1 ... qj ... qn F1 ... Fj ... Fn p1 A1 e1,1 ... e1, j ... e1, n ... ... ... ... ... ... ... 135 ... pi Ai ei ,1 ... pm ... Am ... em,1 ... ei , j ... ... ... em, j ... ei , j ... em, n Таблица 23 MM ММ A1 p MM 1 ... Ai ... ... Am ... p MM i p MM m BL ... ... ... BL p BL1 ... ... ... ... ... ... p BL i p BL m ... ... ... KM KM p KM 1 ... ... ... ... ... ... p KM i p KM m Новая таблица – таблица мнений экспертов заполнена результатами анализа исходной матрицы решений по имеющимся критериям. В ячейки таблицы помещены вероятности появления рекомендаций применения данного решения по конкретному критерию. Таблица открыта для расширения. Новые критерии добавляют столбцы. p XX i 1 для всех XX , i где XX - символьный индекс критерия (ММ – минимаксный критерий, BL – критерий Байеса-Лапласа , KM – критерий Кофлера-Менга и т. д.). Коэффициенты доверия критериям XX в каждой предметной области (распознавание образов в радиолокации, медицинская диагностика, торговые операции с комплектующими для офисных компьютеров, рабочих станций разработчиков важных проектов и т. п.) формируются на базе опыта и имеющихся в данной области знаний. Коррекция текущих значений коэффициентов также возможна. В принципе при назначении коэффициентов учитываются корреляционные связи между критериями. XX 1. XX В ячейках таблицы могут встречаться и нулевые значения. По аналогии с методикой принятия решений, рассмотренной в работе с большинством критериев добавим столбец. pri p XX i XX . XX 136 Пример заполнения таблицы мнений экспертов и расчета оценочной функции рекомендаций экспертов приведен в таблице 24. Таблица 24 A1 A2 A3 A4 A5 0,1 Крит. 1 0 0,7 Крит. 2 1 0,05 Крит. 3 0,2 0,05 Крит. 4 0,1 0,1 Крит. 5 0,9 0,805 0,8 0 0,2 0,2 0,05 0,105 0,1 0 0,2 0,5 0,05 0,05 0,05 0 0,2 0,05 0 0,0175 0,05 0 0,2 0,15 0 0,0225 p ri Наряду с оценочной функцией рекомендаций экспертов целесообразно составить и оценочную функцию выигрышей от применения стратегии рекомендаций экспертов. Она формируется по описанной выше методике. Мнение экспертов может быть использовано в итоговом принятии решений в различных стратегиях. Две крайние стратегии рассмотрим подробнее. Первая стратегия предполагает многократную реализацию многих решений. Такой вариант возможен в гибких производствах, когда реально в выпуске изделий изменять их параметры. Он возможен и при масштабном внедрении решений осуществляемых в различных системах. Назовем эту стратегию рыночной. Вторая подразумевает принятие одного решения и его реализацию в одном или во многих изделиях. Назовем эту стратегию ограниченной. Целесообразность такой стратегии обычно обусловлена высокими затратами, которые необходимо осуществить на реализацию каждого типа решений. Такая обстановка возникает при разработке приборов автоматизации научных исследований, крупномасштабных проектов, в медицинской диагностике и т. п. В ограниченной стратегии критерий Z LS max p XX i XX , i XX а схема принятия решения 137 Ao Aio Aio A p XX io max p XX i XX . i XX Ограниченная стратегия рекомендуется к применению при следующих условиях: Отсутствует возможности реализации нескольких решений, из-за их высокой стоимости или малого объема реализаций; Имеется опыт использования различных критериев в данной предметной области или теоретические наработки по степени доверия различным критериям; Практически отсутствует конкуренция и противодействие в данной предметной области. В рыночной стратегии целью анализа матрицы мнений экспертов (таблица 23) является упорядочение множества решений по значению p ri , ограничение размера множества решений снизу по допуску на минимальное значение p ri с ее нормировкой, формирование последовательности (очереди) реализации решений. 4.7. Принятие последовательности решений В теории управления широко используется модель черного ящика. Входное воздействие через функцию выходов, зависящую от заполнения этого «ящика» вырабатывает управляющее воздействие. Это самая простая и самая сложная модель. Простота ее в малом числе переменных. Сложность в структуре этих переменных и их взаимосвязи. На рис. 123 представлена упрощенная схема принятия решений с анализом внешней ситуации. Входные переменные X представлены N мерным вектором. Реально измеряется или очувстволяется n компонент, n N . На базе вектора x1,..., xi ,..., xn ранжированного по степени влияния (релевантности), формируется набор признаков – алфавит признаков П характеризующих текущую ситуацию. Ситуация в априорном словаре ситуаций представлена набором классов 2. В результате анализа признаков вырабатываются версии 1 о принадлежности текущего описания объекта одному из классов. 138 При этом проверяется достоверность, например как в раннее рассмотренном случае двух классов определялась ошибка первого рода и ошибка второго рода. Рис. 123. Принятие последовательности решений По матрице рисков e1 принимается решение об идентификации объекта, как реализации одного из классов 2, или увеличения объема информации – запрос Y 1. При этом могут проводится дополнительные съемы данных в выбранном множестве компонент, или увеличиваться число n . Данный процесс получил название итерационного, его цель увеличение объема данных для достижения требуемого уровня достоверности оценки принадлежности объекта к определенному классу. После достижения требуемого уровня достоверности, информация о индексах классов и оценок вероятностей их реализации Q поступает в следующую ступень – принятия решений. 139 При принятии решений на базе поступившей информации формируется описание текущей ситуации по крайней мере в виде двух векторов F, q . Принятие решений через критерии и с учетом матрицы последствий решений e 2 принимается одно или несколько решений, претендующих на оптимальность. В виде вектора управления Y 2 эти решения передаются на объект. В случае решения экономических задач в состав вектора X входят и финансовые поступления. Часть их остается внутри системы, стимулируя ее работу. Объем этих поступлений служит индикатором правильности принимаемых решений. Объемы рисков, закладываемые при поиске оптимальных решений, могут быть достаточно велики (при анализе производных критериев мы закладывали величину риска , подчеркивая ее незначительность). Например, один из принципов ведения бизнеса в процветающей компании ACER (Тайвань) звучит примерно так: Не следует рисковать, если не можешь позволить себе проиграть то ради чего сражаешься. Как видно, объем риска в системах не связанных с жизнью и здоровьем людей может быть весьма значителен. В экономических приложениях ТПР много внимания уделяется распределению полученных прибылей внутри системы. В технических задачах этот вопрос мало исследован, хотя для интеллектуальных систем он актуален, как стратегия правильного стимулирования развития системы. Массив отображающий распределение части прибыли ei , j в пользу агента W j согласно решения Ai представлен в таблице 25. Таблица 25 W1 ... Wj ... Wm A1 e1,1 ... e1, j ... e1, n ... Ai ... ei ,1 ... ... ... ei , j ... ... ... ei , j ... Am ... em,1 ... ... ... em, j ... 140 ... em, n Не смотря на специфику задачи рекомендуемые критерии схожи с рассмотренными. Например, эгалитарный критерий по Роллсу увеличивает доходы наиболее неудачного агента max min ei, j . i j Критерий Харшаньи дает максимум интегрального результата max ei, j . i j Синергетический критерий Бекмана ориентируется на комбинацию классического утилитарного и относительного эгалитарного подхода. max ei, j a f ei,1,...,ei, n , i j где a - весовой коэффициент при f - учитывающая минимальные доходы агентов. Принятие решений в среде интеллектуальных объектов имеет свою специфику. В среде противодействующих систем в состав вектора X входят данные маскируемые, целенаправленно изменяемые данные, призванные изменить решения в сторону меньших выигрышей. 4.8. Сложности внедрения методов принятия решения в практику В заключении рассмотрим сомнения возникающие перед специалистами при привлечении инструментариев поддержки принятия решений. Горский П. так оценивает мифы и реальности использования научных методов принятия решений. Миф 1. "Руководители и управленческий аппарат и так выбирают наилучшие варианты из всех возможных в каждой ситуации". Голландские ученые провели в 1984 году изучение 235 внешнеполитических решений, принятых правительством Нидерландов в период с 1900 по 1955 год. Они имели достаточную базу, так как по закону Нидерландов все материалы - протоколы заседаний кабинета министров, служебные записки и т.д. становятся открытыми через 25 лет. Оказалось, что для большинства решений характерен упрощающий подход, ведущий к исключению части важных факторов, не учитывающий неопреде141 ленность и т.д. Можно сказать, что анализ показал стремление руководителей резко упрощать сложные ситуации и принимать решения, пользуясь простыми правилами. И именно в этот период имели место существенные неудачи во внешней политике Нидерландов. Докладывая свои результаты на международной конференции, голландские ученые подчеркнули, что подобное исследование в других странах дало бы похожие результаты. Миф 2. "Принятие важных экономических или политических решений осуществляется совершенно по иному, чем решения другого уровня". Исследования, проведенные психологами, показали удивительно одинаковые черты человеческого поведения в самых разных задачах. При принятии важных решений разного типа - деловых (судьи, брокеры, врачи и т.д.) или личных (игра в казино, игра на ипподроме, картежная игра) - люди бывают непоследовательны, противоречивы, что и приводит к ошибкам. Одинаковость поведения определяется наличием единой для всех людей системы переработки информации. В частности, имеет значение ограниченность кратковременной (или рабочей) памяти человека, в которой осуществляется принятие решений, что вынуждает людей группировать информацию, обобщать факты, учитывать ограниченное количество факторов, использовать специальные приемы, которые получили название эвристик. Все это накладывает существенный отпечаток на любой процесс принятия решений. Миф 3. "В принятии решений самое главное - удача. Научный анализ вряд ли добавит что-то существенное". В принятие решений всегда будет нести в себе субъективный элемент. Но оно должно опираться на определенную стратегию, на продуманный и выверенный план действий. А создание такой стратегии сводится к большой, трудной и постоянной работе, где объективное сплетается с субъективным и роль систематического анализа становится весьма существенной. Миф 4. "Систематический сбор и анализ ситуации требует больших усилий, средств, но мало что дает". Одним из самых трудных этапов подготовки и принятия решений является правильное понимание проблемы. Для этой цели собирается и анализируется большой относящаяся к делу информация. Трудоемкость этой операции очевидна, но чем лучше она автоматизирована, тем правильнее она выполняется. Проведение ее облегчается непрерывным ростом компьютерной грамотности специалистов. Постоянный анализ поступающей информации способен многое уточнить в принятых и прини142 маемых решениях. Многие явления настолько сложны и взаимосвязаны, что крайне редко встречаются эксперты, понимающие их в целом. Миф 5. "Компьютеры нужны лишь для сбора информации. Они не могут помочь руководителю при принятии решений". Современные средства анализа вариантов и подготовки решений нацелены на то, чтобы сделать интуицию специалиста обоснованной. Это меняет многое и, главное, исключает грубые ошибки. Естественно, компьютер способен подсказать, при каких условиях возможны нежелательные последствия. Следует подчеркнуть, что программы ППР стремятся, не только обеспечивают общение с компьютером на привычном языке, но и создают подлинный диалог с квалифицированным пользователем. Литература по сравнению вариантов решений и выбору наилучшего обширна, написаны монографии. Проводятся международные и национальные конференции, работают различные научные школы. Современные методы принятия решений должны быть психологически и математически обоснованы, понятны и удобны для пользователя. Методы принятия решений являются лишь одной из составляющих системы поддержки принятия решений. В нее входят также структурированная информация о проблеме, описания позиций отдельных групп, их критерии, набор известных вариантов решений с оценками, результаты работ по сценариям. Миф 6. "Для современного руководителя самое главное - создать аналитические группы. Они подготовят и подадут ему наилучшие варианты решений". Позиция "подготовьте решение и принесите его мне" - чаще всего приводит к печальным последствиям: к утрате контроля за событиями, к совокупности частных, противоречивых решений, не связанных общей стратегией. Принятие решений всегда связано с преодолением неопределенности, всегда имеет субъективный характер. Иначе говоря, можно оценить последствия принимаемых решений, но точно предугадать будущее невозможно. Миф 7. "Варианты решения проблемы чаще всего очевидны. Надо лишь выбрать один из них". Довольно редко один из очевидных вариантов становится лучшим способом решения проблемы. Чаще всего каждый имеет свои недостатки и трудно ожидать согласия основных активных групп по поводу какоголибо из них. Компьютер не может изобрести новый вариант решения проблемы, но он может помочь найти хорошую идею, а это уже немало. 143 Миф 8. "Принятию решений невозможно научиться. Общеобразовательные курсы лекций ничего не дают". Чтобы успешно принимать сложные решения, специалист должен обладать многими знаниями. Обучение на своих ошибках в наше время становится непозволительной роскошью. Следовательно, специалисты должны учиться, должны проходить специальную подготовку. Прикладной анализ рассматривает принятие решения как выбор наилучшей из возможных альтернатив. Более широко можно трактовать процесс принятия решений как упорядочение альтернатив с точки зрения их предпочтительности. Перечисленные мифы и их опровержение рассчитаны на решение задач в управлении в экономике. Инженерные задачи тесно связаны с системами автоматического управления, которые объединены с обновляемыми базами данных. Это повышает исходный уровень решения задач. Литература 1. Городецкий А.Я. Информационные системы. Вероятностные модели и статистические решения. Учеб.пособие. СПб: Изд-во СПбГПУ, 2003. 326 c. 2. Кузин Л. Т. Основы кибернетики. Т.1. Математические основы кибернетики. Учеб. пособие для вузов. М. Энергия, 1973, 504 с. 3. Гихман И.И., Скороход А.В. Введение в теорию случайных процессов. - 2-е изд, М. Наука, 1977, 568 с. 4. Ширяев А. Н. Вероятность. Учеб. пособие для вузов. М. - 2-е изд, М. Наука, 1989. – 640 с. 5. Рассел, Стюарт, Норвиг, Питер. Искусственный интеллект: современный подход, 2-е изд..: Пер. с англ. – М.: ИД “Вильямс”, 2006. 6. Нильсон Н. Принципы искусственного интеллекта. М. Мир. 1985. 376 с. 7. Мушик Э., Мюллер П. Методы принятия технических решений.: Пер. с нем. – М.: Мир, 1990. 8. Шестаков К.М. Теория принятия решений и распознавание образов: Курс лекций / – Мн.: БГУ 2005. 9. Шестаков К.М. Лабораторный практикум по специальному курсу “Теория принятия решений и распознавание образов”/ – Мн.: БГУ, 2002. 10.Шестаков К.М., Бобко Ю.К. Лабораторный практикум по курсу “Промышленная электроника” / – Мн.: БГУ. 1999. 58 с. 144 11.Максимов С.И. Теория полезности и принятия решений: Обзор. – Мн.: РИВШ БГУ, 1997. – 32 с. 12.Курбацкий А. Н., Чеушев В. А. Информационный метод анализа и оптимизации в системах поддержки принятия решений. – Мн.: ИТК НАН, 1999. _200 с. 13.Смородинский С.С., Батин Н.В. Методы и системы принятия решений. В двух частях. Часть 1. – Мн. БГУИР. 2000 – 96 с. Часть 2. – Мн. БГУИР. 2001. – 80 с. 14.Смородинский С.С., Батин Н.В. Методы анализа и принятия решений в слабоструктурированных задачах. – Мн. БГУИР. 2002 – 116 с. 15.Представление и обработка знаний в графодинамических ассоциативных машинах: Монография / В.В. Голенков, О.Е. Елисеева, В.П. Ивашенко и др.; Под ред. В.В. Голенкова. – Мн.: БГУИР, 2001. 16.Шампандер Алекс. Дж. Искусственный интеллект в компьютерных играх: Как обучать виртуальные персонажи реагировать на внешнее возбуждение Пер. с англ. – М.: ООО «И. Д. Вильямс», 2007. 17.Мулен Э. Коорперативное принятие решений: Аксиомы и модели. – М.: Мир, 1988. 18.Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. В.Н.Вагина, Д.А. Поспелова. – М.: Физматлит, 2004. 19.Волкова В. Н. Теория систем: Учебное пособие / В. Н. Волкова, А. А. Денисов. М.: Высш. Шк. 2006. 20.Иваненко В. И., Лабковский В.А. Проблема неопределенности в задачах принятия решений.; Отв. Ред. Скороход А. В. АН УССР. – Киев: Наук. Думка, 1990. 21.Подиновский В.В., Ногин В.Д. Паретно-оптимальные решения многокритериальных задач. М. Наука, 1982. 22.Р. Штойер. Многокритериальная оптимизация: теория, вычисления и приложения. - М.: Радио и связь, 1992. 23.Пегат А. Нечеткое моделирование и управление. Пер. с англ. _ М. БИНОМ, лаборатория знаний. 2009. – 798с. 24.Крапивенко А.В. Технология мультимедиа и восприятие ощущений: учебное пособие МАИ – БИНОМ Лаборатория знаний 2009, 221 с. 25.Себестиан Г.С. Процессы принятия решений при распознавании образов. Пер. с англ. Под ред. В.И. Иваненко. К Техника. 1965. 26.Заде Л. Понятие лингвистической переменной и ее применение к принятию приближенных решений. М.: Мир, 1976. 165 с. 27.Обработка нечеткой информации в системах принятия решений./ А. Н. Борисов и др. – М.: Радио и связь, 1989. – 304 с. 145 28.Борисов А. Н., Крумберг О. А., Федоров И. П. Принятие решений на основе нечетких моделей: Примеры использования. – Рига.: Зинатне, 1990. – 184 с. 29.Иваненко В. И., Лабковский В.А. Проблема неопределенности в задачах принятия решений.; Отв. Ред. Скороход А. В. АН УССР. – Киев: Наук. Думка, 1990. – 136 с. 30.Носибов Э.Н. Методы обработки нечеткой информации в задачах принятия решений. – Баку: Элм, 2000. 31.Ларичев О.И. Мошкович Е. М. Качественные методы принятия решений. – М.: Наука Физматлит, 1996. – 208 с. 32.Ларичев О. И. Теория и методы принятия решений, а так же Хроника событий в Волшебных Странах: Учебник. – М.: Логос, 2000. – 296 с. 33.Саати Т. Принятие решений. Метод анализа иерархий. Пер. с англ. – М Радио и связьЮ 1993. – 320 с. 34.Осипов Г.С. Приобретение знаний интеллектуальными системами. Основы теории и технологии. – М.: Наука, 1997. 35.Вагин В.Н., Еременко А.П. Некоторые базовые принципы построения интеллектуальных систем поддержки принятия решений в реальном времени. Изв. АН. Теория и системы управления. 2001,№6, с. 114-123. 36.Вилкас Э. И. Оптимальность в играх и решениях. – М.: 1990. – 256 с. 37.Теория выбора и принятия решений. – Учебное пособие. – М.: Наука. 1982. – 328 с. 38.В. А. Горелик В. А., Горелов М. А., Кононенко А. Ф. Анализ конфликтных ситуаций в системах управления. – М.: Радио и связь, 1991. – 288 с. 39.Мулен Э. Кооперативное принятие решений: Аксиомы и модели. М. Мир, 1991. 464 с. 40.Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М. Наука. 1982. 256 с. 41.Питмен Э. Основы теории статистических выводов: Пер. с англ. – М.: Мир, 1986. – 104 с. 42.Бодров В.И., Лазарева Т.Я., Мартемьянов Ю.Ф.Математические методы принятия решений: Учеб. пособие. Тамбов: Изд-во Тамб. гос. тех. ун-та, 2004. 124 с. 43.Эддонс М., Стенсфильд Р. Методы принятия решений. М.: Аудит, ЮНИТИ, 1997. 590 с. 44. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.: Высшая школа, 1998. 304 с. 45.Юдин Д.Б. Вычислительные методы теории принятия решений. М.: Наука, 1989. 316 с. 146 46.Блюмин С.Л., Шуйкова И.А. Модели и методы принятия решений в условиях неопределенности. - Липецк: ЛЭГИ, 2001. – 138 с. 47.Блюмин С.Л., Шуйкова И.А. Введение в математические методы принятия решений. - Липецк: ЛЭГИ, 1999. – 120 с. 48.Александров А.Г. Оптимальные и адаптивные системы: Учеб. Пособие для вузов по спец. “Автоматика и управление в технических системах”. М Высш. шк. 1989. 263 с. 49.Современные методы идентификации систем. Под. ред. Эйкхофа. Пер. с англ. М. Мир. 1983. 400 с. СОДЕРЖАНИЕ 1. 1.1. 1.2. 2. 2.1. 2.2. 2.3. 2.4. 3 Введение Истоки курса Системы поддержки принятия решения Краткий анализ рекомендуемых литературных источников Описание ситуаций Модели в описании ситуаций и процедур Оценка параметров и функций в анализе ситуаций Риск и его описание Управление рисками Поддержка принятия решений. Математика и структуры 147 3 5 5 9 10 10 16 19 22 30 3.2. Анализ математических методов поддержки принятия ре- 30 шений Классификация СППР 44 3.3. 3.4. Принятие решений с анализом данных в трех измерениях Структуры систем поддержки принятия решений 60 64 3.5. 3.6. 4. 4.1. 4.2. 4.2.1. 4.2.2. 4.2.3. 4.2.4. 4.2.5. 4.2.6. 4.3. 4.3.1. 4.3.2. 4.3.3. 4.3.4. 4.4. 4.5. 4.6. 4.7. 4.8. Технология поддержки принятия решений Методы теории игр в принятии решений Выбор решения в различных внешних условиях Общие положения Классические критерии принятия решений Минимаксный критерий принятия решения Критерий Байеса – Лапласа Критерий азартного игрока или предельного оптимизма Критерий Сэвиджа Критерий произведений Расширенный минимаксный критерий Производные критерии принятия решений Критерий Гурвица Критерий Ходжа – Лемана Критерий Геймейера BL(MM) критерий Гибкий критерий принятия решения Адаптивный критерий Кофлера-Менга Принятие решений по нескольким критериям Принятие последовательности решений Сложности внедрения методов принятия решения в практику Литература Содержание 87 91 99 102 111 111 113 116 119 121 124 125 125 126 126 127 129 132 133 138 141 3.1. 148 144 147 Учебное издание Шестаков Константин Михайлович КУРС ЛЕКЦИЙ Электронная версия по специальному курсу «Теория принятие решений» Учебное пособие для студентов факультета радиофизики и компьютерных технологий Ответственный за выпуск К. М. Шестаков Редактор _________________ Корректор ___________________ Подписано в печать_______. Формат _60×84/16. Бумага офсетная. Печать офсетная. Усл. печ. л._____. Уч. – изд. л. ______. Тираж 100 экз. Зак. 486. Белорусский государственный университет. Лицензия ЛВ № 315 от 14.07.98. 220050, Минск, пр.Независимости, 4. Отпечатано в Издательском центре БГУ. 220030, Минск, ул. Красноармейская, 6. 149